はてなまとめ - 9,573個ものRFCドキュメントをDifyで全部取り込んでみた話

1: uokada 2025/07/19 01:56

"ファイル容量：496MB（ZIP圧縮後132MB）このマンモス級のビッグデータ、突っ込んでRAGを実行してもちゃんと処理できるんでしょうか？"

2: zgmf-x20a 2025/07/19 06:45

凄く得るものがあった。ただ、difyのこの部分は、docker-compose見るとpgvectorなのか？と。親子チャンクは調べてみたいが、ソースは英文でなくて和文？

3: mayumayu_nimolove 2025/07/19 07:06

あとで

4: kaputte 2025/07/19 07:23

こりゃすごい

5: hogetax 2025/07/19 09:28

“動機を伺ったのですが「IIJらしいんじゃないかなーと(笑)。」”この記事まで含めてIIJらしいｗ

6: ma2saka 2025/07/19 10:30

動機がいい。「今手元にこんなファイルがあるんですが」

7: rrringress 2025/07/19 11:14

ドラフトとかどう扱ってるんだろ

8: Eiichiro 2025/07/19 11:34

ベクトル検索の検索精度については追ってなかったので、今のトレンド把握できて助かります。

9: strawberryhunter 2025/07/19 12:16

どうなんだろうね。LLMは学習済みのはずなので、用途によってはLLMが正しく答えられるかをテストする方が有益なのではないかと思った。念のためRFC読み込みツールをLLMに提供すればそれで済みそうな気もする。

10: Yaju3D 2025/07/19 12:49

ファイルがたくさんあるなら、Memvid(動画にテキストを保存して高速検索する革新的AI技術)を試してほしいな。

11: lunatican 2025/07/19 16:41

子チャンク2048って大きくない？それくらいがいいのかな。

9,573個ものRFCドキュメントをDifyで全部取り込んでみた話 | IIJ Engineers Blog