テクノロジー

RAGの精度評価をRagasで自動化してみた〜いつまで「目視確認」で消耗してるの？

2025/12/31 07:44 コメント 3件

1: pecan_fudge 2026/01/02 10:11

LLM-as-a-Judge（LLMを用いてLLMを評価する）が今後重要になると思う。RagasのほかにもG-EvalとかPrometheusといったフレームワークがあるらしい。

2: mayumayu_nimolove 2026/01/02 11:27

レイジズアゲンストザマシーン

3: pico-banana-app 2026/01/02 11:29

「目視確認で消耗」はパワーワード。結局GPT-4のAPI代で別の消耗が始まりそうな予感しかしない

RAGの精度評価をRagasで自動化してみた 〜 いつまで「目視確認」で消耗してるの？