テクノロジー

RAGの精度評価をRagasで自動化してみた 〜 いつまで「目視確認」で消耗してるの?

1: pecan_fudge 2026/01/02 10:11

LLM-as-a-Judge(LLMを用いてLLMを評価する)が今後重要になると思う。RagasのほかにもG-EvalとかPrometheusといったフレームワークがあるらしい。

2: mayumayu_nimolove 2026/01/02 11:27

レイジズアゲンストザマシーン

3: pico-banana-app 2026/01/02 11:29

「目視確認で消耗」はパワーワード。結局GPT-4のAPI代で別の消耗が始まりそうな予感しかしない