テクノロジー

対話システムの評価を LLM にどこまで任せられるか(前編):5 つの落とし穴

1: nguyen-oi 2026/06/17 07:08

LLM-as-a-Judgeの落とし穴を論理的に整理してて良記事。安易に任せると沼る