はてなまとめ - AIプロダクトの品質をどう守る？

1: mkusaka 2026/02/17 02:18

LayerX事例で、就業規則（平均50ページ）から有休付与ルールをAIが生成し、各パターンを10回実行して精度90%を受け入れ基準とするLangfuseとrunnによる評価・テスト手法を解説。

2: hogetax 2026/02/17 06:55

講演用のスライドだろうか？聞いてみたかったなぁ

3: nguyen-oi 2026/02/17 07:23

AIの「確率」にエンジニアがどう立ち向かうか。Langfuseとかの評価ツール活用事例は泥臭くて参考になる

4: otihateten3510 2026/02/17 08:30

抽象的で俺には難しい、問題提起は賛成する

5: ihirokyx 2026/02/17 08:52

スコアリング期待値明示フィードバック

6: omega314 2026/02/17 09:41

AI生成画像が挟まると目が滑る。

7: nilab 2026/02/17 09:46

AIプロダクトの品質をどう守る？ - Speaker Deck

8: hogeaegxa 2026/02/17 09:47

うだうだ言っても少なくともWeb系はAIに「品質チェックして問題あれば修正してください」って打ち込んで満足するだけの世界になるんじゃない？

9: kobito19 2026/02/17 10:29

10: hitotakuchan 2026/02/17 10:49

langextract がハマりそう

11: eagleyama 2026/02/17 11:18

テストの設計と運用に人力が入りますと。ここをAIにすると、悪夢の無限連鎖が発生するし

12: shikiarai 2026/02/17 11:48

一般化しないとQAのノウハウも熟成しないだろうし枯れるまで様子見が一番楽

13: hecaton55 2026/02/17 14:57

品質チェックに関しては人間が関与することになるよな。結局責任を取る人間がどこまでチェックするのかというお話になるか？

14: goha5800 2026/02/17 15:00

googleとか、一方でnano bananaだveoだと、もっとAIで画像作れ、動画作れといって、YouTubeで「いかにAI動画だけ自動的に選別してシャドウバンするか」ってやってて、お前らはAI使わせたいのか反対なのかどっちやねんって思う

15: syu-m-5151 2026/02/18 06:14

この辺はまだ全然枯れてこない…モデルがどれだけ進化、変化するかで全然答えが違ったりしそう…。1年前の常識が通用しないの勘弁してくれ…。

16: k1LoW 2026/02/19 09:57

品質維持のためのリグレッションテスト用途でのrunn活用。なるほど。ありがとうございます！

17: minamishinji 2026/02/19 14:19

なるほどなぁ。 / この分野で枯れるまで待ってられるの、すごいな。