中身見てみたけど、法令は金商法、薬機法、借地借家法のみ。問題数も140問しかなかった…作るの大変だろうから文句は言えないけど
デジタル庁が法務AIの評価データセット公開か。これでお役所の仕事も少しはマシになるんかねw
“同データセットは、GitHubで公開中。ライセンスは、同庁が定める「公共データ利用規約(第1.0版)」で、利用ルールのもと商用利用もできる”
当たり前かもしれないが経理のほんのちょっと突っ込んだ質問程度でも正しい答えは返ってこないことが多いので法務は余計にそうなのでは
プロンプト次第なのかもしれないが、普通に聞いてもまともに法令検索してくれないから知ったかぶりな回答しか出ないんだよね。チャッピーの話です。
法務がAI使いだしたら終わりだろ
労働基準法を最優先で頼む
それこそ安野が詳しいんじゃないの
専用LLMがそのうちできそう
まあこんなもんだよね。プログラミングもこのくらいの感覚なので合ってると思う。(人間がやったら100点出るわけでもないと思えないが)
「法務でAIがどこまで使えるか」を測るデータセット、デジタル庁が公開
中身見てみたけど、法令は金商法、薬機法、借地借家法のみ。問題数も140問しかなかった…作るの大変だろうから文句は言えないけど
デジタル庁が法務AIの評価データセット公開か。これでお役所の仕事も少しはマシになるんかねw
“同データセットは、GitHubで公開中。ライセンスは、同庁が定める「公共データ利用規約(第1.0版)」で、利用ルールのもと商用利用もできる”
当たり前かもしれないが経理のほんのちょっと突っ込んだ質問程度でも正しい答えは返ってこないことが多いので法務は余計にそうなのでは
プロンプト次第なのかもしれないが、普通に聞いてもまともに法令検索してくれないから知ったかぶりな回答しか出ないんだよね。チャッピーの話です。
法務がAI使いだしたら終わりだろ
労働基準法を最優先で頼む
それこそ安野が詳しいんじゃないの
専用LLMがそのうちできそう
まあこんなもんだよね。プログラミングもこのくらいの感覚なので合ってると思う。(人間がやったら100点出るわけでもないと思えないが)