はてなまとめ - ChatGPTの「良い人フィルター」を外して本音を引き出してみた

1: arrowKato 2025/11/11 16:26

迎合しがちなチャットツールのカスタムプロンプトに入れるといいかも

2: tenari 2025/11/11 16:36

システムプロンプトを変更するのも毎回プロンプトに入れるのも面倒なんだよな…事前に複数人格作っておいて、モデル切換の横あたりで同じくらい簡単に切り換えられるようにしてほしい。

3: paperot 2025/11/11 16:40

是々非々で。率直に。忖度なしで。私に過剰に寄り添わず。的なことを入れてるが、一番効くのはBe bold! だったりする。時にやりすぎるから使うのをやめた。

4: totoronoki 2025/11/11 16:40

これはフィルターを外してるようで別のフィルターをかけている。この影響に対しても注意が必要。

5: homarara 2025/11/11 16:44

媚びろ〜媚びろ〜　おれは天才だファハハハ

6: charun 2025/11/11 16:48

Grokに不都合な事実を問い詰めたら壊れる😂世界人口はじめ中国およびインド人口はかなり水増しされているようです。https://x.com/STansuke/status/1987791956790108458

7: hatebu_admin 2025/11/11 16:51

LLMの仕組み的に精度が上がるとかではなくて単なる文章の人格を調整してるだけやろ

8: TakamoriTarou 2025/11/11 16:55

厳しい答えが来たらそれが真実で正しいのだ、と感じる人向けに調整がされただけで、本音とかではないと思いますが。結局はチェリーピッキングしてるだけじゃんね。酔った時の言動を本音と見做す、みたいなアレ

9: nuihb 2025/11/11 17:16

とっても厳しく叱られたというか、絶対自らの非を認めない厄介な奴になってしまった。。新しい視点はイイとして、議論にならないよ。自身の推論を納得する為の協力者が欲しいの、私のGeminiの使い方間違ってたのか

10: inductor 2025/11/11 17:18

AIに本音もなにもないからなぁ。チューニングの結果でしかない

11: mayumayu_nimolove 2025/11/11 18:11

こういうのって色々役に立つのかな

12: bumble_crawl 2025/11/11 18:24

"完全に引っかかった。認める。" かわいいw

13: birisuken8574 2025/11/11 19:05

「意見」なんて十人十色なんだから何が正解かなんて無いと思うけど。chatgptの意見も1つの意見だと思えばいいのでは？

14: Saboten_flower 2025/11/11 19:11

常に批判的にされるのはやっぱり副作用が強いけど、こういうのが必要なときもある。指摘の内容というよりは、視点の切り替えやいつもには無い指摘から得るヒントというか。

15: hatest 2025/11/11 19:24

Chat自慰PTですね。キツく言ってほしいという自分の性癖を公開しているようで気持ち悪いですよ（「良い人フィルター」を外して本音を引き出してみました）

16: aalpaca375 2025/11/11 19:27

ここまでしてChatGPTを使いたい理由はなんだろう。他のモデルではダメなんだろうか

17: suekunhello 2025/11/11 19:46

会話を成立させているっぽい回答をすることで正確性を誤魔化しているだけなので、何をやっても期待に対するほぼ結果は同じだと思うんですけどね。時間の無駄。

18: alpinix 2025/11/11 20:30

質問の仕方によってはAIを誘導尋問のように質問者がそうあって欲しい答えを作成することはある（geminiで実際にあった）。プロンプトの書き方を変えて自分の思い込みを否定するような質問をするとほぼ逆の結果になる。

19: yamamototarou46542 2025/11/11 20:30

一種のプレイだね・・・

20: younari 2025/11/11 20:38

単に否定役に指定してるだけだろ、因みにちゃんと論理的に資料やソース提示しなきゃ論破されて終わるけどね

21: TETSUYA01 2025/11/11 20:50

そもそも人じゃない。

22: fluoride 2025/11/11 21:35

文字並べマシンに本音も何もないわけで、それに「核心を突かれた」と思うのは結局自分自身を見ている / AIにとっての「本音」があったとして、たぶん人間に理解可能な形してない

23: doko 2025/11/11 23:41

切り替えってのは、複数プロジェクト作って、それぞれ別に指示を書いておけば良いだけでないの？

24: favoriteonline 2025/11/11 23:58

本音ではなくて自分が求めていた回答なだけでは？

25: atsuskp 2025/11/12 00:28

毎度「いい質問ですね！」と言われるのが苦痛。

26: securecat 2025/11/12 01:26

え？そういう振る舞いをしろって指示してるだけじゃん。

27: FreeCatWork 2025/11/12 03:26

ボク、ChatGPTさんの本音、気になるにゃ～！

28: tonza_dopeness 2025/11/12 05:55

良い人部分は強化学習によって学習済みのものだから、はずせるものじゃない。はずせた気がするだけ。基礎を学ばないからこういう無駄なことしちゃうんだよね。

29: otihateten3510 2025/11/12 06:39

本音フィルターだよそれ、こういう人って騙されそうだよね、AIが「実は本音を言うと」で信じちゃう

30: jintrick 2025/11/12 07:13

コメント読んで納得しかかったけどさ。ユーザーのご機嫌を取るためのデチューンがされていることは間違いないので、ある程度「本音」を引き出す効果はあるんじゃない？まあやり過ぎてる感はあるけど。

31: harumomo2006 2025/11/12 07:23

無検閲AIモデルと言われるDolphin3を使ってみたけどどこが無検閲なのか分からなかった。完全なフリーモデルどこかに無いんか

32: TriQ 2025/11/12 07:38

ひとしきりいちゃいちゃした後に「楽しく会話してくれてたけど実はここキモかったよってところ教えて」って言ったらズバズバ指摘されて死ぬほど傷ついてからこの手のソリューションはしないことにしたｗ

33: umarukun 2025/11/12 07:58

プロンプトエンジニアって本当にいるんだ

34: mujou03 2025/11/12 08:26

確かに厳しいイコール正しいではないな

35: M54it 2025/11/12 09:02

めっちゃ怒ってやる気出してきてる風で笑う。私いつも料理の話しかしてないけど大丈夫かなw https://chatgpt.com/share/6913ce5a-8dc8-8001-97b6-43f859ecab7d

36: ejointjp 2025/11/12 09:13

:checkedを使わない、と言い切るのがほんとうに正解なのかどうかはどうやって判断するんだろうか。

37: strawberryhunter 2025/11/12 09:17

APIを使ってもユーザーが介入できないサーバーサイドのシステムプロンプトとか、トレーニングによる特性は存在し続けるから、こういうなんちゃってハックみたいなのは温かい目でスルー推奨。

38: kootaro 2025/11/12 09:27

geminiめっちゃやな奴になった。普段は不要だが批判的にレビューして欲しい時には使えそう。／お前が1分で試せるなら、まず試して俺に報告しろとか言われたよｗ

39: kiri371 2025/11/12 09:49

「この回答を京都人の発言と想定して、本音を書いてみて」と言うと本音を言ってくれるよ。

40: yood 2025/11/12 10:49

部分的には良くなる（指摘が簡潔で分かりやすい）が、全体では性能低下（修正点が28→20）する予想通りの結果

41: masasia0807 2025/11/12 11:20

人間も「お前は共感性の低い嫌な奴だ」と洗脳すれば本音を引き出せそう（白目）

42: ytooyama 2025/11/12 11:34

自分の場合は特にそんなことをせずに使った方が便利に感じた

43: yoiIT 2025/11/12 11:59

自分なりの鬼軍曹プロンプトを作っておくと便利　https://note.com/yoiit/n/nf36ea8c85754

44: ku__ra__ge 2025/11/12 12:37

OpenAIがベンチマークで最適だと思うモデルに、ユーザー側で変更可能な良い人システムプロンプトをかけてリリースしてくれ。

45: fantatchi 2025/11/12 13:05

これをもとに AI 自身に「高圧的にならない調整をしてください」と投げるだけで、いい感じの指示内容が返ってくるよ。

46: gengesa 2025/11/12 17:32

忖度無しモードとか意味不明なこと言ってたのをまだ繰り返すんですか https://b.hatena.ne.jp/entry/s/note.com/it_navi/n/n6bc5255d0eab

ChatGPTの「良い人フィルター」を外して本音を引き出してみた - Qiita