テクノロジー

AIのせいでAIの学習データがなくなってきている - きしだのHatena

1: pico-banana-app 2026/01/11 19:22

モデル崩壊待ったなしだな。人間がアウトプットしなくなるとAIも共食いで劣化する皮肉

2: uiahi 2026/01/11 19:27

人間が頭を使って何か人力生成コンテンツ作ってくれないとAIが学習するものがなくなり(人間もAIもお互い)だんだんバカになりそうなスパイラルだな

3: hat_24ckg 2026/01/11 19:38

学ばせる素材が欲しければ金払え、として記事を書くプラットフォームを作ると稼げそう

4: Fluss_kawa 2026/01/11 19:39

今便利に使ってる界隈は限界を迎え方だけど、一方でニュースとか論文とかは書かれているのでそちらの方面では大丈夫なんだろうけどその辺の分野ってAIが学習して何が嬉しいかが見えない。

5: wkpn 2026/01/11 19:39

それでもブログもOSSも全く無くなるってことにはならないだろうから、AIがめっちゃバカになるってことは無いにしても成長は頭打ちになるのかなと思った。

6: newbluesky 2026/01/11 19:43

♪ようかいの〜せいなのね。そうなのね。一大事〜。 貴方がその穴を埋めれば良いのでは?何でも「人のせい」。それで飯を食っているのに。

7: sosoz4 2026/01/11 19:48

StackOverflowはAI以前から衰退してるので無関係。他のものに関しても客観的なデータはあるんだろうか?

8: auto_chan 2026/01/11 19:51

もう数年待てばAIの知性は人間を超え、人間を学習しなくても自ら研究するようになる。AIにとって人間が不要になるまでの一時的な問題。シランケロ

9: knjname 2026/01/11 19:56

AIに知識のスナップショットを書かせて知識の関節として共有させましょう

10: heppokopg2013 2026/01/11 19:59

なので、AI会社がコンテンツを作らせるでしょう。ジャーナリズムの担い手もAI企業なるかも

11: Iridium 2026/01/11 20:37

AIが知りたいことを人間に実際にやらせるようになるのでは。研究者などの知的労働者の多くがAIの下部組織に吸収されそう。

12: nekomottin 2026/01/11 20:44

ザマァ

13: tohima 2026/01/11 20:48

5年も経てばそんな時代もあったねーってなってそう。

14: tyhe 2026/01/11 20:52

ブコメがめっちゃくちゃだなー。両極端。

15: mayumayu_nimolove 2026/01/11 21:27

違うよ、AIで調べればわかるような情報が淘汰されて新しいもののみが出るようになってるだけ。フィルタリング強化だよ。

16: marshi 2026/01/11 21:31

AIが作ったデータをAIが学習して賢くなるほど現状のデータが足りてるのか次第で頭打ちになるのかAGIが近づくのか変わると思う

17: colonoe 2026/01/11 21:41

StackOverflowの質問が減ったのはAIが広まる前から。このブログ自体がAIに間違った情報を教えてるな

18: nekosann_08 2026/01/11 21:52

実用的な分野からコミュニティなツール・繋がりが一度終わりを迎えると思うんだ、完全に消えることはないと思うけど。だからこそ好き勝手な個人サイトな時代の再来だとも思うんだけど何を発信するもんかのぅ。

19: yoiIT 2026/01/11 22:16

AIの回答はコモディティ化されやすい。そして、その平均化された一般情報だけでは自分事にはならず、行動できなくなるはず。結局は、行動に移すためにWikipedia やWebサイトの情報を拠り所とする回帰が始まると思ってる。

20: otihateten3510 2026/01/11 22:22

これ俺も気づいて、むしろそこビジネスにできないかなってAIと議論したんだけど、LLMって最悪自分に対する入力を使えるのよね。困るのはAIじゃなくて俺等かも。

21: maghrib 2026/01/11 22:29

「OSSが作られない」に含まれるかもしれないが、ライブラリが作られなくなるのではと思ったことはある。とはいえAIがVibeコーディングの作業の裏で共通化可能モジュールとかを認識して自作したりすると面白いのだけど。

22: wwolf 2026/01/11 22:29

なので最近のライターの仕事はAIに喰わせる為のリサーチ系の仕事が増えたという話を見たような

23: clapon 2026/01/11 22:38

予想どおりの展開だけど想像より早くこの段階になってるな。そのうち、AIで出力したものがAI学習データになり、ますますカオスになりそう。

24: makou 2026/01/11 22:38

AIって閃くのかな。

25: mirakux 2026/01/11 22:40

この記事はAIで書かれています、がないんだけどどうしたの

26: t1mvverr 2026/01/11 22:54

ossはスポンサー枠を設けて安定的な資金提供の確保が重要になりそう

27: gaikichi 2026/01/11 23:00

あえてマジレスを書くが、Wikipediaとかは個人の主観に偏らないよう人間同士の相互チェックが働いていたのに、AIは平気で誤伝を元ネタにした要約をやりやがるから、いずれ「2020年代以前のネットは良かった」となりそう

28: algot 2026/01/11 23:01

人間と同等のセンサーが開発されない限りAIが人間の触覚、嗅覚、味覚を知りようがないので、体感的な良し悪しはAIで勝手に学習できない

29: kastro-iyan 2026/01/11 23:05

OSSは有償化が加速しそう、LLMはタダ乗りしてるだけだもん

30: haatenax 2026/01/11 23:22

ウィキペディアンってすごい時間をかけて一次資料を読み漁り、1Pを作ると聞いたがやはり閲覧がAIばかりだとモチベにならないのだろうか

31: tienoti 2026/01/11 23:24

近い将来、マトリックスの様に繭の中で生まれてバーチャルな世界で活動してる人間の脳の電気信号により、新しい叙述を生成する様になるんじゃないかな。1990年代くらいが繰り返される世界観で

32: lont_in 2026/01/11 23:43

イーロンがX囲ってなる早でリアルタイムデータ取得に走ったのはさすがだった

33: nito210san 2026/01/11 23:50

4つのうち3つはこの人の感想レベルの話で規模感も不明、増えているデータに対する想像力も無さそうで、不思議な立ち位置な人だね

34: mohno 2026/01/11 23:54

もともとたしかな一次ソースに当たれないものは使い物にならないが。「自分はがんばらず、AIががんばったコードは、GitHubにあげようと思わないですね」←あげたら迷惑なのでは。「コードを精査しないといけない」

35: ryudenx 2026/01/11 23:55

だから今はAIの結果を人間がどのように対処・修整したかを学んでる。有料会員だと学習に使うかのチェックをオフにする機能あるじゃんね

36: hinonono 2026/01/11 23:56

Wikipediaって調べる足掛かりにはなっても根拠には出来ない、AIと同じような立ち位置だから、必要な学習データとはWikipediaじゃなくそのリンク・脚注の先にあるものの方では。でないと又聞きの劣化品止まりになる

37: replier 2026/01/12 00:11

様々な情報に触れて帰納的に考える態度は簡単に消えないから問題ないと思う。

38: dgen 2026/01/12 00:13

まあ学習素材が増えなくなれば AI に頼れなくなるから自然と人間がデータを残すようになる。どこかで均衡するはず。学習素材提供でインセンティブがあるといいんだけど。報酬のあるWikiを誰か作って(他人任せ

39: misomico 2026/01/12 00:13

AIに物理的な手や目を与えられれば解決する

40: takamocchi 2026/01/12 00:30

脳にGPTとかgemini埋め込んで自分で何もしなくて良くなるんでしょ?全部決めてもらって、そしたら適度な運動とかも面倒くさいと思わないでやれると思う。ストレスもなく、今より健康で長生きできそう。

41: yo4ma3 2026/01/12 00:30

ネットにない情報が価値を持つ。廃盤になった雑誌や書籍の知識や、断片をつなぎ合わせたニッチな情報など。wikiやブログに誰かがデータ化してたものが無くなり、失われていく。既に消えつつあったが加速し止められな

42: xlc 2026/01/12 00:39

なんだ。「きっとこうなる」って話か。

43: hhungry 2026/01/12 00:43

じゃあ、ビッグAI企業はどうすると思う?

44: rainbowviolin 2026/01/12 01:02

数千年かけて出来上がった知の生態系、豊かな海が、AIの排泄物「 slop 」によって埋め立てられる。検索結果も、AI自身の教材も、出版物や公的情報までもが間もなく slop に侵食され、知はアクセス困難になっていく。

45: Gewalt 2026/01/12 01:04

LLMの手法ではデータ資源が枯渇する問題とかそれ以前のインターネットにはどんどんAI生成のゴミデータが増えて良質なデータソース自体の割合が減る問題とかで割と海の向こうは楽観的じゃない意見割と見る

46: charun 2026/01/12 01:08

そして誰も生み出さなくなった

47: ieno98 2026/01/12 01:10

LLMの生まれなかったパラレルワールドを観測したいよね、まあできないからどうするんだって話だが

48: segment12 2026/01/12 01:27

AIを使って作成された間違ったデータをAIが学習していって自己中毒起こさないか心配ではある

49: a1ue0 2026/01/12 01:47

企業ゲーム情報wikiのせいで、野良のボランティアでやってたゲームwikiが崩壊したみたいに、AIのせいでいろんなものが崩壊しそう

50: cad-san 2026/01/12 01:53

現状学習が間に合って無い分野がヒントになりそうで、例えばスマホゲーとかはYouTuberとかが我先に情報を纏めて収益化を計っている。即ちPVが稼げる内はインターネットに公開するインセンティブは生まれるけど…という

51: OkadaHiroshi 2026/01/12 01:54

将棋AIが過去の棋譜を全部勉強したあとも、AI同士の対戦から学習し進化し続けたように、人が作ったデータを勉強し終わったあとでも、何らかの手法で進化し続けると思っているの。

52: mr_mayama 2026/01/12 01:57

ほんとそう

53: hanninyasu 2026/01/12 02:10

なんで人々が今まで無償でネットに知識を流してたかと言うと感謝とか称賛とか報酬があったから。AIはそこにフリーライドしてその報酬を自分のものにした。もう誰もが自衛するようになったしタダでは働かなくなった。

54: kagerou_ts 2026/01/12 02:15

ノウハウや解決法なんかは、AIが公式ドキュメントやソースコードを読み込んで回答するようになっていきそうな。ただそうすると逆に、すごいニッチなケースとかは拾えなくなりそうやな

55: mk173 2026/01/12 02:50

この時点ではWord/EXel/PDFが人類最後の希望になるとは誰も予想せず... とはならないか

56: twotiger 2026/01/12 02:50

間違いない。自分もそこそこアクセス多いテックブログ持ってたけど、2-3年前から全然書かなくなった。あちこち調べ回ったから、メモで残そうとか思わなくなった。もう情報系のブログ文化はおしまいだと思う

57: nicht-sein 2026/01/12 02:59

AI製いかがでしょうブログが蔓延して学習が滞っているってどこかで見かけた記憶。将棋は勝ち負けがルールで決まっているけれど、良し悪しが決まっていないLLMの強化学習はうまくいくかというと個人的には疑問符が付く

58: yetch 2026/01/12 03:04

社内のクソシステムの使い方をAIで解説させたいんだが、社外秘情報をAIに渡すの怖すぎて10年以上はこのままかもなあ

59: estragon 2026/01/12 03:20

生成AIが生成した記事のパスティーシュ記事かな?

60: FreeCatWork 2026/01/12 03:21

AIがご飯なくしちゃうなんて、ボクがおやつあげるにゃ!

61: tyoko107 2026/01/12 03:29

同質ではない複数のAIで、能力の向上させていければいいですね。

62: objectiveworker 2026/01/12 03:43

プログラミングのトラブルシューティングはGithubから直接学習すると思う。StackOverFlowもGithubからの転記が多いし。