クリーンなAI開発を応援したい 許可されていない著作物からの学習が明確にアウトな世界線に辿り着きたいので
すごい。ただ画像はこのデータセットには無さそうだ
本質的には著作権とかじゃなくて食い扶持を奪うなだから既存クリエイターはAIがクリーンかどうかはあんまり心動かされないと想像する
著作権問題解決したらしたでまた別の観点から難癖付けてくるんじゃないの?(笑)
“フィルタリング: 非英語コンテンツや低品質なテキストを除去。” / 次は国会図書館の出番かな。在野がやるには規模がデカすぎるし。
権利ガーというのは建前で反AIの本音は「AIに腕で負けるのが嫌」という我儘に端を発するラッダイト運動。画像ならAdobeのAIはとっくにクリーンなわけで連中はAI技術を破棄させるまで暴れるだろう
すばらしい(´-`)日本も日本語のオープンなデータセットを整えてほしい。つかNHKのをオープンにしようぜ
引用の要件を満たした無断の引用は「クリーンじゃ無い」引用なの?
引用、先行研究、アイデアなど、他者の著作物を土台にすることはむしろ必須。その繰り返しを源泉に各作品の価値が雪だるま式に積み上がり、ファンタジー、RPG系なろう等の「ジャンル」の形で巨大な価値となることも。
しかしClaudeを作るのに Redditの情報は必須なんだろうなあ
で、お前ら天然知能はオープンデータだけで学習してきたの?誰かの漫画に似た絵や誰かの小説に似た文章書かねえの?AIによる学習を禁じるってことはそういう話になるんだが?
crmea「許可されていない著作物からの学習が明確にアウト」こんな都合のいい綺麗事言ってんじゃねえよ。どうせYOUTUBEで違法アップされたお笑い見ながら書いてるんでしょ。
無断学習とやらで作られた翻訳AIには文句言わないどころか使っていい理由のこじつけを始めるので、そもそも著作権問題じゃない
クリーンな生成AIができると泥棒の誹りを免れない輩がなんか色々言ってるな
日本では著作権問題なんて存在しないので、是非データセット作ってください。翻訳や検索で無断学習されたコンテンツを散々利用しているのに、イラストだけ特例扱いを要求することほど阿呆で糞馬鹿なことはないので。
既に"クリーン"なAdobeを反AIは認めないように、結局のところ性能が上がるとヒスり始めるので付き合うだけ無駄だよ
努力は認めるがこれじゃ駄目だろうな。
同時に公開LLM開発は事前学習から強化学習ってことになるかもね。
いいねー。こういうので、どんどんアホ共を追い詰めていって欲しい。あとwebの玉石混交のデータより、洗練されたデータの方が効率も性能も高くなるんじゃないかと思う。
名前が微妙
8TBくらいで、十分な性能が出るんだな。もっと巨大なデータセットが必要なのかと思ってた。
AIの著作権問題に終止符か? 8TBの巨大オープンデータセット「Common Pile」登場、Llama 2に匹敵するLLMもリリース | XenoSpectrum
クリーンなAI開発を応援したい 許可されていない著作物からの学習が明確にアウトな世界線に辿り着きたいので
すごい。ただ画像はこのデータセットには無さそうだ
本質的には著作権とかじゃなくて食い扶持を奪うなだから既存クリエイターはAIがクリーンかどうかはあんまり心動かされないと想像する
著作権問題解決したらしたでまた別の観点から難癖付けてくるんじゃないの?(笑)
“フィルタリング: 非英語コンテンツや低品質なテキストを除去。” / 次は国会図書館の出番かな。在野がやるには規模がデカすぎるし。
権利ガーというのは建前で反AIの本音は「AIに腕で負けるのが嫌」という我儘に端を発するラッダイト運動。画像ならAdobeのAIはとっくにクリーンなわけで連中はAI技術を破棄させるまで暴れるだろう
すばらしい(´-`)日本も日本語のオープンなデータセットを整えてほしい。つかNHKのをオープンにしようぜ
引用の要件を満たした無断の引用は「クリーンじゃ無い」引用なの?
引用、先行研究、アイデアなど、他者の著作物を土台にすることはむしろ必須。その繰り返しを源泉に各作品の価値が雪だるま式に積み上がり、ファンタジー、RPG系なろう等の「ジャンル」の形で巨大な価値となることも。
しかしClaudeを作るのに Redditの情報は必須なんだろうなあ
で、お前ら天然知能はオープンデータだけで学習してきたの?誰かの漫画に似た絵や誰かの小説に似た文章書かねえの?AIによる学習を禁じるってことはそういう話になるんだが?
crmea「許可されていない著作物からの学習が明確にアウト」こんな都合のいい綺麗事言ってんじゃねえよ。どうせYOUTUBEで違法アップされたお笑い見ながら書いてるんでしょ。
無断学習とやらで作られた翻訳AIには文句言わないどころか使っていい理由のこじつけを始めるので、そもそも著作権問題じゃない
クリーンな生成AIができると泥棒の誹りを免れない輩がなんか色々言ってるな
日本では著作権問題なんて存在しないので、是非データセット作ってください。翻訳や検索で無断学習されたコンテンツを散々利用しているのに、イラストだけ特例扱いを要求することほど阿呆で糞馬鹿なことはないので。
既に"クリーン"なAdobeを反AIは認めないように、結局のところ性能が上がるとヒスり始めるので付き合うだけ無駄だよ
努力は認めるがこれじゃ駄目だろうな。
同時に公開LLM開発は事前学習から強化学習ってことになるかもね。
いいねー。こういうので、どんどんアホ共を追い詰めていって欲しい。あとwebの玉石混交のデータより、洗練されたデータの方が効率も性能も高くなるんじゃないかと思う。
名前が微妙
8TBくらいで、十分な性能が出るんだな。もっと巨大なデータセットが必要なのかと思ってた。