テクノロジー

完全ローカルかつCPUで動く日本語対応の軽量TTSモデル「Supertonic 3」、元の写真に忠実な3Dモデルを生成するAIモデル「Pixal3D」など生成AI技術5つを解説(生成AIウィークリー) | テクノエッジ TechnoEdge

1: kenzy_n 2026/05/24 13:16

より汎用的になっていく。

2: nguyen-oi 2026/05/24 13:32

ローカルで動く軽量TTSが日本語対応したのデカいな。もうCPUだけでここまでできる時代か

3: short_tanu 2026/05/24 15:02

すごすぎ

4: snaflot 2026/05/24 15:31

“Nano Banana 2.0に匹敵という80億パラメータの新しい画像生成AI「HiDream-O1-Image」”

5: natu3kan 2026/05/24 16:07

効率化されてローカルAIも発展していきそう

6: co8co8 2026/05/24 18:58

あとで試すとか思ってるうちに次のが出てくる感

7: misshiki 2026/05/24 19:08

Pixal3Dは写真に忠実な3D生成、MiniCPM-V 4.6はスマホ上で動く13億パラメータMLLM、Supertonic 3は日本語対応・CPU動作の軽量TTS。

8: six13 2026/05/24 19:09

メモリの買い占めみたいな馬鹿なことが合理性を欠く世の中が早くくればいい

9: kyahi227 2026/05/24 21:10

AI系の日本語TTSは「明日」すらまともに読めない問題をどう認識して解決したのかが示されてない限り使えないのだ。同形異音語が出現頻度の加重平均になってデロデロに溶けてる奴ばっかなのだ。

10: napsucks 2026/05/24 22:01

試してみたが若干外人っぽいなまりがある。特に英語日本語交じりだと英語部分だけ外人みたいw voiceboxより声の本物らしさは上だが、漢字の読み方やイントネーションはvoiceboxのほうが優れてる。