テクノロジー

Whisperを超える精度のリアルタイム文字起こしローカルAI「Moonshine Voice」、日本語にも対応(生成AIクローズアップ) | テクノエッジ TechnoEdge

1: Seamless 2026/03/02 08:28

会話を即座に文章にするオープンMoonshine Voice(2.5億パラメータ)がWhisper(15億)を上回る精度。ラズパイに実装可能。話者識別や音声コマンドも装備

2: kusaret 2026/03/02 10:55

Amicalで使ってみたい

3: kalmalogy 2026/03/02 11:13

おお。

4: dickbruna 2026/03/02 12:15

会議のサマライズ目的の文字起こし、Large v3 turboに頼り切ってるのでこれは朗報かも。

5: simila 2026/03/02 12:22

ウィスパーの次は月の輝きか。どうしても月経と絡めてくる界隈かよ

6: kurage_lizard 2026/03/02 13:05

whisperは日本語だとしょうもなくていつ改善されるんだろうって思っていたがこれは期待して良いのだろうか / これもそんなに変わってなさそう、GPUなくても動くのはすごいけどね

7: NEXTAltair 2026/03/02 14:25

Windowsの音声入力と同時に動かしてみるとWindowsデフォルトでついてる音声入力の方が性能自体は良さそう。 whisperは音ファイルとかから一気に文字起こしに使うんだって微妙に使い道が違うきがする

8: T-norf 2026/03/02 15:18

生成AIのシステム応用は、一定割合は音声関連になると思うので気になる。ただ、よほど画期的じゃないと、古くてメジャーなツール名しかググっても出てこず、使う場面まで覚えていられるかなspeach to text , speach 2 text

9: swdrsker 2026/03/02 16:20

Typelessの代用になるか

10: Imamura 2026/03/02 16:43

Whisperは時々全然聞き取ってないくだりが入るので2回通してる。1回目に聞き取らなかったところを2回目はちゃんと文字に起こしてることがある(2回目に聞き取り失敗するところもある)。これはどうかなー

11: misshiki 2026/03/02 17:13

ローカルで動く音声AI「Moonshine Voice」はWhisperを超える精度と低遅延処理を実現し、日本語など多言語対応。Raspberry Piなど軽量機器でも動作可能。

12: j74th 2026/03/02 19:27

音声認識、ラズパイでも動くらしい

13: dollarss 2026/03/02 19:30

音声書き起こしローカルAI

14: spark64 2026/03/02 19:53

日本語エラー率13%てのは高いのか低いのか。Streamもあるのかないのか

15: kyahi227 2026/03/02 20:09

AIに関してGoogleのクラウド提供物以外は全般的に日本語対応が著しく劣るのは仕方ないだろ。Googleとそれ以外では抱えてるデータや専門家が質量共に違いすぎる。

16: mkn_coach 2026/03/03 01:40

+

17: haususuahahdh 2026/03/03 02:01

whisperって無料でローカルで使えるってだけで大して性能良くないよな。

18: IGA-OS 2026/03/03 07:58

“日本語を含むその他の言語モデルは非商用利用に限られる「Moonshine Community License」での提供” 残念