今や日本語もだいぶ自然な感じで発声できるんですね。あと日本語の文章中に英単語入れると、ちゃんとカタカナ読みしてくれるのも気が利いてる。
OpenAIの最新のオーディオモデルのデモ画面。日本語も流暢で漢字も読めた。日本語中の英語は割と日本語英語で読むの地味にすごい。API経由ですでに実利用できる。https://openai.com/index/introducing-our-next-generation-audio-models/
マカフィーのウェbアドヴァイザーw
まず読み方の精度から高い(ノ∀`)
とりあえず「くぁwせdrftgyふじこ」を音読させた / 「ひぇぇ〜〜」はきちんと驚いてくれるし、方言もわりと再現してくれる / Coral がCV 三瓶由布子みたいな青年声だった
おお
Notionに埋め込みたい。ドキュメントを音声で要約して欲しい。
OpenAIのtext-to-speech modelのデモ。結構日本語もちゃんと読んでくれるので、普通に動画とかに使える音声として行けそう
このレベルならオーディオブックとして悪くない。OCRオーディオ再生機能としてOSに組み込んで欲しい。
IPA表記の発声とかできるのかしら
これ商用利用できるのかな?
素晴らしいな。そのうち動画もセリフも自動化されて、開発についてのyoutubeチャンネルが出来そうだ
APIを使った開発者向けのデモ。好きな声色にして、コードスニペット例を表示できる
https://support.google.com/edu/classroom/thread/332572092?hl=en&sjid=14234667637214030921-NC
無料でgpt-4o-mini-ttsを試せるデモ。
iphoneでは動かない?
z
あとで試す
発音は大分良くなった、漢字の読みだけ頼む
iPhoneははてブアプリでは動かないけどSafariなら動きます(私のiPhoneではそうです)
声によって「ゴジラ-1.0」をちゃんと「マイナスいってんゼロ」と読めたり読めなかったりする。不思議。
まさかCoralはスカブコーラルでレントンだから三瓶由布子さん・・・ってコト?まさかねw
とりあえずルイズ!ルイズ!ルイズ!ルイズぅぅうううわぁああああああああああああああああああああああん!!!あぁああああ…ああ…あっあっー!あぁああああああ!!!ルイズルイズルイズぅううぁわぁああああ!!!
音声生成
これなら会社で使えるかも
何度も再生してみると、ときおりハルシネーションが起こる。
言語と音声信号の翻訳みたいなタスクなのかな
多分スマホでも利用できちゃうけど敢えて使えないようにしてる。んじゃ無いとサーバー吹っ飛ぶ。
普通にスマホ(Safari/Chrome)で使えるけどな…(はてブのアプリ内ブラウザだと使えないので、勘違いしてるんだと思うけど)
OpenAI.fm
今や日本語もだいぶ自然な感じで発声できるんですね。あと日本語の文章中に英単語入れると、ちゃんとカタカナ読みしてくれるのも気が利いてる。
OpenAIの最新のオーディオモデルのデモ画面。日本語も流暢で漢字も読めた。日本語中の英語は割と日本語英語で読むの地味にすごい。API経由ですでに実利用できる。https://openai.com/index/introducing-our-next-generation-audio-models/
マカフィーのウェbアドヴァイザーw
まず読み方の精度から高い(ノ∀`)
とりあえず「くぁwせdrftgyふじこ」を音読させた / 「ひぇぇ〜〜」はきちんと驚いてくれるし、方言もわりと再現してくれる / Coral がCV 三瓶由布子みたいな青年声だった
おお
Notionに埋め込みたい。ドキュメントを音声で要約して欲しい。
OpenAIのtext-to-speech modelのデモ。結構日本語もちゃんと読んでくれるので、普通に動画とかに使える音声として行けそう
このレベルならオーディオブックとして悪くない。OCRオーディオ再生機能としてOSに組み込んで欲しい。
IPA表記の発声とかできるのかしら
これ商用利用できるのかな?
素晴らしいな。そのうち動画もセリフも自動化されて、開発についてのyoutubeチャンネルが出来そうだ
APIを使った開発者向けのデモ。好きな声色にして、コードスニペット例を表示できる
https://support.google.com/edu/classroom/thread/332572092?hl=en&sjid=14234667637214030921-NC
無料でgpt-4o-mini-ttsを試せるデモ。
iphoneでは動かない?
z
あとで試す
発音は大分良くなった、漢字の読みだけ頼む
iPhoneははてブアプリでは動かないけどSafariなら動きます(私のiPhoneではそうです)
声によって「ゴジラ-1.0」をちゃんと「マイナスいってんゼロ」と読めたり読めなかったりする。不思議。
まさかCoralはスカブコーラルでレントンだから三瓶由布子さん・・・ってコト?まさかねw
とりあえずルイズ!ルイズ!ルイズ!ルイズぅぅうううわぁああああああああああああああああああああああん!!!あぁああああ…ああ…あっあっー!あぁああああああ!!!ルイズルイズルイズぅううぁわぁああああ!!!
音声生成
これなら会社で使えるかも
何度も再生してみると、ときおりハルシネーションが起こる。
言語と音声信号の翻訳みたいなタスクなのかな
多分スマホでも利用できちゃうけど敢えて使えないようにしてる。んじゃ無いとサーバー吹っ飛ぶ。
普通にスマホ(Safari/Chrome)で使えるけどな…(はてブのアプリ内ブラウザだと使えないので、勘違いしてるんだと思うけど)