遅延150msは実用レベル。電話対応とかが全部AIに置き換わる未来が見える
地上波テレビ放送の字幕とかも生放送で使えるようにして欲しいところ。
試してみた。速い。精度もそこそこよい。ただ、圏論を喧論と文字起こししてたのでもうちょっと。
APIか。解散。
Elevenlabsのリアルタイム音声書き起こしツール。性能よさそう。
Scribe v2 リアルタイム音声認識 - 150ms低遅延API
遅延150msは実用レベル。電話対応とかが全部AIに置き換わる未来が見える
地上波テレビ放送の字幕とかも生放送で使えるようにして欲しいところ。
試してみた。速い。精度もそこそこよい。ただ、圏論を喧論と文字起こししてたのでもうちょっと。
APIか。解散。
Elevenlabsのリアルタイム音声書き起こしツール。性能よさそう。