概要
Voice AI企業のSpeechifyは、ネイティブなWindowsアプリをリリースしました。このアプリでは、地元に保存されたモデルを使用して、他のアプリケーションでの音声入力を可能とし、記事やドキュメント、PDFなどを読み上げる機能も提供しています。
主要な特徴
SpeechifyのWindowsアプリは、Copilot+ PC(AMD、Intel、QualcommのNPUを搭載)および他のWindows 11 PC(IntelやAMDのGPUを搭載)で音声処理をデバイス上で行います。このアプリには、ニューラルテキスト読み上げ、リアルタイム音声検出、Whisperによる文字起こしという3つのモデルが含まれています。
ユーザー設定
ユーザーはアプリをクラウドベースのモデルに切り替えるか、使用中にモデルを変更することも可能です。Speechifyは、VITS Neuralを使用して7種類の速度プリセットで音声を生成し、Sileroオープンソースモデルを使用して音声活動検出を行っています。
CEOからのコメント
「世界中の10億人以上の人がWindowsを使っています。このWindowsアプリのリリースにより、読むことや書くことがどんなデバイスでも障害なく行えることを保証します。特に企業での機会に興奮しています。多くのプロフェッショナルがPCでSpeechifyを求めていました」と、SpeechifyのCEOであるCliff Weitzman氏は述べています。
今後の展開
Speechifyは最近、Granolaのようなミーティング文字起こし機能をリリースしましたが、これはブラウザベースのミーティングに限定されていました。今後、この機能がネイティブアプリで利用可能になる予定です。
