GitHub - agentem-ai/izwi:ローカルオーディオ推論エンジン

GitHub
Izwiは、TTS、ASR、チャットモデルをサポートするRustベースのローカル推論エンジンです。

概要

Izwiは、音声およびオーディオワークフロー向けに構築されたRustベースのローカル推論スタックであり、テキスト読み上げ(TTS)、自動音声認識(ASR)、チャット/オーディオチャットモデルのサポートを提供します。CLIファーストのワークフロー(`izwi`)とWeb UIを備えており、サーバーは`/v1`の下でOpenAIスタイルのルートを公開します。主な機能には、ローカル優先の動作、CLIによるモデルライフサイクル管理(Hugging Faceからのダウンロード)、Apple Silicon(Metal)のアクセラレーションサポート、クロスプラットフォームのネイティブビルドが含まれます。セットアップにはRustツールチェーンとNode.js 18+が必要です。ユーザーはUI依存関係のインストール、バイナリのビルド、CLIのインストール、`izwi serve`の実行により迅速にセットアップできます。現在サポートされているモデルファミリーには、TTS、ASR、チャット、強制アライメント用の様々なQwen3バリアントが含まれており、Voxtral realtimeとLFM2-Audioが今後予定されています。

(出典:GitHub)