Spaces:
Running
on
Zero
Running
on
Zero
| title: AIGamingVoice Japanese | |
| emoji: 🐠 | |
| colorFrom: gray | |
| colorTo: purple | |
| sdk: gradio | |
| sdk_version: 6.2.0 | |
| app_file: app.py | |
| pinned: false | |
| license: mit | |
| short_description: TTS voice for AI (Currently Matcha-TTS) | |
| # AIGamingVoice - Japanese / 日本語 | |
| High-quality, lightweight Japanese Text-to-Speech specifically tuned for AI gaming characters. | |
| Running on ONNX Runtime for fast inference | |
| AIゲームキャラクター向けに調整された高品質・軽量な日本語音声合成システムです。 | |
| ONNX Runtime上で動作します。 | |
| ## 🌟 Features / 特徴 | |
| - **⚡ Fast & Lightweight**: Pure ONNX Runtime implementation | |
| - **高速・軽量**: 純粋なONNX Runtime実装です。 | |
| - **🖼️ Visual Speaker Selection**: Select speakers intuitively from an image gallery. | |
| - **視覚的な話者選択**: 画像ギャラリーから直感的にキャラクター(話者)を選択できます。 | |
| - **🇯🇵 Japanese Optimization**: Uses `pyopenjtalk` for accurate Japanese phoneme generation. | |
| - **日本語最適化**: `pyopenjtalk` を使用し、正確な日本語読み上げを実現しています。 | |
| ## 🛠️ Installation & Local Usage / インストールとローカルでの使用方法 | |
| 1. **Clone the repository / リポジトリをクローン** | |
| ```bash | |
| git clone https://huggingface.co/spaces/YOUR_USERNAME/AIGamingVoice-Japanese | |
| cd AIGamingVoice-Japanese | |
| ``` | |
| 2. **Install dependencies / 依存関係のインストール** | |
| ```bash | |
| pip install -r requirements.txt | |
| ``` | |
| *Note: You need `cmake` installed for pyopenjtalk.* | |
| *注: pyopenjtalkのインストールには `cmake` が必要です。* | |
| 3. **Prepare Models / モデルの準備** | |
| Place your `.onnx` models in the `models/` directory. | |
| `models/` ディレクトリに `.onnx` モデルファイルを配置してください。 | |
| 4. **Prepare Speaker Images (Optional) / 話者画像の準備(オプション)** | |
| Place images (`0.jpg`, `1.jpg`, ...) in the `imgs/` directory to enable the visual selector. | |
| `imgs/` ディレクトリに画像ファイル(`0.jpg`, `1.jpg` ...)を配置すると、画像による話者選択機能が有効になります。 | |
| 5. **Run the application / アプリケーションの実行** | |
| ```bash | |
| python app.py | |
| ``` | |
| Access http://localhost:7860 in your browser. | |
| ブラウザで http://localhost:7860 にアクセスしてください。 | |
| ## 🎮 How to Use / 使い方 | |
| 1. **Select Model**: Choose a voice model from the dropdown. | |
| - **モデル選択**: ドロップダウンから音声モデルを選択します。 | |
| 2. **Select Speaker**: Click on a character image or enter the Speaker ID. | |
| - **話者選択**: キャラクター画像をクリックするか、Speaker IDを入力します。 | |
| 3. **Input Text**: Enter Japanese text to synthesize. | |
| - **テキスト入力**: 読み上げたい日本語テキストを入力します。 | |
| 4. **Adjust Settings**: Tweak Temperature (randomness) and Speaking Rate (speed). | |
| - **設定調整**: Temperature(ランダム性)やSpeaking Rate(話速)を調整できます。 | |
| 5. **Synthesize**: Click the button to generate audio. | |
| - **音声生成**: ボタンをクリックして音声を生成します。 | |
| ## 🤝 Credits / クレジット | |
| - **Matcha-TTS**: Architecture based on Matcha-TTS. | |
| - **ONNX Runtime**: Inference engine. | |
| - **pyopenjtalk**: Japanese text processing frontend. | |
| --- | |
| *Created for AI Gaming Voice Project* | |