nihongoMiniteto / README.md
machinelearnAn's picture
Upload 4 files
4d6dff0 verified

A newer version of the Gradio SDK is available: 6.2.0

Upgrade
metadata
title: JP Audio  Text (Upload Only)
emoji: 🗾
colorFrom: pink
colorTo: purple
sdk: gradio
python_version: '3.10'
suggested_hardware: a10g-small

日本語音声(最大2分)をアップロードしてテキスト化する最小構成のSpaceです。

  • モデル: faster-whisper(デフォルトは Systran/faster-whisper-small
  • 言語は固定で 日本語 に設定(language="ja"
  • マイク録音UIは無効。アップロードのみ

環境変数(任意)

  • MODEL_NAME … 例: Systran/faster-whisper-small, large-v3, distil-large-v3
  • VAD_FILTER"1"(既定)/ "0"
  • MAX_SECONDS … 既定: 120

注意

  • ハードウェアは CPU でも動作しますが、GPU のほうが高速です(Settings → Hardware)。
  • packages.txtffmpeg をインストールしています。