Spaces:

mr-don88
/

ELEVENLAB

Paused

App Files Files Community

mr-don88 commited on Dec 22, 2025

Commit

ed7a892

verified ·

1 Parent(s): 3123380

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -187

app.py CHANGED Viewed

@@ -1,199 +1,50 @@
-# -*- coding: utf-8 -*-
-import os, re, time, random
-import requests
-import gradio as gr
-from pydub import AudioSegment
-import natsort
-# ================== PATH SAFE ==================
-BASE_DIR = os.getcwd()
-VOICE_DIR = os.path.join(BASE_DIR, "voices")
-os.makedirs(VOICE_DIR, exist_ok=True)
-# ================== CORE ==================
-def check_api_key(api_key):
-    try:
-        r = requests.get(
-            "https://api.elevenlabs.io/v1/user",
-            headers={"xi-api-key": api_key},
-            timeout=10
-        )
-        if r.status_code == 200:
-            sub = r.json().get("subscription", {})
-            return {
-                "valid": True,
-                "remaining": sub.get("character_limit", 0)
-                - sub.get("character_count", 0)
-            }
-        return {"valid": False}
-    except:
-        return {"valid": False}
-def parse_text_blocks(text, max_len=200):
-    blocks, cur = [], ""
-    for s in re.split(r'(?<=[.!?])\s+', text):
-        if len(cur) + len(s) <= max_len:
-            cur += " " + s
-        else:
-            blocks.append(cur.strip())
-            cur = s
-    if cur:
-        blocks.append(cur.strip())
-    return blocks
-def estimate_credit(text):
-    return len(text) + 50
-def generate_voice(text, api_key, voice_id, model_id,
-                   stability, similarity, style, speed, boost):
-    time.sleep(random.uniform(1, 2))
-    url = f"https://api.elevenlabs.io/v1/text-to-speech/{voice_id}"
-    headers = {
-        "xi-api-key": api_key,
-        "Content-Type": "application/json"
-    }
-    payload = {
-        "text": text,
-        "model_id": model_id,
-        "voice_settings": {
-            "stability": stability,
-            "similarity_boost": similarity,
-            "style": style,
-            "speed": speed,
-            "use_speaker_boost": boost
-        }
-    }
-    r = requests.post(url, headers=headers, json=payload, timeout=30)
-    if r.status_code == 200:
-        return r.content
-    return None
-def merge_audio(fmt):
-    files = natsort.natsorted([
-        f for f in os.listdir(VOICE_DIR)
-        if f.endswith("." + fmt.lower())
-    ])
-    if not files:
-        return None
-    combined = AudioSegment.from_file(os.path.join(VOICE_DIR, files[0]))
-    for f in files[1:]:
-        combined += AudioSegment.silent(500)
-        combined += AudioSegment.from_file(os.path.join(VOICE_DIR, f))
-    out_path = os.path.join(BASE_DIR, f"output_full.{fmt.lower()}")
-    combined.export(out_path, format=fmt.lower())
-    return out_path
-# ================== MAIN ==================
-def run_tts(api_keys_text, voice_id, text, model_id, fmt,
-            stability, similarity, style, speed, boost):
-    for f in os.listdir(VOICE_DIR):
-        os.remove(os.path.join(VOICE_DIR, f))
-    api_keys = [k.strip() for k in api_keys_text.splitlines() if k.strip()]
-    valid_keys = []
-    for k in api_keys:
-        info = check_api_key(k)
-        if info.get("valid") and info["remaining"] > 500:
-            valid_keys.append([k, info["remaining"]])
-    if not valid_keys:
-        return "❌ Không có API key hợp lệ", None
-    blocks = parse_text_blocks(text)
-    key_idx = 0
-    for i, block in enumerate(blocks):
-        success = False
-        while valid_keys:
-            key, remain = valid_keys[key_idx]
-            need = estimate_credit(block)
-            if remain < need:
-                valid_keys.pop(key_idx)
-                continue
-            audio = generate_voice(
-                block, key, voice_id, model_id,
-                stability, similarity, style, speed, boost
-            )
-            if audio:
-                path = os.path.join(
-                    VOICE_DIR, f"voice_{i+1:03d}.{fmt.lower()}"
-                )
-                with open(path, "wb") as f:
-                    f.write(audio)
-                valid_keys[key_idx][1] -= need
-                success = True
-                break
-            else:
-                valid_keys.pop(key_idx)
-        if not success:
-            return "❌ Hết API key khi đang chạy", None
-    merged = merge_audio(fmt)
-    return "✅ Hoàn tất", merged
-# ================== UI ==================
-with gr.Blocks() as demo:
-    gr.Markdown("## 🔊 ElevenLabs TTS – Hugging Face Stable")
-    api_keys = gr.Textbox(label="API Keys (mỗi dòng 1 key)", lines=4)
-    voice_id = gr.Textbox(label="Voice ID")
-    text = gr.Textbox(label="Text", lines=6)
-    model = gr.Dropdown(
-        choices=[
-            ("Turbo v2.5", "eleven_turbo_v2_5"),
-            ("Flash v2.5", "eleven_flash_v2_5"),
-            ("Multilingual v2", "eleven_multilingual_v2"),
-        ],
-        value="eleven_multilingual_v2",
-        label="Model"
-    )
-    fmt = gr.Dropdown(["MP3", "WAV"], value="MP3", label="Format")
-    stability = gr.Slider(0, 1, 0.9, label="Stability")
-    similarity = gr.Slider(0, 1, 0.5, label="Similarity")
-    style = gr.Slider(0, 1, 0.4, label="Style")
-    speed = gr.Slider(0.7, 1.2, 0.81, label="Speed")
-    boost = gr.Checkbox(True, label="Speaker Boost")
-    run_btn = gr.Button("🎧 Tạo giọng nói")
-    status = gr.Textbox(label="Status")
-    output_audio = gr.Audio(type="filepath", label="Output")
-    run_btn.click(
-        run_tts,
-        inputs=[
-            api_keys, voice_id, text, model, fmt,
-            stability, similarity, style, speed, boost
-        ],
-        outputs=[status, output_audio]
-    )
-# ⚠️ DÒNG QUAN TRỌNG NHẤT CHO HUGGING FACE
-demo.launch(
-    server_name="0.0.0.0",
-    server_port=7860,
-    show_error=True
-)

+---
+title: ElevenLabs TTS Pro
+emoji: 🎤
+colorFrom: blue
+colorTo: green
+sdk: gradio
+sdk_version: 4.0.0
+app_file: app.py
+pinned: false
+---
+# 🎤 ElevenLabs TTS Pro
+Công cụ chuyển văn bản thành giọng nói chuyên nghiệp sử dụng API của ElevenLabs.
+## 🚀 Tính năng
+- 🤖 Hỗ trợ nhiều API keys của ElevenLabs
+- 🎭 Tạo giọng nói với nhiều thông số tùy chỉnh
+- 📝 Hỗ trợ văn bản dài, tự động chia đoạn
+- 💾 Xuất file audio (MP3, WAV, OGG, FLAC)
+- 📄 Tạo file phụ đề SRT tự động
+- 📁 Tải cấu hình từ file (TXT, JSON, ENV)
+## 🔧 Cách sử dụng
+1. **Nhập API Keys**: Lấy từ [ElevenLabs](https://elevenlabs.io/) và nhập vào ô API Keys
+2. **Nhập Voice ID**: Voice ID từ ElevenLabs (VD: `21m00Tcm4TlvDq8ikWAM`)
+3. **Nhập văn bản**: Văn bản cần chuyển thành giọng nói
+4. **Tùy chỉnh thông số**: Stability, Similarity, Style, Speed
+5. **Nhấn "Bắt đầu Tạo Giọng nói"**
+## 📁 Định dạng file hỗ trợ
+- **API Keys**: `.txt`, `.json`, `.env`
+- **Voice IDs**: `.txt`, `.json`
+- **Văn bản**: `.txt`, `.json`
+## ⚠️ Lưu ý
+- Cần có API key hợp lệ từ ElevenLabs
+- Giới hạn ký tự theo gói subscription của bạn
+- File tạo ra sẽ được lưu tạm thời và tự động xóa sau phiên làm việc
+## 🛠️ Công nghệ sử dụng
+- Gradio: Giao diện web
+- ElevenLabs API: TTS engine
+- Pydub: Xử lý audio
+- Python 3.8+