Spaces:

DRDELATV
/

voice

Runtime error

App Files Files Community

DRDELATV commited on May 23, 2025

Commit

70e5c60

verified ·

1 Parent(s): 6588221

Upload folder using huggingface_hub

Browse files

Files changed (34) hide show

.gitattributes +3 -0
.gitignore +10 -0
.gradio/certificate.pem +31 -0
.gradio/flagged/dataset1.csv +2 -0
LICENSE +0 -0
README.md +24 -7
To +0 -0
configurar_entorno.sh +43 -0
dataset.csv +3 -0
drtd_model/.gitattributes +35 -0
drtd_model/README.md +1 -0
drtd_model/config.json +1 -0
examples/test_script.py +9 -0
generar_csv.py +38 -0
grabacion1.wav +3 -0
grabar.sh +35 -0
guion.mp3 +0 -0
guion.txt +3 -0
instalar_dependencias.sh +7 -0
kuchi_voice.wav +3 -0
leer_texto.py +25 -0
mi_voz.wav +3 -0
output.mp3 +0 -0
output.wav +0 -0
prueba.py +2 -0
reproducir_con_mi_voz.py +50 -0
reproducir_web.py +47 -0
requirements.txt +8 -0
src/__init__.py +0 -0
src/app_kuchiyuya.py +41 -0
src/infer_drt.py +32 -0
src/inference.py +30 -0
src/train.py +19 -0
src/train.py.save +152 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+grabacion1.wav filter=lfs diff=lfs merge=lfs -text
+kuchi_voice.wav filter=lfs diff=lfs merge=lfs -text
+mi_voz.wav filter=lfs diff=lfs merge=lfs -text

.gitignore ADDED Viewed

	@@ -0,0 +1,10 @@

+# Ignora entorno virtual
+venv/
+# Ignora audios locales
+voces/*.wav
+# Python cache
+__pycache__/
+*.pyc
+.gitmodules

.gradio/certificate.pem ADDED Viewed

	@@ -0,0 +1,31 @@

+-----BEGIN CERTIFICATE-----
+MIIFazCCA1OgAwIBAgIRAIIQz7DSQONZRGPgu2OCiwAwDQYJKoZIhvcNAQELBQAw
+TzELMAkGA1UEBhMCVVMxKTAnBgNVBAoTIEludGVybmV0IFNlY3VyaXR5IFJlc2Vh
+cmNoIEdyb3VwMRUwEwYDVQQDEwxJU1JHIFJvb3QgWDEwHhcNMTUwNjA0MTEwNDM4
+WhcNMzUwNjA0MTEwNDM4WjBPMQswCQYDVQQGEwJVUzEpMCcGA1UEChMgSW50ZXJu
+ZXQgU2VjdXJpdHkgUmVzZWFyY2ggR3JvdXAxFTATBgNVBAMTDElTUkcgUm9vdCBY
+MTCCAiIwDQYJKoZIhvcNAQEBBQADggIPADCCAgoCggIBAK3oJHP0FDfzm54rVygc
+h77ct984kIxuPOZXoHj3dcKi/vVqbvYATyjb3miGbESTtrFj/RQSa78f0uoxmyF+
+0TM8ukj13Xnfs7j/EvEhmkvBioZxaUpmZmyPfjxwv60pIgbz5MDmgK7iS4+3mX6U
+A5/TR5d8mUgjU+g4rk8Kb4Mu0UlXjIB0ttov0DiNewNwIRt18jA8+o+u3dpjq+sW
+T8KOEUt+zwvo/7V3LvSye0rgTBIlDHCNAymg4VMk7BPZ7hm/ELNKjD+Jo2FR3qyH
+B5T0Y3HsLuJvW5iB4YlcNHlsdu87kGJ55tukmi8mxdAQ4Q7e2RCOFvu396j3x+UC
+B5iPNgiV5+I3lg02dZ77DnKxHZu8A/lJBdiB3QW0KtZB6awBdpUKD9jf1b0SHzUv
+KBds0pjBqAlkd25HN7rOrFleaJ1/ctaJxQZBKT5ZPt0m9STJEadao0xAH0ahmbWn
+OlFuhjuefXKnEgV4We0+UXgVCwOPjdAvBbI+e0ocS3MFEvzG6uBQE3xDk3SzynTn
+jh8BCNAw1FtxNrQHusEwMFxIt4I7mKZ9YIqioymCzLq9gwQbooMDQaHWBfEbwrbw
+qHyGO0aoSCqI3Haadr8faqU9GY/rOPNk3sgrDQoo//fb4hVC1CLQJ13hef4Y53CI
+rU7m2Ys6xt0nUW7/vGT1M0NPAgMBAAGjQjBAMA4GA1UdDwEB/wQEAwIBBjAPBgNV
+HRMBAf8EBTADAQH/MB0GA1UdDgQWBBR5tFnme7bl5AFzgAiIyBpY9umbbjANBgkq
+hkiG9w0BAQsFAAOCAgEAVR9YqbyyqFDQDLHYGmkgJykIrGF1XIpu+ILlaS/V9lZL
+ubhzEFnTIZd+50xx+7LSYK05qAvqFyFWhfFQDlnrzuBZ6brJFe+GnY+EgPbk6ZGQ
+3BebYhtF8GaV0nxvwuo77x/Py9auJ/GpsMiu/X1+mvoiBOv/2X/qkSsisRcOj/KK
+NFtY2PwByVS5uCbMiogziUwthDyC3+6WVwW6LLv3xLfHTjuCvjHIInNzktHCgKQ5
+ORAzI4JMPJ+GslWYHb4phowim57iaztXOoJwTdwJx4nLCgdNbOhdjsnvzqvHu7Ur
+TkXWStAmzOVyyghqpZXjFaH3pO3JLF+l+/+sKAIuvtd7u+Nxe5AW0wdeRlN8NwdC
+jNPElpzVmbUq4JUagEiuTDkHzsxHpFKVK7q4+63SM1N95R1NbdWhscdCb+ZAJzVc
+oyi3B43njTOQ5yOf+1CceWxG1bQVs5ZufpsMljq4Ui0/1lvh+wjChP4kqKOJ2qxq
+4RgqsahDYVvTH9w7jXbyLeiNdd8XM2w9U/t7y0Ff/9yi0GE44Za4rF2LN9d11TPA
+mRGunUHBcnWEvgJBQl9nJEiU0Zsnvgc/ubhPgXRR4Xq37Z0j4r7g1SgEEzwxA57d
+emyPxgcYxn/eR44/KJ4EBs+lVDR3veyJm+kXQ99b21/+jh5Xos1AnX5iItreGCc=
+-----END CERTIFICATE-----

.gradio/flagged/dataset1.csv ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ "Texto (opcional, se ignora)",🔊 Frase aleatoria,timestamp
2	+ ,,2025-05-23 05:31:28.515590

LICENSE ADDED Viewed

File without changes

README.md CHANGED Viewed

@@ -1,12 +1,29 @@
 ---
-title: Voice
-emoji: 🐨
-colorFrom: gray
-colorTo: yellow
 sdk: gradio
 sdk_version: 5.31.0
-app_file: app.py
-pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: voice
+app_file: src/app_kuchiyuya.py
 sdk: gradio
 sdk_version: 5.31.0
 ---
+# 🐽 Kuchiyuya Voice Engine
+**Bienvenido al motor de voz del universo Ariplanteater.**
+Este repositorio contiene el proyecto inicial para entrenar, simular y desplegar modelos de voz inspirados en los personajes de la saga Kuchiuya.
+---
+## 🚀 ¿Qué contiene?
+- 🔧 `src/train.py` – Entrenamiento ficticio del modelo `KuchiyuyaNet`.
+- 🎙️ `src/inference.py` – Interfaz Gradio para convertir texto en sonido (simulado).
+- 🧪 `examples/test_script.py` – Script de prueba del sistema.
+- 📦 `requirements.txt` – Lista de dependencias mínimas.
+- 📁 `models/` – Carpeta donde se guardará el modelo final (simulado).
+---
+## 🧰 Requisitos
+```bash
+python -m venv venv
+source venv/bin/activate
+pip install -r requirements.txt

To ADDED Viewed

File without changes

configurar_entorno.sh ADDED Viewed

	@@ -0,0 +1,43 @@

+#!/bin/bash
+echo "🐖 Iniciando configuración Kuchiyuya Pro..."
+# 1. Verificar carpeta del entorno virtual
+if [ ! -d "venv" ]; then
+    echo "🛠️ Creando entorno virtual..."
+    python3 -m venv venv
+fi
+# 2. Activar entorno
+source venv/bin/activate
+echo "✅ Entorno virtual activado"
+# 3. Verificar requirements.txt
+if [ ! -f "requirements.txt" ]; then
+    echo "❌ No se encontró requirements.txt. Abortando."
+    exit 1
+fi
+# 4. Instalar dependencias
+echo "📦 Instalando dependencias..."
+pip install --upgrade pip
+pip install -r requirements.txt
+# 5. Validación de rutas
+if [ ! -d "src" ]; then
+    echo "❌ Carpeta 'src/' no encontrada. Crea src/inference.py"
+    exit 1
+fi
+if [ ! -d "voces" ]; then
+    echo "📁 Creando carpeta de voces..."
+    mkdir -p voces
+fi
+# 6. Preparar modelo DRTD si fuera necesario (placeholder para kaggle/huggingface)
+echo "🔍 Verifica que tu modelo DRTD esté en src/model_drt/"
+mkdir -p src/model_drt
+echo "✅ Todo listo para correr tu demo:"
+echo "👉 Ejecuta: python src/inference.py"

dataset.csv ADDED Viewed

	@@ -0,0 +1,3 @@


1	+ path,text
2	+ voces/kuchiyuya1.wav,"Kuchiyuyas"
3	+

drtd_model/.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

drtd_model/README.md ADDED Viewed

	@@ -0,0 +1 @@


1	+ Modelo Kuchiyuya TTS inicial

drtd_model/config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ { "architectures": ["DummyTTS"] }

examples/test_script.py ADDED Viewed

	@@ -0,0 +1,9 @@

+import sys
+import os
+# Añade la carpeta src al path
+sys.path.append(os.path.abspath(os.path.join(os.path.dirname(__file__), '..', 'src')))
+from train import train
+train()

generar_csv.py ADDED Viewed

	@@ -0,0 +1,38 @@

+import os
+import csv
+# Carpeta donde están los .wav
+ruta = "voces"
+# Obtener y ordenar archivos .wav
+archivos = sorted([f for f in os.listdir(ruta) if f.endswith(".wav")])
+# Verifica si hay archivos
+if not archivos:
+    print("❌ No se encontraron archivos .wav en la carpeta 'voces'.")
+    exit()
+# Crear archivo dataset.csv
+with open("dataset.csv", "w", newline='', encoding='utf-8') as f:
+    writer = csv.writer(f)
+    writer.writerow(["path", "text"])
+    print("🧠 Comenzando anotación de dataset...\n")
+    for nombre in archivos:
+        ruta_relativa = os.path.join(ruta, nombre)
+        print(f"\n🎧 Reproduciendo: {ruta_relativa}")
+        os.system(f"aplay '{ruta_relativa}'")  # Compatibilidad con espacios en nombres
+        try:
+            texto = input(f"📝 ¿Qué dice exactamente '{nombre}'? ").strip()
+            if texto:
+                writer.writerow([ruta_relativa, texto])
+                print("✅ Guardado.")
+            else:
+                print("⚠️ Entrada vacía. Archivo omitido.")
+        except KeyboardInterrupt:
+            print("\n⛔ Proceso interrumpido por el usuario.")
+            break
+print("\n📦 Dataset final guardado como 'dataset.csv'")

grabacion1.wav ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb6b351f3f7d35e6ad90c5814e4936502ba40d1d4c528dee27cb18b0beabe4bb
+size 1058444

grabar.sh ADDED Viewed

	@@ -0,0 +1,35 @@

+#!/bin/bash
+echo "🎙️ Grabador Kuchiyuya Pro"
+mkdir -p voces
+read -p "👉 Nombre del archivo (sin .wav): " filename
+read -p "⏱️  Duración de la grabación (segundos): " duracion
+read -p "📝 Frase (texto asociado a la grabación): " texto
+archivo="voces/${filename}.wav"
+echo "🎤 Grabando durante $duracion segundos..."
+arecord -d "$duracion" -f cd -r 16000 -c 1 "$archivo"
+echo "✅ Grabación guardada como $archivo"
+# Reproducción
+aplay "$archivo"
+# Visualizar forma de onda si tienes sox
+if command -v play >/dev/null 2>&1; then
+  echo "📊 Visualizando forma de onda con sox..."
+  play "$archivo" norm | sox "$archivo" -n stat
+else
+  echo "⚠️ 'sox' no está instalado. Sin visualización de onda."
+fi
+# Añadir al dataset.csv
+csv="dataset.csv"
+if [ ! -f "$csv" ]; then
+  echo "path,text,speaker" > "$csv"
+fi
+echo "$archivo,\"$texto\",\"$filename\"" >> "$csv"
+echo "🗂️  Añadido al $csv: \"$texto\""

guion.mp3 ADDED Viewed

Binary file (90.8 kB). View file

guion.txt ADDED Viewed

	@@ -0,0 +1,3 @@


1	+ Hola, soy DRDELATV y esta es mi voz definitiva para dominar el metaverso Kuchiyuya.
2	+ [Enter + Ctrl+D]
3	+

instalar_dependencias.sh ADDED Viewed

	@@ -0,0 +1,7 @@

+#!/bin/bash
+echo "🔧 Instalando dependencias: sox, aplay, arecord, gradio, gtts..."
+sudo apt update
+sudo apt install -y sox alsa-utils python3-pip
+pip install gradio gtts
+echo "✅ Todo listo para grabar y reproducir voz Kuchiyuya."

kuchi_voice.wav ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b8e087b27899dec2f9246407208c519e674dd7a299add2b0ede372c7d94ee831
+size 7938044

leer_texto.py ADDED Viewed

	@@ -0,0 +1,25 @@

+import os
+from gtts import gTTS
+print("📝 Escribe o pega tu texto de presentación. Termina con Enter + Ctrl+D (en Linux):\n")
+# Leer texto completo desde stdin
+try:
+    texto = ""
+    while True:
+        linea = input()
+        texto += linea + "\n"
+except EOFError:
+    pass
+# Guardar texto
+with open("guion.txt", "w", encoding="utf-8") as f:
+    f.write(texto)
+# Convertir a voz
+tts = gTTS(text=texto, lang="es")
+tts.save("guion.mp3")
+# Reproducir
+print("🔊 Reproduciendo tu presentación con voz generada...")
+os.system("mpg123 guion.mp3 || ffplay -nodisp -autoexit guion.mp3")

mi_voz.wav ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bbee525a2252f611f1ab306d8f0de537b019903981572fb67d985c336be62f5c
+size 1764044

output.mp3 ADDED Viewed

Binary file (10.6 kB). View file

output.wav ADDED Viewed

Binary file (96 kB). View file

prueba.py ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ import torch
2	+ print("🐷 PyTorch está funcionando:", torch.cuda.is_available())

reproducir_con_mi_voz.py ADDED Viewed

	@@ -0,0 +1,50 @@

+import os
+import csv
+import difflib
+from pydub import AudioSegment
+from pydub.playback import play
+import unicodedata
+def limpiar_texto(texto):
+    texto = texto.lower().strip()
+    texto = unicodedata.normalize("NFKD", texto).encode("ascii", "ignore").decode("utf-8")
+    return texto
+# Cargar dataset
+dataset = []
+with open("dataset.csv", newline='', encoding='utf-8') as f:
+    reader = csv.DictReader(f)
+    for row in reader:
+        dataset.append({
+            "path": row["path"],
+            "text": limpiar_texto(row["text"])
+        })
+# Entrada del usuario
+print("📝 Escribe tu texto y buscaré el audio más parecido con tu voz grabada:")
+texto_input = input("👉 ").strip()
+texto_clean = limpiar_texto(texto_input)
+# Buscar coincidencias con difflib
+frases = [d["text"] for d in dataset]
+matches = difflib.get_close_matches(texto_clean, frases, n=3, cutoff=0.5)
+if not matches:
+    print("❌ No encontré coincidencias suficientes. Intenta con otra frase.")
+    exit()
+# Mostrar opciones
+print("\n🎯 Frase(s) encontrada(s):")
+for i, frase in enumerate(matches):
+    print(f"{i+1}. {frase}")
+# Usar la primera como predeterminada
+match_texto = matches[0]
+# Buscar el path
+ruta_audio = next(d["path"] for d in dataset if d["text"] == match_texto)
+# Reproducir
+print(f"\n🔊 Reproduciendo audio: {ruta_audio}")
+audio = AudioSegment.from_wav(ruta_audio)
+play(audio)

reproducir_web.py ADDED Viewed

	@@ -0,0 +1,47 @@

+import gradio as gr
+import csv
+import os
+import difflib
+from pydub import AudioSegment
+from pydub.playback import play
+DATASET = "dataset.csv"
+AUDIO_DIR = "voces"
+# Carga el dataset
+def cargar_dataset():
+    with open(DATASET, newline='', encoding='utf-8') as f:
+        reader = csv.DictReader(f)
+        return [{"path": row["path"], "text": row["text"].lower().strip()} for row in reader]
+dataset = cargar_dataset()
+def buscar_audio(texto):
+    texto = texto.lower().strip()
+    coincidencias = difflib.get_close_matches(texto, [d["text"] for d in dataset], n=1, cutoff=0.6)
+    if not coincidencias:
+        return None, "❌ No encontré coincidencias."
+    for d in dataset:
+        if d["text"] == coincidencias[0]:
+            ruta = d["path"]
+            return ruta, f"🔊 Reproduciendo: {ruta}"
+    return None, "❌ Algo falló."
+def demo_func(texto):
+    ruta, mensaje = buscar_audio(texto)
+    if ruta:
+        return ruta, mensaje
+    else:
+        return None, mensaje
+demo = gr.Interface(
+    fn=demo_func,
+    inputs=gr.Textbox(label="Texto para buscar en tu voz real"),
+    outputs=[gr.Audio(label="Audio encontrado"), gr.Textbox(label="Resultado")],
+    title="🐽 Voz Kuchiyuya - Búsqueda de frase grabada",
+    description="Introduce una frase parecida a una grabada. El sistema reproducirá el clip más cercano."
+)
+if __name__ == "__main__":
+    demo.launch(share=True)

requirements.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+numpy==1.26.4
+torch
+torchaudio
+scipy
+librosa
+soundfile
+transformers
+gradio

src/__init__.py ADDED Viewed

File without changes

src/app_kuchiyuya.py ADDED Viewed

	@@ -0,0 +1,41 @@

+import gradio as gr
+import csv
+import os
+import difflib
+from pydub import AudioSegment
+from pydub.playback import play
+DATASET = "dataset.csv"
+AUDIO_DIR = "voces"
+def cargar_dataset():
+    with open(DATASET, newline='', encoding='utf-8') as f:
+        reader = csv.DictReader(f)
+        return [{"path": row["path"], "text": row["text"].lower().strip()} for row in reader]
+dataset = cargar_dataset()
+def buscar_audio(texto):
+    texto = texto.lower().strip()
+    coincidencias = difflib.get_close_matches(texto, [d["text"] for d in dataset], n=1, cutoff=0.6)
+    if not coincidencias:
+        return None, "❌ No encontré coincidencias en tus clips grabados."
+    for d in dataset:
+        if d["text"] == coincidencias[0]:
+            return d["path"], f"🎧 Clip encontrado: {d['path']}"
+    return None, "⚠️ Algo falló en la búsqueda."
+def demo_func(texto):
+    ruta, mensaje = buscar_audio(texto)
+    return (ruta if ruta else None), mensaje
+demo = gr.Interface(
+    fn=demo_func,
+    inputs=gr.Textbox(label="Escribe una frase similar a una grabada"),
+    outputs=[gr.Audio(label="Clip de voz"), gr.Textbox(label="Resultado")],
+    title="🐽 Voz Kuchiyuya Real",
+    description="Este demo busca y reproduce tu grabación más parecida al texto ingresado."
+)
+if __name__ == "__main__":
+    demo.launch(share=True)

src/infer_drt.py ADDED Viewed

	@@ -0,0 +1,32 @@

+import os
+import torch
+import gradio as gr
+from transformers import AutoProcessor, AutoModelForSpeechSeq2Seq
+# Modelo en Hugging Face
+MODEL_ID = "DRDELATV/drtd"
+TOKEN = os.getenv("HF_TOKEN")  # ← Token cargado desde .env o variable de entorno
+print("🔁 Cargando modelo DRTD desde Hugging Face...")
+processor = AutoProcessor.from_pretrained(MODEL_ID, token=TOKEN)
+model = AutoModelForSpeechSeq2Seq.from_pretrained(MODEL_ID, token=TOKEN)
+model.eval()
+def inferir_audio(texto):
+    inputs = processor(text=texto, return_tensors="pt")
+    with torch.no_grad():
+        outputs = model.generate(**inputs)
+    audio = processor.batch_decode(outputs, skip_special_tokens=True)[0]
+    print(f"🎤 Texto sintetizado: {texto}")
+    return audio
+demo = gr.Interface(
+    fn=inferir_audio,
+    inputs=gr.Textbox(label="📝 Escribe algo..."),
+    outputs=gr.Textbox(label="🔊 Resultado generado"),
+    title="🐽 TTS DRTD Kuchiyuya",
+    description="Convierte texto en voz usando el modelo personalizado entrenado en HuggingFace"
+)
+if __name__ == "__main__":
+    demo.launch(share=True)

src/inference.py ADDED Viewed

	@@ -0,0 +1,30 @@

+import gradio as gr
+import os
+import random
+AUDIO_DIR = "voces"
+def reproducir_random(texto):
+    if not os.path.exists(AUDIO_DIR):
+        return None, "❌ Carpeta 'voces/' no encontrada."
+    archivos = [f for f in os.listdir(AUDIO_DIR) if f.endswith(".wav")]
+    if not archivos:
+        return None, "⚠️ No hay archivos .wav en la carpeta 'voces/'."
+    elegido = random.choice(archivos)
+    ruta = os.path.join(AUDIO_DIR, elegido)
+    print(f"🎤 Reproduciendo: {ruta}")
+    return ruta
+demo = gr.Interface(
+    fn=reproducir_random,
+    inputs=gr.Textbox(label="Texto (opcional, se ignora)"),
+    outputs=gr.Audio(label="🔊 Frase aleatoria"),
+    title="🐽 Demo de Voz Kuchiyuya",
+    description="Reproduce una frase real grabada al azar desde la carpeta 'voces'. Ideal para demos, IA y entrenamiento de clones vocales."
+)
+if __name__ == "__main__":
+    demo.launch(share=True)

src/train.py ADDED Viewed

	@@ -0,0 +1,19 @@

+import time
+import random
+def train():
+    print("🐷 Iniciando entrenamiento de KuchiyuyaNet v1.0...")
+    print("🔧 Preparando barro, afilando colmillos, calentando tokens...\n")
+    for i in range(1, 101):
+        time.sleep(0.05)  # Simula tiempo de entrenamiento
+        loss = round(random.uniform(0.1, 1.0) / i, 4)
+        status = "🔥" if loss > 0.01 else "💀"
+        print(f"{status} Iteración {i}/100 - pérdida simulada: {loss}")
+    print("\n🎉 ENTRENAMIENTO COMPLETADO")
+    print("✅ KuchiyuyaNet está listo para predecir traiciones, susurrar secretos y dominar el metaverso.")
+    print("📁 Guardando modelo en /models/kuchiyuya_final.pt (simulado)\n")
+if __name__ == "__main__":
+    train()

src/train.py.save ADDED Viewed

	@@ -0,0 +1,152 @@

+# 📁 Estructura del proyecto generado para 'voice'
+# 📦 voice/
+# ├── README.md
+# ├── requirements.txt
+# ├── src/
+# │   ├── model.py
+# │   ├── train.py
+# │   └── inference.py
+# ├── data/
+# │   └── samples/
+# └── app_gradio.py
+# ========================================
+# ✅ README.md (inicial)
+readme = '''
+# 🐽 Kuchiuya Voice Synthesizer
+Este proyecto permite entrenar e inferir voces sintéticas al estilo Kuchiuya.
+## Requisitos
+```bash
+pip install -r requirements.txt
+```
+## Entrenamiento
+```bash
+python src/train.py
+```
+## Inferencia
+```bash
+python src/inference.py --text "El barro no miente."
+```
+## Demo Web
+```bash
+python app_gradio.py
+```
+'''
+# ========================================
+# ✅ requirements.txt
+requirements = '''
+torch
+torchaudio
+numpy
+scipy
+librosa
+soundfile
+gradio
+pyttsx3
+'''
+# ========================================
+# ✅ model.py
+model_py = '''
+import torch.nn as nn
+class SimpleTTSModel(nn.Module):
+    def __init__(self, input_dim=256, hidden_dim=512, output_dim=80):
+        super(SimpleTTSModel, self).__init__()
+        self.model = nn.Sequential(
+            nn.Linear(input_dim, hidden_dim),
+            nn.ReLU(),
+            nn.Linear(hidden_dim, output_dim)
+        )
+    def forward(self, x):
+        return self.model(x)
+'''
+# ========================================
+# ✅ train.py
+train_py = '''
+import torch
+import torch.nn as nn
+import torch.optim as optim
+from src.model import SimpleTTSModel
+import numpy as np
+print("🐷 Entrenando modelo Kuchiuya...")
+# Datos simulados (para demostrar el flujo)
+x = torch.randn((100, 256))
+y = torch.randn((100, 80))
+model = SimpleTTSModel()
+criterion = nn.MSELoss()
+optimizer = optim.Adam(model.parameters(), lr=0.001)
+for epoch in range(10):
+    optimizer.zero_grad()
+    outputs = model(x)
+    loss = criterion(outputs, y)
+    loss.backward()
+    optimizer.step()
+    print(f"Epoch {epoch+1}/10, Pérdida: {loss.item():.4f}")
+# Guardar modelo
+torch.save(model.state_dict(), "tts_model.pth")
+print("✅ Modelo guardado como 'tts_model.pth'")
+'''
+# ========================================
+# ✅ inference.py
+inference_py = '''
+import argparse
+import pyttsx3
+parser = argparse.ArgumentParser()
+parser.add_argument('--text', type=str, required=True, help='Texto a sintetizar')
+args = parser.parse_args()
+engine = pyttsx3.init()
+engine.setProperty('rate', 150)
+engine.save_to_file(args.text, 'output.wav')
+engine.runAndWait()
+print(f"🔊 Texto sintetizado: '{args.text}' → guardado como 'output.wav'")
+'''
+# ========================================
+# ✅ app_gradio.py
+app_gradio_py = '''
+import gradio as gr
+import pyttsx3
+import os
+def sintetizar(texto):
+    engine = pyttsx3.init()
+    engine.setProperty('rate', 150)
+    output_path = "voz_kuchiuya.wav"
+    engine.save_to_file(texto, output_path)
+    engine.runAndWait()
+    return output_path
+demo = gr.Interface(
+    fn=sintetizar,
+    inputs=gr.Textbox(lines=2, placeholder="Escribe tu frase Kuchiuya aquí..."),
+    outputs=gr.Audio(type="filepath"),
+    title="Voz Kuchiuya",
+    description="Convierte texto en una voz ritual cyberpunk del universo Ariplanteater."
+)
+demo.launch()
+'''