notrito commited on
Commit
422bbe8
·
verified ·
1 Parent(s): ff07738

correct code with doc

Browse files
Files changed (1) hide show
  1. app.py +21 -13
app.py CHANGED
@@ -24,9 +24,10 @@ def load_models():
24
  print("⏳ Cargando F5-TTS y vocoder...")
25
  print("=" * 50)
26
 
27
- # Usar la API simplificada de F5-TTS
28
- from f5_tts.infer.utils_infer import load_vocoder, load_checkpoint
29
- from f5_tts.model.backbones.dit import DiT
 
30
 
31
  # Cargar vocoder primero
32
  print("📥 Cargando vocoder Vocos...")
@@ -37,17 +38,24 @@ def load_models():
37
  )
38
  print("✅ Vocoder cargado correctamente")
39
 
40
- # Cargar modelo F5-TTS usando DiT (la arquitectura correcta)
41
- print("\n📥 Cargando modelo F5-TTS...")
42
- print("Usando modelo: F5-TTS Base")
 
 
 
 
 
 
 
 
 
43
 
44
- model = load_checkpoint(
45
- model_cls=DiT, # Usar DiT en lugar de CFM
46
- ckpt_path="hf://SWivid/F5-TTS",
47
- vocab_file="",
48
- ode_method="euler",
49
- use_ema=True,
50
- device="cpu"
51
  )
52
  print("✅ Modelo F5-TTS cargado correctamente")
53
 
 
24
  print("⏳ Cargando F5-TTS y vocoder...")
25
  print("=" * 50)
26
 
27
+ import json
28
+ from cached_path import cached_path
29
+ from f5_tts.infer.utils_infer import load_model, load_vocoder
30
+ from f5_tts.model import DiT
31
 
32
  # Cargar vocoder primero
33
  print("📥 Cargando vocoder Vocos...")
 
38
  )
39
  print("✅ Vocoder cargado correctamente")
40
 
41
+ # Configuración del modelo (copiado del código oficial)
42
+ print("\n📥 Cargando modelo F5-TTS v1 Base...")
43
+
44
+ ckpt_path = str(cached_path("hf://SWivid/F5-TTS/F5TTS_v1_Base/model_1250000.safetensors"))
45
+ model_cfg = dict(
46
+ dim=1024,
47
+ depth=22,
48
+ heads=16,
49
+ ff_mult=2,
50
+ text_dim=512,
51
+ conv_layers=4
52
+ )
53
 
54
+ # Cargar modelo usando la misma función que el código oficial
55
+ model = load_model(
56
+ DiT,
57
+ model_cfg,
58
+ ckpt_path
 
 
59
  )
60
  print("✅ Modelo F5-TTS cargado correctamente")
61