Configuration Parsing Warning: Invalid JSON for config file config.json

XTTS v2 - Norsk Base Model

Dette er en finjustert (fine-tuned) versjon av Coqui sine XTTS v2-vekter, spesifikt trent for å forstå og snakke norsk (bokmål). Modellen fungerer som en solid grunnmur (base model) for videre trening på norske dialekter, eller for direkte bruk.

Om modellen

  • Base model: XTTS v2
  • Datasett: Finjustert på det norske NST-datasettet (Nordisk Språkteknologi).
  • Trening: Trent i ca. 275 000 steg for å fjerne flerspråklig aksent og etablere norsk grammatikk, uttale og setningsmelodi.
  • Kvalitet: Modellen snakker ikke 100 % flytende og menneskelig norsk ennå (kan mangle litt naturlig talerytme), men den er svært nærme. Den uttaler ord riktig med god norsk klang.
  • Status: Ferdigstilt base-modell. Optimalisert for lav latency (kun inference-vekter bevart).
  • Lisens: Modellen bygger på XTTS v2 og faller under Coqui Public Model License (CPML).

⚠️ Viktig: Slik bruker du modellen (Språkkode)

Fordi den originale XTTS v2-arkitekturen ikke har offisiell støtte for norsk, er denne modellen trent ved å overstyre det spanske språkområdet.

Når du skal bruke denne modellen i ferdige TTS-biblioteker, MÅ du sette språkkoden til es (spansk).

Filer i dette repoet

For å kjøre denne modellen trenger du følgende filer:

  • model.pth (Optimaliserte vekter, 2.08 GB)
  • config.json
  • vocab.json
  • dvae.pth
  • mel_stats.pth

Bruksområde

Denne modellen er ypperlig som utgangspunkt for "Transfer Learning" (finjustering på egne stemmer/dialekter) siden den allerede har en dyp forståelse av det norske språket og lydverket.

Downloads last month
79
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support