Configuration Parsing Warning:Invalid JSON for config file config.json

XTTS v2 - Norsk Base Model

Dette er en finjustert (fine-tuned) versjon av Coqui sine XTTS v2-vekter, spesifikt trent for å forstå og snakke norsk (bokmål). Modellen fungerer som en solid grunnmur (base model) for videre trening på norske dialekter, eller for direkte bruk.

Om modellen

Base model: XTTS v2
Datasett: Finjustert på det norske NST-datasettet (Nordisk Språkteknologi).
Trening: Trent i ca. 275 000 steg for å fjerne flerspråklig aksent og etablere norsk grammatikk, uttale og setningsmelodi.
Kvalitet: Modellen snakker ikke 100 % flytende og menneskelig norsk ennå (kan mangle litt naturlig talerytme), men den er svært nærme. Den uttaler ord riktig med god norsk klang.
Status: Ferdigstilt base-modell. Optimalisert for lav latency (kun inference-vekter bevart).
Lisens: Modellen bygger på XTTS v2 og faller under Coqui Public Model License (CPML).

⚠️ Viktig: Slik bruker du modellen (Språkkode)

Fordi den originale XTTS v2-arkitekturen ikke har offisiell støtte for norsk, er denne modellen trent ved å overstyre det spanske språkområdet.

Når du skal bruke denne modellen i ferdige TTS-biblioteker, MÅ du sette språkkoden til es (spansk).

Filer i dette repoet

For å kjøre denne modellen trenger du følgende filer:

model.pth (Optimaliserte vekter, 2.08 GB)
config.json
vocab.json
dvae.pth
mel_stats.pth

Bruksområde

Denne modellen er ypperlig som utgangspunkt for "Transfer Learning" (finjustering på egne stemmer/dialekter) siden den allerede har en dyp forståelse av det norske språket og lydverket.

Downloads last month: 8