Maris AI Model

Model Summary

Maris AI Model ir Maris AI apmācības izvads, kas tiek trenēts no Maris AI ilgtermiņa atmiņas dataset repozitorija.

Modeļa publicēšana tiek vadīta no šī repozitorija:

  • treniņa konfigurācija: huggingface/training-config.json
  • treniņa entrypoint: huggingface/train.sh
  • publicēšanas skripts: core-python/scripts/export_to_hf.py

Intended Use

Šis modelis ir paredzēts:

  • Maris AI teksta asistenta adaptācijai uz projekta sarunām un darba plūsmām;
  • iekšējai eksperimentēšanai un iteratīvai fine-tuning automatizācijai;
  • turpmākai izvērtēšanai pirms publiskas vai produkcijas izvietošanas.

Training Data

Treniņdati tiek ielādēti no Hugging Face dataset repozitorija MarisUK/maris-ai-memory.

Pipeline apstrādā šādus ierakstu tipus:

  • conversation ierakstus kā user/assistant dialogu;
  • ģenerāciju ierakstus (image, music, video, code, autonomous) kā prompt + metadata tekstuālu reprezentāciju;
  • jebkuru citu ierakstu kā normalizētu JSON tekstu.

Training Procedure

Training pipeline:

  1. ielādē Maris AI dataset repozitoriju;
  2. sagatavo tekstu ar vienotu chat formātu;
  3. sagatavo apmācības tokenus Maris AI teksta pipeline vajadzībām;
  4. izveido validation split, ja repo tāds nav publicēts;
  5. trenē modeli;
  6. saglabā modeli, tokenizeri un metriku JSON failus ar Maris AI identitāti;
  7. pēc izvēles publicē modeli uz Maris AI model repozitoriju.

Evaluation

Pipeline saglabā training-metrics.json un evaluation-metrics.json lokālajā output direktorijā. Galvenā automātiski aprēķinātā metrika ir:

  • eval_loss
  • perplexity

Risks and Limitations

  • Dati var saturēt operacionālu un sensitīvu saturu, tāpēc publiska publicēšana ir jāveic tikai pēc sanitizācijas.
  • Modelis nav validēts drošībai, faktu precizitātei vai bias ierobežošanai.
  • Fine-tuning kvalitāte tieši atkarīga no dataset kvalitātes un filtrēšanas.

How to Use

Izmanto MarisUK/maris-ai-master kā galveno Maris AI modeļa identifikatoru.

Operational Notes

  • huggingface/sync.sh publicē šo failu kā modeļa repo saknes README.md.
  • GitHub Actions workflow /.github/workflows/core-train.yml var palaist automātisku treniņu un publicēšanu.
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Space using MarisUK/maris-ai-master 1