Create README.md
Browse files
README.md
ADDED
|
@@ -0,0 +1,26 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
---
|
| 2 |
+
datasets:
|
| 3 |
+
- techiaith/cofnodycynulliad_en-cy
|
| 4 |
+
language:
|
| 5 |
+
- cy
|
| 6 |
+
---
|
| 7 |
+
|
| 8 |
+
Mae'r model LLM yn seiliedig ar [BangorAI/mistral-7b-cy-tokenizer-train-6](https://huggingface.co/BangorAI/mistral-7b-cy-tokenizer-train-6), sef y model Mistral-7B, gyda estyniad yn y tocynnydd ac hyfforddiant parhaus ar gyfer y Gymraeg.
|
| 9 |
+
|
| 10 |
+
Cafodd y model hyfforddiant cywrain pellach ar ddata Cofnod y Cynulliad a ddarparir gan [TechIaith](https://huggingface.co/techiaith).
|
| 11 |
+
|
| 12 |
+
|
| 13 |
+
### Fformat Sgwrs
|
| 14 |
+
|
| 15 |
+
Mae'r hyfforddiant cywrain wedi defnyddio'r fformat canlynol ar gyfer trosi o'r Saesneg i'r Gymraeg (a'r naill ffordd i'r llall).
|
| 16 |
+
```
|
| 17 |
+
Cyfieithwch y testun Saesneg canlynol i'r Gymraeg.
|
| 18 |
+
### Saesneg:
|
| 19 |
+
{prompt}
|
| 20 |
+
|
| 21 |
+
### Cymraeg:
|
| 22 |
+
|
| 23 |
+
```
|
| 24 |
+
|
| 25 |
+
## Hawlfraint
|
| 26 |
+
Mae'r data Cofnod y Cynulliad dan drywdded [Llywodraeth Agored](https://www.nationalarchives.gov.uk/doc/open-government-licence-cymraeg/version/3/).
|