Update README.md
Browse files
README.md
CHANGED
|
@@ -25,11 +25,11 @@ python generate_text.py -i <data_id> -o <output_path>
|
|
| 25 |
**Adestramento**
|
| 26 |
|
| 27 |
Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro
|
| 28 |
-
Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de linearización sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira:
|
| 29 |
|
| 30 |
-
<img src="https://huggingface.co/proxectonos/Nos_D2T-gl/
|
| 31 |
|
| 32 |
-
Desta forma, o modelo text-to-text
|
| 33 |
|
| 34 |
<!--**Procedemento de adestramento**
|
| 35 |
+ Pre-procesado dos datos (linearization)
|
|
|
|
| 25 |
**Adestramento**
|
| 26 |
|
| 27 |
Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro
|
| 28 |
+
Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de "linearización" sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira:
|
| 29 |
|
| 30 |
+
<img src="https://huggingface.co/proxectonos/Nos_D2T-gl/resolve/main/exemplo-linearizacion.png" width="65%">
|
| 31 |
|
| 32 |
+
Desta forma, o modelo text-to-text é quen de interpretar as táboas de datos "linearizadas" e aprender a xerar textos que describan ditos datos.
|
| 33 |
|
| 34 |
<!--**Procedemento de adestramento**
|
| 35 |
+ Pre-procesado dos datos (linearization)
|