proxectonos
/

Nos_D2T-gl

text2text-generation

text-generation-inference

Model card Files Files and versions

gcjavi commited on Mar 14, 2023

Commit

5dda266

·

1 Parent(s): 76a3956

Update README.md

Files changed (1) hide show

README.md +7 -14

README.md CHANGED Viewed

@@ -24,26 +24,19 @@ python generate_text.py -i <data_id> -o <output_path>
 **Adestramento**
-Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro
 Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de "linearización" sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira:
 <img src="https://huggingface.co/proxectonos/Nos_D2T-gl/resolve/main/exemplo-linearizacion.png" width="75%" style="margin:auto;">
-Desta forma, o modelo text-to-text é quen de interpretar as táboas de datos "linearizadas" e aprender a xerar textos que describan ditos datos.
-<!--**Procedemento de adestramento**
-+ Pre-procesado dos datos (linearization)
-+ Script de adestramento
-+ ```bash
-codigo para adestrar o modelo
-```
-**Hiperparámetros**
-Os parámetros usados para o adestramento do modelo son os configurados no script de adestramento.
-Engadir datos dos hiperparámetros por defecto
-**Avaliación**
--->
 **Licenzas do Modelo**
 MIT License

 **Adestramento**
+Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro.
 Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de "linearización" sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira:
 <img src="https://huggingface.co/proxectonos/Nos_D2T-gl/resolve/main/exemplo-linearizacion.png" width="75%" style="margin:auto;">
+Desta forma, o modelo text-to-text é quen de interpretar as táboas de datos "linearizadas" e os seus textos asociados, e así aprender a xerar textos que describan os datos estruturados que se lle proporcionen como input.
+Para realizar o fine-tuning sobre o modelo empregaronse os seguintes hiperparámetros:
++ Batch size: 8
++ Optimizer: Adam
++ Learning rate: 1e-5
++ Training epochs: 1000
 **Licenzas do Modelo**
 MIT License