proxectonos
/

Nos_D2T-gl

text2text-generation

text-generation-inference

Model card Files Files and versions

gcjavi commited on Mar 13, 2023

Commit

ec950d5

·

1 Parent(s): 5600ebd

Update README.md

Files changed (1) hide show

README.md +5 -3

README.md CHANGED Viewed

@@ -15,13 +15,15 @@ Fine-tuning dun modelo text-to-text para realizar a tarefa de data-to-text en ga
 + Abrir terminal bash
 + Instalar [Python 3.10](https://www.python.org/downloads/release/python-3104/)
-+ Xerar textos a partir de táboas de datos co seguinte comando:
 ```bash
-python generate_text.py -i <datat_id> -o <output_path>
 ```
 **Adestramento**
 Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro
 Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de linearización sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira:

 + Abrir terminal bash
 + Instalar [Python 3.10](https://www.python.org/downloads/release/python-3104/)
++ Para xerar un texto a partir dalgúns dos 568 casos de test do noso dataset, empregarase o seguinte comando:
 ```bash
+python generate_text.py -i <data_id> -o <output_path>
 ```
++ O argumento -i indica o ID da táboa de datos da cal se quere xerar un texto. Serán validos IDs de 0 ata 569, xa que estos son os casos de test dispoñibles cos que non se adestrou o modelo.
++ O argumento -o empregase para indicar o path no cal se creará un arquivo con texto xerado. En caso de non indicarse crearase o arquivo no directorio actual.
 **Adestramento**
 Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro
 Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de linearización sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira: