gcjavi commited on
Commit
ec950d5
·
1 Parent(s): 5600ebd

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +5 -3
README.md CHANGED
@@ -15,13 +15,15 @@ Fine-tuning dun modelo text-to-text para realizar a tarefa de data-to-text en ga
15
 
16
  + Abrir terminal bash
17
  + Instalar [Python 3.10](https://www.python.org/downloads/release/python-3104/)
18
- + Xerar textos a partir de táboas de datos co seguinte comando:
19
  ```bash
20
- python generate_text.py -i <datat_id> -o <output_path>
21
  ```
 
 
22
 
23
-
24
  **Adestramento**
 
25
  Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro
26
  Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de linearización sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira:
27
 
 
15
 
16
  + Abrir terminal bash
17
  + Instalar [Python 3.10](https://www.python.org/downloads/release/python-3104/)
18
+ + Para xerar un texto a partir dalgúns dos 568 casos de test do noso dataset, empregarase o seguinte comando:
19
  ```bash
20
+ python generate_text.py -i <data_id> -o <output_path>
21
  ```
22
+ + O argumento -i indica o ID da táboa de datos da cal se quere xerar un texto. Serán validos IDs de 0 ata 569, xa que estos son os casos de test dispoñibles cos que non se adestrou o modelo.
23
+ + O argumento -o empregase para indicar o path no cal se creará un arquivo con texto xerado. En caso de non indicarse crearase o arquivo no directorio actual.
24
 
 
25
  **Adestramento**
26
+
27
  Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro
28
  Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de linearización sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira:
29