Update README.md
Browse files
README.md
CHANGED
|
@@ -15,13 +15,15 @@ Fine-tuning dun modelo text-to-text para realizar a tarefa de data-to-text en ga
|
|
| 15 |
|
| 16 |
+ Abrir terminal bash
|
| 17 |
+ Instalar [Python 3.10](https://www.python.org/downloads/release/python-3104/)
|
| 18 |
-
+
|
| 19 |
```bash
|
| 20 |
-
python generate_text.py -i <
|
| 21 |
```
|
|
|
|
|
|
|
| 22 |
|
| 23 |
-
|
| 24 |
**Adestramento**
|
|
|
|
| 25 |
Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro
|
| 26 |
Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de linearización sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira:
|
| 27 |
|
|
|
|
| 15 |
|
| 16 |
+ Abrir terminal bash
|
| 17 |
+ Instalar [Python 3.10](https://www.python.org/downloads/release/python-3104/)
|
| 18 |
+
+ Para xerar un texto a partir dalgúns dos 568 casos de test do noso dataset, empregarase o seguinte comando:
|
| 19 |
```bash
|
| 20 |
+
python generate_text.py -i <data_id> -o <output_path>
|
| 21 |
```
|
| 22 |
+
+ O argumento -i indica o ID da táboa de datos da cal se quere xerar un texto. Serán validos IDs de 0 ata 569, xa que estos son os casos de test dispoñibles cos que non se adestrou o modelo.
|
| 23 |
+
+ O argumento -o empregase para indicar o path no cal se creará un arquivo con texto xerado. En caso de non indicarse crearase o arquivo no directorio actual.
|
| 24 |
|
|
|
|
| 25 |
**Adestramento**
|
| 26 |
+
|
| 27 |
Para adestrar o modelo na tarefa data-to-text empregouse o primeiro dataset público para data-to-text en galego liberado polo Proxecto Nós e que se atopa dispoñíbel no seguinte repositorio: https://zenodo.org/record/7661650#.ZA8aZ3bMJro
|
| 28 |
Debido a que o modelo base usa como entrada un formato textual e os nosos datos de entrada son en formato táboa, realizamos un proceso de linearización sobre os datos estruturados. Este proceso consiste en transformar as táboas de datos en datos textuais etiquetados da seguinte maneira:
|
| 29 |
|