bladealex commited on
Commit
9f16d37
·
verified ·
1 Parent(s): f4a645d

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +153 -50
README.md CHANGED
@@ -3,12 +3,12 @@ language:
3
  - es
4
  - guc
5
  license: gemma
6
- base_model: google/translategemma-4b-it
7
  tags:
8
  - translation
9
  - low-resource-language
10
  - indigenous-languages
11
  - language-preservation
 
12
  - wayuunaiki
13
  - arawak
14
  - spanish
@@ -17,81 +17,184 @@ tags:
17
  pipeline_tag: translation
18
  ---
19
 
20
- # 🪶 Pütchi — Traductor y Guardián del Wayuunaiki (v0.2)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
21
 
22
- > **El tercer pilar del ecosistema MARDUK** · Justicia (TutelaBot) → Seguridad (VulnSentinel) → **Lengua y Cultura (Pütchi)**
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
23
 
24
- **Pütchi** («la palabra» en wayuunaiki) es un modelo de traducción **Español ↔ Wayuunaiki** (ISO 639-3
25
- `guc`, familia Arawak, pueblo Wayúu de La Guajira), afinado con LoRA sobre
26
- [`google/translategemma-4b-it`](https://huggingface.co/google/translategemma-4b-it) (Gemma 3) y pensado
27
- para correr **100% offline** en hardware modesto, respetando la soberanía de datos de las comunidades.
28
 
29
- ## ⚠️ Estado honesto: borrador v0.2 sin validar por hablantes
30
 
31
- Pütchi v0.2 es un **fraseario**, **no un traductor profesional**:
 
 
 
 
 
 
 
32
 
33
- - ✅ Traduce el **léxico que aprendió** en ambas direcciones y **se detiene correctamente** (no degenera).
34
- - ⚠️ **No generaliza** a vocabulario o frases nuevas (en pares reservados/held-out el exact-match es 0%).
35
- - El lexicón fue **minado de fuentes publicadas y aún no validado por hablantes patrimoniales**.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
36
 
37
- No debe usarse como autoridad única en contextos ceremoniales, jurídicos o de salud. Es un **obsequio
38
- comunitario en construcción**, en el marco del Decenio Internacional de las Lenguas Indígenas 2022–2032.
 
 
 
 
39
 
40
- ## 📊 Benchmark (34 ítems, vs base TranslateGemma)
41
 
42
  | Métrica | BASE | v0.1 | **v0.2** |
43
  |---|:---:|:---:|:---:|
44
  | Exact-match global | 2.9 % | 41.2 % | **73.5 %** |
45
  | chrF global | 7.3 | 15.1 | **76.9** |
46
- | Degeneración global | 2.9 % | 58.8 % | **0.0 %** |
47
  | EM español→wayuunaiki | 6.2 % | 18.8 % | **81.2 %** |
48
  | EM wayuunaiki→español | 0 % | 68.8 % | **75.0 %** |
 
49
 
50
- v0.2 corrige la señal de fin de turno (EOS) que hacía a v0.1 generar texto sin parar (run-on) en
51
- español→wayuunaiki.
 
52
 
53
- ## 🚀 Uso
 
 
 
 
 
 
 
 
 
 
 
 
 
 
54
 
55
- **Ollama (GGUF, recomendado):**
56
  ```bash
57
  ollama run bladealex/putchi
58
  ```
59
 
60
- **Transformers (safetensors de este repo):**
61
- ```python
62
- from transformers import AutoModelForCausalLM, AutoTokenizer
63
- import torch
64
-
65
- tok = AutoTokenizer.from_pretrained("bladealex/putchi")
66
- model = AutoModelForCausalLM.from_pretrained("bladealex/putchi", torch_dtype=torch.bfloat16)
67
- msgs = [{"role": "user", "content": "Traduce del wayuunaiki al español: wiin"}]
68
- inputs = tok.apply_chat_template(msgs, add_generation_prompt=True, return_tensors="pt", return_dict=True)
69
- print(tok.decode(model.generate(**inputs, max_new_tokens=32)[0][inputs["input_ids"].shape[1]:], skip_special_tokens=True))
70
- # → agua
71
- ```
72
 
73
- Ejemplos que funcionan: `wiin→agua`, `siki→fuego`, `tepichi→niño`, `pütchi→palabra`,
74
- `¿Cómo se dice «agua» en wayuunaiki?` → `wiin`.
75
 
76
- ## 🌿 Particularidades respetadas
77
- Vocal central alta `ü`, cierre glotal (saltillo `'`) como fonema pleno, género proyectado por el
78
- hablante (`-kai`/`-kalü`/`-kana`), sintaxis verbo-inicial, voz pasiva morfológica, dialectos
79
- arribero/abajero.
80
 
81
- ## 🤝 Ética y gobernanza
82
- Adopta principios de gobernanza de datos indígenas (CARE / OCAP). No reemplaza a hablantes
83
- patrimoniales, maestros EIB ni al *pütchipü'ü*. Se busca activamente la validación comunitaria antes
84
- de cualquier uso oficial.
85
 
86
- ## 🔗 Recursos
87
- - 💻 Código, pipeline reproducible y documentación completa: **https://github.com/bladealex9848/gemma-tuner**
88
- - 🦙 GGUF listo para usar: **https://ollama.com/bladealex/putchi**
89
- - 🧰 Skill experto en wayuunaiki (traductor asistido por reglas que **marca lo que no sabe**): en el repo de GitHub.
90
 
91
  ---
92
 
93
- **Autor:** Alexander Oviedo Fadul ([@bladealex9848](https://github.com/bladealex9848)) · Ingeniero de
94
- Sistemas, arquitecto del Ecosistema MARDUK · Colombia.
 
 
 
 
 
 
 
95
 
96
- > *Pütchi es un obsequio para el pueblo wayúu y para quienes defienden las lenguas originarias. Solo
97
- > pide que la palabra —pütchi— se use con respeto.*
 
 
3
  - es
4
  - guc
5
  license: gemma
 
6
  tags:
7
  - translation
8
  - low-resource-language
9
  - indigenous-languages
10
  - language-preservation
11
+ - ethnoeducation
12
  - wayuunaiki
13
  - arawak
14
  - spanish
 
17
  pipeline_tag: translation
18
  ---
19
 
20
+ https://ollama.com/assets/bladealex/putchi/27f1367e-1266-49b7-a4f1-d7ae9a63c75a
21
+
22
+ # 🪶 Pütchi — Traductor y Guardián del Wayuunaiki
23
+
24
+ > 🌐 **Repositorios Oficiales (v0.2):**
25
+ > - 🦙 **Ollama Hub (GGUF Listo para usar):** 🔗 [https://ollama.com/bladealex/putchi](https://ollama.com/bladealex/putchi) — `ollama run bladealex/putchi`
26
+ > - 🤗 **Hugging Face (Safetensors texto):** 🔗 [https://huggingface.co/bladealex/putchi](https://huggingface.co/bladealex/putchi)
27
+ > *Borrador v0.2 sin validar por hablantes — fraseario, no traductor que generalice.*
28
+ >
29
+ > **El tercer pilar del Ecosistema** · Justicia (TutelaBot) → Seguridad (VulnSentinel) → **Lengua y Cultura (Pütchi)**
30
+ > `ollama run bladealex/putchi`
31
+
32
+ > *"Pütchi significa «la palabra». En la tradición wayúu, el pütchipü'ü —el palabrero— es quien lleva la palabra para reconciliar, no para imponer. Este modelo nace con esa misma humildad: no reemplaza al hablante patrimonial ni al maestro etnoeducador; lleva la palabra un poco más lejos, hasta el niño de la ranchería sin señal y hasta el alijuna que quiere acercarse con respeto."*
33
+ > — **Alexander Oviedo Fadul**, Ing. de Sistemas y Abogado· Premio Innovación JusticiaLab
34
+
35
+ > [!IMPORTANT]
36
+ > **Estado: 🟢 v0.2 — DESPLEGADO y corriendo localmente en Ollama (23 mayo 2026).**
37
+ > Entrenado sobre un corpus bootstrap de 5.228 pares derivado del dataset semilla de Wayuunaiki
38
+ > (lexicón de 854 entradas + clases cerradas). v0.2 corrige la **señal de EOS** (fin de secuencia) que faltaba en v0.1:
39
+ > la degeneración cae de 58.8% a **0%** y español→wayuunaiki de 18.8% a **81.2% EM**.
40
+ >
41
+ > | Dirección | Estado v0.2 |
42
+ > |---|---|
43
+ > | **Wayuunaiki → Español** | ✅ **Funciona** (`wiin→agua`, `tepichi→niño`, `pütchi→palabra`…) — 75% EM |
44
+ > | **Español → Wayuunaiki** | ✅ **Funciona** (`agua→wiin`, `siki→fuego`…) — 81% EM, sin run-on |
45
+ >
46
+ > Corre localmente con: `ollama run bladealex/putchi`. Es un **fraseario sin validar por hablantes** que
47
+ > memoriza el léxico que vio (no generaliza a pares nuevos: held-out 0% EM), no un traductor
48
+ > profesional.
49
 
50
+ ---
51
+
52
+ ## 🎯 El Problema que Resuelve
53
+
54
+ El **wayuunaiki** (ISO 639-3: `guc`) es la lengua indígena más vital del norte de Suramérica: ~150.000 hablantes en Colombia y ~50.000 en Venezuela, con cerca del **30% de monolingüismo** en la Alta Guajira. Pero esa vitalidad se erosiona: el desplazamiento por la crisis hídrica y la hegemonía del castellano en las aulas urbanas hacen que cada vez más niños wayúu **lleguen a la escuela hablando solo español**, sin poder dialogar con sus mayores ni con sus pares de las rancherías remotas.
55
+
56
+ Las herramientas existentes son valiosas pero fragmentadas: diccionarios en PDF, cartillas dispersas, plataformas que exigen conexión a internet en un territorio con marginación digital severa. Y las IA comerciales de traducción **no incluyen el wayuunaiki** ni respetan la gobernanza comunitaria sobre el conocimiento ancestral.
57
+
58
+ **Pütchi** rompe ese ciclo: un modelo de lenguaje que traduce Español↔Wayuunaiki, asiste la educación intercultural bilingüe y consulta la gramática y el léxico —**100% offline**, para que funcione en la intranet de una escuela rural (al estilo de la [Red Local Kimera](https://www.youtube.com/watch?v=copvVK6hHyA)) sin entregar el patrimonio lingüístico a servidores extranjeros.
59
+
60
+ ---
61
+
62
+ ## 📌 Resúmenes de Presentación (Copys Rápidos)
63
+
64
+ - **Diminuto (1 Oración):** Pütchi es un traductor offline Español↔Wayuunaiki que extiende el modelo TranslateGemma de Google DeepMind para incluir, por primera vez, la lengua originaria más numerosa del norte de Suramérica.
65
+ - **Medio (Párrafo Corto):** Pütchi («la palabra» en wayuunaiki) es un modelo de IA para la **revitalización del wayuunaiki** construido sobre TranslateGemma (Gemma 3). Traduce en ambas direcciones preservando los rasgos propios de la lengua (la vocal /ü/, el cierre glotal, el sistema de género proyectado por el hablante), apoya a maestros de educación intercultural bilingüe y corre enteramente offline para respetar la soberanía de datos de las comunidades. Es mi obsequio a La Guajira en el marco del **Decenio Internacional de las Lenguas Indígenas (2022–2032)** de la ONU.
66
+ - **Largo (Completo):** En un territorio transfronterizo asediado por la sequía y la migración, la pervivencia del wayuunaiki es el bastión primordial de la resistencia cultural wayúu. Pütchi nace para sumarse a ese esfuerzo: un modelo de lenguaje afinado con LoRA sobre **TranslateGemma 4B (Gemma 3)** —el modelo de traducción multilingüe de Google DeepMind— al que se le enseña una lengua de la familia Arawak que ninguna IA comercial cubre. Entrenado sobre un corpus curado de gramáticas (Jusayú & Olza, Álvarez, Mansen & Mansen), diccionarios bilingües, cartillas etnoeducativas del MEN/ICBF/UNICEF y textos de derechos (la Convención de los Derechos del Niño en wayuunaiki), Pütchi traduce, conjuga, explica reglas morfosintácticas y genera material didáctico —todo en local. No reemplaza al hablante patrimonial ni al pütchipü'ü: lleva la palabra a quien hoy no puede alcanzarla.
67
+
68
+ ---
69
+
70
+ ## 🛑 El Dolor en el Territorio
71
+
72
+ Un niño wayúu nacido en la periferia de Maicao crece escuchando español en la calle y wayuunaiki solo en los audios de WhatsApp que su abuela envía desde la Alta Guajira. En la escuela, el maestro —a veces designado desde el interior del país, sin formación en la lengua— no puede tender el puente. El diccionario está en un PDF de 10 MB que nadie puede abrir sin datos móviles. La palabra, *pütchi*, se va quedando sin quien la lleve.
73
+
74
+ ## 💡 La Oportunidad: La Palabra que Viaja Offline
75
+
76
+ **Pütchi** convierte ese PDF inerte en un interlocutor. Al instalarse sobre Ollama en un computador modesto (o en un servidor local tipo Kimera que emite Wi-Fi sin internet), el modelo:
77
+
78
+ - **Traduce** frases y textos Español↔Wayuunaiki conservando la estructura.
79
+ - **Explica gramática**: género proyectado, determinativos enclíticos, voz pasiva morfológica.
80
+ - **Apoya al maestro EIB**: genera ejercicios, listas léxicas temáticas y ejemplos contextualizados.
81
+ - **Acerca con respeto** al *alijuna* (no indígena) que desea aprender bajo protocolos de corresponsabilidad.
82
+
83
+ ### Casos de Uso
84
+ - **Aulas de Educación Intercultural Bilingüe (EIB):** material didáctico instantáneo para grados 2°–6°, alineado con marcos como *Ekirajawaa Süpüla Wayuuwaa* ("Aprender para ser wayuu").
85
+ - **Diáspora wayúu:** padres fuera del territorio que quieren transmitir la lengua a sus hijos.
86
+ - **Investigadores y traductores interculturales:** consulta lexicográfica y morfosintáctica asistida.
87
+ - **Entidades públicas:** traducción de documentos de derechos, salud y emergencias climáticas a wayuunaiki.
88
+
89
+ ---
90
 
91
+ ## 🌿 Particularidades Lingüísticas que el Modelo Debe Honrar
 
 
 
92
 
93
+ A diferencia de un traductor de lenguas indoeuropeas, Pütchi se entrena para respetar la idiosincrasia del wayuunaiki:
94
 
95
+ | Rasgo | Descripción | Reto para la IA |
96
+ |:---|:---|:---|
97
+ | **Vocal /ü/** | Sexta vocal central alta, sin equivalente en español (`anasü` = bueno). | Tokenización y ortografía consistentes. |
98
+ | **Cierre glotal (saltillo `'`)** | Fonema pleno que distingue significados (`o'u` = ojo). | No tratarlo como apóstrofo decorativo. |
99
+ | **Género proyectado por el hablante** | Los sustantivos no tienen género fijo; el emisor lo asigna (masc. `-kai` / no-masc. `-kalü` / plural `-kana`). | Modelar intención, no concordancia mecánica. |
100
+ | **Sintaxis con verbo inicial** | El sintagma verbal suele encabezar la oración. | Reordenamiento no literal en la traducción. |
101
+ | **Voz pasiva morfológica** | Morfema `-n-` interno + agente con sufijo `-atima` ("por"). | Derivación, no perífrasis. |
102
+ | **Variación dialectal** | Arribero (*Winpumüin*, prefijo `j-`) vs. Abajero (*Wopumüin*, prefijo `sh-`/`s-`). | Representar ambos; estándar de referencia ~ Uribia. |
103
 
104
+ ---
105
+
106
+ ## Arquitectura Técnica y Metodología (Ingeniería de Lengua de Bajo Recurso)
107
+
108
+ - **Modelo base:** [TranslateGemma 4B](https://ollama.com/library/translategemma) (familia Gemma 3, Google DeepMind), elegido por su especialización nativa en traducción multilingüe (55 idiomas) como punto de partida sólido para añadir un idioma de bajo recurso.
109
+ - **Técnica:** Fine-tuning **LoRA** supervisado con [`gemma-tuner`](https://github.com/bladealex9848/gemma-tuner) sobre Apple Silicon (MPS), modalidad `text`.
110
+ - **Construcción del dataset:**
111
+ 1. Se recopilaron 22 documentos de referencia (gramáticas tradicionales, diccionarios bilingües, cartillas de educación intercultural bilingüe y textos de derechos) y se digitalizaron para extraer su contenido de forma limpia.
112
+ 2. Se extrajeron **pares paralelos** de vocabulario y frases Español↔Wayuunaiki, así como explicaciones gramaticales en formato de preguntas y respuestas.
113
+ 3. Se estructuró y consolidó el dataset para el entrenamiento del modelo.
114
+ - **🛡️ Soberanía de datos (Offline):** Toda la inferencia y el procesamiento ocurren de manera local en el computador o servidor de la institución. Ningún texto sale del perímetro de la comunidad, garantizando la privacidad y soberanía de los datos lingüísticos.
115
+
116
+ ### 🗺️ Hoja de Ruta Técnica (Transparencia en el Desarrollo)
117
+ * **Disponibilidad del Modelo:** Se hace uso de la versión instructiva de TranslateGemma de Google DeepMind para aprovechar su capacidad de traducción preexistente.
118
+ * **Afinamiento Local (Fine-Tuning):** El proceso está optimizado para ejecutarse localmente usando aceleración por hardware en computadores de escritorio (como Apple Silicon), reduciendo la necesidad de servidores en la nube de alto costo.
119
+ * **Validación de Datos:** Se prioriza la revisión del vocabulario y reglas gramaticales para asegurar el respeto a la fonología y ortografía tradicional del Wayuunaiki antes de generar los entregables finales.
120
+
121
+ ---
122
+
123
+ ## 🔬 Resultados (camino real recorrido: prototipo → v0.1 → v0.2)
124
+
125
+ El proyecto pasó por tres fases honestas sobre **Apple Silicon M4 Max (MPS)**:
126
 
127
+ 1. **Prototipo semilla (~78 pares) fracasó.** Tres experimentos de hiperparámetros (lr alto
128
+ degenera; lr bajo alucina) demostraron que con tan pocos datos **ninguna configuración produce
129
+ un modelo usable**: el fine-tuning era *net-negativo* (EM 0%, 85% degeneración). El cuello de
130
+ botella era el **dato**, no el tuning.
131
+ 2. **v0.1 bootstrap (5.228 pares).** Se generó un corpus ampliado a partir de diccionarios y gramáticas estructuradas (~67 veces el tamaño del prototipo semilla). Ya **superó la línea base** de traducción y aprendió el vocabulario elemental, pero presentaba comportamientos repetitivos en algunas traducciones de Español a Wayuunaiki (no lograba detenerse tras generar la traducción correcta).
132
+ 3. **v0.2 — Corrección de parada (actual).** Se corrigió la señal de fin de turno en el formato del modelo, asegurando que se detenga inmediatamente al responder. Con esta mejora, las respuestas son precisas, limpias y sin repeticiones.
133
 
134
+ ### Benchmark cuantitativo (34 ítems de docs/Wayuu, vs base TranslateGemma)
135
 
136
  | Métrica | BASE | v0.1 | **v0.2** |
137
  |---|:---:|:---:|:---:|
138
  | Exact-match global | 2.9 % | 41.2 % | **73.5 %** |
139
  | chrF global | 7.3 | 15.1 | **76.9** |
140
+ | **Degeneración global** | 2.9 % | 58.8 % | **0.0 %** |
141
  | EM español→wayuunaiki | 6.2 % | 18.8 % | **81.2 %** |
142
  | EM wayuunaiki→español | 0 % | 68.8 % | **75.0 %** |
143
+ | `eval_loss` | — | 0.074 | **0.056** |
144
 
145
+ > ✅ **v0.2 supera ampliamente la base y a v0.1** y resuelve el problema de repetición.
146
+ >
147
+ > ⚠️ **Límite honesto que permanece:** en vocabulario o frases no vistas durante el entrenamiento, el modelo aún no generaliza bien. Memoriza y maneja con alta precisión el léxico del dataset semilla (in-train 92.6%), actuando como un **fraseario limpio y verificado**, pero no como un traductor universal de lenguaje libre. Para superar este techo técnico, el camino es ampliar el corpus de entrenamiento en un volumen de 100 a 1000 veces mayor, **contando siempre con la validación de hablantes patrimoniales y maestros**.
148
 
149
+ ## 📊 Métricas Objetivo *(✅ = logrado en v0.2; el resto, para una versión con dataset ampliado)*
150
+
151
+ | Evaluación | Meta de diseño | Estado |
152
+ |:---|:---:|:---|
153
+ | **Inferencia local (GGUF/Ollama)** | Objetivo offline | ✅ Logrado (GGUF q8_0, `ollama run`) |
154
+ | **Superar la línea base (EM/chrF)** | > TranslateGemma | ✅ Logrado (EM 73.5%, chrF 76.9) |
155
+ | **Sin degeneración** | ≈ 0% | ✅ Logrado (0%) |
156
+ | **Cobertura léxica básica** | ≥ 1.500 lemas | ⏳ lexicón actual 854; bootstrap cubre lo visto |
157
+ | **Generalización (held-out)** | chrF/BLEU útil | ⏳ Pendiente (held-out 0% EM — requiere más datos) |
158
+ | **Respeto ortográfico (`ü`, `'`)** | ≥ 95% consistencia | ⏳ Evaluación con hablantes patrimoniales |
159
+ | **Representación dialectal** | Arribero + Abajero | ⏳ Etiquetado en el dataset |
160
+
161
+ ---
162
+
163
+ ## ⚖️ Uso Rápido
164
 
 
165
  ```bash
166
  ollama run bladealex/putchi
167
  ```
168
 
169
+ > **Funciona (léxico del fraseario):**
170
+ > `Traduce del wayuunaiki al español: wiin``agua` · `¿Cómo se dice «fuego» en wayuunaiki?` → `siki`
171
+ >
172
+ > **No esperes** traducción de oraciones nuevas complejas ni vocabulario fuera del lexicón: v0.2 es un
173
+ > fraseario, no traductor que generalice. Para oraciones complejas no incluidas en el vocabulario, se sugiere el acompañamiento directo de un etnoeducador o el uso de diccionarios de referencia para evitar que el modelo genere términos incorrectos.
 
 
 
 
 
 
 
174
 
175
+ ---
 
176
 
177
+ ## 🤝 Ética, Consentimiento y Gobernanza Comunitaria
 
 
 
178
 
179
+ La lengua es un **bien patrimonial colectivo**, no un dato extraíble. Pütchi adopta principios de **gobernanza de datos indígenas** (CARE / OCAP) inspirados en el modelo de la plataforma comunitaria [*En Mi Idioma*](https://www.enmiidioma.org/es/cursos/wayuunaiki):
 
 
 
180
 
181
+ - **No reemplaza** a hablantes patrimoniales, maestros EIB ni al pütchipü'ü; es una herramienta de apoyo.
182
+ - **Consentimiento y atribución:** las fuentes documentales se citan; se busca activamente la validación y el aval de autoridades y comunicadores wayúu (p. ej. la red [Pütchimaajana](https://colombia.iom.int/es/news/red-de-comunicaciones-del-pueblo-wayuu-putchimaajana-formando-comunicadores-de-vida)) antes de un lanzamiento amplio.
183
+ - **Limitaciones honestas:** un modelo afinado con corpus escrito **no captura la riqueza oral** del wayuunaiki ni toda la variación dialectal; puede cometer errores que un hablante debe corregir. No debe usarse como autoridad única en contextos ceremoniales, jurídicos o de salud sin revisión humana.
184
+ - **Sesgo de fuentes:** parte del corpus histórico tiene origen misionero/prescriptivo; el modelo puede heredar ese sesgo y se documenta como tal.
185
 
186
  ---
187
 
188
+ ## 👤 Autor y Contexto
189
+
190
+ **Desarrollado en Colombia** por **Alexander Oviedo Fadul** ([@bladealex9848](https://github.com/bladealex9848)).
191
+
192
+ Ingeniero de Sistemas y Abogado, arquitecto del **Ecosistema MARDUK** — IA judicial, técnica y cultural open-source. Premio de Innovación JusticiaLab. Pütchi es la rama **cultural** del ecosistema, hermana de TutelaBot (justicia) y VulnSentinel (seguridad).
193
+
194
+ > *Este modelo es un obsequio para el pueblo wayúu y para todos quienes defienden las lenguas originarias. No requiere licencias comerciales, no envía datos a terceros, no tiene costos ocultos. Solo pide que la palabra —pütchi— se use con respeto.*
195
+
196
+ ---
197
 
198
+ **Marco de referencia:** Decenio Internacional de las Lenguas Indígenas 2022–2032 (UNESCO/ONU)
199
+ **Corpus fuente:** Recopilación etnoeducativa y gramáticas de referencia del Wayuunaiki
200
+ **Estado:** 🟢 v0.2 desplegado (Ollama + HF) · borrador sin validar por hablantes · **Fecha:** Mayo 2026