Spaces:

Navya-Sree
/

UNESCO_Language_Translator

Sleeping

App Files Files Community

Navya-Sree commited on Jul 7, 2025

Commit

39758c1

verified ·

1 Parent(s): c6412b7

Update README.md

Browse files

Files changed (1) hide show

README.md +53 -0

README.md CHANGED Viewed

@@ -8,5 +8,58 @@ sdk_version: 5.35.0
 app_file: app.py
 pinned: false
 ---
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 app_file: app.py
 pinned: false
 ---
+---
+language:
+- multilingual
+- endangered-languages
+tags:
+- translation
+- unesco
+- m2m100
+license: mit
+datasets:
+- UNESCO language vitality data
+metrics:
+- BLEU
+- chrF++
+---
+# UNESCO Language Translator 🌍
+**A specialized translation model for UNESCO's endangered languages** powered by Meta's M2M100 and Hugging Face.
+## Key Features
+- 🔍 **Endangered Language Focus**: 35+ UNESCO-protected languages
+- ⚡️ **Context-Aware Translation**: Preserves cultural context
+- 📊 **Language Vitality Tags**: Shows preservation status
+- 🤝 **Community Feedback**: Crowdsourced quality improvement
+## Supported Languages
+| Language | ISO Code | Vitality Level |
+|----------|----------|----------------|
+| Aymara   | ay       | Vulnerable     |
+| Cherokee | chr      | Definitely Endangered |
+| Quechua  | qu       | Vulnerable     |
+| ...      | ...      | ...            |
+[See full list](https://unesco.org/languages)
+## Usage
+```python
+from transformers import M2M100ForConditionalGeneration, M2M100Tokenizer
+model = M2M100ForConditionalGeneration.from_pretrained("unesco/translator")
+tokenizer = M2M100Tokenizer.from_pretrained("unesco/translator")
+def translate(text, target_lang):
+    tokenizer.src_lang = "auto"
+    encoded = tokenizer(text, return_tensors="pt")
+    generated_tokens = model.generate(
+        **encoded,
+        forced_bos_token_id=tokenizer.get_lang_id(target_lang),
+        cultural_preservation=True  # Unique feature!
+    )
+    return tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
+translate("Traditional knowledge matters", "qu")
 Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference