ilhami
/

Tr_En-MbartFinetune

text2text-generation

Model card Files Files and versions

ilhami commited on Jun 12, 2022

Commit

8d3e8d9

·

1 Parent(s): 2030988

Update README.md

Files changed (1) hide show

README.md +37 -1

README.md CHANGED Viewed

@@ -10,4 +10,40 @@ datasets:
 metrics:
 - bleu
 - sacrebleu
----

 metrics:
 - bleu
 - sacrebleu
+---
+## Model Details
+- **Developed by:** İlhami SEL
+- **Model type:** Mbart Finetune Machine Translation
+- **Language:** Turkish - English
+- **Resources for more information:** Sel, İ. , Üzen, H. & Hanbay, D. (2021). Creating a Parallel Corpora for Turkish-English Academic Translations . Computer Science , 5th International Artificial Intelligence and Data Processing symposium , 335-340 . DOI: 10.53070/bbd.990959
+```python
+checkpoint2 = "ilhami/Tr_En-MbartFinetune"
+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+tokenizer = AutoTokenizer.from_pretrained(checkpoint)
+model = AutoModelForSeq2SeqLM.from_pretrained(checkpoint).to("cuda")
+tr= ["Sohbet robotları son yıllarda yaygın bir şekilde kullanılmaya başlanmıştır. ",
+"İnsanları taklit eden ve daha iyi müşteri memnuniyeti sağlayan sohbet robotları en gelişkin doğal dil işleme tekniklerine ihtiyaç duymaktadır. ",
+"Bu çalışma sohbet robotu konuşmalarının niyet tahminini geliştirmeye odaklanmıştır." ,
+"Kelime gösterimi için TF-IDF, Doc2vec ve BERT gibi geleneksel ve gelişmiş doğal dil işleme yöntemleri, çoklu sınıf ve çoklu etiket tahmini için ise lojistik regresyon, rastgele orman ve yapay sinir ağları kullanılmıştır." ,
+"Sohbet robotu konuşma veri kümeleri, sinema bileti rezervasyonu, restoran rezervasyonu ve taksi çağırma olmak üzere üç farklı alandan alınmıştır. ",
+"Bu çalışmanın sonunda, BERT ve BERT ile TF-IDF birleşimi modellerin diğer kombinasyonlardan daha iyi sonuç verdiği görülmüştür. ",
+"BERT gibi ön eğitimli modellerden faydalanmanın daha iyi bağlamsal anlama sağladığı ortaya çıkmıştır. ",
+"TF-IDF yerleştirmeleri, BERT gösterimi ile birleştirilerek niyet kategorisi tahmininin iyileştirilmesi amaçlanmıştır."]
+encoded_text = tokenizer(tr, return_tensors="pt", padding = True).to("cuda")
+generated_tokens = model.generate(**encoded_text)
+en = tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)
+```