IBB-University
/

ghadeer_question_answer

Text Generation

text-generation-inference

Model card Files Files and versions

GhadeerALbadani commited on Dec 28, 2023

Commit

27df063

·

1 Parent(s): 0217575

Update README.md

Files changed (1) hide show

README.md +0 -42

README.md CHANGED Viewed

@@ -1,42 +0,0 @@
-language: ar
-datasets:
-- wikipedia
-- Osian
-- 1.5B-Arabic-Corpus
-- oscar-arabic-unshuffled
-- Assafir(private)
-widget:
- - text: "يحكى أن مزارعا مخادعا قام ببيع بئر الماء الموجود في أرضه لجاره مقابل مبلغ كبير من المال"
- - text: "القدس مدينة تاريخية، بناها الكنعانيون في"
- - text: "كان يا ما كان في قديم الزمان"
----
-## Testing the model using `transformers`:
-```python
-from transformers import GPT2TokenizerFast, pipeline
-#for base and medium
-from transformers import GPT2LMHeadModel
-#for large and mega
-# pip install arabert
-from arabert.aragpt2.grover.modeling_gpt2 import GPT2LMHeadModel
-from arabert.preprocess import ArabertPreprocessor
-MODEL_NAME='IBB-University/ghadeer_question_answer'
-arabert_prep = ArabertPreprocessor(model_name=MODEL_NAME)
-text=""
-text_clean = arabert_prep.preprocess(text)
-model = GPT2LMHeadModel.from_pretrained(MODEL_NAME)
-tokenizer = GPT2TokenizerFast.from_pretrained(MODEL_NAME)
-generation_pipeline = pipeline("text-generation",model=model,tokenizer=tokenizer)
-#feel free to try different decoding settings
-generation_pipeline(text,
-    pad_token_id=tokenizer.eos_token_id,
-    num_beams=10,
-    max_length=200,
-    top_p=0.9,
-    repetition_penalty = 3.0,
-    no_repeat_ngram_size = 3)[0]['generated_text']