Instructions to use marefa-nlp/marefa-ner with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- Transformers
How to use marefa-nlp/marefa-ner with Transformers:
# Use a pipeline as a high-level helper from transformers import pipeline pipe = pipeline("token-classification", model="marefa-nlp/marefa-ner")# Load model directly from transformers import AutoTokenizer, AutoModelForTokenClassification tokenizer = AutoTokenizer.from_pretrained("marefa-nlp/marefa-ner") model = AutoModelForTokenClassification.from_pretrained("marefa-nlp/marefa-ner") - Inference
- Notebooks
- Google Colab
- Kaggle
مشكلة في الكياتات التي التصقت بها حروف
السلام عليكم ورحمة الله وبركاته
جزاكم الله خيراً على العمل المميز، ولكن لاحظت أنه لا يستخرج الكيانات إذا التصق بها حرف ما، مثلاً في النص التالي:
حدثنا قتيبة حدثنا عبد الوهاب عن أيوب عن ابن أبي مليكة عن عقبة بن الحارث قال جيء بالنعيمان أو بابن النعيمان شاربا فأمر النبي صلى الله عليه وسلم من كان بالبيت أن يضربوه قال فضربوه فكنت أنا فيمن ضربه بالنعال.
لن يستخرج (النعيمان) و(ابن النعيمان) و(البيت) و(النعال)؛ بسبب التصاق حرف (ب) بها، ولو فصلنا حرف (ب) عنها بمسافة لحُلَّت المشكلة، ولكن هذا شاق يدوياً وخاصة مع النصوص الكبيرة.
وكذلك الحال في المثال التالي:
حدثنا سعيد بن منصور وقتيبة بن سعيد وأبو كامل الجحدري - واللفظ لسعيد - قالوا حدثنا أبو عوانة عن سماك بن حرب عن مصعب بن سعد قال دخل عبد الله بن عمر على ابن عامر يعوده وهو مريض فقال ألا تدعو الله لي يا ابن عمر قال إني سمعت رسول الله صلى الله عليه وسلم يقول «لا تقبل صلاة بغير طهور ولا صدقة من غلول وكنت على البصرة».
لن يستخرج (قتيبة بن سعيد) و(أبو كامل الجحدري) و(لسعيد)؛ بسبب التصاق حرف (و) بها.
حاولت تصحيح الأمر بتعديل الكود، ولكن فيه بعض الثغرات، فهل لديكم حل مثالي لهذه المشكلة؟