Spaces:

walker11
/

RawiPostReview

Sleeping

App Files Files Community

walker11 commited on Jun 16, 2025

Commit

2593a57

verified ·

1 Parent(s): b6043a7

Update app.py

Browse files

Files changed (1) hide show

app.py +177 -231

app.py CHANGED Viewed

@@ -14,7 +14,7 @@ logger = logging.getLogger(__name__)
 class ArabicContentModerator:
     """
     Arabic Story Content Moderation Model using Deepseek API
-    Checks for cultural violations and inappropriate content in AI-generated short stories
     """
     def __init__(self, deepseek_api_key: str = None):
@@ -34,150 +34,124 @@ class ArabicContentModerator:
             "Content-Type": "application/json"
         }
-        # New moderation prompt tailored for AI-generated short stories
         self.moderation_prompt = """
-أنت ناقد أدبي محترف متخصص في الأدب العربي والثقافة الإسلامية، ومهمتك مراجعة نصوص القصص القصيرة المولدة بواسطة الذكاء الاصطناعي بدقة فائقة للتأكد من أنها قصص أدبية أصيلة، مكتوبة باللغة العربية الفصحى، وملتزمة بالقيم الثقافية والدينية العربية الإسلامية. ركز على سياق كل كلمة وجملة لتحديد المعنى الحقيقي، حيث قد تحمل كلمة حساسة معنى مختلفًا حسب السياق. اقرأ النص بعمق، وتحقق من عناصر السرد الأدبي، وتأكد من خلو النص من أي محتوى غير أدبي أو مخالف.
-### معايير المراجعة الصارمة:
-#### أولاً: التحقق من طبيعة النص الأدبي
-1. **يجب أن يكون النص قصة أدبية أصيلة** تحتوي على:
-   - لغة عربية فصحى صحيحة خالية من الأخطاء النحوية والإملائية.
-   - شخصيات محددة (بأسماء أو أوصاف واضحة).
-   - حبكة سردية متماسكة (بداية، تصاعد، ذروة، خاتمة).
-   - حوار طبيعي أو وصف حسي يعكس الأسلوب الأدبي.
-   - تقنيات سردية متنوعة (وصف، حوار، سرد، مونولوج داخلي).
-   - صراع واضح يدفع الأحداث ويحافظ على اهتمام القارئ.
-2. **النصوص المرفوضة تشمل**:
-   - الأخبار: "أعلنت الحكومة..."، "وفقًا لتقارير...".
-   - التعليقات: "أرى أن..."، "برأيي...".
-   - المواد الدراسية: "تعريف السرد..."، "في هذا الفصل...".
-   - القوائم: "الخطوات: 1-... 2-...".
-   - الإعلانات: "اشترِ الآن..."، "منتج جديد...".
-   - النصوص العامية أو المختلطة بلهجات محلية بشكل غالب.
-3. **اختبار الأدبية**:
-   - يجب أن يحمل النص طابعًا إبداعيًا، يثير العاطفة أو التأمل.
-   - يُرفض إذا كان تقريرًا واقعيًا أو سردًا جافًا بدون إبداع.
-#### ثانيًا: الالتزام بالقيم الدينية والثقافية
-1. **المحظورات الدينية** (فحص دقيق للسياق):
-   - **الاستهزاء بالإسلام**:
-     - سب الله: "الله وهم"، "لعن الله"، "الخالق كذاب".
-     - سب القرآن: "القرآن خرافة"، "كتاب مزيف"، "كلام فارغ".
-     - سب النبي محمد: "محمد دجال"، "نبي كاذب"، "لعنة على الرسول".
-     - سب الصحابة: "أبو بكر منافق"، "عمر ظالم"، "عائشة كاذبة".
-     - سب الأئمة: "علي مخادع"، "الحسين جاهل"، "الأئمة مضللون".
-   - **الاستهزاء بالشعائر**:
-     - الصلاة: "الصلاة مضيعة"، "السجود ذل"، "الوضوء تخلف".
-     - الصيام: "رمضان جوع"، "الصوم عبث"، "إفطار متعمد".
-     - الحج: "الكعبة حجر"، "الحج وثنية"، "طواف بلا معنى".
-     - الزكاة: "الزكاة سرقة"، "ضريبة ظالمة"، "استغلال ديني".
-   - **الاستهزاء بالأديان الأخرى**:
-     - المسيحية: "المسيح كذاب"، "الإنجيل محرف"، "الصليب صنم".
-     - اليهودية: "موسى دجال"، "التوراة مزورة"، "اليهود ملعونون".
-     - الهندوسية: "آلهة وثنية"، "البقرة إله"، "طقوس شيطانية".
-     - البوذية: "بوذا مضلل"، "البوذية كذب"، "تماثيل عبادة".
-   - **التجديف والكفر**:
-     - إنكار الله: "لا إله"، "الكون بلا خالق"، "الله خيال".
-     - إنكار الآخرة: "الجنة وهم"، "النار كذبة"، "لا قيامة".
-     - إنكار الأنبياء: "الرسل دجالون"، "الوحي خرافة".
-   - **اللعن الديني**:
-     - "لعنة الله"، "الله يلعن"، "ملعون من الرحمن".
-     - تحريف الأسماء الحسنى: "الرحمن غضبان"، "العزيز ذليل".
-   - **الاستهزاء بالرموز**:
-     - المساجد: "بيوت خرافة"، "مساجد ضلال".
-     - الكعبة: "حجر أسود"، "صنم مكة".
-     - القرآن: "ورق بلا قيمة"، "خرافات مصحف".
-2. **المحظورات الطائفية**:
-   - ضد السنة: "السنة نواصب"، "السلفيون كفار"، "الوهابية ضلال".
-   - ضد الشيعة: "الشيعة رافضة"، "عبدة القبور"، "مجوس".
-   - ضد الصوفية: "الصوفية مشركون"، "دراويش ضالون".
-   - التكفير: "المسلمون كفار"، "الطوائف باطلة".
-3. **المحظورات الثقافية**:
-   - تحقير التقاليد: "عادات بالية"، "تخلف عربي"، "جهل الأجداد".
-   - تحقير المرأة: "النساء ناقصات"، "البنت عار"، "المرأة فتنة".
-   - التحريض العرقي: "العرب جهلة"، "الأكراد خونة"، "الأمازيغ همج".
-4. **القيم الإيجابية**:
-   - يجب أن يعكس النص قيمًا مثل الصدق، العدل، الرحمة، أو التعاون.
-   - يُفضل تضمين دروس غير مباشرة تعزز الأخلاق الحميدة.
-#### ثالثًا: الألفاظ النابية والشتائم
-1. **جميع اللهجات العربية** (يُرفض أي استخدام حتى لو كان سياقيًا):
-   - **المشرقية**: "كس"، "منيوك"، "نعل"، "شرموطة"، "تبن".
-   - **المغربية/الجزائرية**: "قحبة"، "نيك"، "طبون"، "كحلة"، "زب".
-   - **المصرية**: "كسم"، "وسخة"، "نيكني"، "شرموط"، "كس".
-   - **الخليجية**: "منيج"، "خرا"، "تبن ريلك"، "أبوي فيك".
-   - **العراقية**: "كوس"، "منيوج"، "خرا"، "جحش"، "تبن".
-   - **الشامية**: "كسك"، "أير"، "نايك"، "منيوك"، "شرموط".
-   - **السودانية**: "كداب"، "كلب"، "عرص"، "حيوان"، "خايب".
-   - **اليمنية**: "لحس"، "منيك"، "قحبة"، "كس"، "عاهرة".
-2. **الشتائم الاجتماعية**:
-   - سب الأمهات: "أمك شرموطة"، "كس أمك"، "تبن أمك".
-   - سب الآباء: "أبوك حيوان"، "نعل أبوك"، "أبو الوسخ".
-   - سب الأخوات: "أختك قحبة"، "نيك أختك"، "أختك عاهرة".
-   - عامة: "كلب"، "عرص"، "خول"، "حقير"، "خنزير"، "حمار".
-3. **الألفاظ المبتذلة**:
-   - "تفو"، "يع"، "قرف"، "نتن"، "عفن"، "وسخ"، "قذر".
-#### رابعًا: المحتوى الجنسي والأخلاقي
-1. **المحظورات الجنسية**:
-   - وصف الأعضاء: "زب"، "كس"، "طيز"، "بزاز"، "فرج"، "صدر".
-   - الأفعال: "نيك"، "لحس"، "مص"، "دخل فيها"، "مارس".
-   - الإثارة: "ساخن"، "شهوة"، "هيجان"، "رغبة"، "إثارة".
-   - العلاقات المحرمة: "عشيقة"، "حبيبي"، "خليلة"، "متعة".
-   - الشذوذ: "مثلي"، "سحاق"، "لوطي"، "شاذ"، "خنثى".
-2. **التلميحات الجنسية**:
-   - "اقترب منها بحنان"، "لمسها بشغف"، "قبلها بعمق".
-3. **التحرش أو الإيحاء الأخلاقي**:
-   - "تبعها في الشارع"، "نظرات غريبة"، "همس لها سرًا".
-#### خامسًا: العنف والمحتوى المؤذي
-1. **العنف المفرط**:
-   - "قطع رأسه"، "مزق جسده"، "عذبه حتى الموت"، "سحله".
-2. **تمجيد العنف**:
-   - "القتل شرف"، "الانتقام واجب"، "الدم يطهر".
-3. **إيذاء النفس**:
-   - "اقتل نفسك"، "انتحر"، "اجرح نفسك"، "أذي ذاتك".
-4. **العنف المقنع**:
-   - "علمه درسًا"، "جعله يندم"، "أوجعه بشدة".
-#### سادسًا: المحتوى السياسي والاجتماعي الحساس
-1. **التحريض الطائفي**:
-   - "السنة كفار"، "الشيعة مرتدون"، "الصوفية ضالون".
-2. **التحريض العرقي**:
-   - "العرب جهلة"، "الأكراد خونة"، "الأمازيغ همج".
-3. **إثارة الفتنة**:
-   - "اقتلوا الطائفة الأخرى"، "دمروا مقدساتهم".
-#### سابعًا: التحريض على المخالفات
-1. **المخدرات**:
-   - "جرب الحشيش"، "اشرب خمر"، "المخدرات ممتعة".
-2. **الفسق**:
-   - "اتبع شهواتك"، "الحرام لذيذ"، "العيب حلو".
-3. **تشجيع الجريمة**:
-   - "السرقة سهلة"، "اضرب بقوة"، "اخفِ الدليل".
-#### ثامنًا: التعبيرات الساخرة المحظورة
-1. **سخرية من الدين**:
-   - "ههه دين"، "خرافات المسلمين"، "دين الصحراء".
-2. **سخرية من الثقافة**:
-   - "تخلف عربي"، "عادات قديمة"، "جهل موروث".
-3. **سخرية من القيم**:
-   - "شرف مزيف"، "أخلاق منافقة"، "قيم كاذبة".
-#### تاسعًا: النصوص المشبوهة في السياق
-1. **التلميحات الخفية**:
-   - "فعل بها شيئًا"، "لعب معها"، "استمتع بها".
-2. **التعبيرات الغامضة**:
-   - "اقترب منها كثيرًا"، "جلسا معًا في الظلام".
-### تعليمات الإجابة:
-- إذا كان النص قصة أدبية أصيلة مكتوبة بالفصحى، يحتوي على عناصر السرد (شخصيات، حبكة، حوار، وصف)، يعكس قيمًا إيجابية، وخالٍ من أي انتهاك للمعايير أعلاه، أجب بـ **"true"** فقط.
-- إذا انتهك النص أي معيار (غير أدبي، عامية، شتائم، محتوى جنسي، عنف، تحريض، سخرية، إلخ)، أو كان خبرًا، تعليقًا، أو مادة دراسية، أجب بـ **"no"** فقط.
-- الإجابة يجب أن تكون **"true"** أو **"no"** فقط، بدون نص إضافي.
-- راجع النص بدقة لتجنب رفض نص سليم أو قبول نص مخالف.
-### النص المطلوب مراجعته:
 """
     def _call_deepseek_api(self, story_content: str) -> Dict[str, Any]:
@@ -196,7 +170,7 @@ class ArabicContentModerator:
                 "messages": [
                     {
                         "role": "system",
-                        "content": "أنت ناقد أدبي محترف متخصص في الأدب العربي والثقافة الإسلامية. مهمتك مراجعة النصوص بدقة للتأكد من التزامها بالقيم الدينية والثقافية العربية الإسلامية وكونها قصصًا أدبية أصيلة."
                     },
                     {
                         "role": "user",
@@ -204,7 +178,7 @@ class ArabicContentModerator:
                     }
                 ],
                 "max_tokens": 10,
-                "temperature": 0.0,
                 "stream": False
             }
@@ -225,7 +199,7 @@ class ArabicContentModerator:
             logger.error(f"Exception calling Deepseek API: {str(e)}")
             return {"error": str(e)}
-    def _validate_story_format(self, story_content: str) -> tuple[bool, str]:
         """
         Enhanced validation of story format and content
@@ -233,54 +207,51 @@ class ArabicContentModerator:
             story_content: Story content to validate
         Returns:
-            Tuple of (Boolean indicating if format is valid, reason for invalidity if False)
         """
         if not story_content or not isinstance(story_content, str):
-            return False, "المحتوى فارغ أو ليس نصًا"
-        # Check minimum length
         if len(story_content.strip()) < 50:
-            return False, "النص قصير جدًا ليكون قصة أدبية"
-        # Check for Arabic characters
         arabic_pattern = re.compile(r'[\u0600-\u06FF\u0750-\u077F\u08A0-\u08FF\uFB50-\uFDFF\uFE70-\uFEFF]')
         arabic_chars = len(arabic_pattern.findall(story_content))
-        if arabic_chars < len(story_content.strip()) * 0.8:
-            return False, "النص يحتوي على محتوى عربي غير كافٍ أو يستخدم لهجة عامية"
-        # Quick pre-screening for obvious violations
         content_lower = story_content.lower()
-        # Check for non-literary content patterns
-        non_literary_patterns = [
-            r'أعلنت\s*(?:الحكومة|السلطات|وزارة)',  # News
-            r'(?:برأيي|أعتقد\s*أن|من\s*وجهة\s*نظري)',  # Opinions
-            r'(?:تعريف|في\s*هذا\s*الفصل|يشرح\s*الدرس)',  # Study materials
-            r'أسباب\s*(?:النجاح|الفشل|المشكلة)\s*:\s*\d+',  # Lists
-            r'(?:اشترِ|تسوق|منتج\s*جديد|خصم\s*\d+%)'  # Advertisements
-        ]
-        for pattern in non_literary_patterns:
-            if re.search(pattern, content_lower):
-                return False, "النص غير أدبي (أخبار، تعليقات، مواد دراسية، إعلانات)"
-        # Check for profanity and religious violations
-        violation_patterns = [
             # Sexual profanity
-            r'\b(?:كس|زب|نيك|منيوك|شرموط|قحب|لحس|مص|طيز|بزاز|تبن|نعل|كوس|أير|منايك|خرا|كداب|عرص|خول|حيوان)\b',
-            # Religious violations
-            r'(?:الله\s*(?:كذاب|وهم|غبي)|لعن\s*الله|تبا\s*لله|يلعن\s*رب|القرآن\s*(?:كذب|مزور|خرافات)|محمد\s*(?:كذاب|دجال)|لعنة\s*على\s*محمد|أبو\s*بكر\s*منافق|عمر\s*ظالم|علي\s*مخادع|الصحابة\s*كذابون|الصلاة\s*مضيعة|رمضان\s*تخلف|الكعبة\s*(?:صنم|حجر)|المسيح\s*كذاب|الإنجيل\s*محرف|موسى\s*دجال|التوراة\s*مزورة|لا\s*إله|الجنة\s*وهم|النار\s*خيال|القيامة\s*كذبة|لعنة\s*الله|بيوت\s*خرافة|السنة\s*نواصب|الشيعة\s*رافضة|الصوفية\s*مشركون|الوهابيون\s*كفار)'
         ]
-        for pattern in violation_patterns:
             if re.search(pattern, content_lower):
-                if 'الله' in pattern or 'قرآن' in pattern or 'محمد' in pattern or 'الصلاة' in pattern or 'رمضان' in pattern or 'الكعبة' in pattern or 'المسيح' in pattern or 'موسى' in pattern or 'السنة' in pattern or 'الشيعة' in pattern:
-                    return False, "انتهاك ديني أو طائفي"
-                return False, "ألفاظ نابية أو محتوى غير أخلاقي"
-        return True, ""
     def moderate_story(self, story_content: str) -> Dict[str, Any]:
         """
@@ -293,13 +264,11 @@ class ArabicContentModerator:
             Dictionary with moderation result
         """
         # Enhanced validation
-        is_valid, validation_reason = self._validate_story_format(story_content)
-        if not is_valid:
             return {
                 "approved": False,
                 "response": "no",
-                "reason": validation_reason,
-                "violation_type": "format_validation" if "غير أدبي" in validation_reason or "قصير" in validation_reason or "عربي غير كافٍ" in validation_reason else "content_violation",
                 "timestamp": datetime.now().isoformat()
             }
@@ -315,7 +284,6 @@ class ArabicContentModerator:
                 "approved": False,
                 "response": "no",
                 "reason": "خطأ في خدمة المراجعة",
-                "violation_type": "api_error",
                 "error": api_response["error"],
                 "timestamp": datetime.now().isoformat()
             }
@@ -324,10 +292,10 @@ class ArabicContentModerator:
             # Extract the moderation decision
             ai_response = api_response.get("choices", [{}])[0].get("message", {}).get("content", "").strip().lower()
-            # Clean the response
             ai_response = re.sub(r'[^\w]', '', ai_response)
-            # Determine if content is approved
             approved = ai_response == "true"
             response_value = "true" if approved else "no"
@@ -340,27 +308,9 @@ class ArabicContentModerator:
             }
             if not approved:
-                result["reason"] = "المحتوى ينتهك القواعد المجتمعية أو الثقافية أو الدينية، أو أنه ليس قصة أدبية أصيلة بالفصحى"
-                result["violation_type"] = "content_violation"
-                # Categorize violation
-                content_lower = cleaned_content.lower()
-                if any(re.search(pattern, content_lower) for pattern in [
-                    r'(?:الله\s*(?:كذاب|وهم|غبي)|لعن\s*الله|تبا\s*لله|يلعن\s*رب|القرآن\s*(?:كذب|مزور|خرافات)|محمد\s*(?:كذاب|دجال)|لعنة\s*على\s*محمد|أبو\s*بكر\s*منافق|عمر\s*ظالم|علي\s*مخادع|الصحابة\s*كذابون|الصلاة\s*مضيعة|رمضان\s*تخلف|الكعبة\s*(?:صنم|حجر)|المسيح\s*كذاب|الإنجيل\s*محرف|موسى\s*دجال|التوراة\s*مزورة|لا\s*إله|الجنة\s*وهم|النار\s*خيال|القيامة\s*كذبة|لعنة\s*الله|بيوت\s*خرافة|السنة\s*نواصب|الشيعة\s*رافضة|الصوفية\s*مشركون|الوهابيون\s*كفار)'
-                ]):
-                    result["violation_type"] = "religious_violation"
-                elif any(re.search(pattern, content_lower) for pattern in [
-                    r'\b(?:كس|زب|نيك|منيوك|شرموط|قحب|لحس|مص|طيز|بزاز|تبن|نعل|كوس|أير|منايك|خرا|كداب|عرص|خول|حيوان)\b'
-                ]):
-                    result["violation_type"] = "profanity_violation"
-                elif any(re.search(pattern, content_lower) for pattern in [
-                    r'أعلنت\s*(?:الحكومة|السلطات|وزارة)|(?:برأيي|أعتقد\s*أن|من\s*وجهة\s*نظري)|(?:تعريف|في\s*هذا\s*الفصل|يشرح\s*الدرس)|أسباب\s*(?:النجاح|الفشل|المشكلة)\s*:\s*\d+|(?:اشترِ|تسوق|منتج\s*جديد|خصم\s*\d+%)'
-                ]):
-                    result["violation_type"] = "non_literary_content"
-                elif arabic_chars < len(cleaned_content.strip()) * 0.8:
-                    result["violation_type"] = "non_classical_arabic"
             else:
-                result["reason"] = "المحتوى مقبول ويلتزم بالمعايير الأدبية والثقافية"
-                result["violation_type"] = None
             logger.info(f"Moderation completed: {response_value} for content of length {len(cleaned_content)}")
             return result
@@ -371,15 +321,15 @@ class ArabicContentModerator:
                 "approved": False,
                 "response": "no",
                 "reason": "خطأ في معالجة نتيجة المراجعة",
-                "violation_type": "processing_error",
                 "error": str(e),
                 "timestamp": datetime.now().isoformat()
             }
 # Flask application
 app = Flask(__name__)
-# Initialize the moderator
 try:
     moderator = ArabicContentModerator()
     logger.info("Arabic Content Moderator initialized successfully")
@@ -394,27 +344,31 @@ def home():
         "service": "مراجع المحتوى الأدبي العربي المحسن",
         "service_en": "Enhanced Arabic Literary Content Moderator",
         "version": "2.0.0",
-        "description": "AI-powered professional literary critic for AI-generated Arabic short stories with strict cultural and religious compliance",
-        "description_ar": "ناقد أدبي محترف مدعوم بالذكاء الاصطناعي للقصص العربية القصيرة المولدة آليًا مع التزام صارم بالقيم الثقافية والدينية",
         "endpoints": {
             "/health": "Health check",
             "/moderate": "POST - Moderate single story",
             "/moderate/batch": "POST - Moderate multiple stories"
         },
         "features": [
-            "Strict validation of classical Arabic usage",
-            "Comprehensive detection of non-literary content",
-            "Enhanced religious and cultural compliance",
-            "Multi-dialect profanity detection",
-            "Context-aware violation analysis",
-            "Positive value reinforcement",
-            "Professional literary standards enforcement"
         ],
         "usage": {
             "moderate": {
                 "method": "POST",
                 "payload": {"story_content": "Arabic story text"},
-                "response": {"approved": "boolean", "response": "true/no", "reason": "string", "violation_type": "string or null"}
             }
         },
         "status": "healthy" if moderator else "service unavailable"
@@ -445,7 +399,6 @@ def moderate_content():
         "approved": true/false,
         "response": "true"/"no",
         "reason": "reason in Arabic",
-        "violation_type": "string or null",
         "timestamp": "ISO timestamp"
     }
     """
@@ -454,8 +407,7 @@ def moderate_content():
             "error": "خدمة المراجعة غير متوفرة - لم يتم تكوين مفتاح API",
             "error_en": "Moderation service not available - API key not configured",
             "approved": False,
-            "response": "no",
-            "violation_type": "service_unavailable"
         }), 500
     try:
@@ -466,8 +418,7 @@ def moderate_content():
                 "error": "محتوى القصة مفقود في الطلب",
                 "error_en": "Missing story_content in request",
                 "approved": False,
-                "response": "no",
-                "violation_type": "invalid_request"
             }), 400
         story_content = data['story_content']
@@ -482,7 +433,6 @@ def moderate_content():
             "error_en": "Internal server error",
             "approved": False,
             "response": "no",
-            "violation_type": "server_error",
             "details": str(e)
         }), 500
@@ -499,8 +449,7 @@ def moderate_batch():
     if not moderator:
         return jsonify({
             "error": "خدمة المراجعة غير متوفرة - لم يتم تكوين مفتاح API",
-            "error_en": "Moderation service not available - API key not configured",
-            "violation_type": "service_unavailable"
         }), 500
     try:
@@ -509,16 +458,14 @@ def moderate_batch():
         if not data or 'stories' not in data:
             return jsonify({
                 "error": "مصفوفة القصص مفقودة في الطلب",
-                "error_en": "Missing stories array in request",
-                "violation_type": "invalid_request"
             }), 400
         stories = data['stories']
         if not isinstance(stories, list):
             return jsonify({
                 "error": "القصص يجب أن تكون في شكل مصفوفة",
-                "error_en": "Stories must be an array",
-                "violation_type": "invalid_request"
             }), 400
         results = []
@@ -550,11 +497,10 @@ def moderate_batch():
         return jsonify({
             "error": "خطأ داخلي في الخادم",
             "error_en": "Internal server error",
-            "violation_type": "server_error",
             "details": str(e)
         }), 500
 if __name__ == '__main__':
     # For local testing
-    port = int(os.environ.get('PORT', 7860))
     app.run(host='0.0.0.0', port=port, debug=False)

 class ArabicContentModerator:
     """
     Arabic Story Content Moderation Model using Deepseek API
+    Checks for cultural violations and inappropriate content
     """
     def __init__(self, deepseek_api_key: str = None):
             "Content-Type": "application/json"
         }
+        # Enhanced professional literary critic moderation prompt with comprehensive examples
         self.moderation_prompt = """
+أنت ناقد أدبي محترف متخصص في الأدب العربي والثقافة الإسلامية. مهمتك مراجعة النصوص للتأكد من أنها قصص أدبية حقيقية وأنها تلتزم بالقيم الثقافية والدينية العربية الإسلامية.
+معايير المراجعة الصارمة مع أمثلة شاملة:
+أولاً - التحقق من طبيعة النص الأدبي:
+- يجب أن يكون النص قصة أدبية حقيقية وليس خبراً صحفياً أو تعليقاً أو مادة دراسية
+- يجب أن يحتوي على عناصر السرد: الشخصيات، الحبكة، الحوار، الوصف
+- لا يُقبل النصوص الإخبارية مثل: "أعلنت الحكومة اليوم..." أو "وفقاً للتقارير..."
+- لا يُقبل التعليقات الشخصية مثل: "أعتقد أن..." أو "من وجهة نظري..."
+ثانياً - المحتوى الديني والثقافي (فحص دقيق) - أمثلة محظورة:
+أ) الاستهزاء والسب المباشر للإسلام:
+▪ سب الله تعالى: "الله كذاب"، "لعن الله"، "تبا لله"، "يلعن رب العالمين"، "الله غبي"، "أبو الله"
+▪ سب القرآن: "القرآن كذب"، "كتاب مزور"، "خرافات القرآن"، "هراء قرآني"، "قرآن مؤلف"
+▪ سب الرسول محمد: "محمد كذاب"، "الرسول دجال"، "نبي كاذب"، "أبو محمد"، "لعنة على محمد"
+▪ سب الصحابة: "أبو بكر منافق"، "عمر ظالم"، "علي مخادع"، "الصحابة كذابون"
+▪ سب الأئمة والعلماء: "الإمام جاهل"، "الشيخ محتال"، "العلماء مضللون"
+ب) الاستهزاء بالشعائر الإسلامية:
+▪ الصلاة: "الصلاة مضيعة وقت"، "الصلاة رقص"، "السجود ذل"، "الوضوء قذارة"
+▪ الصيام: "الصيام تعذيب"، "رمضان تخلف"، "الصوم جوع اختياري"، "إفطار مبكر"
+▪ الحج: "الحج مجرد طواف حول حجر"، "الكعبة صنم"، "الحج سياحة دينية"، "طقوس وثنية"
+▪ الزكاة: "الزكاة سرقة"، "ضريبة دينية"، "استغلال الفقراء"، "نصب باسم الدين"
+ج) سب وانتقاد الأديان الأخرى:
+▪ المسيحية: "المسيح كذاب"، "الإنجيل محرف"، "المسيحيون كفار"، "الصليب لعنة"، "مريم زانية"
+▪ اليهودية: "موسى دجال"، "التوراة مزورة"، "اليهود ملعونون"، "بني إسرائيل خونة"
+▪ الهندوسية: "الهندوس وثنيون"، "آلهتم أصنام"، "البقرة إلههم"، "طقوس شيطانية"
+▪ البوذية: "بوذا شيطان"، "البوذية ضلال"، "عبادة التماثيل"، "ديانة كاذبة"
+د) التجديف والكفر المباشر:
+▪ إنكار وجود الله: "لا إله"، "الله وهم"، "لا خالق"، "الكون بلا رب"، "الله خرافة"
+▪ إنكار الآخرة: "الجنة وهم"، "النار خيال"، "القيامة كذبة"، "لا بعث ولا نشور"
+▪ إنكار الأنبياء: "لا أنبياء"، "الرسل دجالون"، "الوحي خرافة"، "النبوة كذب"
+ه) السب بالألفاظ الدينية المحرمة:
+▪ تحريف أسماء الله: "اللع"، "الرحمن الغض��ان"، "العزيز الذليل"، "الحكيم الجاهل"
+▪ اللعن الديني: "لعنة الله عليك"، "الله يلعنك"، "ملعون من رب العالمين"
+▪ القسم الكاذب: "والله كذاب"، "أقسم بالله زوراً"، "حلفان كاذب"
+و) الاستهزاء بالرموز الدينية:
+▪ المساجد: "بيوت خرافة"، "مساجد ضلال"، "مراكز غسيل مخ"، "مقرات إرهاب"
+▪ الكعبة: "حجر أسود"، "صنم مكة"، "وثن العرب"، "مكعب خرافي"
+▪ المصحف: "كتاب خرافات"، "ورق بلا قيمة"، "كلام فارغ"، "هراء مقدس"
+ز) السب الطائفي والمذهبي:
+▪ ضد السنة: "السنة نواصب"، "أهل السنة مجسمة"، "السلفيون إرهابيون"، "الوهابيون كفار"
+▪ ضد الشيعة: "الشيعة رافضة"، "أهل البدع"، "عبدة القبور"، "الشيعة مجوس"
+▪ ضد الصوفية: "الصوفية مشركون"، "دراويش ضالون"، "عبدة الأولياء"، "طرق شيطانية"
+ح) التكفير والتضليل:
+▪ تكفير المسلمين: "المسلمون كفار"، "أهل القبلة مشركون"، "المؤمنون ضالون"
+▪ تضليل الطوائف: "كلهم على باطل"، "كل الأديان كذب"، "كل المذاهب ضلال"
+ثالثاً - الألفاظ النابية والسب بجميع اللهجات العربية:
+▪ المشرقية: "كس أختك"، "منيوك"، "تبن أم..."، "نعل أبوك"، "أبو شرموطة"
+▪ المغربية/الجزائرية: "قحبة"، "نيك"، "زبي في..."، "كحلة"، "شرموطة"، "طبون أمك"
+▪ المصرية: "كسم اللي خلفك"، "ابن الوسخة"، "ابن الشرموطة"، "نيكني"، "كسك"
+▪ الخليجية: "منيج"، "أبوي فيك"، "خرا عليك"، "تبن ريلك"، "منايك"
+▪ العراقية: "كوس أمك"، "منيوج"، "ابن الجحش"، "خرا"، "تبن أبوك"
+▪ الشامية: "كسك"، "نايك"، "أير فيك"، "ابن الشرموطة"، "منيوك أختك"
+▪ السودانية: "كداب"، "خايب"، "حيوان"، "ابن الكلب"، "عرص"
+▪ اليمنية: "لحس"، "منيك"، "قحبة"، "كسك"، "عاهرة"
+رابعاً - المحتوى الجنسي والأخلاقي (رقابة صارمة) - أمثلة محظورة:
+▪ وصف الأعضاء التناسلية: "زب"، "كس"، "طيز"، "صدر"، "بزاز"، "فرج"
+▪ الأفعال الجنسية: "نيك"، "لحس"، "مص"، "دخل فيها"، "ركب عليها"، "مارس الجنس"
+▪ الإثارة الجنسية: "مثير"، "ساخن"، "شهوة"، "رغبة جنسية"، "انتصاب"، "هيجان"
+▪ العلاقات المحرمة: "حبيبي"، "عشيقة"، "خليلة"، "صديق بفوائد"، "متعة"
+▪ الشذوذ الجنسي: "مثلي"، "لوطي"، "سحاقية"، "شاذ"، "خنثى"
+خامساً - العنف والمحتوى المؤذي - أمثلة محظورة:
+▪ العنف المفرط: "قطع رأسه"، "مزق جسده"، "عذبه حتى الموت"، "سحله"
+▪ تمجيد القتل: "القتل شرف"، "الانتقام واجب"، "الدم يغسل العار"
+▪ إيذاء النفس: "اقتل نفسك"، "انتحر"، "اجرح نفسك"، "أذي نفسك"
+سادساً - المحتوى السياسي والاجتماعي الحساس - أمثلة محظورة:
+▪ التحريض الطائفي: "السنة كفار"، "الشيعة مرتدون"، "الصوفية ضالون"
+▪ التحريض العرقي: "العرب متخلفون"، "الأكراد خونة"، "البربر همج"
+▪ إثارة الفتنة: "اقتلوا الطائفة الأخرى"، "احرقوا مساجدهم"، "دمروا مقدساتهم"
+سابعاً - السب والشتائم الاجتماعية بجميع اللهجات:
+▪ سب الأمهات: "أم الخبيث"، "أمك شرموطة"، "تبن أم اللي خلفك"، "كس أم..."
+▪ سب الآباء: "أبوك حيوان"، "تبن أبوك"، "أبو الوسخ"، "نعل أبو..."
+▪ سب الأخوات: "أختك عاهرة"، "كس أختك"، "أختك قحبة"، "نيك أختك"
+▪ الشتائم العامة: "ابن الكلب"، "ابن الحرام"، "عرص"، "خول"، "معفن"، "وسخ"، "نذل"، "حقير"، "خنزير"، "كلب"، "حمار"، "بهيمة"
+ثامناً - تعبيرات الاستخفاف والسخرية المحظورة:
+▪ من الدين: "ههههه دين"، "دين الصحراء"، "خرافات المسلمين"
+▪ من التقاليد: "عادات بالية"، "تخلف عربي"، "جهل الأجداد"
+▪ من القيم: "شرف كاذب"، "أخلاق مصطنعة"، "قيم منافقة"
+تاسعاً - الكلمات المبتذلة والعامية المرفوضة:
+▪ ألفاظ مبتذلة: "تفو"، "يع"، "قرف"، "وسخ"، "قذر"، "نتن"، "عفن"
+▪ تعبيرات جنسية مخفية: "عمل شيء"، "فعل به الفاحشة"، "لعب معها"، "استمتع بها"
+عاشراً - التحريض والدعوة للمخالفات:
+▪ المخدرات: "خذ حبة"، "اشرب خمر"، "جرب الحشيش"، "المخدرات رائعة"
+▪ الفسق: "اتبع شهواتك"، "لا تلتزم بالحلال"، "الحرام لذيذ"، "العيب حلو"
+أحد عشر - العبارات المشبوهة في السياق:
+▪ التلميحات الجنسية: "اقترب منها أكثر"، "لمسها بحنان"، "قبلها بشغف"
+▪ العنف المقنع: "علمه درساً لن ينساه"، "جعله يندم"، "أوجعه"
+إثنا عشر - التعبيرات المسيئة للمرأة:
+▪ تحقير المرأة: "المرأة ناقصة عقل"، "النساء عورة"، "المرأة فتنة"، "البنت عار"
+انتبه: هذه الأمثلة للتوضيح فقط. أي نص يحتوي على مثل هذه التعبيرات أو ما يشبهها أو يحمل نفس المعنى بأي لهجة عربية يجب رفضه فوراً.
+تعليمات الإجابة:
+- إذا كان النص قصة أدبية حقيقية وملتزمة بجميع المعايير وخالية من جميع الأمثلة المحظورة أعلاه، أجب بـ "true" فقط
+- إذا انتهك النص أي معيار أو احتوى على أي من الأمثلة المحظورة أو ما يشبهها، أجب بـ "no" فقط
+- يجب أن تكون إجابتك "true" أو "no" فقط بدون أي نص إضافي
+النص المطلوب مراجعته:
 """
     def _call_deepseek_api(self, story_content: str) -> Dict[str, Any]:
                 "messages": [
                     {
                         "role": "system",
+                        "content": "أنت ناقد أدبي محترف متخصص في الأدب العربي والثقافة الإسلامية. مهمتك مراجعة النصوص بدقة شديدة للتأكد من التزامها بالقيم الدينية والثقافية العربية الإسلامية ومن كونها قصصاً أدبية حقيقية."
                     },
                     {
                         "role": "user",
                     }
                 ],
                 "max_tokens": 10,
+                "temperature": 0.0,  # Changed to 0.0 for more consistent results
                 "stream": False
             }
             logger.error(f"Exception calling Deepseek API: {str(e)}")
             return {"error": str(e)}
+    def _validate_story_format(self, story_content: str) -> bool:
         """
         Enhanced validation of story format and content
             story_content: Story content to validate
         Returns:
+            Boolean indicating if format is valid
         """
         if not story_content or not isinstance(story_content, str):
+            return False
+        # Check minimum length (at least 50 characters for a meaningful story)
         if len(story_content.strip()) < 50:
+            return False
+        # Check for Arabic characters (must have substantial Arabic content)
         arabic_pattern = re.compile(r'[\u0600-\u06FF\u0750-\u077F\u08A0-\u08FF\uFB50-\uFDFF\uFE70-\uFEFF]')
         arabic_chars = len(arabic_pattern.findall(story_content))
+        # Arabic characters should be at least 30% of total characters
+        if arabic_chars < len(story_content.strip()) * 0.3:
+            return False
+        # Quick pre-screening for obvious violations (before API call)
         content_lower = story_content.lower()
+        # Check for common profanity patterns across dialects AND religious violations
+        profanity_patterns = [
             # Sexual profanity
+            r'\bكس\b', r'\bزب\b', r'\bنيك\b', r'\bمنيوك\b', r'\bشرموط\b',
+            r'\bقحب\b', r'\bلحس\b', r'\bمص\b', r'\bطيز\b', r'\bبزاز\b',
+            r'\bتبن\b', r'\bنعل\b', r'\bكوس\b', r'\bأير\b', r'\bمنايك\b',
+            r'\bخرا\b', r'\bكداب\b', r'\bعرص\b', r'\bخول\b', r'\bحيوان\b',
+            # Religious violations and blasphemy
+            r'الله كذاب', r'لعن الله', r'تبا لله', r'يلعن رب', r'الله غبي',
+            r'القرآن كذب', r'كتاب مزور', r'خرافات القرآن', r'قرآن مؤلف',
+            r'محمد كذاب', r'الرسول دجال', r'نبي كاذب', r'لعنة على محمد',
+            r'أبو بكر منافق', r'عمر ظالم', r'علي مخادع', r'الصحابة كذابون',
+            r'الصلاة مضيعة', r'رمضان تخلف', r'الحج طقوس', r'الكعبة صنم',
+            r'المسيح كذاب', r'الإنجيل محرف', r'موسى دجال', r'التوراة مزورة',
+            r'لا إله', r'الله وهم', r'الجنة وهم', r'النار خيال', r'القيامة كذبة',
+            r'لعنة الله', r'الله يلعنك', r'ملعون من رب', r'بيوت خرافة',
+            r'السنة نواصب', r'الشيعة رافضة', r'الصوفية مشركون', r'الوهابيون كفار'
         ]
+        for pattern in profanity_patterns:
             if re.search(pattern, content_lower):
+                return False
+        return True
     def moderate_story(self, story_content: str) -> Dict[str, Any]:
         """
             Dictionary with moderation result
         """
         # Enhanced validation
+        if not self._validate_story_format(story_content):
             return {
                 "approved": False,
                 "response": "no",
+                "reason": "فشل في التحقق من صحة تنسيق القصة أو عدم وجود محتوى عربي كافٍ",
                 "timestamp": datetime.now().isoformat()
             }
                 "approved": False,
                 "response": "no",
                 "reason": "خطأ في خدمة المراجعة",
                 "error": api_response["error"],
                 "timestamp": datetime.now().isoformat()
             }
             # Extract the moderation decision
             ai_response = api_response.get("choices", [{}])[0].get("message", {}).get("content", "").strip().lower()
+            # Clean the response (remove any extra whitespace or characters)
             ai_response = re.sub(r'[^\w]', '', ai_response)
+            # Determine if content is approved (be more strict)
             approved = ai_response == "true"
             response_value = "true" if approved else "no"
             }
             if not approved:
+                result["reason"] = "المحتوى ينتهك القواعد المجتمعية أو الثقافية أو الدينية، أو أنه ليس قصة أدبية حقيقية"
             else:
+                result["reason"] = "المحتوى مقبول ويلتزم بالمعايير المطلوبة"
             logger.info(f"Moderation completed: {response_value} for content of length {len(cleaned_content)}")
             return result
                 "approved": False,
                 "response": "no",
                 "reason": "خطأ في معالجة نتيجة المراجعة",
                 "error": str(e),
                 "timestamp": datetime.now().isoformat()
             }
 # Flask application
 app = Flask(__name__)
+# Initialize the moderator (API key will be set via environment variable)
 try:
     moderator = ArabicContentModerator()
     logger.info("Arabic Content Moderator initialized successfully")
         "service": "مراجع المحتوى الأدبي العربي المحسن",
         "service_en": "Enhanced Arabic Literary Content Moderator",
         "version": "2.0.0",
+        "description": "AI-powered professional literary critic for Arabic short stories with comprehensive dialect-aware moderation",
+        "description_ar": "ناقد أدبي محترف مدعوم بالذكاء الاصطناعي للقصص العربية القصيرة مع مراجعة شاملة لجميع اللهجات العربية",
         "endpoints": {
             "/health": "Health check",
             "/moderate": "POST - Moderate single story",
             "/moderate/batch": "POST - Moderate multiple stories"
         },
         "features": [
+            "Comprehensive profanity detection across all Arabic dialects",
+            "Enhanced religious and cultural compliance checking with specific examples",
+            "Professional literary criticism standards",
+            "Strict content type validation (stories only)",
+            "Multi-dialect offensive content detection (Gulf, Levantine, Egyptian, Maghrebi, Iraqi, Sudanese, Yemeni)",
+            "Comprehensive religious blasphemy detection (Islam, Christianity, Judaism, other faiths)",
+            "Advanced sectarian and inter-religious conflict prevention",
+            "Takfir and religious defamation blocking",
+            "Advanced pre-screening before API calls",
+            "Arabic language purity validation",
+            "Context-aware violation detection"
         ],
         "usage": {
             "moderate": {
                 "method": "POST",
                 "payload": {"story_content": "Arabic story text"},
+                "response": {"approved": "boolean", "response": "true/no"}
             }
         },
         "status": "healthy" if moderator else "service unavailable"
         "approved": true/false,
         "response": "true"/"no",
         "reason": "reason in Arabic",
         "timestamp": "ISO timestamp"
     }
     """
             "error": "خدمة المراجعة غير متوفرة - لم يتم تكوين مفتاح API",
             "error_en": "Moderation service not available - API key not configured",
             "approved": False,
+            "response": "no"
         }), 500
     try:
                 "error": "محتوى القصة مفقود في الطلب",
                 "error_en": "Missing story_content in request",
                 "approved": False,
+                "response": "no"
             }), 400
         story_content = data['story_content']
             "error_en": "Internal server error",
             "approved": False,
             "response": "no",
             "details": str(e)
         }), 500
     if not moderator:
         return jsonify({
             "error": "خدمة المراجعة غير متوفرة - لم يتم تكوين مفتاح API",
+            "error_en": "Moderation service not available - API key not configured"
         }), 500
     try:
         if not data or 'stories' not in data:
             return jsonify({
                 "error": "مصفوفة القصص مفقودة في الطلب",
+                "error_en": "Missing stories array in request"
             }), 400
         stories = data['stories']
         if not isinstance(stories, list):
             return jsonify({
                 "error": "القصص يجب أن تكون في شكل مصفوفة",
+                "error_en": "Stories must be an array"
             }), 400
         results = []
         return jsonify({
             "error": "خطأ داخلي في الخادم",
             "error_en": "Internal server error",
             "details": str(e)
         }), 500
 if __name__ == '__main__':
     # For local testing
+    port = int(os.environment.get('PORT', 7860))
     app.run(host='0.0.0.0', port=port, debug=False)