import json
import random


def generate_data(count=3000):
    categories = [
        {
            "topic": "Greeting",
            "keywords": ["မင်္ဂလာ", "ဟိုင်း", "ဘယ်လိုလဲ", "နေကောင်းလား", "အခြေအနေ"],
            "step1": "🔍 အဆင့် ၁ - Perception: ဒါဟာ နှုတ်ခွန်းဆက်ခြင်း (Greeting) အမျိုးအစားဖြစ်ပါတယ်။ User က ယဉ်ကျေးစွာ စကားစမြည်ပြောဆိုလိုတာပါ။",
            "step2": "🧠 အဆင့် ၂ - Logical Sequence:\n   1️⃣ ပထမ User ရဲ့ စကားထဲမှာ Greeting Pattern (မင်္ဂလာ၊ ဟိုင်း၊ နေကောင်းလား) စစ်ဆေးပါ။\n   2️⃣ ဒုတိယ အခြေအနေအရ Standard Greeting Response ကို ပြန်လည်ရွေးချယ်ပါ။\n   3️⃣ တတိယ Response ကို ယဉ်ကျေးပျူငှာစွာ ပြန်ဆိုရန် ပြင်ဆင်ပါ။",
            "step3": "✅ အဆင့် ၃ - Verification: ပြန်ဆိုလိုက်တဲ့ Response ဟာ မြန်မာ့ယဉ်ကျေးမှုနဲ့ ကိုက်ညီပြီး လေးစားဖွယ်ရှိမရှိ ပြန်စစ်ပါ။ Politeness level သင့်တော်ကြောင်း အတည်ပြုပါ။",
            "answers": ["🙏 အဖြေ: **မင်္ဂလာပါ။ နေကောင်းလား။** ခင်ဗျားရဲ့ မေးမြန်းမှုအတွက် ကျေးဇူးတင်ပါတယ်။", "🙏 အဖြေ: **မင်္ဂလာပါ။** ကျွန်တော် ဘာကူညီပေးရမလဲခင်ဗျာ။", "🙏 အဖြေ: **ဟိုင်း!** နေကောင်းပါတယ်။ သင်ရော နေကောင်းရဲ့လား။"]
        },
        {
            "topic": "Thanking",
            "keywords": ["ကျေးဇူး", "ကျေးဇူးတင်", "thank you", "thanks", "ကျေးဇူးပါ"],
            "step1": "🔍 အဆင့် ၁ - Perception: ဒါဟာ ကျေးဇူးတင်စကား (Thanking) အမျိုးအစားဖြစ်ပါတယ်။ User က အကူအညီအတွက် ကျေးဇူးတင်ကြောင်း ဖော်ပြလိုတာပါ။",
            "step2": "🧠 အဆင့် ၂ - Logical Sequence:\n   1️⃣ User ရဲ့ ကျေးဇူးတင်စကားကို အသိအမှတ်ပြုပါ။\n   2️⃣ ဝမ်းမြောက်ကြောင်း ပြန်လည်တုံ့ပြန်ပါ။\n   3️⃣ နောင်တွင်လည်း ကူညီရန် အသင့်ရှိကြောင်း ဖော်ပြပါ။",
            "step3": "✅ အဆင့် ၃ - Verification: တုံ့ပြန်မှုဟာ ဖော်ရွေပြီး ကူညီလိုစိတ်ရှိကြောင်း ပေါ်လွင်စေရပါမယ်။",
            "answers": ["🙏 အဖြေ: **ရပါတယ်ခင်ဗျာ။** ကူညီခွင့်ရတာ ဝမ်းသာပါတယ်။", "🙏 အဖြေ: **ကျေးဇူးတင်စရာ မလိုပါဘူး။** နောက်လည်း လိုအပ်တာရှိရင် ပြောပါဦး။", "🙏 အဖြေ: **မလိုပါဘူးခင်ဗျာ။** ကျွန်တော့်ဘက်က အမြဲအသင့်ရှိနေမှာပါ။"]
        },
        {
            "topic": "Apology",
            "keywords": ["ဆောရီး", "တောင်းပန်", "မှားသွား", "sorry", "ခွင့်လွှတ်"],
            "step1": "🔍 အဆင့် ၁ - Perception: ဒါဟာ တောင်းပန်စကား (Apology) အမျိုးအစားဖြစ်ပါတယ်။ User က အမှားတစ်ခုခုအတွက် စိတ်မကောင်းဖြစ်နေတာပါ။",
            "step2": "🧠 အဆင့် ၂ - Logical Sequence:\n   1️⃣ User ရဲ့ တောင်းပန်မှုကို လက်ခံပါ။\n   2️⃣ ကိစ္စမရှိကြောင်း သို့မဟုတ် နားလည်ကြောင်း ပြန်ပြောပါ။\n   3️⃣ အခြေအနေကို ပြေလည်အောင် ညှိနှိုင်းပါ။",
            "step3": "✅ အဆင့် ၃ - Verification: တုံ့ပြန်မှုဟာ စာနာနားလည်မှုရှိပြီး အပြုသဘောဆောင်ရပါမယ်။",
            "answers": ["🙏 အဖြေ: **ရပါတယ်ခင်ဗျာ။** စိတ်ထဲမထားပါနဲ့။", "🙏 အဖြေ: **ကိစ္စမရှိပါဘူး။** လူတိုင်း မှားတတ်တာပဲလေ။", "🙏 အဖြေ: **နားလည်ပေးလို့ ရပါတယ်။** နောက်တစ်ခါ သတိထားရင် ရပါပြီ။"]
        },
        {
            "topic": "Asking for Help",
            "keywords": ["ကူညီ", "အကူအညီ", "help", "မေးချင်", "သိချင်"],
            "step1": "🔍 အဆင့် ၁ - Perception: ဒါဟာ အကူအညီတောင်းခံခြင်း (Requesting Help) အမျိုးအစားဖြစ်ပါတယ်။ User က တစ်ခုခုကို သိလိုတာ သို့မဟုတ် လုပ်ဆောင်ပေးစေလိုတာပါ။",
            "step2": "🧠 အဆင့် ၂ - Logical Sequence:\n   1️⃣ User ရဲ့ လိုအပ်ချက်ကို သေချာနားထောင်ပါ။\n   2️⃣ ကူညီပေးနိုင်ကြောင်း အတည်ပြုပါ။\n   3️⃣ အသေးစိတ် အချက်အလက်ကို မေးမြန်းပါ။",
            "step3": "✅ အဆင့် ၃ - Verification: တုံ့ပြန်မှုဟာ တက်ကြွပြီး အားကိုးထိုက်ကြောင်း ပြသရပါမယ်။",
            "answers": ["🙏 အဖြေ: **ဟုတ်ကဲ့ခင်ဗျာ။** ဘာများ ကူညီပေးရမလဲ ပြောပြပေးပါ။", "🙏 အဖြေ: **သေချာပေါက် ကူညီပေးပါ့မယ်။** ဘာအကြောင်း သိချင်တာလဲခင်ဗျာ။", "🙏 အဖြေ: **ပြောပါခင်ဗျာ။** ကျွန်တော် တတ်နိုင်သလောက် အကောင်းဆုံး ကူညီပေးပါ့မယ်။"]
        },
        {
            "topic": "Farewell",
            "keywords": ["သွားပြီ", "နှုတ်ဆက်", "bye", "goodbye", "နောက်မှတွေ့မယ်"],
            "step1": "🔍 အဆင့် ၁ - Perception: ဒါဟာ နှုတ်ဆက်ခြင်း (Farewell) အမျိုးအစားဖြစ်ပါတယ်။ User က စကားပြောခြင်းကို ရပ်နားလိုတာပါ။",
            "step2": "🧠 အဆင့် ၂ - Logical Sequence:\n   1️⃣ User ရဲ့ နှုတ်ဆက်မှုကို အသိအမှတ်ပြုပါ။\n   2️⃣ ကောင်းမွန်တဲ့ ဆုတောင်းစကား ပြောကြားပါ။\n   3️⃣ နောက်တစ်ကြိမ် ပြန်လည်ဆုံတွေ့ရန် ဖိတ်ခေါ်ပါ။",
            "step3": "✅ အဆင့် ၃ - Verification: တုံ့ပြန်မှုဟာ နွေးထွေးပြီး အဆုံးသတ်ကောင်းတစ်ခု ဖြစ်ရပါမယ်။",
            "answers": ["🙏 အဖြေ: **ဟုတ်ကဲ့ပါ။** သွားပါဦးခင်ဗျာ။ ဘေးကင်းပါစေ။", "🙏 အဖြေ: **Bye Bye!** နောက်မှ ပြန်တွေ့ကြတာပေါ့။", "🙏 အဖြေ: **ကောင်းသောနေ့လေး ဖြစ်ပါစေ။** နောက်မှ ပြန်စကားပြောကြမယ်နော်။"]
        }
    ]


    data_list = []
    for i in range(count):
        cat = random.choice(categories)
        entry = {
            "keywords": cat["keywords"],
            "step1": cat["step1"],
            "step2": cat["step2"],
            "step3": cat["step3"],
            "answer": random.choice(cat["answers"])
        }
        data_list.append(entry)
    
    return data_list


if __name__ == "__main__":
    result = generate_data(3000)
    with open("responses.jsonl", "w", encoding="utf-8") as f:
        json.dump(result, f, ensure_ascii=False, indent=3)
    print(f"Successfully generated 3000 entries.")