Spaces:

irhamni
/

predict

Running

App Files Files Community

irhamni commited on Jan 16

Commit

2df7b5a

verified ·

1 Parent(s): 3a2cd4b

Update app.py

Browse files

Files changed (1) hide show

app.py +101 -4

app.py CHANGED Viewed

@@ -1447,6 +1447,104 @@ def build_kpi_markdown(summary_jenis: pd.DataFrame, agg_total: pd.DataFrame, agg
 # 14) LLM + WORD
 # ============================================================
 def generate_word_report(wilayah, summary_jenis, agg_total, agg_jenis, analysis_text):
     doc = Document()
     doc.add_heading(f"Laporan IPLM — {wilayah}", level=1)
@@ -1507,15 +1605,14 @@ def generate_word_report(wilayah, summary_jenis, agg_total, agg_jenis, analysis_
     doc.add_heading("Metodologi", level=2)
     doc.add_paragraph(
         "Indeks dasar dihitung per entitas menggunakan transformasi Yeo-Johnson dan normalisasi MinMax nasional per indikator. "
-        "Nilai kemudian diagregasi per wilayah×jenis untuk memperoleh Indeks Dasar wilayah per jenis."
     )
     doc.add_paragraph(
         "Penyesuaian dilakukan berbasis kecukupan sampel minimum 68% pada level wilayah, "
-        "dengan rumus faktor = min(total_terkumpul / target_total_68, 1.0). "
-        "Indeks_Final_wilayah×jenis = Indeks_Dasar_Agregat × faktor."
     )
     doc.add_paragraph(
-        "Nilai keseluruhan wilayah (FIX) dihitung sebagai rata-rata 3 jenis (sekolah+umum+khusus) ÷ 3, dengan missing dianggap 0."
     )
     doc.add_heading("Analisis Naratif (LLM)", level=2)

 # 14) LLM + WORD
 # ============================================================
+_HF_CLIENT = None
+def get_llm_client():
+    global _HF_CLIENT
+    if _HF_CLIENT is not None:
+        return _HF_CLIENT
+    try:
+        _HF_CLIENT = InferenceClient(model=LLM_MODEL_NAME, token=HF_TOKEN) if HF_TOKEN else InferenceClient(model=LLM_MODEL_NAME)
+        return _HF_CLIENT
+    except Exception:
+        _HF_CLIENT = None
+        return None
+def build_context(summary_jenis: pd.DataFrame, agg_total: pd.DataFrame, verif_total: pd.DataFrame, wilayah: str, kew: str) -> str:
+    lines = []
+    lines.append(f"Wilayah filter: {wilayah}")
+    lines.append(f"Kewenangan: {kew}")
+    lines.append("Metode: Indeks dasar dihitung per entitas (Yeo-Johnson + MinMax nasional per indikator), lalu diagregasi per wilayah×jenis.")
+    lines.append("Penyesuaian: faktor = min(total_terkumpul / target_total_68, 1.0).")
+    lines.append("FIX keseluruhan: nilai keseluruhan = rata-rata 3 jenis (sekolah+umum+khusus) ÷ 3 (missing=0, tetap ÷3).")
+    if summary_jenis is not None and not summary_jenis.empty:
+        lines.append("\nRingkasan (jenis + keseluruhan):")
+        for _, r in summary_jenis.iterrows():
+            try:
+                jenis = str(r.get("Jenis", "")).strip()
+                jw = int(pd.to_numeric(r.get("Jumlah_Wilayah", 0), errors="coerce") or 0)
+                tp = int(pd.to_numeric(r.get("Total_Perpus", 0), errors="coerce") or 0)
+                fin = float(pd.to_numeric(r.get("Indeks_Final_Disesuaikan_0_100", 0), errors="coerce") or 0)
+                das = float(pd.to_numeric(r.get("Indeks_Dasar_0_100", 0), errors="coerce") or 0)
+                cov = float(pd.to_numeric(r.get("Coverage_Target68_Jenis_%", 0), errors="coerce") or 0)
+                lines.append(f"- {jenis}: wilayah={jw}, total_perpus={tp}, dasar={das:.2f}, final={fin:.2f}, coverage_target68={cov:.2f}%")
+            except Exception:
+                continue
+    if agg_total is not None and not agg_total.empty:
+        label_col = "Kab/Kota" if "Kab/Kota" in agg_total.columns else ("Provinsi" if "Provinsi" in agg_total.columns else None)
+        if label_col:
+            lines.append("\nTop 5 wilayah (Final tertinggi):")
+            top = agg_total.sort_values("Indeks_Final_Wilayah_0_100", ascending=False).head(5)
+            for _, r in top.iterrows():
+                wl = str(r.get(label_col, "(wilayah)"))
+                fin = float(pd.to_numeric(r.get("Indeks_Final_Wilayah_0_100", 0), errors="coerce") or 0)
+                lines.append(f"- {wl}: Final={fin:.2f}")
+    return "\n".join(lines)
+def generate_llm_analysis(summary_jenis, agg_total, verif_total, wilayah, kew):
+    ctx = build_context(summary_jenis, agg_total, verif_total, wilayah, kew)
+    # kalau LLM dimatikan / token gak ada -> return teks aman
+    client = get_llm_client()
+    if (client is None) or (not USE_LLM):
+        return (
+            "Analisis otomatis (LLM) tidak tersedia.\n\n"
+            "Catatan: Set USE_LLM=True dan pastikan HF_TOKEN tersedia bila ingin mengaktifkan analisis LLM."
+        )
+    system_prompt = (
+        "Anda adalah analis kebijakan perpustakaan dan literasi di Indonesia. "
+        "Tugas Anda menyusun analisis berbasis data IPLM secara formal, tajam, dan operasional."
+    )
+    user_prompt = f"""
+DATA RINGKAS IPLM:
+{ctx}
+TULISKAN ANALISIS BAHASA INDONESIA FORMAL, STRUKTUR:
+1) Gambaran umum hasil wilayah (1 paragraf).
+2) Analisis jenis sekolah, umum, khusus serta indeks keseluruhan (2 paragraf).
+3) Penjelasan makna penyesuaian berbasis target 68% (1 paragraf, netral).
+4) Rekomendasi program 3–5 tahun (2 paragraf, konkret dan dapat dieksekusi).
+ATURAN:
+- Jangan memakai label eksplisit "rendah/sedang/tinggi".
+- Gunakan frasa netral: "memerlukan penguatan", "memerlukan konsolidasi", dsb.
+"""
+    try:
+        resp = client.chat_completion(
+            model=LLM_MODEL_NAME,
+            messages=[
+                {"role": "system", "content": system_prompt},
+                {"role": "user", "content": user_prompt},
+            ],
+            max_tokens=1100,
+            temperature=0.25,
+            top_p=0.9,
+        )
+        text = resp.choices[0].message.content.strip()
+        return text if text else "LLM mengembalikan respon kosong."
+    except Exception as e:
+        return f"⚠️ Error saat memanggil LLM: {repr(e)}"
 def generate_word_report(wilayah, summary_jenis, agg_total, agg_jenis, analysis_text):
     doc = Document()
     doc.add_heading(f"Laporan IPLM — {wilayah}", level=1)
     doc.add_heading("Metodologi", level=2)
     doc.add_paragraph(
         "Indeks dasar dihitung per entitas menggunakan transformasi Yeo-Johnson dan normalisasi MinMax nasional per indikator. "
+        "Nilai kemudian diagregasi per wilayah×jenis."
     )
     doc.add_paragraph(
         "Penyesuaian dilakukan berbasis kecukupan sampel minimum 68% pada level wilayah, "
+        "dengan rumus faktor = min(total_terkumpul / target_total_68, 1.0)."
     )
     doc.add_paragraph(
+        "Nilai keseluruhan (FIX) dihitung sebagai rata-rata 3 jenis (sekolah+umum+khusus) ÷ 3, dengan missing dianggap 0."
     )
     doc.add_heading("Analisis Naratif (LLM)", level=2)