JobRecommendation-JSON-EN

Running

App Files Files Community

firmanaziz commited on Mar 6

Commit

6d082aa

verified ·

1 Parent(s): 86249f9

Update app.py

Browse files

Files changed (1) hide show

app.py +132 -63

app.py CHANGED Viewed

@@ -1,9 +1,26 @@
 import gradio as gr
 import fitz  # PyMuPDF
 import json
 import urllib.parse
-# --- KONSTANTA BATAS TOKEN OUTPUT ---
 MAX_OUTPUT_TOKENS = 8192
 # --- FUNGSI-FUNGSI UTAMA ---
@@ -22,91 +39,143 @@ def generate_search_links(keywords):
     keywords_encoded = urllib.parse.quote_plus(keywords)
     keywords_hyphenated = keywords.lower().replace(" ", "-").replace("(", "").replace(")", "")
     links = {
-        "LinkedIn": f"https://www.linkedin.com/jobs/search/?keywords={keywords_encoded}&location=Indonesia",
-        "JobStreet": f"https://www.jobstreet.co.id/id/job-search/{keywords_hyphenated}-jobs/",
-        "Glints": f"https://glints.com/id/opportunities/jobs/explore?keyword={keywords_encoded}",
-        "Indeed": f"https://id.indeed.com/jobs?q={keywords_encoded}",
-        "Google Jobs": f"https://www.google.com/search?q={keywords_encoded}+jobs+in+Indonesia&ibp=htl;jobs"
     }
     return links
-def get_dummy_analysis(nama_kandidat="Kandidat"):
-    """Mengembalikan data analisis karir dummy untuk keperluan testing."""
-    return {
-        "jabatan_ideal": "Software Engineer (Backend)",
-        "alasan_kecocokan": [
-            f"{nama_kandidat} memiliki pengalaman solid dalam pengembangan backend menggunakan Python dan Node.js.",
-            "Portofolio menunjukkan kemampuan merancang arsitektur RESTful API yang scalable.",
-            "Latar belakang pendidikan di bidang Ilmu Komputer mendukung pemahaman algoritma yang kuat.",
-            "Pengalaman berkolaborasi dalam tim Agile menjadikan kandidat siap di lingkungan kerja modern."
-        ],
-        "deskripsi_pekerjaan": [
-            "Merancang, membangun, dan memelihara layanan backend yang efisien dan andal.",
-            "Berkolaborasi dengan tim frontend untuk mendefinisikan dan mengimplementasikan antarmuka API.",
-            "Melakukan code review dan memastikan standar kualitas kode terpenuhi.",
-            "Mengoptimalkan performa aplikasi dan query database untuk skala besar.",
-            "Mendokumentasikan arsitektur sistem dan proses teknis secara berkala."
-        ],
-        "potensi_karir": [
-            "Senior Backend Engineer dalam 2-3 tahun dengan spesialisasi di sistem terdistribusi.",
-            "Tech Lead atau Engineering Manager setelah membangun pengalaman kepemimpinan tim.",
-            "Solution Architect untuk kandidat yang tertarik pada desain sistem skala enterprise.",
-            "Wirausaha teknologi atau CTO di startup bidang teknologi."
-        ],
-        "kisaran_gaji": {
-            "junior": "Rp 6.000.000 - Rp 10.000.000 / bulan",
-            "mid_level": "Rp 12.000.000 - Rp 20.000.000 / bulan",
-            "senior": "Rp 22.000.000 - Rp 40.000.000 / bulan"
-        },
-        "kelebihan_tambahan": [
-            "Kandidat memiliki kontribusi aktif di GitHub yang memperkuat kredibilitas teknis secara publik.",
-            "Kemampuan komunikasi dalam bahasa Inggris membuka peluang karir di perusahaan multinasional atau remote global."
-        ]
-    }
 def analyze_career_path(cv_file):
-    """Fungsi utama pipeline (DUMMY): Ekstrak PDF -> Return JSON dummy -> Tambah Link."""
     if cv_file is None:
         raise gr.Error("Mohon upload file CV (PDF) Anda.")
     try:
-        print("--- [DUMMY MODE] Memulai Proses Analisis Karir ---")
-        # Tetap ekstrak teks PDF agar input pipeline tetap berjalan normal
         teks_cv = ekstrak_teks_dari_pdf(cv_file.name)
         if not teks_cv:
             raise gr.Error("PDF kosong atau tidak dapat dibaca.")
-        print(f"✅ Teks berhasil diekstrak ({len(teks_cv)} karakter). [Tidak dikirim ke API]")
-        # Coba ambil nama dari baris pertama teks CV sebagai sentuhan personal
-        nama_kandidat = teks_cv.strip().splitlines()[0].strip() if teks_cv.strip() else "Kandidat"
-        print(f"👤 Nama kandidat terdeteksi: {nama_kandidat}")
-        print("2. [DUMMY] Melewati pemanggilan Gemini API, menggunakan data dummy...")
-        response_json = get_dummy_analysis(nama_kandidat)
-        print("✅ Data dummy berhasil disiapkan.")
-        print("3. Membuat tautan pencarian dari hasil analisis...")
-        keywords_from_analysis = response_json.get("jabatan_ideal", "")
-        search_links = generate_search_links(keywords_from_analysis)
         response_json["tautan_pencarian"] = search_links
-        print("✅ Tautan pencarian ditambahkan ke JSON.")
-        print("--- [DUMMY MODE] Proses Selesai ---")
         return response_json
     except Exception as e:
         print(f"🛑 ERROR DALAM FUNGSI ANALISIS: {e}")
         raise gr.Error(f"Terjadi kesalahan: {e}")
-# --- MEMBUAT INTERFACE GRADIO ---
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
     gr.Markdown("# 🚀 API Analis Peluang Karir Personal")
-    gr.Markdown(
-        "> ⚠️ **MODE TESTING (DUMMY)** — Output menggunakan data statis, bukan hasil dari Gemini API.\n\n"
-        "Antarmuka ini dapat digunakan untuk pengujian. Endpoint API publik tersedia di `/run/predict` untuk integrasi ke website Anda."
-    )
     with gr.Row():
         with gr.Column(scale=1):

 import gradio as gr
+import google.generativeai as genai
 import fitz  # PyMuPDF
 import json
+import os
+import re
 import urllib.parse
+# --- KONFIGURASI API KEY ---
+API_CONFIGURED = False
+try:
+    api_key = os.environ.get('GEMINI_API_KEY')
+    if api_key:
+        genai.configure(api_key=api_key)
+        model = genai.GenerativeModel('gemma-3-27b-it')  # Gemma 3 1B
+        API_CONFIGURED = True
+        print("✅ Konfigurasi API dan model berhasil.")
+    else:
+        print("🛑 Secret 'GEMINI_API_KEY' tidak ditemukan.")
+except Exception as e:
+    print(f"🛑 Terjadi error saat inisialisasi: {e}")
+# --- KONSTANTA ---
 MAX_OUTPUT_TOKENS = 8192
 # --- FUNGSI-FUNGSI UTAMA ---
     keywords_encoded = urllib.parse.quote_plus(keywords)
     keywords_hyphenated = keywords.lower().replace(" ", "-").replace("(", "").replace(")", "")
     links = {
+        "LinkedIn":   f"https://www.linkedin.com/jobs/search/?keywords={keywords_encoded}&location=Indonesia",
+        "JobStreet":  f"https://www.jobstreet.co.id/id/job-search/{keywords_hyphenated}-jobs/",
+        "Glints":     f"https://glints.com/id/opportunities/jobs/explore?keyword={keywords_encoded}",
+        "Indeed":     f"https://id.indeed.com/jobs?q={keywords_encoded}",
+        "Google Jobs":f"https://www.google.com/search?q={keywords_encoded}+jobs+in+Indonesia&ibp=htl;jobs"
     }
     return links
+def parse_json_safe(text: str) -> dict:
+    """
+    Parse JSON dari teks bebas model.
+    Strategi (urutan prioritas):
+      1. Cari blok ```json ... ``` atau ``` ... ```
+      2. Cari objek { ... } terluar
+      3. Raise error jika semua gagal
+    """
+    # Strategi 1: ambil dari blok markdown code fence
+    fence_match = re.search(r"```(?:json)?\s*(\{.*?\})\s*```", text, re.DOTALL)
+    if fence_match:
+        candidate = fence_match.group(1)
+        try:
+            return json.loads(candidate)
+        except json.JSONDecodeError:
+            pass  # lanjut ke strategi berikutnya
+    # Strategi 2: ambil objek { ... } terluar
+    start = text.find("{")
+    end   = text.rfind("}")
+    if start != -1 and end != -1 and end > start:
+        candidate = text[start:end + 1]
+        try:
+            return json.loads(candidate)
+        except json.JSONDecodeError as e:
+            raise ValueError(
+                f"Ditemukan struktur JSON tapi gagal di-parse: {e}\n"
+                f"Cuplikan teks: {candidate[:300]}"
+            )
+    raise ValueError(
+        f"Tidak ditemukan JSON valid dalam respons model.\n"
+        f"Cuplikan respons: {text[:300]}"
+    )
+def log_token_usage(usage_metadata):
+    if usage_metadata is None:
+        print("⚠️  Token usage: data tidak tersedia.")
+        return
+    prompt_tokens    = getattr(usage_metadata, 'prompt_token_count',     'N/A')
+    candidate_tokens = getattr(usage_metadata, 'candidates_token_count', 'N/A')
+    total_tokens     = getattr(usage_metadata, 'total_token_count',      'N/A')
+    print("=" * 40)
+    print("📊 TOKEN USAGE")
+    print(f"   🔼 Input  (prompt)  : {prompt_tokens}")
+    print(f"   🔽 Output (response): {candidate_tokens}  [limit: {MAX_OUTPUT_TOKENS}]")
+    print(f"   ➕ Total            : {total_tokens}")
+    print("=" * 40)
 def analyze_career_path(cv_file):
+    if not API_CONFIGURED:
+        raise gr.Error("API Key Gemini belum terkonfigurasi. Periksa Logs aplikasi.")
     if cv_file is None:
         raise gr.Error("Mohon upload file CV (PDF) Anda.")
     try:
+        print("--- Memulai Proses Analisis Karir ---")
         teks_cv = ekstrak_teks_dari_pdf(cv_file.name)
         if not teks_cv:
             raise gr.Error("PDF kosong atau tidak dapat dibaca.")
+        print("✅ Teks berhasil diekstrak.")
+        print("2. Mengirim permintaan analisis karir ke model...")
+        prompt_analisis_karir = f"""
+Anda adalah seorang "Career Analyst AI". Baca teks CV berikut dan buat laporan peluang karir.
+Teks CV:
+---
+{teks_cv}
+---
+PENTING: Balas HANYA dengan satu blok JSON murni. Jangan tambahkan teks, penjelasan, atau komentar apapun di luar JSON.
+Format output WAJIB persis seperti ini:
+{{
+  "jabatan_ideal": "string",
+  "alasan_kecocokan": ["poin 1", "poin 2", "poin 3", "poin 4"],
+  "deskripsi_pekerjaan": ["poin 1", "poin 2", "poin 3", "poin 4", "poin 5"],
+  "potensi_karir": ["poin 1", "poin 2", "poin 3", "poin 4"],
+  "kisaran_gaji": {{
+    "junior": "Rp X - Rp Y / bulan",
+    "mid_level": "Rp X - Rp Y / bulan",
+    "senior": "Rp X - Rp Y / bulan"
+  }},
+  "kelebihan_tambahan": ["poin 1", "poin 2"]
+}}
+"""
+        # ⚠️ Gemma 3 tidak support response_mime_type JSON — dihapus
+        generation_config = genai.types.GenerationConfig(
+            max_output_tokens=MAX_OUTPUT_TOKENS,
+        )
+        response = model.generate_content(prompt_analisis_karir, generation_config=generation_config)
+        log_token_usage(getattr(response, 'usage_metadata', None))
+        raw_text = response.text
+        print(f"📝 Raw response preview: {raw_text[:200]!r}")
+        # Parse manual — tidak bergantung pada response_mime_type
+        try:
+            response_json = parse_json_safe(raw_text)
+            print("✅ JSON berhasil di-parse.")
+        except ValueError as parse_err:
+            print(f"🛑 Gagal parse JSON: {parse_err}")
+            raise gr.Error(
+                f"Model tidak menghasilkan JSON yang valid.\n"
+                f"Detail: {parse_err}"
+            )
+        print("3. Membuat tautan pencarian...")
+        search_links = generate_search_links(response_json.get("jabatan_ideal", ""))
         response_json["tautan_pencarian"] = search_links
+        print("✅ Tautan pencarian ditambahkan.")
+        print("--- Proses Selesai ---")
         return response_json
+    except gr.Error:
+        raise
     except Exception as e:
         print(f"🛑 ERROR DALAM FUNGSI ANALISIS: {e}")
         raise gr.Error(f"Terjadi kesalahan: {e}")
+# --- INTERFACE GRADIO ---
 with gr.Blocks(theme=gr.themes.Soft()) as demo:
     gr.Markdown("# 🚀 API Analis Peluang Karir Personal")
+    gr.Markdown("Antarmuka ini dapat digunakan untuk pengujian. Endpoint API publik tersedia di `/run/predict` untuk integrasi ke website Anda.")
     with gr.Row():
         with gr.Column(scale=1):