Spaces:

anggars
/

sentimind

Sleeping

App Files Files Community

sentimind / api /README.md

anggars

Sync from GitHub Actions: 916d1edec5240f1937338b7b58a1e9b9fa4ddcda

96e3e26 verified 19 days ago

preview code

raw

history blame contribute delete

6 kB

	# Dokumentasi Backend Sentimind (API)

	Dokumen ini menjelaskan struktur folder `api`, fungsi dari setiap file, dan logika perhitungan yang digunakan dalam sistem Sentimind.

	## 📂 Struktur Folder

	```
	api/
	├── index.py # Entry point utama aplikasi (FastAPI)
	├── predict.py # Endpoint untuk prediksi teks manual
	├── quiz.py # Endpoint untuk sistem kuis MBTI
	├── core/
	│ ├── chatbot.py # Logic Chatbot menggunakan Google Gemini
	│ ├── nlp_handler.py # Logic utama NLP (Machine Learning + Youtube)
	│ └── quiz_logic.py # Perhitungan skor dan logika MBTI
	└── data/
	├── questions.json # Database soal kuis
	├── model_mbti.pkl # Model Machine Learning untuk MBTI
	└── model_emotion.pkl # Model Machine Learning untuk Emosi
	```

	---

	## 🧠 Logika Perhitungan Kuis (MBTI Scoring)

	Perhitungan MBTI dilakukan di file `api/core/quiz_logic.py`. Sistem tidak menggunakan sistem "benar/salah", melainkan sistem Dimensi Bipolar.

	### 1. Variabel Dimensi

	Kita memiliki 4 variabel skor awal yang dimulai dari angka 0:

	- `EI`: Introvert vs Extravert
	- `SN`: Sensing vs Intuition
	- `TF`: Thinking vs Feeling
	- `JP`: Judging vs Perceiving

	### 2. Rumus Per Soal

	Setiap soal memiliki atribut `dimension` (misal "EI") dan `direction` (1 atau -1).
	User memberikan jawaban dalam skala -3 sampai 3 (Sangat Tidak Setuju s.d. Sangat Setuju).

	Rumus:

	```python
	Skor Dimensi += (Jawaban User * Arah Soal)
	```

	Contoh Kasus:

	- Soal: "Saya suka pesta."
	- Dimensi: `EI`
	- Arah (`direction`): `1` (Positif mengarah ke Extravert)
	- Jawaban User: `3` (Sangat Setuju)
	- Hitungan: `3 * 1 = 3`. Skor EI bertambah +3 (Makin E).

	- Soal: "Saya butuh waktu sendiri."
	- Dimensi: `EI`
	- Arah (`direction`): `-1` (Positif mengarah ke Introvert)
	- Jawaban User: `3` (Sangat Setuju)
	- Hitungan: `3 * -1 = -3`. Skor EI berkurang -3 (Makin I).

	### 3. Penentuan Hasil Akhir

	Setelah menghitung total skor dari 40 soal, hasil ditentukan berdasarkan tanda positif/negatif:

	\| Dimensi \| Skor Positif (>= 0) \| Skor Negatif (< 0) \|
	\| :------ \| :------------------ \| :----------------- \|
	\| EI \| E (Extravert) \| I (Introvert) \|
	\| SN \| S (Sensing) \| N (Intuition) \|
	\| TF \| T (Thinking) \| F (Feeling) \|
	\| JP \| J (Judging) \| P (Perceiving) \|

	---

	## 📜 Penjelasan File & Fungsi (Detail)

	### 1. `api/index.py`

	File utama untuk menjalankan server backend.

	- `app = FastAPI()`: Inisialisasi aplikasi.
	- `startup_event()`: Mengecek keberadaan `YOUTUBE_API_KEY` saat server nyala. Menentukan mode Official atau Scraping.
	- `app.add_middleware(CORSMiddleware)`: Mengizinkan frontend (berbeda port) untuk mengakses API ini.
	- Routes: Mendaftarkan URL endpoint dari file lain (`/api/predict`, `/api/quiz`, dll).
	- `analyze_youtube_video(video_id)`: Endpoint khusus untuk analisis YouTube. Memanggil `NLPHandler` untuk mengambil transkrip/komentar dan melakukan prediksi.

	### 2. `api/predict.py`

	Handler untuk fitur "Analyzer" (Input Teks Manual).

	- `predict_endpoint(input_data)`: Menerima JSON `{ "text": "..." }`, memvalidasi input, lalu memanggil `NLPHandler.predict_all` untuk mendapatkan hasil MBTI dan Emosi.

	### 3. `api/quiz.py`

	Handler untuk fitur "Quiz".

	- `get_quiz_questions()`: Mengambil daftar soal dari `QuizHandler`.
	- `submit_quiz(submission)`: Menerima jawaban user dan mengembalikan hasil MBTI.

	### 4. `api/core/chatbot.py`

	Otak dari fitur Chatbot.

	- `__init__`: Menghubungkan ke Google Gemini API. Menggunakan model `gemini-2.0-flash` atau fallback ke `lite`.
	- `generate_response(user_query, lang)`:
	- Membuat `system_prompt` yang mendefinisikan persona AI "Sentimind".
	- Menyesuaikan gaya bahasa (Slang Jakarta untuk ID, Formal untuk EN).
	- Mengirim prompt ke Gemini dan mengembalikan teks balasan.

	### 5. `api/core/nlp_handler.py` (Core Logic)

	File paling kompleks yang menangani Machine Learning dan pemrosesan data.

	Fungsi Utama:

	- `load_models()`: Memuat file `.pkl` (model ML yang sudah dilatih) ke memory agar prediksi cepat.
	- `_validate_with_gemini(text, ml_prediction)`:
	- Teknik Hybrid AI: Menggunakan LLM (Gemini) untuk "mengoreksi" hasil Machine Learning klasik.
	- Jika teks cukup panjang (>50 kata), Gemini akan menganalisis ulang teks dan memberikan "second opinion".
	- Mengembalikan confidence score dan alasan logis.
	- `predict_all(raw_text)`:
	1. Translate teks ke Inggris (karena model dilatih pakai B.Inggris).
	2. Prediksi MBTI pakai Model ML.
	3. Validasi MBTI pakai Gemini (jika memungkinkan).
	4. Prediksi Emosi pakai Model ML + Normalisasi probabilitas.
	5. Ekstrak Keyword utama.
	6. Generate penjelasan/reasoning untuk ditampilkan di UI.
	- `fetch_youtube_transcript(video_id)`:
	- Mencoba pakai Official YouTube API dulu (ambil judul, deskripsi, komentar).
	- Jika gagal/tak ada key, fallback ke Scraping (ambil subtitle otomatis).

	### 6. `api/core/quiz_logic.py`

	Logic pemrosesan kuis.

	- `get_questions()`: Membaca file `api/data/questions.json`.
	- `calculate_mbti(answers)`: Mengimplementasikan rumus scoring MBTI (lihat bagian Logika Perhitungan Kuis di atas).

	---

	## 🛠 Flow Data (E2E)

	1. Frontend kirim data (Teks/Jawaban Kuis/Video ID) ke Backend.
	2. Backend (`index.py` / `quiz.py` / `predict.py`) terima request.
	3. Core Logic (`NLPHandler` / `QuizHandler`) memproses data:
	- Load Model ML.
	- Hitung Matematika / Prediksi Statistik.
	- Panggil External API (Gemini/YouTube) jika perlu.
	4. Backend membalas dengan JSON standar:
	```json
	{
	"success": true,
	"mbti": "INTJ",
	"emotion": { "id": "Senang", "en": "Joy" },
	"reasoning": { ... }
	}
	```
	5. Frontend menampilkan animasi dan hasil ke user.