Spaces:
Runtime error
Pemeriksaan Fakta Berita Hoax
Alat untuk mendeteksi berita hoax/palsu di Indonesia menggunakan RAG (Retrieval-Augmented Generation).
Fitur
- Antarmuka CLI untuk pemeriksaan fakta
- Antarmuka web menggunakan Gradio
- Endpoint API melalui FastAPI
- Database vektor (Milvus) untuk menyimpan embedding dokumen
- Integrasi pencarian web (Tavily)
Instalasi
- Clone repositori
- Instal dependensi:
pip install -r requirements.txt - Siapkan Milvus:
- Pastikan Anda telah menginstal dan menjalankan Milvus. Lihat dokumentasi Milvus untuk instruksi instalasi.
- Aplikasi terhubung ke Milvus menggunakan pengaturan default. Jika instance Milvus Anda menggunakan pengaturan yang berbeda, sesuaikan parameter koneksi di
hoax_detect/services/vector_store.py.
Penggunaan
CLI
Inisialisasi database vektor (Opsional): Jika Anda ingin menggunakan database vektor untuk pemeriksaan fakta, Anda perlu menginisialisasinya terlebih dahulu. Ini melibatkan pemuatan dataset dan pembuatan embedding. Langkah ini hanya diperlukan jika Anda belum menginisialisasi database atau jika Anda ingin menyegarkan data.
python -m hoax_detect.data.loader --init_dbJalankan antarmuka baris perintah:
python -m hoax_detect.cli --query "pertanyaan Anda di sini" --use_vector_db True --use_tavily True--query: Cuplikan berita atau pernyataan yang ingin Anda periksa faktanya. Wajib diisi.--use_vector_db: Nilai boolean yang menunjukkan apakah akan menggunakan database vektor untuk mengambil konteks. Defaultnya adalahTrue.--use_tavily: Nilai boolean yang menunjukkan apakah akan menggunakan Tavily untuk pencarian web. Defaultnya adalahTrue.
Contoh:
python -m hoax_detect.cli --query "Jokowi mengundurkan diri" --use_vector_db True --use_tavily True
Aplikasi Gradio
Jalankan aplikasi Gradio:
python gradio_app.pyAkses aplikasi di browser Anda:
Aplikasi akan menyediakan URL lokal (biasanya
http://localhost:7860) yang dapat Anda gunakan untuk mengakses antarmuka Gradio di browser web Anda.Gunakan antarmuka:
- Masukkan cuplikan berita atau pernyataan yang ingin Anda periksa faktanya di bidang input.
- Pilih apakah akan menggunakan database vektor dan/atau Tavily untuk pengambilan konteks menggunakan kotak centang yang disediakan.
- Klik tombol "Submit" untuk memulai proses pemeriksaan fakta.
- Hasilnya, termasuk pernyataan yang telah diperiksa faktanya dan bukti pendukung, akan ditampilkan di area output.
API
Aplikasi ini juga menyediakan API FastAPI. Lihat hoax_detect/api.py untuk detail tentang endpoint yang tersedia. Anda dapat mengakses dokumentasi API di /docs setelah menjalankan API.
Konfigurasi
Pengaturan konfigurasi, seperti jalur dataset, didefinisikan dalam hoax_detect/config.py. Anda dapat mengubah pengaturan ini dengan membuat file .env di direktori root proyek. Lihat .env.example untuk opsi yang tersedia.
Kontribusi
Kontribusi dipersilakan! Silakan kirim pull request dengan perubahan Anda.