Spaces:
Sleeping
Sleeping
| title: Netzerointerview Ragsystem | |
| emoji: 🌖 | |
| colorFrom: gray | |
| colorTo: yellow | |
| sdk: gradio | |
| sdk_version: 5.42.0 | |
| app_file: app.py | |
| pinned: false | |
| license: apache-2.0 | |
| # 訪談轉錄稿 RAG 系統 | |
| ## 📋 系統簡介 | |
| 這是一個基於 RAG(Retrieval-Augmented Generation)技術的訪談轉錄稿智慧分析系統,部署在 Hugging Face Spaces 上。 | |
| ## ✨ 主要功能 | |
| - **AI 對話介面**:透過自然語言查詢訪談內容 | |
| - **訪綱自動填答**:上傳 Word 格式訪綱,自動生成答案 | |
| - **受訪者篩選**:可選擇特定受訪者進行分析 | |
| - **語義搜尋**:使用 multilingual-e5-large 模型進行精準搜尋 | |
| ## 🚀 技術架構 | |
| - **前端框架**: Gradio 5.42.0 | |
| - **向量模型**: intfloat/multilingual-e5-large | |
| - **語言模型**: GPT-4o-mini | |
| - **資料儲存**: Hugging Face Datasets | |
| - **運行環境**: Hugging Face Spaces (CPU) | |
| ## 📦 資料集 | |
| - **位置**: `s880453/interview-transcripts-vectorized` | |
| - **格式**: 預先向量化的訪談轉錄稿 | |
| - **維度**: 1024 維向量 | |
| ## 🔧 環境變數 | |
| 需要在 Hugging Face Spaces 設定以下 Secrets: | |
| - `HF_TOKEN`: Hugging Face Access Token | |
| - `OPENAI_API_KEY`: OpenAI API Key | |
| ## 📄 License | |
| Apache 2.0 | |
| ## 👥 作者 | |
| s880453 | |
| ## 📞 聯絡方式 | |
| 如有問題請在 Hugging Face 上留言或開啟 Issue。 | |