Spaces:

dellabee7
/

python-api-reference-2025

Sleeping

python-api-reference-2025

File size: 1,868 Bytes

4e6a306
 
82f7e90
9da9b54
82f7e90
 
 
 
 
 
 
 
 
 
 
 
15d6c6c
82f7e90
 
 
 
4e6a306
15d6c6c
9da9b54
09c85b0
15d6c6c
9da9b54
4e6a306
82f7e90
15d6c6c
 
 
 
 
4e6a306
15d6c6c
 
 
4e6a306
 
82f7e90
4e6a306
15d6c6c
 
4e6a306
9da9b54
4e6a306
15d6c6c
 
4e6a306

import gradio as gr
from huggingface_hub import InferenceClient
from PyPDF2 import PdfReader
import os

# PDF 텍스트 미리 읽어오기
def extract_pdf_text(pdf_paths):
    full_text = ""
    for path in pdf_paths:
        reader = PdfReader(path)
        for page in reader.pages:
            text = page.extract_text()
            if text:
                full_text += text + "\n"
    return full_text.strip()

# 레퍼런스 PDF 텍스트 불러오기
pdf_context = extract_pdf_text([
    "assets/Programming-Fundamentals-1570222270.pdf",
    "assets/1분파이썬_강의자료_전체.pdf"
])

# 무료 사용 가능한 FLAN-T5 모델 사용
client = InferenceClient(
    model="tiiuae/falcon-rw-1b", 
    token=os.getenv("HUGGINGFACEHUB_API_TOKEN")
)

def respond(message, history, system_message, max_tokens, temperature, top_p):
    # 단순 프롬프트 구성 (flan-t5는 chat 구조가 아님)
    prompt = f"{system_message}\n\n문서 요약:\n{pdf_context}\n\n질문: {message}\n답변:"
    result = client.text_generation(
        prompt=prompt,
        max_new_tokens=max_tokens,
        temperature=temperature,
        top_p=top_p
    )
    return result.strip()

demo = gr.ChatInterface(
    fn=respond,
    additional_inputs=[
        gr.Textbox(value="당신은 파이썬 API 문서에 기반해 답변하는 유용한 조교입니다.", label="System message"),
        gr.Slider(minimum=1, maximum=1024, value=512, step=1, label="Max new tokens"),
        gr.Slider(minimum=0.1, maximum=4.0, value=0.7, step=0.1, label="Temperature"),
        gr.Slider(minimum=0.1, maximum=1.0, value=0.95, step=0.05, label="Top-p"),
    ],
    title="📘 파이썬 API 레퍼런스 챗봇 (FLAN-T5 기반)",
    description="한국공대 수업자료 기반으로 질문에 답하는 무료 챗봇입니다."
)

if __name__ == "__main__":
    demo.launch()