docx

Running

App Files Files Community

ll7098ll commited on Sep 13, 2024

Commit

2d9e2da

verified ·

1 Parent(s): 87c2ac0

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -31

app.py CHANGED Viewed

@@ -1,13 +1,19 @@
 import os
 import io
-import openai
 from PyPDF2 import PdfReader
-import gradio as gr
 from docx import Document
-# OpenAI API 키 설정
-openai.api_key = os.getenv("OPENAI_API_KEY")
 def extract_text_from_pdf(pdf_file):
     """PDF 파일에서 텍스트를 추출합니다."""
@@ -26,7 +32,7 @@ def generate_report(
     reference_pdfs,
     additional_instructions: str = "",
 ) -> io.BytesIO:
-    """GPT-3.5-turbo를 사용하여 보고서를 생성하고 docx 파일로 변환합니다."""
     try:
         # 보고서 서식 PDF에서 텍스트 추출
         report_format = extract_text_from_pdf(report_format_pdf)
@@ -47,37 +53,44 @@ def generate_report(
             f"보고서를 최대한 자세하고 유익하게 작성하십시오."
         )
-        # GPT-3.5-turbo API 호출
-        response = openai.ChatCompletion.create(
-            model="gpt-4-turbo",
-            messages=[{"role": "user", "content": prompt}],
-        )
-        report_text = response.choices[0].message.content.strip()
-        # docx 파일 생성 후 바이트 스트림에 저장
-        doc = Document()
-        doc.add_paragraph(report_text)
-        doc_stream = io.BytesIO()
-        doc.save(doc_stream)
-        doc_stream.seek(0)
         return doc_stream
     except Exception as e:
         raise Exception(f"보고서 생성 중 오류가 발생했습니다: {e}")
-# Gradio 인터페이스 설정
-iface = gr.Interface(
-    fn=generate_report,
-    inputs=[
-        gr.File(label="보고서 서식 PDF 업로드", file_types=[".pdf"]),
-        gr.File(label="참고 PDF 파일 업로드", file_types=[".pdf"], file_count="multiple"),
-        gr.Textbox(lines=3, label="추가 지침"),
-    ],
-    outputs=gr.File(label="생성된 보고서 (docx)", file_types=[".docx"]),
-    title="보고서 생성 챗봇",
-    description="서식 PDF, 참고 PDF 파일, 추가 지침을 입력하여 보고서를 생성하세요.",
-)
-# 인터페이스 실행
-iface.launch(share=True)

 import os
 import io
+import time
+import google.generativeai as genai
 from PyPDF2 import PdfReader
+import streamlit as st
 from docx import Document
+# Google Gemini API 키 설정 (Streamlit secrets 사용 권장)
+genai.configure(api_key=st.secrets["GEMINI_API_KEY"])
+# Gemini 모델 설정
+model = genai.GenerativeModel(
+    model_name="gemini-1.5-pro-exp-0827"
+)
 def extract_text_from_pdf(pdf_file):
     """PDF 파일에서 텍스트를 추출합니다."""
     reference_pdfs,
     additional_instructions: str = "",
 ) -> io.BytesIO:
+    """Gemini를 사용하여 보고서를 생성하고 docx 파일로 변환합니다."""
     try:
         # 보고서 서식 PDF에서 텍스트 추출
         report_format = extract_text_from_pdf(report_format_pdf)
             f"보고서를 최대한 자세하고 유익하게 작성하십시오."
         )
+        # Gemini API 호출 (스트리밍)
+        full_text = ""
+        doc_stream = io.BytesIO()
+        response = model.generate_content(prompt, stream=True)
+        for chunk in response:
+            full_text += chunk.text
+            # docx 파일 업데이트 (매 chunk마다 docx 파일을 다시 생성하지 않고 업데이트)
+            doc = Document()
+            doc.add_paragraph(full_text)
+            doc.save(doc_stream)
+            doc_stream.seek(0)
+            time.sleep(0.05)
         return doc_stream
     except Exception as e:
         raise Exception(f"보고서 생성 중 오류가 발생했습니다: {e}")
+# Streamlit 앱 설정
+st.title("보고서 생성 챗봇")
+st.write("서식 PDF, 참고 PDF 파일, 추가 지침을 입력하여 보고서를 생성하세요.")
+# 파일 업로드
+report_format_pdf = st.file_uploader("보고서 서식 PDF 업로드", type="pdf")
+reference_pdfs = st.file_uploader("참고 PDF 파일 업로드", type="pdf", accept_multiple_files=True)
+additional_instructions = st.text_area("추가 지침", height=100)
+# 보고서 생성 버튼
+if st.button("보고서 생성") and report_format_pdf and reference_pdfs:
+    with st.spinner("보고서 생성 중..."):
+        try:
+            doc_stream = generate_report(report_format_pdf, reference_pdfs, additional_instructions)
+            st.download_button(
+                label="보고서 다운로드 (docx)",
+                data=doc_stream,
+                file_name="generated_report.docx",
+                mime="application/vnd.openxmlformats-officedocument.wordprocessingml.document",
+            )
+        except Exception as e:
+            st.error(e)