Spaces:

Howarddddd
/

HW4

Sleeping

App Files Files Community

Howarddddd commited on Apr 10, 2025

Commit

6e596d5

verified ·

1 Parent(s): 68f538c

Update app.py

Browse files

Files changed (1) hide show

app.py +17 -11

app.py CHANGED Viewed

@@ -2,31 +2,37 @@ import gradio as gr
 import fitz  # PyMuPDF
 import openai
 import re
 import os
 openai.api_key = os.environ.get("OPENAI_API_KEY")
-# --- 共用：清理履歷內容 ---
 def clean_text(text):
     text = re.sub(r'^\s*\d+\s*$', '', text, flags=re.MULTILINE)
     text = re.sub(r'\n\s*\n+', '\n\n', text)
     text = re.sub(r'[ \t]+', ' ', text)
     return text.strip()
-# --- 擷取 PDF 文字 ---
 def extract_text_from_pdf(file):
     doc = fitz.open(file.name)
-    text = ""
     for page in doc:
-        text += page.get_text()
     doc.close()
-    return clean_text(text)
-# --- GPT：履歷分析（STAR 法則）---
 def analyze_resume(resume_text):
     prompt = f"""
 你是一位專業的履歷健檢與職涯輔導顧問，請協助我以下幾件事：
 1. 根據下方履歷內容，幫我整理出：
    - 學歷背景
    - 技能與工具
@@ -61,10 +67,10 @@ def analyze_resume(resume_text):
     content = response['choices'][0]['message']['content']
     return content.replace("**", "").replace("* ", "• ").replace("*", "").strip()
-# --- GPT：撰寫個人自傳 ---
 def generate_autobiography(resume_text):
     prompt = f"""
-請根據以下履歷內容，幫我撰寫一段約 300 字的個人自傳，口吻自然、自信，強調個人特質、學習歷程與職涯目標，可作為履歷中的「自我介紹」使用：
 履歷內容：
 ------------------------
@@ -84,10 +90,10 @@ def generate_autobiography(resume_text):
 # --- Gradio UI ---
 with gr.Blocks(title="求職小幫手 AI") as demo:
-    gr.Markdown("## 🧑‍💼 求職小幫手 AI\n請上傳你的履歷 PDF，我們將幫你分析履歷並生成個人自傳。")
     with gr.Row():
-        pdf_input = gr.File(label="📄 上傳履歷 PDF（限 PDF）", file_types=[".pdf"])
         extract_btn = gr.Button("⬇️ 擷取與清理內容")
     resume_textbox = gr.Textbox(label="📄 擷取後的履歷純文字", lines=20, interactive=False)

 import fitz  # PyMuPDF
 import openai
 import re
 import os
+# ✅ 使用 Hugging Face Secrets 管理 API 金鑰
 openai.api_key = os.environ.get("OPENAI_API_KEY")
+# --- 清理文字 ---
 def clean_text(text):
     text = re.sub(r'^\s*\d+\s*$', '', text, flags=re.MULTILINE)
     text = re.sub(r'\n\s*\n+', '\n\n', text)
     text = re.sub(r'[ \t]+', ' ', text)
     return text.strip()
+# --- 改進版：區塊式擷取 PDF 文字 + 座標排序 ---
 def extract_text_from_pdf(file):
     doc = fitz.open(file.name)
+    text_blocks = []
     for page in doc:
+        blocks = page.get_text("blocks")  # 回傳每段區塊含座標
+        blocks = sorted(blocks, key=lambda b: (b[1], b[0]))  # 先依 y，再依 x 排序
+        for b in blocks:
+            text_blocks.append(b[4])
     doc.close()
+    return clean_text("\n".join(text_blocks))
+# --- GPT 履歷分析（STAR 法則）---
 def analyze_resume(resume_text):
     prompt = f"""
 你是一位專業的履歷健檢與職涯輔導顧問，請協助我以下幾件事：
+注意：這份履歷是由 PDF 擷取而來，可能因版面問題導致部分文字順序略有錯亂。請你盡量根據語意邏輯判斷內容。
 1. 根據下方履歷內容，幫我整理出：
    - 學歷背景
    - 技能與工具
     content = response['choices'][0]['message']['content']
     return content.replace("**", "").replace("* ", "• ").replace("*", "").strip()
+# --- GPT 自傳撰寫 ---
 def generate_autobiography(resume_text):
     prompt = f"""
+這是從 PDF 擷取的履歷文字，順序可能略有錯亂。請盡量根據語意整理，幫我撰寫一段約 300 字的個人自傳。口吻自然、自信，強調個人特質、學習歷程與職涯目標，可作為履歷中的「自我介紹」使用：
 履歷內容：
 ------------------------
 # --- Gradio UI ---
 with gr.Blocks(title="求職小幫手 AI") as demo:
+    gr.Markdown("## 🧑‍💼 求職小幫手 AI\n上傳履歷 PDF，我們幫你分析亮點並撰寫個人自傳！")
     with gr.Row():
+        pdf_input = gr.File(label="📄 上傳履歷 PDF", file_types=[".pdf"])
         extract_btn = gr.Button("⬇️ 擷取與清理內容")
     resume_textbox = gr.Textbox(label="📄 擷取後的履歷純文字", lines=20, interactive=False)