Spaces:

hanbinChen
/

apply-helper

Sleeping

App Files Files Community

apply-helper / docs /spec.md

hanbinChen

Refactor LLM service and analysis logic for improved structure and error handling

6c8af71 6 months ago

preview code

raw

history blame contribute delete

9.69 kB

	# 📑 技术规格说明（SPR） — AI-powered Resume & Cover Letter Generator

	## 1. 项目结构

	```
	apply-helper/
	├── pyproject.toml # 项目依赖与配置
	├── uv.lock # UV 依赖锁定文件
	├── .env.example # 环境变量配置模板
	├── src/ # 源代码根目录
	│ ├── streamlit_app.py # Streamlit 前端主入口
	│ ├── mock_data.py # 测试用模拟数据
	│ ├── services/ # 业务逻辑层
	│ │ ├── __init__.py
	│ │ ├── analyse_service.py # JD/用户信息分析与总结
	│ │ ├── generation_service.py # 简历与求职信生成
	│ │ └── llm_service.py # LLM/LiteLLM 统一封装与调用
	│ └── llm/ # LLM集成层
	│ ├── __init__.py
	│ ├── litellm_client.py # LiteLLM API 封装
	│ └── prompt_templates.py # LLM Prompt 模板管理
	├── docs/ # 文档目录
	│ ├── prd.md # 产品需求文档
	│ ├── spec.md # 技术规格说明（本文件）
	│ ├── services.spec.md # 服务层规格说明
	│ └── llm.spec.md # LLM集成规格说明
	└── tests/ # 单元测试（待实现）
	```

	## 2. 主要 Python 文件与函数

	### 2.1 `src/streamlit_app.py` — Streamlit 前端主入口

	- 页面布局: 侧边栏输入控制，主区域双列预览（简历 + 求职信）
	- 会话状态管理: 使用 `st.session_state` 持久化分析结果、生成文档和错误状态
	- 主要函数：
	- `main()`：应用入口，负责页面配置、UI渲染与交互逻辑
	- `initialize_session_state()`：初始化会话状态变量
	- `handle_analyse(jd: str, user_info: str)`：分析按钮回调，包含输入验证、调用服务、异常处理
	- `handle_refine(feedback: str)`：优化按钮回调，基于反馈更新分析
	- `handle_mock_analyse()`：模拟分析按钮回调，加载预设测试数据
	- 模拟数据功能: 三个按钮支持加载模拟JD、简历和完整分析结果
	- 错误处理: 集中化错误显示，用户友好提示信息



	### 2.2 LLM 集成层

	#### `src/services/llm_service.py` — LLM服务包装层
	- 核心功能: 提供LLM调用的统一接口，负责提示词模板格式化和LiteLLM调用
	- 主要函数:
	- `analyse_llm(jd: str, user_info: str) -> str`: 工作分析，返回原始LLM响应字符串
	- `refine_llm(summary_json: str, feedback: str) -> str`: 基于反馈优化分析，返回原始LLM响应
	- `generate_resume_llm(summary_json: str, user_info: str) -> str`: 生成Markdown格式简历
	- `generate_cover_letter_llm(job_description: str, user_info: str) -> str`: 生成德语求职信

	#### `src/llm/litellm_client.py` — LiteLLM客户端集成
	- 多Provider支持: 优先支持Azure OpenAI，备用支持标准OpenAI
	- 自动配置: 基于环境变量自动检测和配置最优客户端
	- 主要函数:
	- `call_llm(prompt: str, model: str = None, max_tokens: int = 800, temperature: float = 1.0) -> str`
	- `get_azure_client() -> dict`: 配置Azure OpenAI客户端
	- `get_openai_client() -> dict`: 配置标准OpenAI客户端
	- 包含连接测试和调试模式，支持litellm debug

	#### `src/llm/prompt_templates.py` — 提示词模板管理
	- 模板类型: analyse, refine, generate_resume, generate_cover_letter
	- 函数: `get_template(name: str) -> str`
	- 特点:
	- 字典存储，包含详细的JSON输出格式要求
	- ANALYSE_PROMPT: 德国科技市场专家角色，8-12个技能提取，4-6个匹配点分析
	- GENERATE_COVER_LETTER_PROMPT: 德语商务求职信生成，符合德国商务信函规范
	- 所有模板包含明确的输出格式要求和角色设定

	#### 核心处理逻辑
	- 提示词管理: 从模板获取提示词，使用Python字符串format动态替换参数
	- LLM调用: 通过LiteLLM统一接口调用不同provider的模型
	- 错误处理: LiteLLM层处理API调用异常，服务层处理业务逻辑异常
	- 响应处理: 返回原始字符串响应，由上层服务负责结构化解析


	### 2.3 业务服务层

	#### `src/services/analyse_service.py` — 分析服务
	- 功能: 职位描述与用户背景的匹配分析，使用Pydantic数据模型
	- 数据模型: `AnalysisResult(BaseModel)` - 结构化分析结果
	- key_skills: List[str] - 关键技能列表
	- match_points: List[str] - 匹配优势点
	- gap_points: List[str] - 技能差距点
	- suggestions: List[str] - 改进建议
	- pitch: str - 价值主张
	- 主要逻辑:
	- 验证输入参数非空
	- 委托LLM服务进行分析
	- `_parse_analysis_response()` - 复杂JSON解析逻辑，处理代码块包装
	- `analyse()` - 初始分析，返回AnalysisResult对象
	- `refine()` - 基于反馈优化分析，使用model_dump_json()序列化

	#### `src/services/generation_service.py` — 文档生成服务
	- 功能: 编排简历和求职信的生成
	- 主要接口:
	- `generate_resume(summary: AnalysisResult, user_info: str) -> str` - 生成简历
	- `generate_cover_letter(job_description: str, user_info: str) -> str` - 生成求职信
	- `generate_both(summary: AnalysisResult, user_info: str, job_description: str) -> Tuple[str, str]` - 生成完整文档对
	- 主要逻辑:
	- 使用AnalysisResult对象和原始文本作为输入
	- 调用LLM服务生成简历(Markdown)和求职信(德语文本)
	- 支持动态导入处理，兼容模块和独立运行
	- 返回生成的文档元组

	### 2.4 模拟数据系统

	#### `src/mock_data.py` — 测试数据管理
	- MOCK_JD: 完整的高级软件工程师职位描述
	- MOCK_RESUME: John Smith 的详细简历信息
	- Analysis_Summary: 结构化分析结果（Dict格式）
	- key_skills, match_points, gap_points, suggestions, pitch
	- Resume: 生成的Markdown格式简历
	- Cover_Letter: 生成的纯文本求职信
	- 用途: 支持无需LLM调用的完整工作流测试

	## 3. Streamlit UI 实现

	### 3.1 页面布局

	- 侧边栏（Sidebar）：
	- 模拟数据按钮: 三列布局 - "Load Mock JD", "Load Mock Resume", "Mock Analyse"
	- 输入区域:
	- Job Description 文本区域（高度150px）
	- User Resume/Info 文本区域（高度200px）
	- 控制按钮: "Analyse" 按钮（全宽）
	- 优化区域:
	- Feedback 文本区域（高度100px）
	- "Refine" 按钮（全宽）

	- 主区域（Main Area）：
	- 错误显示: 使用 `st.error()` 显示异常信息
	- 分析摘要: 使用 `st.json()` 展示结构化分析结果
	- 双列预览:
	- 左列: Resume 预览（Markdown 渲染）
	- 右列: Cover Letter 预览（纯文本显示）

	### 3.2 会话状态管理

	状态变量:
	- `summary` - 分析摘要结果
	- `resume_md` - 生成的简历Markdown
	- `cover_letter_txt` - 生成的求职信文本
	- `error` - 错误信息显示
	- `user_info_input` - 用户输入缓存

	### 3.3 交互流程

	1. 标准工作流:
	- 输入JD和用户信息 → 点击"Analyse" → 显示分析和生成结果
	- 输入反馈 → 点击"Refine" → 更新分析和重新生成

	2. 模拟数据工作流:
	- 点击"Load Mock JD" → 自动填充职位描述
	- 点击"Load Mock Resume" → 自动填充简历信息
	- 点击"Mock Analyse" → 直接加载完整分析结果

	3. 错误处理:
	- 输入验证: 检查空值，显示友好错误信息
	- 异常捕获: 包装在try-catch中，显示具体错误消息
	- 状态清理: 成功时清除error状态


	## 4. 技术实现详情

	### 4.1 依赖管理

	核心依赖: streamlit (UI), litellm (LLM调用), python-dotenv (环境变量), weasyprint (PDF，未使用), pydantic (验证，未使用)

	安装和运行:
	1. `pip install uv` - 安装包管理器
	2. `uv sync` - 同步依赖
	3. `cp .env.example .env` - 配置环境变量
	4. `uv run streamlit run src/streamlit_app.py` - 启动应用

	### 4.2 LLM集成配置

	多Provider支持: 优先Azure OpenAI，备用标准OpenAI

	Azure OpenAI配置: AZURE_OPENAI_API_KEY, AZURE_OPENAI_ENDPOINT, AZURE_OPENAI_MODEL, AZURE_OPENAI_API_VERSION(默认2024-12-01-preview)

	OpenAI配置: OPENAI_API_KEY（使用gpt-3.5-turbo模型）

	配置逻辑:
	- 优先检测Azure配置，如果完整则使用Azure
	- Azure不可用时回退到标准OpenAI
	- 支持模型参数覆盖，但仅支持azure/前缀的模型
	- 包含详细的配置验证和错误提示

	### 4.3 开发和测试

	模拟数据测试:
	- 无需配置LLM即可测试完整UI流程
	- `src/mock_data.py` 包含完整测试数据集
	- 点击"Mock Analyse"按钮即可加载预设结果

	调试和测试模式:
	- `python src/llm/litellm_client.py` - 测试LLM连接和配置验证
	- `python src/services/analyse_service.py` - 测试分析服务完整流程
	- `python src/services/generation_service.py` - 测试文档生成流程
	- 包含litellm._turn_on_debug()调试支持

	### 4.4 架构特点

	模块化设计:
	- 业务逻辑与UI分离
	- LLM集成层独立封装
	- 服务层薄包装，便于替换实现

	扩展点:
	- 添加新的LLM provider: 扩展 `litellm_client.py` 中的客户端配置函数
	- 添加PDF导出: 实现 `pdf_service.py` 集成WeasyPrint
	- 添加新的生成模板: 在 `prompt_templates.py` 中添加新模板常量
	- 数据验证增强: 当前使用Pydantic AnalysisResult模型，可扩展更多验证模型
	- 多语言支持: 扩展prompt_templates支持不同语言的求职信生成