Jay-v2 commited on
Commit
ae7ba48
·
verified ·
1 Parent(s): deb44d9

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +24 -10
README.md CHANGED
@@ -9,39 +9,47 @@ tags:
9
  base_model:
10
  - BAAI/bge-large-zh-v1.5
11
  ---
 
12
  # CRE: CareerInternational Recruitment Embedding Model 🚀
 
13
  > **CRE** 是一款专为人力资源场景打造的嵌入模型。通过引入局部特征感知(Local Feature-aware)的归纳偏好,显著提升了简历与职位描述(JD)的语义对齐精度。
 
14
  ---
 
15
  ### 💡 技术来源 (Technical Background)
 
16
  | 维度 | 详细信息 |
17
  | :--- | :--- |
18
  | **专利名称** | 一种基于局部特征投影的招聘场景语义匹配方法及其系统 |
19
  | **申请号** | 2025108424429 |
20
  | **当前状态** | 已公开(实审中) |
21
  | **主要发明人** | 焦英浩 等 |
 
22
  ---
23
 
24
  ### 更新日志 (Release Notes)
 
25
  * **2025/03/28**: 发布 **CRE v0.5.0** 初始版本及技术报告。
26
- *
27
  ### 核心特性 (Key Features)
28
  * **局部特征提取 (Local Feature-aware)**: 借助 **CNN** 结构引入归纳偏好,使模型在文本编码过程中对人力资源场景下的“技能词”、“职级”等局部核心特征更为敏锐。
29
  * **投影层设计 (Projection Layer)**: 本质上是一种精巧的辅助微调方法。通过在微调阶段增加特定的投影参数进行协同训练,在不破坏基座模型通用能力的前提下,大幅提高编码质量。
30
  * **全场景覆盖**: 适配 **检索 (Retrieval)**、**RAG (检索增强生成)** 以及 **智能体 (Agent)** 等多种下游任务。
31
 
32
- ![CRE-0.5 introduction](photos/cre_0_5_introduction.jpg)
33
 
34
  ### Using Sentence-Transformers
 
35
  ```python
36
- from sentence_transformers import SentenceTransformer
37
- from sentence_transformers import util
38
 
39
- model = SentenceTransformer("JayThinkDiff/CRE-0.5")
 
40
 
41
  query_embedding = model.encode("嵌入式")
42
  passage_embedding = model.encode([
43
- "岗位职责:1.从事通讯产品相关嵌入式软件研发工作;2.进行软件详细设计,代码编写,单元测试,集成测试等;3.进行软件代码的维护和改进工作;4.完成部门安排的其它研发相关工作。任职资格:1.通信,计算机,电子,自动化等相关专业本科及以上学历,英语CET-4以上,具备英文技术资料阅读能力;2.熟练掌握C语言程序设计,熟悉软件开发过程;4.有数通领域(交换/路由协议)开发经验者优先;有TCP/IP栈,路由协议/MPLS协议等开发经验者优先;有BROADCOM/MARVELL/INTEL系列多核处理器/转发芯片/网络处理器/交换芯片等开发经验者优先;熟悉软件架构和软件流程,有过大型嵌入式软件或平台软件设计方面经验者优先。5. 具有独立思考和自我学习能力;拥有良好的工作态度和服务敬业精神;积极上进,具有团队合作精神;沟通表达能力强,能适应加班和出差",
44
- "招聘嵌入式系统工程师,要求会 设计嵌入式系统及单片机、会软件编程!PCB设计:AD、Pulsonix、Cadence(至少会一种)编程语言要求会:C、C++ 、Java、Python (至少会两种,Python必须会)3D设计要求会:CATIA 、SOLIDWORKS、 AutoCAD (至少会一种)工作内容:设计、开发嵌入式系统;构造嵌入式系统的框架结构、内核原理;负责编写整体系统设计方案;负责嵌入式硬件、软件开发工作;对客户进行系统技术支持。工作地点:山西晋中薪酬待遇:依据要求面谈,公司利润分红!",
45
  ])
46
 
47
  print("查询结果:", util.cos_sim(query_embedding, passage_embedding))
@@ -52,14 +60,20 @@ Expected Output:
52
  """
53
  ```
54
 
55
- <ul>注意事项:
56
- <li>使用CLS Token来表征句子</li>
57
- <li>最大输入Token长度为512</li>
 
 
58
  </ul>
59
  </small>
60
 
 
 
61
  ## Citation
 
62
  If you find our work helpful, please cite this patent:
 
63
  ```bibtex
64
  @misc{jiao2025recruitment,
65
  title={一种基于局部特征投影的招聘场景语义匹配方法及其系统},
 
9
  base_model:
10
  - BAAI/bge-large-zh-v1.5
11
  ---
12
+
13
  # CRE: CareerInternational Recruitment Embedding Model 🚀
14
+
15
  > **CRE** 是一款专为人力资源场景打造的嵌入模型。通过引入局部特征感知(Local Feature-aware)的归纳偏好,显著提升了简历与职位描述(JD)的语义对齐精度。
16
+
17
  ---
18
+
19
  ### 💡 技术来源 (Technical Background)
20
+
21
  | 维度 | 详细信息 |
22
  | :--- | :--- |
23
  | **专利名称** | 一种基于局部特征投影的招聘场景语义匹配方法及其系统 |
24
  | **申请号** | 2025108424429 |
25
  | **当前状态** | 已公开(实审中) |
26
  | **主要发明人** | 焦英浩 等 |
27
+
28
  ---
29
 
30
  ### 更新日志 (Release Notes)
31
+ * **2026/05/09**: 发布 **CRE v1.1**,优化长文本特征提取与推理性能。
32
  * **2025/03/28**: 发布 **CRE v0.5.0** 初始版本及技术报告。
33
+
34
  ### 核心特性 (Key Features)
35
  * **局部特征提取 (Local Feature-aware)**: 借助 **CNN** 结构引入归纳偏好,使模型在文本编码过程中对人力资源场景下的“技能词”、“职级”等局部核心特征更为敏锐。
36
  * **投影层设计 (Projection Layer)**: 本质上是一种精巧的辅助微调方法。通过在微调阶段增加特定的投影参数进行协同训练,在不破坏基座模型通用能力的前提下,大幅提高编码质量。
37
  * **全场景覆盖**: 适配 **检索 (Retrieval)**、**RAG (检索增强生成)** 以及 **智能体 (Agent)** 等多种下游任务。
38
 
39
+ ![CRE Introduction](photos/cre_0_5_introduction.jpg)
40
 
41
  ### Using Sentence-Transformers
42
+
43
  ```python
44
+ from sentence_transformers import SentenceTransformer, util
 
45
 
46
+ # 请根据实际发布的模型名修改
47
+ model = SentenceTransformer("JayThinkDiff/CRE-1.1")
48
 
49
  query_embedding = model.encode("嵌入式")
50
  passage_embedding = model.encode([
51
+ "岗位职责:1.从事通讯产品相关嵌入式软件研发工作;2.进行软件详细设计...",
52
+ "招聘嵌入式系统工程师,要求会设计嵌入式系统及单片机、会软件编程...",
53
  ])
54
 
55
  print("查询结果:", util.cos_sim(query_embedding, passage_embedding))
 
60
  """
61
  ```
62
 
63
+ <small>
64
+ <strong>注意事项:</strong>
65
+ <ul>
66
+ <li>使用 CLS Token 来表征句子语义。</li>
67
+ <li>最大输入 Token 长度建议设置为 512。</li>
68
  </ul>
69
  </small>
70
 
71
+ ---
72
+
73
  ## Citation
74
+
75
  If you find our work helpful, please cite this patent:
76
+
77
  ```bibtex
78
  @misc{jiao2025recruitment,
79
  title={一种基于局部特征投影的招聘场景语义匹配方法及其系统},