nerserver / reports /remote_api_test_report.md
Robin
fix(zh): slice entity text from original input to avoid BERT tokenizer spaces
f90826c

远端 API 测试报告

  • 服务地址:https://robinwu-nerserver.hf.space
  • 测试时间:2026-04-30 09:43:24
  • 健康检查:✓ OK (1259ms) — {"status":"ok"}
  • 用例总数:15

一、汇总

用例 描述 HTTP 实体数 召回 耗时
EN-01 英文短句,显式 language=en,自定义标签 ✓ 200 5 5/5 1632ms
EN-02 英文长段,labels 留空触发默认双语标签集 ✓ 200 5 1/4 1542ms
ZH-01 中文现代商业文本,显式 language=zh ✓ 200 6 0/4 1305ms
ZH-02 中文医疗场景,自定义双语标签 ✓ 200 5 0/3 1282ms
ZH-03 古典文学边界测试 — 「尤氏来请」应只取「尤氏」 ✓ 200 6 0/6 1330ms
AR-01 阿拉伯语新闻 ✓ 200 4 2/2 1307ms
MIX-01 中英混合 · 职场场景,language=mixed 强制双跑 ✓ 200 7 3/7 1652ms
MIX-02 学术场景,labels 留空 ✓ 200 4 2/5 1635ms
AUTO-01 纯中文文本,应被检测为 zh ✓ 200 3 0/3 1267ms
AUTO-02 纯英文文本,应被检测为 en ✓ 200 4 3/3 1940ms
AUTO-03 中英混合,应被检测为 mixed 并双跑合并 ✓ 200 4 2/3 1428ms
MIN-01 min_entities=10 强制兜底(短文本启发式只期望 1 个) ✓ 200 1 0/1 1501ms
MIN-02 min_entities=0 关闭兜底 ✓ 200 1 0/1 1183ms
THR-01 高阈值 0.8 - 期望返回更少但更高置信度的实体 ✓ 200 1 1/3 1525ms
EDGE-01 空文本 ✓ 200 0 1160ms
  • 通过率:15/15
  • 累计耗时:21688ms(平均 1446ms/请求)

二、分组详细结果

EN — GLiNER 主路径

EN-01 · 英文短句,显式 language=en,自定义标签

请求

{
  "text": "Elon Musk founded SpaceX in Hawthorne, California in 2002.",
  "labels": [
    "full name of a person",
    "company or organization name",
    "geographical location",
    "date or year"
  ],
  "language": "en"
}

响应:HTTP 200 · 1632ms · 5 个实体

文本 标签 置信度 起止
Elon Musk 人名或姓名 0.85 0–9
SpaceX company or organization name 0.85 18–24
Hawthorne 地名或城市 0.70 28–37
California geographical location 0.57 39–49
2002 date or year 0.89 53–57

期望命中 5/5:Elon Musk, 2002, SpaceX, Hawthorne, California

EN-02 · 英文长段,labels 留空触发默认双语标签集

请求

{
  "text": "President Biden signed the Inflation Reduction Act in Washington D.C. on August 16, 2022. The legislation was championed by Senator Chuck Schumer and was seen as a major win for the Democratic Party.",
  "language": "en"
}

响应:HTTP 200 · 1542ms · 5 个实体

文本 标签 置信度 起止
President Biden 人名或姓名 0.66 0–15
Inflation Reduction Act legislation or policy name 0.78 27–50
Washington D.C. geographical location 0.64 54–69
August 16, 2022 date or year 0.92 73–88
Senator Chuck Schumer 人名或姓名 0.66 124–145

期望命中 1/4:Chuck Schumer, Democratic Party, Biden, Washington D.C.
未命中Chuck Schumer, Democratic Party, Biden

ZH — BERT 主路径

ZH-01 · 中文现代商业文本,显式 language=zh

请求

{
  "text": "阿里巴巴集团创始人马云于2019年卸任董事局主席,由张勇接任。总部位于杭州的阿里巴巴旗下拥有淘宝、天猫、支付宝等业务板块。",
  "language": "zh"
}

响应:HTTP 200 · 1305ms · 6 个实体

文本 标签 置信度 起止
阿 里 巴 巴 集 团 公司或组织机构名称 1.00 0–6
马 云 人名或姓名 1.00 9–11
2019 年 日期或年份 1.00 12–17
张 勇 人名或姓名 1.00 26–28
杭 州 地名或城市 1.00 35–37
阿 里 巴 巴 公司或组织机构名称 0.99 38–42

期望命中 0/4:张勇, 杭州, 阿里巴巴, 马云
未命中杭州, 阿里巴巴, 张勇, 马云

ZH-02 · 中文医疗场景,自定义双语标签

请求

{
  "text": "北京协和医院心内科主任王建国教授团队,于2023年成功完成首例机器人辅助冠状动脉搭桥手术,患者来自山东省济南市。",
  "labels": [
    "人名或姓名",
    "医院或医疗机构名称",
    "地名或城市",
    "日期或年份"
  ],
  "language": "zh"
}

响应:HTTP 200 · 1282ms · 5 个实体

文本 标签 置信度 起止
北 京 协 和 医 院 心 内 科 公司或组织机构名称 0.98 0–9
王 建 国 人名或姓名 1.00 11–14
2023 年 日期或年份 0.96 20–25
山 东 省 地名或城市 1.00 49–52
济 南 市 地名或城市 1.00 52–55

期望命中 0/3:济南, 王建国, 北京协和医院
未命中济南, 王建国, 北京协和医院

ZH — BERT 边界识别

ZH-03 · 古典文学边界测试 — 「尤氏来请」应只取「尤氏」

请求

{
  "text": "尤氏来请,王熙凤笑道:你来了。贾母命人摆酒,宝玉和黛玉在大观园散步。",
  "language": "zh"
}

响应:HTTP 200 · 1330ms · 6 个实体

文本 标签 置信度 起止
尤 氏 人名或姓名 1.00 0–2
王 熙 凤 人名或姓名 1.00 5–8
贾 母 人名或姓名 1.00 15–17
宝 玉 人名或姓名 1.00 22–24
黛 玉 人名或姓名 1.00 25–27
大 观 园 地名或城市 0.93 28–31

期望命中 0/6:贾母, 大观园, 宝玉, 尤氏, 黛玉, 王熙凤
未命中尤氏, 黛玉, 王熙凤, 贾母, 大观园, 宝玉

✓ 边界正确(未出现 {'王熙凤笑道', '尤氏来请'})

AR — GLiNER 主路径

AR-01 · 阿拉伯语新闻

请求

{
  "text": "أعلن الرئيس محمد بن سلمان عن إطلاق مشروع نيوم في المملكة العربية السعودية عام 2017، وتبلغ تكلفته 500 مليار دولار.",
  "labels": [
    "full name of a person",
    "geographical location",
    "project or initiative name",
    "date or year"
  ],
  "language": "ar"
}

响应:HTTP 200 · 1307ms · 4 个实体

文本 标签 置信度 起止
محمد بن سلمان 人名或姓名 0.71 12–25
نيوم project or initiative name 0.55 41–45
المملكة العربية السعودية 地名或城市 0.65 49–73
2017 date or year 0.82 78–82

期望命中 2/2:محمد بن سلمان, المملكة العربية السعودية

Mixed — 双模型合并

MIX-01 · 中英混合 · 职场场景,language=mixed 强制双跑

请求

{
  "text": "张伟加入了 Google 北京研发中心,负责 Android 系统优化。他的同事 Sarah Chen 来自 Meta,两人共同参与了 2024 年的 AI Summit。",
  "language": "mixed"
}

响应:HTTP 200 · 1652ms · 7 个实体

文本 标签 置信度 起止
张 伟 人名或姓名 1.00 0–2
Google 公司或组织机构名称 0.82 6–12
北 京 研 发 中 心 公司或组织机构名称 0.86 13–19
Sarah Chen 人名或姓名 0.89 41–51
Meta company or organization name 0.85 55–59
2024 年 日期或年份 0.66 68–74
AI Summit event name 0.49 76–85

期望命中 3/7:2024, Meta, Google, Android, 北京, Sarah Chen, 张伟
未命中2024, Android, 北京, 张伟

MIX-02 · 学术场景,labels 留空

请求

{
  "text": "清华大学计算机系教授李明在 NeurIPS 2023 发表了关于 Transformer 架构的论文,合作者来自 MIT 和 Stanford University。",
  "language": "mixed"
}

响应:HTTP 200 · 1635ms · 4 个实体

文本 标签 置信度 起止
清 华 大 学 计 算 机 系 公司或组织机构名称 1.00 0–8
李 明 人名或姓名 1.00 10–12
MIT university or research institution 0.76 57–60
Stanford University university or research institution 0.85 63–82

期望命中 2/5:Stanford University, 李明, 清华大学, Transformer, MIT
未命中李明, 清华大学, Transformer

auto — 自动语言检测

AUTO-01 · 纯中文文本,应被检测为 zh

请求

{
  "text": "马云创立了阿里巴巴,总部在杭州。"
}

响应:HTTP 200 · 1267ms · 3 个实体

文本 标签 置信度 起止
马 云 人名或姓名 1.00 0–2
阿 里 巴 巴 公司或组织机构名称 1.00 5–9
杭 州 地名或城市 1.00 13–15

期望命中 0/3:杭州, 阿里巴巴, 马云
未命中杭州, 阿里巴巴, 马云

AUTO-02 · 纯英文文本,应被检测为 en

请求

{
  "text": "Tim Cook is the CEO of Apple in Cupertino."
}

响应:HTTP 200 · 1940ms · 4 个实体

文本 标签 置信度 起止
Tim Cook 人名或姓名 0.86 0–8
CEO 人名或姓名 0.61 16–19
Apple 公司或组织机构名称 0.90 23–28
Cupertino 地名或城市 0.88 32–41

期望命中 3/3:Cupertino, Tim Cook, Apple

AUTO-03 · 中英混合,应被检测为 mixed 并双跑合并

请求

{
  "text": "李华在 Microsoft 担任工程师,常驻 Seattle 办公室。"
}

响应:HTTP 200 · 1428ms · 4 个实体

文本 标签 置信度 起止
李华在 人名或姓名 0.41 0–3
李 华 人名或姓名 1.00 0–2
Microsoft 公司或组织机构名称 0.75 4–13
Seattle 地名或城市 0.79 23–30

期望命中 2/3:李华, Microsoft, Seattle
未命中李华

min_entities 覆盖启发式

MIN-01 · min_entities=10 强制兜底(短文本启发式只期望 1 个)

请求

{
  "text": "马云",
  "language": "zh",
  "min_entities": 10
}

响应:HTTP 200 · 1501ms · 1 个实体

文本 标签 置信度 起止
马 云 人名或姓名 1.00 0–2

期望命中 0/1:马云
未命中马云

MIN-02 · min_entities=0 关闭兜底

请求

{
  "text": "马云",
  "language": "zh",
  "min_entities": 0
}

响应:HTTP 200 · 1183ms · 1 个实体

文本 标签 置信度 起止
马 云 人名或姓名 1.00 0–2

期望命中 0/1:马云
未命中马云

Threshold 变化

THR-01 · 高阈值 0.8 - 期望返回更少但更高置信度的实体

请求

{
  "text": "Tesla and SpaceX are companies founded by Elon Musk.",
  "language": "en",
  "threshold": 0.8
}

响应:HTTP 200 · 1525ms · 1 个实体

文本 标签 置信度 起止
Elon Musk 人名或姓名 0.86 42–51

期望命中 1/3:Tesla, SpaceX, Elon Musk
未命中Tesla, SpaceX

Edge cases

EDGE-01 · 空文本

请求

{
  "text": ""
}

响应:HTTP 200 · 1160ms · 0 个实体

未识别到实体

三、按路由分组性能

分组 用例数 最快 最慢 平均
EN — GLiNER 主路径 2 1542ms 1632ms 1587ms
ZH — BERT 主路径 2 1282ms 1305ms 1294ms
ZH — BERT 边界识别 1 1330ms 1330ms 1330ms
AR — GLiNER 主路径 1 1307ms 1307ms 1307ms
Mixed — 双模型合并 2 1635ms 1652ms 1643ms
auto — 自动语言检测 3 1267ms 1940ms 1545ms
min_entities 覆盖启发式 2 1183ms 1501ms 1342ms
Threshold 变化 1 1525ms 1525ms 1525ms
Edge cases 1 1160ms 1160ms 1160ms