File size: 12,609 Bytes
f90826c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
# 远端 API 测试报告

- 服务地址:`https://robinwu-nerserver.hf.space`
- 测试时间:2026-04-30 09:43:24
- 健康检查:✓ OK (1259ms) — {"status":"ok"}
- 用例总数:15

## 一、汇总

| 用例 | 描述 | HTTP | 实体数 | 召回 | 耗时 |
|---|---|---|---|---|---|
| **EN-01** | 英文短句,显式 language=en,自定义标签 | ✓ 200 | 5 | 5/5 | 1632ms |
| **EN-02** | 英文长段,labels 留空触发默认双语标签集 | ✓ 200 | 5 | 1/4 | 1542ms |
| **ZH-01** | 中文现代商业文本,显式 language=zh | ✓ 200 | 6 | 0/4 | 1305ms |
| **ZH-02** | 中文医疗场景,自定义双语标签 | ✓ 200 | 5 | 0/3 | 1282ms |
| **ZH-03** | 古典文学边界测试 — 「尤氏来请」应只取「尤氏」 | ✓ 200 | 6 | 0/6 | 1330ms |
| **AR-01** | 阿拉伯语新闻 | ✓ 200 | 4 | 2/2 | 1307ms |
| **MIX-01** | 中英混合 · 职场场景,language=mixed 强制双跑 | ✓ 200 | 7 | 3/7 | 1652ms |
| **MIX-02** | 学术场景,labels 留空 | ✓ 200 | 4 | 2/5 | 1635ms |
| **AUTO-01** | 纯中文文本,应被检测为 zh | ✓ 200 | 3 | 0/3 | 1267ms |
| **AUTO-02** | 纯英文文本,应被检测为 en | ✓ 200 | 4 | 3/3 | 1940ms |
| **AUTO-03** | 中英混合,应被检测为 mixed 并双跑合并 | ✓ 200 | 4 | 2/3 | 1428ms |
| **MIN-01** | min_entities=10 强制兜底(短文本启发式只期望 1 个) | ✓ 200 | 1 | 0/1 | 1501ms |
| **MIN-02** | min_entities=0 关闭兜底 | ✓ 200 | 1 | 0/1 | 1183ms |
| **THR-01** | 高阈值 0.8 - 期望返回更少但更高置信度的实体 | ✓ 200 | 1 | 1/3 | 1525ms |
| **EDGE-01** | 空文本 | ✓ 200 | 0 | — | 1160ms |

- 通过率:**15/15**
- 累计耗时:**21688ms**(平均 1446ms/请求)

## 二、分组详细结果

### EN — GLiNER 主路径

#### EN-01 · 英文短句,显式 language=en,自定义标签

**请求**
```json
{
  "text": "Elon Musk founded SpaceX in Hawthorne, California in 2002.",
  "labels": [
    "full name of a person",
    "company or organization name",
    "geographical location",
    "date or year"
  ],
  "language": "en"
}
```

**响应**:HTTP 200 · 1632ms · 5 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `Elon Musk` | 人名或姓名 | 0.85 | 0–9 |
| `SpaceX` | company or organization name | 0.85 | 18–24 |
| `Hawthorne` | 地名或城市 | 0.70 | 28–37 |
| `California` | geographical location | 0.57 | 39–49 |
| `2002` | date or year | 0.89 | 53–57 |

**期望命中** 5/5:`Elon Musk`, `2002`, `SpaceX`, `Hawthorne`, `California`  

#### EN-02 · 英文长段,labels 留空触发默认双语标签集

**请求**
```json
{
  "text": "President Biden signed the Inflation Reduction Act in Washington D.C. on August 16, 2022. The legislation was championed by Senator Chuck Schumer and was seen as a major win for the Democratic Party.",
  "language": "en"
}
```

**响应**:HTTP 200 · 1542ms · 5 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `President Biden` | 人名或姓名 | 0.66 | 0–15 |
| `Inflation Reduction Act` | legislation or policy name | 0.78 | 27–50 |
| `Washington D.C.` | geographical location | 0.64 | 54–69 |
| `August 16, 2022` | date or year | 0.92 | 73–88 |
| `Senator Chuck Schumer` | 人名或姓名 | 0.66 | 124–145 |

**期望命中** 1/4:`Chuck Schumer`, `Democratic Party`, `Biden`, `Washington D.C.`  
**未命中**`Chuck Schumer`, `Democratic Party`, `Biden`  

### ZH — BERT 主路径

#### ZH-01 · 中文现代商业文本,显式 language=zh

**请求**
```json
{
  "text": "阿里巴巴集团创始人马云于2019年卸任董事局主席,由张勇接任。总部位于杭州的阿里巴巴旗下拥有淘宝、天猫、支付宝等业务板块。",
  "language": "zh"
}
```

**响应**:HTTP 200 · 1305ms · 6 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `阿 里 巴 巴 集 团` | 公司或组织机构名称 | 1.00 | 0–6 |
| `马 云` | 人名或姓名 | 1.00 | 9–11 |
| `2019 年` | 日期或年份 | 1.00 | 12–17 |
| `张 勇` | 人名或姓名 | 1.00 | 26–28 |
| `杭 州` | 地名或城市 | 1.00 | 35–37 |
| `阿 里 巴 巴` | 公司或组织机构名称 | 0.99 | 38–42 |

**期望命中** 0/4:`张勇`, `杭州`, `阿里巴巴`, `马云`  
**未命中**`杭州`, `阿里巴巴`, `张勇`, `马云`  

#### ZH-02 · 中文医疗场景,自定义双语标签

**请求**
```json
{
  "text": "北京协和医院心内科主任王建国教授团队,于2023年成功完成首例机器人辅助冠状动脉搭桥手术,患者来自山东省济南市。",
  "labels": [
    "人名或姓名",
    "医院或医疗机构名称",
    "地名或城市",
    "日期或年份"
  ],
  "language": "zh"
}
```

**响应**:HTTP 200 · 1282ms · 5 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `北 京 协 和 医 院 心 内 科` | 公司或组织机构名称 | 0.98 | 0–9 |
| `王 建 国` | 人名或姓名 | 1.00 | 11–14 |
| `2023 年` | 日期或年份 | 0.96 | 20–25 |
| `山 东 省` | 地名或城市 | 1.00 | 49–52 |
| `济 南 市` | 地名或城市 | 1.00 | 52–55 |

**期望命中** 0/3:`济南`, `王建国`, `北京协和医院`  
**未命中**`济南`, `王建国`, `北京协和医院`  

### ZH — BERT 边界识别

#### ZH-03 · 古典文学边界测试 — 「尤氏来请」应只取「尤氏」

**请求**
```json
{
  "text": "尤氏来请,王熙凤笑道:你来了。贾母命人摆酒,宝玉和黛玉在大观园散步。",
  "language": "zh"
}
```

**响应**:HTTP 200 · 1330ms · 6 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `尤 氏` | 人名或姓名 | 1.00 | 0–2 |
| `王 熙 凤` | 人名或姓名 | 1.00 | 5–8 |
| `贾 母` | 人名或姓名 | 1.00 | 15–17 |
| `宝 玉` | 人名或姓名 | 1.00 | 22–24 |
| `黛 玉` | 人名或姓名 | 1.00 | 25–27 |
| `大 观 园` | 地名或城市 | 0.93 | 28–31 |

**期望命中** 0/6:`贾母`, `大观园`, `宝玉`, `尤氏`, `黛玉`, `王熙凤`  
**未命中**`尤氏`, `黛玉`, `王熙凤`, `贾母`, `大观园`, `宝玉`  

> ✓ 边界正确(未出现 {'王熙凤笑道', '尤氏来请'})

### AR — GLiNER 主路径

#### AR-01 · 阿拉伯语新闻

**请求**
```json
{
  "text": "أعلن الرئيس محمد بن سلمان عن إطلاق مشروع نيوم في المملكة العربية السعودية عام 2017، وتبلغ تكلفته 500 مليار دولار.",
  "labels": [
    "full name of a person",
    "geographical location",
    "project or initiative name",
    "date or year"
  ],
  "language": "ar"
}
```

**响应**:HTTP 200 · 1307ms · 4 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `محمد بن سلمان` | 人名或姓名 | 0.71 | 12–25 |
| `نيوم` | project or initiative name | 0.55 | 41–45 |
| `المملكة العربية السعودية` | 地名或城市 | 0.65 | 49–73 |
| `2017` | date or year | 0.82 | 78–82 |

**期望命中** 2/2:`محمد بن سلمان`, `المملكة العربية السعودية`  

### Mixed — 双模型合并

#### MIX-01 · 中英混合 · 职场场景,language=mixed 强制双跑

**请求**
```json
{
  "text": "张伟加入了 Google 北京研发中心,负责 Android 系统优化。他的同事 Sarah Chen 来自 Meta,两人共同参与了 2024 年的 AI Summit。",
  "language": "mixed"
}
```

**响应**:HTTP 200 · 1652ms · 7 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `张 伟` | 人名或姓名 | 1.00 | 0–2 |
| `Google` | 公司或组织机构名称 | 0.82 | 6–12 |
| `北 京 研 发 中 心` | 公司或组织机构名称 | 0.86 | 13–19 |
| `Sarah Chen` | 人名或姓名 | 0.89 | 41–51 |
| `Meta` | company or organization name | 0.85 | 55–59 |
| `2024 年` | 日期或年份 | 0.66 | 68–74 |
| `AI Summit` | event name | 0.49 | 76–85 |

**期望命中** 3/7:`2024`, `Meta`, `Google`, `Android`, `北京`, `Sarah Chen`, `张伟`  
**未命中**`2024`, `Android`, `北京`, `张伟`  

#### MIX-02 · 学术场景,labels 留空

**请求**
```json
{
  "text": "清华大学计算机系教授李明在 NeurIPS 2023 发表了关于 Transformer 架构的论文,合作者来自 MIT 和 Stanford University。",
  "language": "mixed"
}
```

**响应**:HTTP 200 · 1635ms · 4 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `清 华 大 学 计 算 机 系` | 公司或组织机构名称 | 1.00 | 0–8 |
| `李 明` | 人名或姓名 | 1.00 | 10–12 |
| `MIT` | university or research institution | 0.76 | 57–60 |
| `Stanford University` | university or research institution | 0.85 | 63–82 |

**期望命中** 2/5:`Stanford University`, `李明`, `清华大学`, `Transformer`, `MIT`  
**未命中**`李明`, `清华大学`, `Transformer`  

### auto — 自动语言检测

#### AUTO-01 · 纯中文文本,应被检测为 zh

**请求**
```json
{
  "text": "马云创立了阿里巴巴,总部在杭州。"
}
```

**响应**:HTTP 200 · 1267ms · 3 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `马 云` | 人名或姓名 | 1.00 | 0–2 |
| `阿 里 巴 巴` | 公司或组织机构名称 | 1.00 | 5–9 |
| `杭 州` | 地名或城市 | 1.00 | 13–15 |

**期望命中** 0/3:`杭州`, `阿里巴巴`, `马云`  
**未命中**`杭州`, `阿里巴巴`, `马云`  

#### AUTO-02 · 纯英文文本,应被检测为 en

**请求**
```json
{
  "text": "Tim Cook is the CEO of Apple in Cupertino."
}
```

**响应**:HTTP 200 · 1940ms · 4 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `Tim Cook` | 人名或姓名 | 0.86 | 0–8 |
| `CEO` | 人名或姓名 | 0.61 | 16–19 |
| `Apple` | 公司或组织机构名称 | 0.90 | 23–28 |
| `Cupertino` | 地名或城市 | 0.88 | 32–41 |

**期望命中** 3/3:`Cupertino`, `Tim Cook`, `Apple`  

#### AUTO-03 · 中英混合,应被检测为 mixed 并双跑合并

**请求**
```json
{
  "text": "李华在 Microsoft 担任工程师,常驻 Seattle 办公室。"
}
```

**响应**:HTTP 200 · 1428ms · 4 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `李华在` | 人名或姓名 | 0.41 | 0–3 |
| `李 华` | 人名或姓名 | 1.00 | 0–2 |
| `Microsoft` | 公司或组织机构名称 | 0.75 | 4–13 |
| `Seattle` | 地名或城市 | 0.79 | 23–30 |

**期望命中** 2/3:`李华`, `Microsoft`, `Seattle`  
**未命中**`李华`  

### min_entities 覆盖启发式

#### MIN-01 · min_entities=10 强制兜底(短文本启发式只期望 1 个)

**请求**
```json
{
  "text": "马云",
  "language": "zh",
  "min_entities": 10
}
```

**响应**:HTTP 200 · 1501ms · 1 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `马 云` | 人名或姓名 | 1.00 | 0–2 |

**期望命中** 0/1:`马云`  
**未命中**`马云`  

#### MIN-02 · min_entities=0 关闭兜底

**请求**
```json
{
  "text": "马云",
  "language": "zh",
  "min_entities": 0
}
```

**响应**:HTTP 200 · 1183ms · 1 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `马 云` | 人名或姓名 | 1.00 | 0–2 |

**期望命中** 0/1:`马云`  
**未命中**:`马云`  

### Threshold 变化

#### THR-01 · 高阈值 0.8 - 期望返回更少但更高置信度的实体

**请求**
```json
{
  "text": "Tesla and SpaceX are companies founded by Elon Musk.",
  "language": "en",
  "threshold": 0.8
}
```

**响应**:HTTP 200 · 1525ms · 1 个实体

| 文本 | 标签 | 置信度 | 起止 |
|---|---|---|---|
| `Elon Musk` | 人名或姓名 | 0.86 | 42–51 |

**期望命中** 1/3:`Tesla`, `SpaceX`, `Elon Musk`  
**未命中**:`Tesla`, `SpaceX`  

### Edge cases

#### EDGE-01 · 空文本

**请求**
```json
{
  "text": ""
}
```

**响应**:HTTP 200 · 1160ms · 0 个实体

_未识别到实体_

## 三、按路由分组性能

| 分组 | 用例数 | 最快 | 最慢 | 平均 |
|---|---|---|---|---|
| EN — GLiNER 主路径 | 2 | 1542ms | 1632ms | 1587ms |
| ZH — BERT 主路径 | 2 | 1282ms | 1305ms | 1294ms |
| ZH — BERT 边界识别 | 1 | 1330ms | 1330ms | 1330ms |
| AR — GLiNER 主路径 | 1 | 1307ms | 1307ms | 1307ms |
| Mixed — 双模型合并 | 2 | 1635ms | 1652ms | 1643ms |
| auto — 自动语言检测 | 3 | 1267ms | 1940ms | 1545ms |
| min_entities 覆盖启发式 | 2 | 1183ms | 1501ms | 1342ms |
| Threshold 变化 | 1 | 1525ms | 1525ms | 1525ms |
| Edge cases | 1 | 1160ms | 1160ms | 1160ms |