Spaces:

Nx-Neuralon
/

ASD

Sleeping

File size: 2,913 Bytes

b6d0232

from __future__ import annotations

from app.llm_client import chat_completion_json, safe_json_loads
from app.schemas import AgentResult, Finding


DOCUMENT_AGENT_SYSTEM = """

你是一个儿童孤独症谱系障碍辅助筛查系统中的“文档智能体”。

你的任务是分析患者/家属/医生提供的文档材料，包括：

- 病例资料

- 孤独症检测表/量表

- 问卷

- 观察记录

- 其他结构化或半结构化文档



你不是做正式诊断，而是抽取与“五不”辅助筛查相关的文档证据。

你必须只输出严格 JSON，不要输出 markdown，不要解释。

""".strip()


DOCUMENT_AGENT_USER_TEMPLATE = """

请分析以下文档内容，并输出结构化 JSON。



要求：

1. 关注“五不”：

   - 不（少）看

   - 不（少）应

   - 不（少）指

   - 不（少）语

   - 不当

2. 每条 finding 使用以下格式：

{

  "warning_type": "不（少）看|不（少）应|不（少）指|不（少）语|不当",

  "start_sec": 0,

  "end_sec": 0,

  "confidence": 0.0,

  "evidence": "从文档提炼的关键证据",

  "behavior_tags": ["标签1", "标签2"],

  "clinical_note": "简短临床解释",

  "clip_summary": "一句话摘要",

  "modality_limit": "document_only"

}

3. 文档证据没有视频时间戳，因此 start_sec 和 end_sec 固定为 0。

4. 若某一维度没有足够证据，可以不输出。

5. 输出格式必须为：

{

  "findings": [...],

  "clip_level_summary": "文档总体摘要"

}



文档内容如下：

<<DOCUMENT_BUNDLE>>

""".strip()


class DocumentAgent:
    def __init__(self, model: str):
        self.model = model

    def agent_name(self) -> str:
        return "document_agent"

    def run(self, client, document_bundle: str) -> AgentResult:
        messages = [
            {"role": "system", "content": DOCUMENT_AGENT_SYSTEM},
            {
                "role": "user",
                "content": DOCUMENT_AGENT_USER_TEMPLATE.replace("<<DOCUMENT_BUNDLE>>", document_bundle),
            },
        ]

        raw_text = chat_completion_json(
            client=client,
            model=self.model,
            messages=messages,
            temperature=0.1,
            timeout=180,
        )

        try:
            payload = safe_json_loads(raw_text)
            findings = [Finding(**f) for f in payload.get("findings", [])]
            clip_level_summary = payload.get("clip_level_summary", "")
        except Exception:
            findings = []
            clip_level_summary = "文档智能体输出解析失败，建议人工复核。"

        return AgentResult(
            agent_name=self.agent_name(),
            findings=findings,
            clip_start_sec=0.0,
            clip_end_sec=0.0,
            clip_level_summary=clip_level_summary,
            raw_text=raw_text,
        )