YAML Metadata Warning:empty or missing yaml metadata in repo card

Check out the documentation for more information.

🫀 复活吧我的赛博前任

导入聊天截图 + 语音文件 → 克隆前任的人格与声音 → 通过微信/QQ/飞书/WhatsApp 复活 TA

⚠️ 法律风险提示

使用前请务必阅读：

本工具涉及个人隐私数据处理和 AI 人格克隆，使用不当可能触犯法律：

法律法规	相关条款	违反后果
《民法典》第1019条	禁止伪造侵害肖像权	民事赔偿
《民法典》第1034条	个人信息保护	民事赔偿
《个人信息保护法》第14条	处理个人信息需同意	行政处罚
《刑法》第253条之一	侵犯公民个人信息罪	刑事处罚
GDPR 第17条	被遗忘权（数据删除权）	高额罚款
各州 Deepfake 法案	禁止深度伪造	刑事处罚

首次使用必须运行伦理确认：

python3 main.py consent          # 确认伦理条款
python3 main.py consent --show-legal  # 查看完整法律条文

📖 这是什么？

一个能让你的「电子前任」复活的 AI 工具。

你只需要准备：

📸 你和 TA 的聊天截图（微信/QQ/短信都行）或导出文件
🎤 TA 的语音消息（微信语音条、录音等）

它能做什么：

从截图/导出文件中读懂 TA 的说话风格、口头禅、性格
从语音中克隆 TA 的声音
让 TA 在微信/QQ/飞书/WhatsApp 上"复活"，像真人一样跟你聊天
有记忆：记住聊过的事，越聊越像 TA
一键销毁：随时安全删除所有本地数据

🖥️ 图形界面（推荐）

# macOS / Linux
./start.sh

# Windows
start.bat

# 或直接
python3 gui_app.py

GUI 功能：

📊 仪表盘 — 实时数据总览
⚖️ 伦理声明 — 可视化确认流程
📸 截图识别 — 多引擎选择 + 图片预览
📥 导入记录 — 支持多种格式 + 表格预览
🧹 数据清洗 — 选项配置 + 实时预览
🧠 人格预览 — 聊天记录 vs 人格模型对比
🎤 声音克隆 — 音频试听 + 训练进度
🚀 一键部署 — 步骤配置 + 进度追踪
🔥 数据销毁 — 扫描预览 + 安全销毁
📋 运行日志 — 实时日志 + 级别过滤

🚀 快速开始

第一步：安装 Python

Windows 用户：

打开 https://www.python.org/downloads/
点击 "Download Python 3.x.x"
安装时勾选 "Add Python to PATH" ✅

Mac 用户：

brew install python3

第二步：安装依赖

cd skills/cyber-ex-resurrection
pip install -r requirements.txt

# 国内镜像加速
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

第三步：伦理确认（必须）

python3 main.py consent

首次使用会展示伦理声明和法律风险，你需要逐项确认才能继续。

第四步：配置 MIMO API

编辑 config.json，填入 MIMO API Key：

{
  "mimo": {
    "api_key": "sk-你的API-Key",
    "endpoint": "https://api.xiaomimimo.com/v1"
  }
}

获取 API Key：https://platform.xiaomimimo.com → 控制台 → API Keys

📸 使用方法

方法一：一键 Pipeline（推荐）

# 从截图开始
python3 main.py pipeline -s data/screenshots/ -v data/voices/

# 或从导出文件开始
python3 main.py pipeline -f data/wechat_export.txt -v data/voices/

# 然后聊天
python3 main.py chat

方法三：一键部署（CLI）

# 从截图到机器人，全自动
python3 deploy.py --input data/screenshots/ --voices data/voices/ --platform wechat

# 从导入文件开始
python3 deploy.py --import-file data/wechat.txt --voices data/voices/

# 仅清洗数据
python3 deploy.py --import-file data/wechat.txt --clean-only

方法四：分步执行

# 1. 提取对话（选择引擎）
python3 main.py ocr -i data/screenshots/ --engine mimo_omni
# 或导入已有记录
python3 main.py import -i data/wechat.txt

# 2. 智能清洗
python3 main.py clean

# 3. 构建人格
python3 main.py persona

# 4. 训练声音
python3 main.py voice -i data/voices/

# 5. 聊天
python3 main.py chat

方法三：启动微信机器人

python3 main.py bot -p wechat

🔍 OCR 引擎

引擎	优势	安装
`mimo_omni`	语义理解最强，复杂截图	内置（需 API）
`paddleocr`	手写体、竖排、特殊符号	`pip install paddleocr`
`easyocr`	多语言、表情包	`pip install easyocr`
`multi`	三引擎融合投票	安装以上全部

python3 main.py ocr -i data/screenshots/ --engine paddleocr
python3 main.py ocr -i data/screenshots/ --engine multi

📥 导入格式

支持多种聊天记录格式：

格式	示例
JSON	`[{"role":"me","text":"你好"}]`
CSV	`role,text,time` 带标题行
HTML	微信导出的网页文件
TXT (带时间戳)	`[2024-01-15 14:30] 我: 消息`
TXT (微信导出)	带分隔线的导出格式
SQLite	手机备份数据库

python3 main.py import -i data/wechat.txt
python3 main.py import -i data/chat.csv
python3 main.py import -i data/backup.db
python3 main.py import -i data/chats/   # 整个目录

🧹 数据清洗

自动过滤：系统消息、广告、重复内容、无效对话、合并连续消息

python3 main.py clean                    # 默认清洗
python3 main.py clean --no-ads           # 保留广告
python3 main.py clean --keep-emoji-only  # 保留纯表情

🔥 一键数据销毁

python3 main.py destroy --scan   # 扫描本地数据（不删除）
python3 main.py destroy          # 安全销毁所有数据

安全流程：文件覆写（零填充）→ 删除，确保不可恢复。

🧠 记忆系统

层级	说明	持久性
滑动窗口	最近 10 轮对话	会话内
关键事件	自动提取的重要信息	跨会话
持久记忆	序列化到文件	永久

💬 支持的平台

平台	状态
微信	✅（需 Wechaty Token）
QQ	✅
飞书	✅
WhatsApp	✅
CLI 聊天	✅ 默认

📁 项目结构

skills/cyber-ex-resurrection/
├── main.py               # 主入口
├── config.json           # 配置文件
├── requirements.txt      # 依赖
├── ethics.py             # ⚖️ 伦理声明 & 同意验证
├── data_destroy.py       # 🔥 一键数据销毁
├── ocr_extract.py        # 截图 OCR（MIMO Omni）
├── ocr_engines.py        # 🔍 多引擎 OCR（Paddle/Easy/MIMO）
├── importers.py          # 📥 多格式导入
├── data_cleaner.py       # 🧹 智能数据清洗
├── chat_parser.py        # 对话解析
├── persona_builder.py    # 人格建模
├── voice_clone.py        # 声音克隆
├── voice_tts.py          # 语音合成
├── chat_engine.py        # 对话引擎
├── memory.py             # 记忆系统
├── pipeline.py           # 统一管线
└── bots/                 # IM 机器人

📝 更新日志

v1.2.4 (2026-05-22)

🐛 Bug 修复（9项）:
- memory.py: 修复 Counter import 位置导致的潜在 NameError
- importers.py: 修复 _normalize_role 过度匹配（"i" 子串命中 Lisa/Kevin 等名字）
- voice_clone.py: 修复音频格式转换静默失败（pydub 缺失时非 wav 文件被当 wav 用）
- ocr_engines.py: 修复 asyncio.run() 在已有事件循环中崩溃
- importers.py: 修复 _import_backup SQL 注入风险（表名/列名白名单校验）
- persona_builder.py: 修复步骤编号跳跃，改为连续 Step 1-5
- persona_builder.py: 简化 max_lines 配置为 max_chat_lines（默认 500）
- voice_tts.py: import hashlib 移到文件顶部
- chat_engine.py: _call_mimo 增加空列表防御和 system prompt 自动补全

v1.2.3 (2026-05-21)

🧠 多维度人格建模：性格特征、价值观、兴趣爱好、说话习惯、情感模式、社交风格六大维度
📚 RAG 知识库：聊天记录向量化，TF-IDF + 余弦相似度检索，上下文增强生成
💖 情感分析引擎：8 种情绪检测（开心/难过/生气/惊讶/害怕/厌恶/爱/调皮），情感轨迹追踪
🗄️ 四层记忆架构：滑动窗口 + 关键事件 + 持久记忆 + 向量记忆(RAG)
🎯 用户偏好记忆：自动提取喜欢/不喜欢/习惯/重要日期
🔍 语义检索：基于 RAG 的历史对话检索，提升上下文理解
🎭 情感化回复：根据检测到的情绪自动调整回复语气

v1.2.0 (2026-05-21)

🖥️ 跨平台 GUI：PyQt6 图形界面，支持 Windows/macOS/Linux，暗色主题
🚀 一键部署 CLI：deploy.py 命令行全自动，无需手动输入多个命令
📊 仪表盘：实时数据统计、快速操作入口、Pipeline 进度追踪
⚖️ 可视化伦理确认：GUI 确认流程 + 法律条文展示
📸 OCR 预览：多引擎选择、图片预览、结果表格
🧠 人格对比预览：聊天记录 vs 人格模型左右分栏对比
🎤 声音试听：音频预览播放 + 训练进度可视化
🔥 数据销毁增强：扫描预览、选择性/全量销毁、安全覆写
📋 日志系统：实时日志流、级别过滤、文件导出、RotatingFileHandler
⚡ 启动脚本：start.sh (macOS/Linux) / start.bat (Windows) 一键启动

v1.1.1 (2026-05-21)

⚖️ 伦理合规：强制伦理声明、使用前同意确认、法律条文参考
🔥 一键数据销毁：安全覆写删除所有本地数据
🔍 多引擎 OCR：PaddleOCR + EasyOCR + MIMO Omni
📥 多格式导入：txt/csv/html/微信导出/手机备份
🧹 智能数据清洗：自动过滤系统消息、广告、重复内容

v1.1.0 (2026-05-21)

🧠 人格建模升级：n-gram + few-shot
💾 三层记忆架构
🔄 Pipeline 一键执行
💬 有状态对话引擎

v1.0.0 (2026-05-21)

🎉 首次发布

👤 作者

AARONCXXX 📧 122241711@qq.com

📄 许可证

MIT License

🫀 「如果记忆有声音，那就让 TA 继续说话。」

Downloads last month: 3

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support