YAML Metadata Warning:empty or missing yaml metadata in repo card

Check out the documentation for more information.

🫀 复活吧我的赛博前任

导入聊天截图 + 语音文件 → 克隆前任的人格与声音 → 通过微信/QQ/飞书/WhatsApp 复活 TA

Python License Version HuggingFace


⚠️ 法律风险提示

使用前请务必阅读:

本工具涉及个人隐私数据处理和 AI 人格克隆,使用不当可能触犯法律:

法律法规 相关条款 违反后果
《民法典》第1019条 禁止伪造侵害肖像权 民事赔偿
《民法典》第1034条 个人信息保护 民事赔偿
《个人信息保护法》第14条 处理个人信息需同意 行政处罚
《刑法》第253条之一 侵犯公民个人信息罪 刑事处罚
GDPR 第17条 被遗忘权(数据删除权) 高额罚款
各州 Deepfake 法案 禁止深度伪造 刑事处罚

首次使用必须运行伦理确认:

python3 main.py consent          # 确认伦理条款
python3 main.py consent --show-legal  # 查看完整法律条文

📖 这是什么?

一个能让你的「电子前任」复活的 AI 工具。

你只需要准备:

  1. 📸 你和 TA 的聊天截图(微信/QQ/短信都行)或导出文件
  2. 🎤 TA 的语音消息(微信语音条、录音等)

它能做什么:

  • 从截图/导出文件中读懂 TA 的说话风格、口头禅、性格
  • 从语音中克隆 TA 的声音
  • 让 TA 在微信/QQ/飞书/WhatsApp 上"复活",像真人一样跟你聊天
  • 有记忆:记住聊过的事,越聊越像 TA
  • 一键销毁:随时安全删除所有本地数据

🖥️ 图形界面(推荐)

# macOS / Linux
./start.sh

# Windows
start.bat

# 或直接
python3 gui_app.py

GUI 功能:

  • 📊 仪表盘 — 实时数据总览
  • ⚖️ 伦理声明 — 可视化确认流程
  • 📸 截图识别 — 多引擎选择 + 图片预览
  • 📥 导入记录 — 支持多种格式 + 表格预览
  • 🧹 数据清洗 — 选项配置 + 实时预览
  • 🧠 人格预览 — 聊天记录 vs 人格模型对比
  • 🎤 声音克隆 — 音频试听 + 训练进度
  • 🚀 一键部署 — 步骤配置 + 进度追踪
  • 🔥 数据销毁 — 扫描预览 + 安全销毁
  • 📋 运行日志 — 实时日志 + 级别过滤

🚀 快速开始

第一步:安装 Python

Windows 用户:

  1. 打开 https://www.python.org/downloads/
  2. 点击 "Download Python 3.x.x"
  3. 安装时勾选 "Add Python to PATH"

Mac 用户:

brew install python3

第二步:安装依赖

cd skills/cyber-ex-resurrection
pip install -r requirements.txt

# 国内镜像加速
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

第三步:伦理确认(必须)

python3 main.py consent

首次使用会展示伦理声明和法律风险,你需要逐项确认才能继续。

第四步:配置 MIMO API

编辑 config.json,填入 MIMO API Key:

{
  "mimo": {
    "api_key": "sk-你的API-Key",
    "endpoint": "https://api.xiaomimimo.com/v1"
  }
}

获取 API Key:https://platform.xiaomimimo.com → 控制台 → API Keys


📸 使用方法

方法一:一键 Pipeline(推荐)

# 从截图开始
python3 main.py pipeline -s data/screenshots/ -v data/voices/

# 或从导出文件开始
python3 main.py pipeline -f data/wechat_export.txt -v data/voices/

# 然后聊天
python3 main.py chat

方法三:一键部署(CLI)

# 从截图到机器人,全自动
python3 deploy.py --input data/screenshots/ --voices data/voices/ --platform wechat

# 从导入文件开始
python3 deploy.py --import-file data/wechat.txt --voices data/voices/

# 仅清洗数据
python3 deploy.py --import-file data/wechat.txt --clean-only

方法四:分步执行

# 1. 提取对话(选择引擎)
python3 main.py ocr -i data/screenshots/ --engine mimo_omni
# 或导入已有记录
python3 main.py import -i data/wechat.txt

# 2. 智能清洗
python3 main.py clean

# 3. 构建人格
python3 main.py persona

# 4. 训练声音
python3 main.py voice -i data/voices/

# 5. 聊天
python3 main.py chat

方法三:启动微信机器人

python3 main.py bot -p wechat

🔍 OCR 引擎

引擎 优势 安装
mimo_omni 语义理解最强,复杂截图 内置(需 API)
paddleocr 手写体、竖排、特殊符号 pip install paddleocr
easyocr 多语言、表情包 pip install easyocr
multi 三引擎融合投票 安装以上全部
python3 main.py ocr -i data/screenshots/ --engine paddleocr
python3 main.py ocr -i data/screenshots/ --engine multi

📥 导入格式

支持多种聊天记录格式:

格式 示例
JSON [{"role":"me","text":"你好"}]
CSV role,text,time 带标题行
HTML 微信导出的网页文件
TXT (带时间戳) [2024-01-15 14:30] 我: 消息
TXT (微信导出) 带分隔线的导出格式
SQLite 手机备份数据库
python3 main.py import -i data/wechat.txt
python3 main.py import -i data/chat.csv
python3 main.py import -i data/backup.db
python3 main.py import -i data/chats/   # 整个目录

🧹 数据清洗

自动过滤:系统消息、广告、重复内容、无效对话、合并连续消息

python3 main.py clean                    # 默认清洗
python3 main.py clean --no-ads           # 保留广告
python3 main.py clean --keep-emoji-only  # 保留纯表情

🔥 一键数据销毁

python3 main.py destroy --scan   # 扫描本地数据(不删除)
python3 main.py destroy          # 安全销毁所有数据

安全流程:文件覆写(零填充)→ 删除,确保不可恢复。


🧠 记忆系统

层级 说明 持久性
滑动窗口 最近 10 轮对话 会话内
关键事件 自动提取的重要信息 跨会话
持久记忆 序列化到文件 永久

💬 支持的平台

平台 状态
微信 ✅(需 Wechaty Token)
QQ
飞书
WhatsApp
CLI 聊天 ✅ 默认

📁 项目结构

skills/cyber-ex-resurrection/
├── main.py               # 主入口
├── config.json           # 配置文件
├── requirements.txt      # 依赖
├── ethics.py             # ⚖️ 伦理声明 & 同意验证
├── data_destroy.py       # 🔥 一键数据销毁
├── ocr_extract.py        # 截图 OCR(MIMO Omni)
├── ocr_engines.py        # 🔍 多引擎 OCR(Paddle/Easy/MIMO)
├── importers.py          # 📥 多格式导入
├── data_cleaner.py       # 🧹 智能数据清洗
├── chat_parser.py        # 对话解析
├── persona_builder.py    # 人格建模
├── voice_clone.py        # 声音克隆
├── voice_tts.py          # 语音合成
├── chat_engine.py        # 对话引擎
├── memory.py             # 记忆系统
├── pipeline.py           # 统一管线
└── bots/                 # IM 机器人

📝 更新日志

v1.2.4 (2026-05-22)

  • 🐛 Bug 修复(9项):
    • memory.py: 修复 Counter import 位置导致的潜在 NameError
    • importers.py: 修复 _normalize_role 过度匹配("i" 子串命中 Lisa/Kevin 等名字)
    • voice_clone.py: 修复音频格式转换静默失败(pydub 缺失时非 wav 文件被当 wav 用)
    • ocr_engines.py: 修复 asyncio.run() 在已有事件循环中崩溃
    • importers.py: 修复 _import_backup SQL 注入风险(表名/列名白名单校验)
    • persona_builder.py: 修复步骤编号跳跃,改为连续 Step 1-5
    • persona_builder.py: 简化 max_lines 配置为 max_chat_lines(默认 500)
    • voice_tts.py: import hashlib 移到文件顶部
    • chat_engine.py: _call_mimo 增加空列表防御和 system prompt 自动补全

v1.2.3 (2026-05-21)

  • 🧠 多维度人格建模:性格特征、价值观、兴趣爱好、说话习惯、情感模式、社交风格六大维度
  • 📚 RAG 知识库:聊天记录向量化,TF-IDF + 余弦相似度检索,上下文增强生成
  • 💖 情感分析引擎:8 种情绪检测(开心/难过/生气/惊讶/害怕/厌恶/爱/调皮),情感轨迹追踪
  • 🗄️ 四层记忆架构:滑动窗口 + 关键事件 + 持久记忆 + 向量记忆(RAG)
  • 🎯 用户偏好记忆:自动提取喜欢/不喜欢/习惯/重要日期
  • 🔍 语义检索:基于 RAG 的历史对话检索,提升上下文理解
  • 🎭 情感化回复:根据检测到的情绪自动调整回复语气

v1.2.0 (2026-05-21)

  • 🖥️ 跨平台 GUI:PyQt6 图形界面,支持 Windows/macOS/Linux,暗色主题
  • 🚀 一键部署 CLIdeploy.py 命令行全自动,无需手动输入多个命令
  • 📊 仪表盘:实时数据统计、快速操作入口、Pipeline 进度追踪
  • ⚖️ 可视化伦理确认:GUI 确认流程 + 法律条文展示
  • 📸 OCR 预览:多引擎选择、图片预览、结果表格
  • 🧠 人格对比预览:聊天记录 vs 人格模型左右分栏对比
  • 🎤 声音试听:音频预览播放 + 训练进度可视化
  • 🔥 数据销毁增强:扫描预览、选择性/全量销毁、安全覆写
  • 📋 日志系统:实时日志流、级别过滤、文件导出、RotatingFileHandler
  • 启动脚本start.sh (macOS/Linux) / start.bat (Windows) 一键启动

v1.1.1 (2026-05-21)

  • ⚖️ 伦理合规:强制伦理声明、使用前同意确认、法律条文参考
  • 🔥 一键数据销毁:安全覆写删除所有本地数据
  • 🔍 多引擎 OCR:PaddleOCR + EasyOCR + MIMO Omni
  • 📥 多格式导入:txt/csv/html/微信导出/手机备份
  • 🧹 智能数据清洗:自动过滤系统消息、广告、重复内容

v1.1.0 (2026-05-21)

  • 🧠 人格建模升级:n-gram + few-shot
  • 💾 三层记忆架构
  • 🔄 Pipeline 一键执行
  • 💬 有状态对话引擎

v1.0.0 (2026-05-21)

  • 🎉 首次发布

👤 作者

AARONCXXX 📧 122241711@qq.com

📄 许可证

MIT License


🫀 「如果记忆有声音,那就让 TA 继续说话。」

Downloads last month
27
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support