ExamInk-Seg
基于 PyTorch Lightning 的墨迹二值分割模型。输入 RGB 图像,输出 1 通道墨迹掩码。
模型信息
- 架构:U-Net++ (segmentation_models_pytorch) + ResNet50 编码器 (ImageNet 预训练)
- 任务:手写/试卷墨迹二值分割
- 框架:PyTorch Lightning
- 输入:3 通道 RGB,按 ImageNet 均值/方差归一化
- 输出:1 通道 logits 掩码;对 logits 取 sigmoid 得到概率
训练概要
- Loss:0.8 * Dice (from logits) + 0.2 * BCEWithLogits (pos_weight=2.0)
- 指标:IoU 与 F1(阈值 0.3 和 0.5)
- 训练裁剪:1024,随机裁剪 / 有墨迹优先裁剪,水平翻转
- 优化器:AdamW (lr 3e-5, weight_decay 1e-5)
- 学习率调度:ReduceLROnPlateau,监控 val_iou_05(mode=max, factor=0.5, patience=2, min_lr=1e-7)
文件
config.json:模型结构与训练超参数model.safetensors:导出权重best.ckpt:PyTorch Lightning checkpoint
推理说明
- 归一化:mean=(0.485, 0.456, 0.406),std=(0.229, 0.224, 0.225)
- 对 logits 取
sigmoid得到二值掩码概率 - 验证/推理使用滑窗:tile=1024,stride=768,可选水平翻转 TTA
许可证
MIT
- Downloads last month
- 6
Model tree for ynyg/ExamInk-Seg
Base model
microsoft/resnet-50