--- license: apache-2.0 datasets: - ynyg/ExamInk-Seg language: - zh - en base_model: - microsoft/resnet-50 pipeline_tag: image-to-image --- # ExamInk-Seg 基于 PyTorch Lightning 的墨迹二值分割模型。输入 RGB 图像,输出 1 通道墨迹掩码。 ## 模型信息 - **架构**:U-Net++ (segmentation_models_pytorch) + ResNet50 编码器 (ImageNet 预训练) - **任务**:手写/试卷墨迹二值分割 - **框架**:PyTorch Lightning - **输入**:3 通道 RGB,按 ImageNet 均值/方差归一化 - **输出**:1 通道 logits 掩码;对 logits 取 sigmoid 得到概率 ## 训练概要 - **Loss**:0.8 * Dice (from logits) + 0.2 * BCEWithLogits (pos_weight=2.0) - **指标**:IoU 与 F1(阈值 0.3 和 0.5) - **训练裁剪**:1024,随机裁剪 / 有墨迹优先裁剪,水平翻转 - **优化器**:AdamW (lr 3e-5, weight_decay 1e-5) - **学习率调度**:ReduceLROnPlateau,监控 val_iou_05(mode=max, factor=0.5, patience=2, min_lr=1e-7) ## 文件 - `config.json`:模型结构与训练超参数 - `model.safetensors`:导出权重 - `best.ckpt`:PyTorch Lightning checkpoint ## 推理说明 - 归一化:mean=(0.485, 0.456, 0.406),std=(0.229, 0.224, 0.225) - 对 logits 取 `sigmoid` 得到二值掩码概率 - 验证/推理使用滑窗:tile=1024,stride=768,可选水平翻转 TTA ## 许可证 MIT