zooeyy
/

Style-Transfer

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.lz4 filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text
+# Audio files - uncompressed
+*.pcm filter=lfs diff=lfs merge=lfs -text
+*.sam filter=lfs diff=lfs merge=lfs -text
+*.raw filter=lfs diff=lfs merge=lfs -text
+# Audio files - compressed
+*.aac filter=lfs diff=lfs merge=lfs -text
+*.flac filter=lfs diff=lfs merge=lfs -text
+*.mp3 filter=lfs diff=lfs merge=lfs -text
+*.ogg filter=lfs diff=lfs merge=lfs -text
+*.wav filter=lfs diff=lfs merge=lfs -text
+# Image files - uncompressed
+*.bmp filter=lfs diff=lfs merge=lfs -text
+*.gif filter=lfs diff=lfs merge=lfs -text
+*.png filter=lfs diff=lfs merge=lfs -text
+*.tiff filter=lfs diff=lfs merge=lfs -text
+# Image files - compressed
+*.jpg filter=lfs diff=lfs merge=lfs -text
+*.jpeg filter=lfs diff=lfs merge=lfs -text
+*.webp filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,110 @@

+---
+tags:
+- text-to-image
+- lora
+- diffusers
+- template:diffusion-lora
+widget:
+- output:
+    url: images/ComfyUI_temp_pnapt_00077_.png
+  text: 图1变为图2风格
+- output:
+    url: images/ComfyUI_temp_pnapt_00074_.png
+  text: 图1变为图2风格
+- output:
+    url: images/ComfyUI_temp_pnapt_00073_.png
+  text: 图1变为图2风格
+- output:
+    url: images/ComfyUI_temp_pnapt_00072_.png
+  text: 图1变为图2风格
+base_model: Qwen/Qwen-Image-Edit-2511
+instance_prompt: 图1变为图2风格
+license: mit
+---
+# Style Transfer-Alpha0.1
+<Gallery />
+## Model description
+🎨 Qwen-Image-Edit 风格模仿 LoRA 模型 v0.1（Alpha）
+这是一个基于 [Qwen-Image-Edit-2511](https:&#x2F;&#x2F;huggingface.co&#x2F;Qwen&#x2F;Qwen-Image-Edit-2511) 的实验性LoRA微调模型，专注于风格转换与艺术变换。使用400多组图像训练了22000步，rank为32，学习率为0.0001，训练分辨率为1024，并在NVIDIA RTX 4090上实现了约每迭代15秒的速度。
+🎨 Qwen-Image-Edit Style Mimic LoRA — v0.1 (Alpha)
+An experimental LoRA fine-tuned model based on [Qwen-Image-Edit-2511](https:&#x2F;&#x2F;huggingface.co&#x2F;Qwen&#x2F;Qwen-Image-Edit-2511), designed for style transfer and artistic transformation. Trained with over 400 image pairs for 22,000 steps at rank 32, using a learning rate of 0.0001 and training resolution of 1024, achieving approximately 15 seconds per iteration on an NVIDIA RTX 4090.
+🔍 工作原理
+给定：
+一张源图像（例如，一个人的照片）
+一张参考图像（例如，卡通、线稿、插画等）
+![微信图片_20251230170631_361_150](https:&#x2F;&#x2F;cdn-uploads.huggingface.co&#x2F;production&#x2F;uploads&#x2F;671e48a732f6aa242c8c5de8&#x2F;2F2WX8_Gsfe7dJQKj4Quv.png)
+模型将参考图像的视觉风格应用于源图像，同时保留其结构和构图。虽然它仍处于早期阶段，但在ComfyUI中已经能够对部分风格产生良好的效果。
+✅ 示例：将cosplay照片转化为Lacoste鳄鱼素描风格、色彩斑斓的波普艺术狗或极简主义冬季卡通——只需一键。
+🔍 How It Works
+Given:
+A source image (e.g., a photo of a person)
+A reference image (e.g., cartoon, line art, illustration, etc.)
+The model applies the visual style of the reference image to the source image while preserving its structure and composition. Although still in its early stages, it has shown promising results for certain styles in ComfyUI.
+✅ Example: Turn a cosplay photo into a Lacoste-style crocodile sketch, a colorful pop-art dog, or a minimalist winter cartoon — all with one click.
+🛠️ 使用指南
+在 ComfyUI 中：
+1. 加载你的源图像（例如，一张照片）。
+2. 加载一个风格参考图像。
+3. 应用此 LoRA，强度设置为0.6–1.0。
+4. 使用图像到图像或修复节点生成结果。
+尽管该模型在某些风格上表现良好，但它仍在开发中，可能会遇到一些局限性。
+In SD WebUI:
+Load the LoRA via &quot;Load LoRA&quot; tab.
+Set LoRA weight to 0.7–1.0.
+Use with img2img mode and a reference image as input.
+💡 Tip: For best results, use references with similar aspect ratios and compositions.
+🧪 训练详情
+基础模型: Qwen-Image-Edit-2511
+训练方法: LoRA 微调（Rank&#x3D;32, Alpha&#x3D;16）
+数据集: 自定义精选的艺术风格数据集（线稿、卡通、波普艺术、超现实主义等），包含超过400组图像
+Epochs: 22000 步
+Batch Size: 1
+学习率: 1e-4
+优化器: AdamW
+训练硬件: NVIDIA RTX 4090，大约每迭代15秒
+⚠️ 局限性与未来工作
+尽管前景看好，但该模型仍处于早期发展阶段。当前的局限性包括：
+转换过程中面部特征可能会有些模糊
+色彩一致性在不同风格间可能有所不同
+复杂纹理可能无法完全转移
+📌 未来改进：
+使用遮罩增强面部保护
+添加色彩校正损失
+支持更多样化的参考风格
+在更高分辨率的图像上进行训练
+🔄 版本控制
+v0.1（Alpha）: 初始发布——实验性但功能正常
+v0.2+: 预计很快推出，具有改进的稳定性和准确性
+📂 License
+该模型根据MIT许可证发布。您可以在任何目的下自由使用、修改和分发它，包括商业应用，只需注明原作者即可。
+📣 反馈与贡献
+我正在积极改进这个模型！如果您有任何建议、发现错误或想要提供示例，请打开一个问题或留下评论。
+让我们一起让风格转换更加强大吧！🌟
+📝 Created by @zooeyy Still training... stay tuned!
+## Trigger words
+You should use `图1变为图2风格` to trigger the image generation.
+## Download model
+[Download](/zooeyy/Style-Transfer/tree/main) them in the Files & versions tab.