upload 2025/03/15
Browse files- Wan2.1-T2V-14B_LoRAReadme.txt +1 -1
- Wan2.1_i2v_720p_14B_fp16/A/anal_beads_wanvideo_i2v_epoch10.safetensors +3 -0
- Wan2.1_i2v_720p_14B_fp16/A/anal_beads_wanvideo_i2v_epoch10.txt +4 -0
- Wan2.1_i2v_720p_14B_fp16/T/tentacle_pit_wanvideo_i2v_epoch5.safetensors +3 -0
- Wan2.1_i2v_720p_14B_fp16/T/tentacle_pit_wanvideo_i2v_epoch5.txt +4 -0
- Wan2.1_i2v_720p_14B_fp16/T/torn_clothes_wanvideo_i2v_epoch10.safetensors +3 -0
- Wan2.1_i2v_720p_14B_fp16/T/torn_clothes_wanvideo_i2v_epoch10.txt +7 -0
- Wan2.1_i2v_720p_14B_fp16_LoRAReadme.txt +52 -0
Wan2.1-T2V-14B_LoRAReadme.txt
CHANGED
|
@@ -1,5 +1,5 @@
|
|
| 1 |
■このファイルについて
|
| 2 |
-
Wan2.1-T2V-
|
| 3 |
T2Vで学習していますが、I2Vモデルで出力確認しています
|
| 4 |
作成にはdiffusion-pipeを使用しています
|
| 5 |
|
|
|
|
| 1 |
■このファイルについて
|
| 2 |
+
Wan2.1-T2V-14Bで作成したLoRAの説明書です
|
| 3 |
T2Vで学習していますが、I2Vモデルで出力確認しています
|
| 4 |
作成にはdiffusion-pipeを使用しています
|
| 5 |
|
Wan2.1_i2v_720p_14B_fp16/A/anal_beads_wanvideo_i2v_epoch10.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:9ddcf94b65bcc7829987fb82d5d6d200b4dca42c87873076f29a51277e6fbb1f
|
| 3 |
+
size 359259456
|
Wan2.1_i2v_720p_14B_fp16/A/anal_beads_wanvideo_i2v_epoch10.txt
ADDED
|
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
アナルビーズモーションLoRA
|
| 2 |
+
anal beadsで呼び出し
|
| 3 |
+
引き抜き及び挿入のモーションを学習させており、そうした動きを出しやすくなります
|
| 4 |
+
T2VのLoRAと比べ、打率は明確に上がっていると思います
|
Wan2.1_i2v_720p_14B_fp16/T/tentacle_pit_wanvideo_i2v_epoch5.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:7da00d4b431101f962590390c6caa811f4571bf469d3d417954cd1d58db9d197
|
| 3 |
+
size 359259456
|
Wan2.1_i2v_720p_14B_fp16/T/tentacle_pit_wanvideo_i2v_epoch5.txt
ADDED
|
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
触手空間LoRA
|
| 2 |
+
tentacle pitで呼び出し
|
| 3 |
+
挿入している触手はもとより、周辺の触手もうねうねさせるよう学習させています
|
| 4 |
+
元画像でうねうねさせる触手を用意するなど必要ですし、そこそこガチャも必要そうです
|
Wan2.1_i2v_720p_14B_fp16/T/torn_clothes_wanvideo_i2v_epoch10.safetensors
ADDED
|
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
version https://git-lfs.github.com/spec/v1
|
| 2 |
+
oid sha256:e7a1a4fded0ce51c0fba9a4601c5979d71727b2d524f7362dd8df3d85cec5c52
|
| 3 |
+
size 359259504
|
Wan2.1_i2v_720p_14B_fp16/T/torn_clothes_wanvideo_i2v_epoch10.txt
ADDED
|
@@ -0,0 +1,7 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
服破りLoRA
|
| 2 |
+
torn clothesで呼び出し
|
| 3 |
+
女の子の服がバーンと盛大に破けます
|
| 4 |
+
torn clothes and tearing clothes by another's hand ,cloth's debris is fallen downみたいな書き方をしてもいいと思います
|
| 5 |
+
元画像で男の手が女の子の服を掴んでいるシーンなどにすると、その手の動きに合わせて破きやすいです
|
| 6 |
+
ただ結構暴れん坊なLoRAなので、ガチャはそこそこ発生すると思います
|
| 7 |
+
竿役までやぶれて砕け散ったり、破ける演出のあとに別の女の子が出現したりします
|
Wan2.1_i2v_720p_14B_fp16_LoRAReadme.txt
ADDED
|
@@ -0,0 +1,52 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
| 1 |
+
■このファイルについて
|
| 2 |
+
Wan2.1_i2v_720p_14B_fp16で作成したLoRAの説明書です
|
| 3 |
+
Wan2.1_i2v_720p_14B_fp16モデルでのみ出力確認しています
|
| 4 |
+
学習にはmusubi-tunerを使用しています
|
| 5 |
+
|
| 6 |
+
学習設定は以下で回しています、参考まで(グラボは5090を使用)
|
| 7 |
+
|
| 8 |
+
・dataset.tomlの記述は以下(torn_clothesのものを記載)
|
| 9 |
+
[general]
|
| 10 |
+
resolution = [512,512]
|
| 11 |
+
caption_extension = ".txt"
|
| 12 |
+
batch_size = 1
|
| 13 |
+
enable_bucket = true
|
| 14 |
+
bucket_no_upscale = false
|
| 15 |
+
|
| 16 |
+
[[datasets]]
|
| 17 |
+
target_frames = [13,17,21,25,29,33,37,41,45,49,53,57,61,65]
|
| 18 |
+
frame_extraction = "head"
|
| 19 |
+
num_repeats =5
|
| 20 |
+
|
| 21 |
+
※これで事前キャッシュ作成時に各フレーム長のキャッシュが生成されるので最大のものだけ残す
|
| 22 |
+
|
| 23 |
+
・学習コマンドは以下
|
| 24 |
+
accelerate launch --num_cpu_threads_per_process 1 wan_train_network.py --task i2v-14B --dit %dit_path% --dataset_config %config_path% --clip %clip_path% --flash_attn --split_attn --mixed_precision fp16 --fp8_base --fp8_scaled --blocks_to_swap 36 --optimizer_type adamw8bit --learning_rate 2e-4 --gradient_checkpointing --max_data_loader_n_workers 2 --persistent_data_loader_workers --network_module networks.lora_wan --network_dim 32 --timestep_sampling shift --discrete_flow_shift 3.0 --max_train_epochs 10 --save_every_n_epochs 1 --seed 42 --output_dir %output_path% --output_name %output_name%
|
| 25 |
+
|
| 26 |
+
・動画素材数は45~80程度
|
| 27 |
+
・2次元3次元素材は両方使用
|
| 28 |
+
・タグは1フレーム目の画像でtagger、自然言語なし
|
| 29 |
+
・フレーム33までであれば24GBに収まりそうでしたので、4090などであればそちらまでに抑えればよいかと
|
| 30 |
+
・24fpsの動画にしてしまっていたので、16fpsなWanVideoとは食い合わせが悪かったかもしれません(ややスローモーな動画が生まれやすいのはそのせいかも…)
|
| 31 |
+
|
| 32 |
+
■anal_beads_wanvideo_i2v_epoch10
|
| 33 |
+
アナルビーズモーションLoRA
|
| 34 |
+
anal beadsで呼び出し
|
| 35 |
+
引き抜き及び挿入のモーションを学習させており、そうした動きを出しやすくなります
|
| 36 |
+
T2VのLoRAと比べ、打率は明確に上がっていると思います
|
| 37 |
+
|
| 38 |
+
■tentacle_pit_wanvideo_i2v_epoch5
|
| 39 |
+
触手空間LoRA
|
| 40 |
+
tentacle pitで呼び出し
|
| 41 |
+
挿入している触手はもとより、周辺の触手もうねうねさせるよう学習させています
|
| 42 |
+
元画像でうねうねさせる触手を用意するなど必要ですし、そこそこガチャも必要そうです
|
| 43 |
+
|
| 44 |
+
■torn_clothes_wanvideo_i2v_epoch10
|
| 45 |
+
服破りLoRA
|
| 46 |
+
torn clothesで呼び出し
|
| 47 |
+
女の子の服がバーンと盛大に破けます
|
| 48 |
+
torn clothes and tearing clothes by another's hand ,cloth's debris is fallen downみたいな書き方をしてもいいと思います
|
| 49 |
+
元画像で男の手が女の子の服を掴んでいるシーンなどにすると、その手の動きに合わせて破きやすいです
|
| 50 |
+
ただ結構暴れん坊なLoRAなので、ガチャはそこそこ発生すると思います
|
| 51 |
+
竿役までやぶれて砕け散ったり、破ける演出のあとに別の女の子が出現したりします
|
| 52 |
+
|