Spaces:

masapon05
/

tagger_installation

No application file

App Files Files Community

masapon05 commited on Dec 13, 2024

Commit

79e323c

verified ·

1 Parent(s): 7bc3fa8

Upload 2 files

Browse files

Files changed (2) hide show

tagger導入手順書(Ubuntu系Linux用).md +42 -0
tagging.py +79 -0

tagger導入手順書(Ubuntu系Linux用).md ADDED Viewed

	@@ -0,0 +1,42 @@

+# tagger導入手順書(Ubuntu系Linux用)
+## 1. 必要なパッケージのインストール
+```bash
+sudo apt update
+sudo apt install python3-pip python3-venv git
+```
+## 2. リポジトリのクローンと環境設定
+```bash
+git clone https://github.com/ryogrid/anime-illust-image-searcher.git
+cd anime-illust-image-searcher
+python3 -m venv venv
+source venv/bin/activate
+```
+## 3. 必要なPythonライブラリのインストール
+```bash
+pip install torch timm pillow numpy
+```
+## 4. タグ定義ファイルのダウンロード
+```bash
+wget https://huggingface.co/SmilingWolf/wd-eva02-large-tagger-v3/raw/main/selected_tags.csv
+```
+## 5. 動作確認
+```bash
+python tagging.py --dir ./your_image_directory/
+```
+## 注意事項
+- 仮想環境を再度使用する場合は `source venv/bin/activate` を実行してください
+- GPUを使用する場合は、CUDAとcuDNNのインストールが別途必要です
+- 処理速度は1ファイルあたり約10-15秒かかります
+- 出力結果は `tags-wd-tagger.txt` に保存されます

tagging.py ADDED Viewed

	@@ -0,0 +1,79 @@

+import os
+import argparse
+from PIL import Image
+import torch
+import timm
+import glob
+from datetime import datetime
+import time
+import numpy as np
+import csv
+def get_image_files(directory):
+    """画像ファイルを再帰的に取得"""
+    extensions = ('*.jpg', '*.jpeg', '*.png', '*.gif', '*.webp')
+    image_files = []
+    for ext in extensions:
+        image_files.extend(glob.glob(os.path.join(directory, '**', ext), recursive=True))
+    return image_files
+def process_image(image_path, model, size=448):
+    """画像からタグを抽出"""
+    try:
+        image = Image.open(image_path).convert('RGB')
+        image = image.resize((size, size))
+        image = np.array(image) / 255.0
+        image = torch.from_numpy(image).permute(2, 0, 1).float().unsqueeze(0)
+        with torch.no_grad():
+            outputs = model(image)
+        probs = torch.sigmoid(outputs[0])
+        return [(i, score.item()) for i, score in enumerate(probs) if score > 0.5]
+    except Exception as e:
+        print(f"Error processing {image_path}: {str(e)}")
+        return []
+def main():
+    parser = argparse.ArgumentParser()
+    parser.add_argument('--dir', required=True, help='画像が含まれるディレクトリのパス')
+    parser.add_argument('--after', help='この日付以降に更新されたファイルのみを処理 (YYYY-MM-DD形式)')
+    args = parser.parse_args()
+    print("Loading model...")
+    model = timm.create_model('hf-hub:SmilingWolf/wd-eva02-large-tagger-v3', pretrained=True)
+    model.eval()
+    print("Loading tag mapping...")
+    with open('selected_tags.csv', 'r', encoding='utf-8') as f:
+        reader = csv.reader(f)
+        next(reader)  # ヘッダーをスキップ
+        tag_mapping = {i: row[0] for i, row in enumerate(reader)}
+    image_files = get_image_files(args.dir)
+    if args.after:
+        filter_date = datetime.strptime(args.after, '%Y-%m-%d')
+        image_files = [f for f in image_files if datetime.fromtimestamp(os.path.getmtime(f)) > filter_date]
+    output_file = "tags-wd-tagger.txt"
+    print(f"Processing {len(image_files)} images...")
+    with open(output_file, 'w', encoding='utf-8') as f:
+        for i, image_path in enumerate(image_files, 1):
+            start_time = time.time()
+            relative_path = os.path.relpath(image_path, args.dir)
+            tag_indices = process_image(image_path, model)
+            if tag_indices:
+                tags = [tag_mapping[idx] for idx, _ in tag_indices]
+                f.write(f"{relative_path}: {', '.join(tags)}\n")
+            elapsed = time.time() - start_time
+            print(f"Processed {i}/{len(image_files)} - {relative_path} ({elapsed:.2f}s)")
+    print(f"\nTagging complete. Results saved to {output_file}")
+if __name__ == "__main__":
+    main()