Upload folder using huggingface_hub

Browse files

Files changed (9) hide show

.gitattributes +5 -0
demo_imgs/Doughnut-q30.jpg +3 -0
demo_imgs/cat-q20.jpg +3 -0
demo_imgs/cat-q75.jpg +3 -0
demo_imgs/fail-case.jpg +3 -0
demo_imgs/random-screenshot-q48.jpg +0 -0
demo_imgs/random-screenshot-q90.jpg +3 -0
infer.py +87 -0
quality_factor_estimation.pt +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,8 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+demo_imgs/cat-q20.jpg filter=lfs diff=lfs merge=lfs -text
+demo_imgs/cat-q75.jpg filter=lfs diff=lfs merge=lfs -text
+demo_imgs/Doughnut-q30.jpg filter=lfs diff=lfs merge=lfs -text
+demo_imgs/fail-case.jpg filter=lfs diff=lfs merge=lfs -text
+demo_imgs/random-screenshot-q90.jpg filter=lfs diff=lfs merge=lfs -text

demo_imgs/Doughnut-q30.jpg ADDED Viewed

Git LFS Details

SHA256: 5d72f82913e3b615cd5ce1dd95986707a4ba71b9d1deeef47740fd3e3986d038
Pointer size: 132 Bytes
Size of remote file: 1.21 MB

demo_imgs/cat-q20.jpg ADDED Viewed

Git LFS Details

SHA256: 7c7573e01c83305b429fcb241aab106746deb400b0d525d9814c583b1bd6c54e
Pointer size: 131 Bytes
Size of remote file: 354 kB

demo_imgs/cat-q75.jpg ADDED Viewed

Git LFS Details

SHA256: 216f70daf6a86b37811cb6590f2fceae6e204a8f7b16042cae31b7b09470677e
Pointer size: 132 Bytes
Size of remote file: 1.12 MB

demo_imgs/fail-case.jpg ADDED Viewed

Git LFS Details

SHA256: 13038cd468095314706aeed70f3ddf12f8e66306f3c823d83459387c15a4ce98
Pointer size: 131 Bytes
Size of remote file: 109 kB

demo_imgs/random-screenshot-q48.jpg ADDED Viewed

demo_imgs/random-screenshot-q90.jpg ADDED Viewed

Git LFS Details

SHA256: 6aebb5f6b3b7bf5aeeba4d878029a8b578cbe83c411a0e5e34a51073491c1664
Pointer size: 131 Bytes
Size of remote file: 105 kB

infer.py ADDED Viewed

	@@ -0,0 +1,87 @@

+# Credit to @Rimuru for the ideas and original implementation.
+# Trained on PNG illustrations and RAW photos converted to PNG that were then synthetically augmented at various quality levels.
+# Got 95.3% overall validation accuracy with the lowest performance being JXL.
+# Per-Format Val Acc:   jpeg: 99.7% | webp: 96.2% | avif: 96.3% | jxl: 94.3%
+# Do not trust this for production, it will fail on edge cases and images with multiple compressions.
+import torch
+import torch.nn as nn
+from PIL import Image
+from torchvision import transforms
+from pathlib import Path
+from typing import Dict
+Image.MAX_IMAGE_PIXELS = 120000000
+class LightweightCompressionNet(nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.conv_blocks = nn.Sequential(
+            nn.Conv2d(3, 16, kernel_size=4, stride=1, padding=0), nn.GELU(),
+            nn.Conv2d(16, 32, kernel_size=4, stride=1, padding=0), nn.GELU(),
+            nn.Conv2d(32, 64, kernel_size=4, stride=2, padding=0), nn.GELU(),
+            nn.Conv2d(64, 128, kernel_size=4, stride=2, padding=0), nn.GELU(),
+            nn.Conv2d(128, 256, kernel_size=4, stride=4, padding=0), nn.GELU(),
+            nn.Conv2d(256, 256, kernel_size=4, stride=4, padding=0), nn.GELU(),
+            nn.Conv2d(256, 256, kernel_size=3, stride=2, padding=0), nn.GELU(),
+            nn.AdaptiveAvgPool2d(1)
+        )
+        self.head = nn.Sequential(
+            nn.Linear(256, 32), nn.GELU(),
+            nn.Linear(32, 4), nn.Sigmoid()
+        )
+    def forward(self, x):
+        features = self.conv_blocks(x)
+        features = features.view(features.size(0), -1)
+        return self.head(features)
+class CompressionArtifactPredictor:
+    def __init__(self, model_path: str, device: str = "cuda"):
+        self.device = torch.device(device if torch.cuda.is_available() else "cpu")
+        self.model = LightweightCompressionNet().to(self.device)
+        self.model.eval()
+        checkpoint = torch.load(model_path, map_location=self.device, weights_only=True)
+        self.model.load_state_dict(checkpoint['model_state_dict'])
+        self.preprocess = transforms.Compose([transforms.ToTensor()])
+        self.compression_formats = ['jpeg', 'webp', 'avif', 'jxl']
+        self.quality_ranges = {'jpeg': (0, 100), 'webp': (0, 100), 'avif': (0, 100), 'jxl': (0, 100)}
+    def predict(self, image: Image.Image) -> Dict[str, Dict[str, float]]:
+        img_tensor = self.preprocess(image).unsqueeze(0).to(self.device)
+        with torch.no_grad():
+            with torch.amp.autocast('cuda', dtype=torch.bfloat16):
+                predictions = self.model(img_tensor).squeeze(0).cpu().float().numpy()
+        results = {}
+        for i, fmt in enumerate(self.compression_formats):
+            normalized_score = float(predictions[i])
+            min_q, max_q = self.quality_ranges[fmt]
+            results[fmt] = {
+                'normalized_score': normalized_score,
+                'predicted_quality': normalized_score * (max_q - min_q) + min_q,
+                'artifact_level': 1.0 - normalized_score
+            }
+        return results
+    def predict_format(self, image: Image.Image, format_name: str) -> float:
+        if format_name not in self.compression_formats:
+            raise ValueError(f"Unsupported format. Choose from: {self.compression_formats}")
+        return self.predict(image)[format_name]['predicted_quality']
+if __name__ == "__main__":
+    predictor = CompressionArtifactPredictor("quality_factor_estimation.pt")
+    # Set your image path here!
+    image_path = Path("./demo_imgs/cat-q75.jpg")
+    image = Image.open(image_path).convert('RGB')
+    # This assumes that there isnt any format trickery or many different compressions, tried to keep it simple for first iteration
+    ext_map = {'.jpg': 'jpeg', '.jpeg': 'jpeg', '.webp': 'webp', '.avif': 'avif', '.jxl': 'jxl'}
+    fmt = ext_map.get(image_path.suffix.lower())
+    quality = predictor.predict_format(image, fmt)
+    print(f"{image_path.name} - estimated to be q={quality:.2f}")

quality_factor_estimation.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7450c4d027dbeb7e686eaf531f45719e245a5c1f89adddc7e1ae0c2d1b7b48f2
+size 9386549