Upload 8 files

Browse files

Files changed (8) hide show

README.md +121 -3
casting_autoencoder.onnx +3 -0
casting_autoencoder.pth +3 -0
config.yaml +30 -0
model.bin +3 -0
model.xml +885 -0
requirements.txt +3 -0
train_model.py +97 -0

README.md CHANGED Viewed

@@ -1,3 +1,121 @@
----
-license: mit
----

+# Anomaly Detection Model – Edge AI for Casting Defect Inspection
+## Overview
+The **Anomaly Detection Model** is an **autoencoder-based anomaly detection system** fine-tuned for industrial **casting defect inspection**. It identifies whether a metal casting image is *normal (OK)* or *defective* by reconstructing input images and analyzing reconstruction errors.
+This model is designed for **Edge AI deployment**, optimized via **ONNX** and **OpenVINO IR** formats to run efficiently on low-power Intel edge devices.
+---
+## Model Details
+- **Architecture:** Convolutional Autoencoder
+- **Framework:** PyTorch
+- **Training Objective:** Minimize reconstruction loss (MSE) for normal samples
+- **Optimization:** ONNX and OpenVINO IR export for edge inference
+- **Task:** Unsupervised anomaly detection
+- **Domain:** Industrial visual inspection
+---
+## Repository Structure
+```
+├── config.yaml                # Configuration file for training
+├── train_model.py             # Training script
+├── casting_autoencoder.pth    # Trained PyTorch model
+├── casting_autoencoder.onnx   # ONNX export
+├── model.bin                  # OpenVINO IR model (bin)
+├── model.xml                  # OpenVINO IR model (xml)
+├── requirements.txt           # Dependencies
+└── README.md                  # Model card (this file)
+```
+---
+## Dataset
+**Dataset:** Casting Product Image Dataset (Kaggle)
+- **Classes:** Defective / Normal
+- **Modality:** Grayscale industrial images
+- **Training Strategy:** Only *normal* samples used for training the autoencoder.
+---
+## Training Configuration
+| Parameter | Value |
+|------------|--------|
+| Batch Size | 32 |
+| Epochs | 50 |
+| Optimizer | Adam |
+| Learning Rate | 1e-3 |
+| Loss Function | MSELoss |
+---
+## Export & Deployment
+| Format | Purpose |
+|---------|----------|
+| `.pth` | Original PyTorch model |
+| `.onnx` | Framework-independent inference |
+| `.xml` / `.bin` | OpenVINO IR format for edge devices |
+**Edge Optimization:** Model converted and optimized using `openvino.convert_model()`.
+---
+## Inference Example
+```python
+from openvino.runtime import Core
+import cv2
+import numpy as np
+ie = Core()
+model = ie.read_model(model="casting_ir/model.xml")
+compiled_model = ie.compile_model(model=model, device_name="CPU")
+# Load and preprocess image
+img = cv2.imread('sample_casting.png', cv2.IMREAD_GRAYSCALE)
+img = cv2.resize(img, (128, 128)) / 255.0
+img = np.expand_dims(img, (0,1)).astype(np.float32)
+# Run inference
+infer_request = compiled_model.create_infer_request()
+result = infer_request.infer(inputs={compiled_model.inputs[0]: img})
+reconstructed = result[compiled_model.outputs[0]]
+error = np.mean((img - reconstructed)**2)
+if error > 0.01:
+    print("Defective Casting Detected")
+else:
+    print("Casting OK")
+```
+---
+## Intended Use
+- Automated visual inspection for manufacturing/QA systems.
+- Real-time edge deployment in industrial environments.
+**Not recommended for:**
+- Non-industrial datasets.
+- Scenarios with significant domain drift (e.g., lighting changes or non-casting objects).
+---
+## Limitations
+- Accuracy depends on lighting and background consistency.
+- Model trained primarily on grayscale casting images.
+- Thresholds for anomaly detection must be tuned for specific deployment environments.
+---
+## License
+This project is released under the [MIT License](LICENSE).
+---
+## Author
+**Arunima Surendran**
+Applied AI  Engineer
+[GitHub Repository](https://github.com/arunimakanavu/anomalydetectionmodel)
+---

casting_autoencoder.onnx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7ac75b27b96e87240a5a516f1a745cdf615e53ebd682c9cea9b8d620483ef6bc
+size 191021

casting_autoencoder.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5aed04db97f4fb56e7e71f8cabdfdbaf8a7153a6f79f0e2f4d91aebd2082aa37
+size 193559

config.yaml ADDED Viewed

	@@ -0,0 +1,30 @@

+ckpt_path: null
+seed_everything: 42
+data:
+  class_path: anomalib.data.Folder
+  init_args:
+    root: ./casting_data/train
+    normal_dir: ok_front
+    abnormal_dir: def_front
+    task: classification
+    image_size: [256, 256]
+    train_batch_size: 32
+    eval_batch_size: 32
+    num_workers: 4
+model:
+  class_path: anomalib.models.Patchcore
+  init_args:
+    backbone: resnet18
+    layers:
+      - layer2
+      - layer3
+trainer:
+  accelerator: auto
+  devices: 1
+  max_epochs: 1
+logging:
+  log_graph: false

model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fd301efb30159cd017a7a1d04c43b79a4ffcd43050b17b231c7067a39b1de28c
+size 94214

model.xml ADDED Viewed

	@@ -0,0 +1,885 @@

+<?xml version="1.0"?>
+<net name="main_graph" version="11">
+	<layers>
+		<layer id="0" name="input" type="Parameter" version="opset1">
+			<data shape="1,3,304,304" element_type="f32" />
+			<output>
+				<port id="0" precision="FP32" names="input">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>304</dim>
+					<dim>304</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="1" name="encoder.0.weight_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="16, 3, 3, 3" offset="0" size="864" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="2" name="encoder.0.weight" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="encoder.0.weight">
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="3" name="/encoder/encoder.0/Conv/WithoutBiases" type="Convolution" version="opset1">
+			<data strides="2, 2" dilations="1, 1" pads_begin="1, 1" pads_end="1, 1" auto_pad="explicit" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>304</dim>
+					<dim>304</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="4" name="Reshape_25_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 16, 1, 1" offset="864" size="32" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="5" name="Reshape_25" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="6" name="/encoder/encoder.0/Conv" type="Add" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="/encoder/encoder.0/Conv_output_0">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="7" name="/encoder/encoder.1/Relu" type="ReLU" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="/encoder/encoder.1/Relu_output_0">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="8" name="encoder.2.weight_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="32, 16, 3, 3" offset="896" size="9216" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>32</dim>
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="9" name="encoder.2.weight" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>32</dim>
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="encoder.2.weight">
+					<dim>32</dim>
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="10" name="/encoder/encoder.2/Conv/WithoutBiases" type="Convolution" version="opset1">
+			<data strides="2, 2" dilations="1, 1" pads_begin="1, 1" pads_end="1, 1" auto_pad="explicit" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>32</dim>
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="11" name="Reshape_39_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 32, 1, 1" offset="10112" size="64" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="12" name="Reshape_39" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="13" name="/encoder/encoder.2/Conv" type="Add" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="/encoder/encoder.2/Conv_output_0">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="14" name="/encoder/encoder.3/Relu" type="ReLU" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="/encoder/encoder.3/Relu_output_0">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="15" name="encoder.4.weight_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="64, 32, 3, 3" offset="10176" size="36864" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>64</dim>
+					<dim>32</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="16" name="encoder.4.weight" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>64</dim>
+					<dim>32</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="encoder.4.weight">
+					<dim>64</dim>
+					<dim>32</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="17" name="/encoder/encoder.4/Conv/WithoutBiases" type="Convolution" version="opset1">
+			<data strides="2, 2" dilations="1, 1" pads_begin="1, 1" pads_end="1, 1" auto_pad="explicit" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>64</dim>
+					<dim>32</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>38</dim>
+					<dim>38</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="18" name="Reshape_53_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 64, 1, 1" offset="47040" size="128" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="19" name="Reshape_53" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="20" name="/encoder/encoder.4/Conv" type="Add" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>38</dim>
+					<dim>38</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="/encoder/encoder.4/Conv_output_0">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>38</dim>
+					<dim>38</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="21" name="/encoder/encoder.5/Relu" type="ReLU" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>38</dim>
+					<dim>38</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="/encoder/encoder.5/Relu_output_0">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>38</dim>
+					<dim>38</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="22" name="decoder.0.weight_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="64, 32, 3, 3" offset="47168" size="36864" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>64</dim>
+					<dim>32</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="23" name="decoder.0.weight" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>64</dim>
+					<dim>32</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="decoder.0.weight">
+					<dim>64</dim>
+					<dim>32</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="24" name="ConvolutionBackpropData_56" type="ConvolutionBackpropData" version="opset1">
+			<data strides="2, 2" dilations="1, 1" pads_begin="1, 1" pads_end="1, 1" auto_pad="explicit" output_padding="1, 1" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>64</dim>
+					<dim>38</dim>
+					<dim>38</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>64</dim>
+					<dim>32</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="25" name="Reshape_58_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 32, 1, 1" offset="84032" size="64" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="26" name="Reshape_58" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="27" name="/decoder/decoder.0/ConvTranspose" type="Add" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="/decoder/decoder.0/ConvTranspose_output_0">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="28" name="/decoder/decoder.1/Relu" type="ReLU" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="/decoder/decoder.1/Relu_output_0">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="29" name="decoder.2.weight_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="32, 16, 3, 3" offset="84096" size="9216" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>32</dim>
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="30" name="decoder.2.weight" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>32</dim>
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="decoder.2.weight">
+					<dim>32</dim>
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="31" name="ConvolutionBackpropData_61" type="ConvolutionBackpropData" version="opset1">
+			<data strides="2, 2" dilations="1, 1" pads_begin="1, 1" pads_end="1, 1" auto_pad="explicit" output_padding="1, 1" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>32</dim>
+					<dim>76</dim>
+					<dim>76</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>32</dim>
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="32" name="Reshape_63_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 16, 1, 1" offset="93312" size="32" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="33" name="Reshape_63" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="34" name="/decoder/decoder.2/ConvTranspose" type="Add" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="/decoder/decoder.2/ConvTranspose_output_0">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="35" name="/decoder/decoder.3/Relu" type="ReLU" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="/decoder/decoder.3/Relu_output_0">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="36" name="decoder.4.weight_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="16, 3, 3, 3" offset="93344" size="864" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="37" name="decoder.4.weight" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="decoder.4.weight">
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="38" name="ConvolutionBackpropData_66" type="ConvolutionBackpropData" version="opset1">
+			<data strides="2, 2" dilations="1, 1" pads_begin="1, 1" pads_end="1, 1" auto_pad="explicit" output_padding="1, 1" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>16</dim>
+					<dim>152</dim>
+					<dim>152</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>16</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+					<dim>3</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>304</dim>
+					<dim>304</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="39" name="Reshape_68_compressed" type="Const" version="opset1">
+			<data element_type="f16" shape="1, 3, 1, 1" offset="94208" size="6" />
+			<output>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="40" name="Reshape_68" type="Convert" version="opset1">
+			<data destination_type="f32" />
+			<rt_info>
+				<attribute name="decompression" version="0" />
+			</rt_info>
+			<input>
+				<port id="0" precision="FP16">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="41" name="/decoder/decoder.4/ConvTranspose" type="Add" version="opset1">
+			<data auto_broadcast="numpy" />
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>304</dim>
+					<dim>304</dim>
+				</port>
+				<port id="1" precision="FP32">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>1</dim>
+					<dim>1</dim>
+				</port>
+			</input>
+			<output>
+				<port id="2" precision="FP32" names="/decoder/decoder.4/ConvTranspose_output_0">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>304</dim>
+					<dim>304</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="42" name="output" type="Sigmoid" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>304</dim>
+					<dim>304</dim>
+				</port>
+			</input>
+			<output>
+				<port id="1" precision="FP32" names="output">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>304</dim>
+					<dim>304</dim>
+				</port>
+			</output>
+		</layer>
+		<layer id="43" name="output/sink_port_0" type="Result" version="opset1">
+			<input>
+				<port id="0" precision="FP32">
+					<dim>1</dim>
+					<dim>3</dim>
+					<dim>304</dim>
+					<dim>304</dim>
+				</port>
+			</input>
+		</layer>
+	</layers>
+	<edges>
+		<edge from-layer="0" from-port="0" to-layer="3" to-port="0" />
+		<edge from-layer="1" from-port="0" to-layer="2" to-port="0" />
+		<edge from-layer="2" from-port="1" to-layer="3" to-port="1" />
+		<edge from-layer="3" from-port="2" to-layer="6" to-port="0" />
+		<edge from-layer="4" from-port="0" to-layer="5" to-port="0" />
+		<edge from-layer="5" from-port="1" to-layer="6" to-port="1" />
+		<edge from-layer="6" from-port="2" to-layer="7" to-port="0" />
+		<edge from-layer="7" from-port="1" to-layer="10" to-port="0" />
+		<edge from-layer="8" from-port="0" to-layer="9" to-port="0" />
+		<edge from-layer="9" from-port="1" to-layer="10" to-port="1" />
+		<edge from-layer="10" from-port="2" to-layer="13" to-port="0" />
+		<edge from-layer="11" from-port="0" to-layer="12" to-port="0" />
+		<edge from-layer="12" from-port="1" to-layer="13" to-port="1" />
+		<edge from-layer="13" from-port="2" to-layer="14" to-port="0" />
+		<edge from-layer="14" from-port="1" to-layer="17" to-port="0" />
+		<edge from-layer="15" from-port="0" to-layer="16" to-port="0" />
+		<edge from-layer="16" from-port="1" to-layer="17" to-port="1" />
+		<edge from-layer="17" from-port="2" to-layer="20" to-port="0" />
+		<edge from-layer="18" from-port="0" to-layer="19" to-port="0" />
+		<edge from-layer="19" from-port="1" to-layer="20" to-port="1" />
+		<edge from-layer="20" from-port="2" to-layer="21" to-port="0" />
+		<edge from-layer="21" from-port="1" to-layer="24" to-port="0" />
+		<edge from-layer="22" from-port="0" to-layer="23" to-port="0" />
+		<edge from-layer="23" from-port="1" to-layer="24" to-port="1" />
+		<edge from-layer="24" from-port="2" to-layer="27" to-port="0" />
+		<edge from-layer="25" from-port="0" to-layer="26" to-port="0" />
+		<edge from-layer="26" from-port="1" to-layer="27" to-port="1" />
+		<edge from-layer="27" from-port="2" to-layer="28" to-port="0" />
+		<edge from-layer="28" from-port="1" to-layer="31" to-port="0" />
+		<edge from-layer="29" from-port="0" to-layer="30" to-port="0" />
+		<edge from-layer="30" from-port="1" to-layer="31" to-port="1" />
+		<edge from-layer="31" from-port="2" to-layer="34" to-port="0" />
+		<edge from-layer="32" from-port="0" to-layer="33" to-port="0" />
+		<edge from-layer="33" from-port="1" to-layer="34" to-port="1" />
+		<edge from-layer="34" from-port="2" to-layer="35" to-port="0" />
+		<edge from-layer="35" from-port="1" to-layer="38" to-port="0" />
+		<edge from-layer="36" from-port="0" to-layer="37" to-port="0" />
+		<edge from-layer="37" from-port="1" to-layer="38" to-port="1" />
+		<edge from-layer="38" from-port="2" to-layer="41" to-port="0" />
+		<edge from-layer="39" from-port="0" to-layer="40" to-port="0" />
+		<edge from-layer="40" from-port="1" to-layer="41" to-port="1" />
+		<edge from-layer="41" from-port="2" to-layer="42" to-port="0" />
+		<edge from-layer="42" from-port="1" to-layer="43" to-port="0" />
+	</edges>
+	<rt_info>
+		<MO_version value="2024.6.0-17404-4c0f47d2335-releases/2024/6" />
+		<Runtime_version value="2024.6.0-17404-4c0f47d2335-releases/2024/6" />
+		<conversion_parameters>
+			<input_model value="DIR/casting_autoencoder.onnx" />
+			<is_python_api_used value="False" />
+			<output_dir value="/home/arunima/intel/casting_data/./casting_ir" />
+		</conversion_parameters>
+		<legacy_frontend value="False" />
+	</rt_info>
+</net>

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+torch
+torchvision
+numpy

train_model.py ADDED Viewed

	@@ -0,0 +1,97 @@

+import torch
+import torch.nn as nn
+from torch.utils.data import DataLoader
+from torchvision import datasets, transforms
+import numpy as np
+import os
+# =============== 1. CONFIG =================
+IMG_SIZE = 304
+BATCH_SIZE = 32
+EPOCHS = 10
+LR = 1e-3
+MODEL_PATH = "casting_autoencoder.pth"
+ONNX_PATH = "casting_autoencoder.onnx"
+TRAIN_DIR = "casting_data/train"      # only OK parts
+TEST_DEFECT_DIR = "casting_data/test"  # defects for thresholding
+# =============== 2. DATA PIPELINE =================
+transform = transforms.Compose([
+    transforms.Grayscale(num_output_channels=3),
+    transforms.Resize((IMG_SIZE, IMG_SIZE)),
+    transforms.ToTensor()
+])
+train_data = datasets.ImageFolder(root=TRAIN_DIR, transform=transform)
+train_loader = DataLoader(train_data, batch_size=BATCH_SIZE, shuffle=True)
+# =============== 3. MODEL =================
+class Autoencoder(nn.Module):
+    def __init__(self):
+        super().__init__()
+        self.encoder = nn.Sequential(
+            nn.Conv2d(3, 16, 3, stride=2, padding=1), nn.ReLU(),
+            nn.Conv2d(16, 32, 3, stride=2, padding=1), nn.ReLU(),
+            nn.Conv2d(32, 64, 3, stride=2, padding=1), nn.ReLU(),
+        )
+        self.decoder = nn.Sequential(
+            nn.ConvTranspose2d(64, 32, 3, stride=2, padding=1, output_padding=1), nn.ReLU(),
+            nn.ConvTranspose2d(32, 16, 3, stride=2, padding=1, output_padding=1), nn.ReLU(),
+            nn.ConvTranspose2d(16, 3, 3, stride=2, padding=1, output_padding=1), nn.Sigmoid()
+        )
+    def forward(self, x):
+        x = self.encoder(x)
+        x = self.decoder(x)
+        return x
+# =============== 4. TRAINING LOOP =================
+device = "cuda" if torch.cuda.is_available() else "cpu"
+model = Autoencoder().to(device)
+criterion = nn.MSELoss()
+optimizer = torch.optim.Adam(model.parameters(), lr=LR)
+print(" Training started...")
+for epoch in range(EPOCHS):
+    total_loss = 0
+    for imgs, _ in train_loader:
+        imgs = imgs.to(device)
+        output = model(imgs)
+        loss = criterion(output, imgs)
+        optimizer.zero_grad()
+        loss.backward()
+        optimizer.step()
+        total_loss += loss.item()
+    print(f"Epoch [{epoch+1}/{EPOCHS}] - Loss: {total_loss/len(train_loader):.4f}")
+torch.save(model.state_dict(), MODEL_PATH)
+print(f" Model saved to {MODEL_PATH}")
+# =============== 5. THRESHOLD CALIBRATION =================
+defect_data = datasets.ImageFolder(root=TEST_DEFECT_DIR, transform=transform)
+defect_loader = DataLoader(defect_data, batch_size=1)
+model.eval()
+errors = []
+with torch.no_grad():
+    for img, _ in defect_loader:
+        img = img.to(device)
+        out = model(img)
+        err = criterion(out, img).item()
+        errors.append(err)
+threshold = np.mean(errors) * 0.8
+print(f"⚡ Suggested anomaly threshold: {threshold:.4f}")
+# =============== 6. EXPORT TO ONNX =================
+dummy = torch.randn(1, 3, IMG_SIZE, IMG_SIZE).to(device)
+torch.onnx.export(
+    model,
+    dummy,
+    ONNX_PATH,
+    input_names=["input"],
+    output_names=["output"],
+    opset_version=12
+)
+print(f" ONNX model exported to {ONNX_PATH}")