diff --git "a/Python/app.js" "b/Python/app.js"
--- "a/Python/app.js"
+++ "b/Python/app.js"
@@ -83,7 +83,7 @@ const MODULE_CONTENT = {
                     <div class="box-content">Python is a <strong>dynamically-typed, garbage-collected, interpreted language</strong> with a C-based runtime (CPython). Everything is an object — integers, functions, even classes. Understanding this object model is what separates beginners from professionals.</div>
                 </div>
 
-                <h3>1. Data Structures for DS — Complete Reference</h3>
+                <h3>1. Data Structures — Complete Reference</h3>
                 <table>
                     <tr><th>Type</th><th>Mutable</th><th>Ordered</th><th>Hashable</th><th>Use Case</th></tr>
                     <tr><td><strong>list</strong></td><td>✓</td><td>✓</td><td>✗</td><td>Sequential data, time series, feature lists</td></tr>
@@ -96,450 +96,709 @@ const MODULE_CONTENT = {
                     <tr><td><strong>bytearray</strong></td><td>✓</td><td>✓</td><td>✗</td><td>Mutable binary buffers</td></tr>
                 </table>
 
-                <h3>2. Python Memory Model — What No One Teaches</h3>
+                <h3>2. Time Complexity — What Every Dev Must Know</h3>
+                <table>
+                    <tr><th>Operation</th><th>list</th><th>dict</th><th>set</th></tr>
+                    <tr><td>Lookup by index/key</td><td>O(1)</td><td>O(1)</td><td>—</td></tr>
+                    <tr><td>Search (x in ...)</td><td>O(n)</td><td>O(1)</td><td>O(1)</td></tr>
+                    <tr><td>Insert/Append</td><td>O(1) end, O(n) middle</td><td>O(1)</td><td>O(1)</td></tr>
+                    <tr><td>Delete</td><td>O(n)</td><td>O(1)</td><td>O(1)</td></tr>
+                    <tr><td>Sort</td><td>O(n log n)</td><td>—</td><td>—</td></tr>
+                    <tr><td>Iteration</td><td>O(n)</td><td>O(n)</td><td>O(n)</td></tr>
+                </table>
+                <p><strong>Real-world impact:</strong> Checking if an item exists in a list of 1M elements = ~50ms. In a set = ~0.00005ms. That's <strong>1,000,000x faster</strong>. Always use sets/dicts for membership testing.</p>
+
+                <h3>3. Python Memory Model</h3>
                 <div class="info-box">
-                    <div class="box-title">⚡ Everything Is An Object</div>
-                    <div class="box-content">In Python, <strong>every value is an object</strong> on the heap. Variables are just references (pointers) to objects. <code>a = [1, 2, 3]</code> — the list lives on the heap; <code>a</code> is a name that points to it. <code>b = a</code> makes both point to the <strong>same list</strong> — no copy is made. This is called <strong>aliasing</strong>.</div>
+                    <div class="box-title">⚡ Everything Is An Object on the Heap</div>
+                    <div class="box-content">Variables are <strong>references</strong> (pointers), not boxes. <code>a = [1,2,3]</code> creates a list on the heap; <code>a</code> points to it. <code>b = a</code> makes both point to the <strong>same list</strong>. This is <strong>aliasing</strong> — the #1 source of bugs in beginner Python code.</div>
                 </div>
-                <p><strong>Reference Counting:</strong> Python uses reference counting + cyclic garbage collector. Each object tracks how many names point to it. When count hits 0, memory is freed immediately. <code>del</code> doesn't always free memory — it just decrements the reference count.</p>
-                <p><strong>Integer Interning:</strong> Python caches integers from <strong>-5 to 256</strong> and short strings. So <code>a = 100; b = 100; a is b</code> is <code>True</code>, but <code>a = 1000; b = 1000; a is b</code> may be <code>False</code>. Never use <code>is</code> for value comparison — always use <code>==</code>.</p>
-                <p><strong>Garbage Collection Generations:</strong> CPython has 3 generations (gen0, gen1, gen2). New objects start in gen0. Objects that survive a collection move to the next generation. Long-lived objects (gen2) are collected less frequently. Use <code>gc.get_stats()</code> to monitor.</p>
+                <p><strong>Reference Counting:</strong> Each object tracks how many names reference it. When count = 0, freed immediately. <code>del</code> decrements the count, doesn't necessarily free memory.</p>
+                <p><strong>Integer Interning:</strong> Python caches integers <strong>-5 to 256</strong>. So <code>a = 100; b = 100; a is b</code> → True. But <code>a = 1000; b = 1000; a is b</code> → may be False. Never use <code>is</code> for value comparison.</p>
+                <p><strong>Garbage Collection:</strong> 3 generations (gen0, gen1, gen2). New objects in gen0. Survivors promoted. Use <code>gc.collect()</code> after deleting large ML models.</p>
 
-                <h3>3. Generators & Iterators — The Core of Pythonic Code</h3>
+                <h3>4. Generators & Iterators — The Heart of Python</h3>
                 <div class="info-box">
-                    <div class="box-title">🔄 Lazy Evaluation Is King</div>
-                    <div class="box-content"><strong>Generators</strong> produce values one at a time using <code>yield</code>, consuming O(1) memory regardless of data size. A list of 1 billion items = ~8GB RAM. A generator of 1 billion items = ~100 bytes. The <strong>Iterator Protocol</strong>: any object with <code>__iter__</code> and <code>__next__</code> methods. Generators are just syntactic sugar for iterators.</div>
+                    <div class="box-title">🔄 Lazy Evaluation</div>
+                    <div class="box-content"><code>yield</code> suspends state, <code>return</code> terminates. A list of 1B items = ~8GB. A generator = ~100 bytes. The <strong>Iterator Protocol</strong>: any object with <code>__iter__</code> + <code>__next__</code>. Generator expressions: <code>(x**2 for x in range(10**9))</code> — O(1) memory.</div>
                 </div>
-                <p><strong>yield vs return:</strong> <code>return</code> terminates the function. <code>yield</code> suspends it, saving the entire stack frame (local variables, instruction pointer). The next <code>next()</code> call resumes from where it left off.</p>
-                <p><strong>yield from:</strong> Delegates to a sub-generator. <code>yield from iterable</code> is equivalent to <code>for item in iterable: yield item</code> but also forwards <code>send()</code> and <code>throw()</code> calls.</p>
-                <p><strong>Generator Expressions:</strong> <code>(x**2 for x in range(10**9))</code> — uses O(1) memory. List comprehension <code>[x**2 for x in range(10**9)]</code> — tries to allocate ~8GB. Always prefer generator expressions for large data.</p>
+                <p><strong>yield from:</strong> Delegates to sub-generator. Forwards <code>send()</code> and <code>throw()</code>. Essential for building composable data pipelines.</p>
+                <p><strong>send():</strong> Two-way communication with generators (coroutines). <code>value = yield result</code> — both receives and produces values.</p>
 
-                <h3>4. Closures & First-Class Functions</h3>
-                <p>Functions in Python are <strong>first-class objects</strong> — they can be passed as arguments, returned from other functions, and assigned to variables. A <strong>closure</strong> is a function that captures variables from its enclosing scope. This is the foundation of decorators, callbacks, and functional programming in Python.</p>
+                <h3>5. Closures & First-Class Functions</h3>
+                <p>Functions are first-class objects — passed as args, returned, assigned. A <strong>closure</strong> captures variables from enclosing scope. Foundation of decorators, callbacks, and functional programming.</p>
 
-                <h3>5. Critical Python Gotchas</h3>
+                <h3>6. Critical Python Gotchas for Projects</h3>
                 <div class="callout warning">
-                    <div class="callout-title">⚠️ Mutable Default Arguments — #1 Python Trap</div>
-                    <code>def append_to(element, target=[]):</code> — This default list is shared across ALL calls! Default arguments are evaluated ONCE at function definition time, not at call time. Fix: use <code>target=None</code> then <code>if target is None: target = []</code>.
+                    <div class="callout-title">⚠️ The 5 Deadliest Python Traps</div>
+                    <strong>1. Mutable Default Args:</strong> <code>def f(x, lst=[]):</code> — list shared across ALL calls. Fix: <code>lst=None</code>.<br>
+                    <strong>2. Late Binding Closures:</strong> <code>[lambda: i for i in range(5)]</code> — all return 4! Fix: <code>lambda i=i: i</code>.<br>
+                    <strong>3. Shallow Copy:</strong> <code>list(a)</code> copies outer list but shares inner objects.<br>
+                    <strong>4. String Concatenation:</strong> <code>s += "text"</code> in a loop creates new string every time — O(n²). Use <code>''.join(parts)</code>.<br>
+                    <strong>5. Circular Imports:</strong> Module A imports B, B imports A → ImportError. Fix: restructure or lazy import.
                 </div>
-                <p><strong>Late Binding Closures:</strong> <code>[lambda: i for i in range(5)]</code> — all lambdas return 4! Variables in closures are looked up at call time, not definition time. Fix: <code>[lambda i=i: i for i in range(5)]</code>.</p>
-                <p><strong>Tuple Assignment Gotcha:</strong> <code>a = ([1,2],); a[0] += [3]</code> raises TypeError AND modifies the list! The <code>+=</code> first mutates the list in-place (succeeds), then tries to reassign the tuple element (fails).</p>
 
-                <h3>6. collections Module — Power Tools</h3>
+                <h3>7. Error Handling for Production Projects</h3>
+                <div class="info-box">
+                    <div class="box-title">🛡️ Exception Hierarchy You Must Know</div>
+                    <div class="box-content">
+                        <code>BaseException</code> → <code>Exception</code> (catch this) → <code>ValueError</code>, <code>TypeError</code>, <code>KeyError</code>, <code>FileNotFoundError</code>, <code>ConnectionError</code>...<br>
+                        <strong>Rules:</strong> (1) Never catch bare <code>except:</code>. (2) Catch specific exceptions. (3) Use <code>else</code> for success path. (4) <code>finally</code> always runs. (5) Create custom exceptions for your project.
+                    </div>
+                </div>
+
+                <h3>8. collections Module — Power Tools</h3>
                 <table>
-                    <tr><th>Class</th><th>Purpose</th><th>Why It Matters in DS</th></tr>
-                    <tr><td><strong>defaultdict</strong></td><td>Dict with default factory</td><td>Group data without KeyError: <code>defaultdict(list)</code></td></tr>
-                    <tr><td><strong>Counter</strong></td><td>Count hashable objects</td><td>Label distribution: <code>Counter(y_train)</code></td></tr>
-                    <tr><td><strong>namedtuple</strong></td><td>Lightweight immutable class</td><td>Return multiple values with names, not indices</td></tr>
-                    <tr><td><strong>OrderedDict</strong></td><td>Dict remembering insertion order</td><td>Legacy (dicts are ordered 3.7+), useful for <code>move_to_end()</code></td></tr>
-                    <tr><td><strong>deque</strong></td><td>Double-ended queue</td><td>Sliding window computations, BFS algorithms</td></tr>
-                    <tr><td><strong>ChainMap</strong></td><td>Stack multiple dicts</td><td>Layer config: defaults → env → CLI overrides</td></tr>
+                    <tr><th>Class</th><th>Purpose</th><th>Project Use Case</th></tr>
+                    <tr><td><strong>defaultdict</strong></td><td>Dict with default factory</td><td>Group data: <code>defaultdict(list)</code></td></tr>
+                    <tr><td><strong>Counter</strong></td><td>Count hashable objects</td><td>Label distribution, word frequency</td></tr>
+                    <tr><td><strong>namedtuple</strong></td><td>Lightweight immutable class</td><td>Return multiple named values</td></tr>
+                    <tr><td><strong>deque</strong></td><td>Double-ended queue</td><td>Sliding window, BFS, ring buffer</td></tr>
+                    <tr><td><strong>ChainMap</strong></td><td>Stack multiple dicts</td><td>Config layers: defaults → env → CLI</td></tr>
+                    <tr><td><strong>OrderedDict</strong></td><td>Ordered dict (legacy)</td><td><code>move_to_end()</code> for LRU cache</td></tr>
                 </table>
 
-                <h3>7. itertools — Memory-Efficient Pipelines</h3>
+                <h3>9. itertools — Memory-Efficient Pipelines</h3>
                 <table>
-                    <tr><th>Function</th><th>What It Does</th><th>DS Use Case</th></tr>
-                    <tr><td><code>chain()</code></td><td>Concatenate iterables</td><td>Merge multiple data files lazily</td></tr>
-                    <tr><td><code>islice()</code></td><td>Slice any iterator</td><td>Take first N records from generator</td></tr>
-                    <tr><td><code>groupby()</code></td><td>Group consecutive elements</td><td>Process sorted log entries by date</td></tr>
-                    <tr><td><code>product()</code></td><td>Cartesian product</td><td>Generate hyperparameter grid</td></tr>
+                    <tr><th>Function</th><th>What It Does</th><th>Project Use</th></tr>
+                    <tr><td><code>chain()</code></td><td>Concatenate iterables lazily</td><td>Merge data files</td></tr>
+                    <tr><td><code>islice()</code></td><td>Slice any iterator</td><td>Take first N from generator</td></tr>
+                    <tr><td><code>groupby()</code></td><td>Group consecutive elements</td><td>Process sorted logs by date</td></tr>
+                    <tr><td><code>product()</code></td><td>Cartesian product</td><td>Hyperparameter grid</td></tr>
                     <tr><td><code>combinations()</code></td><td>All r-length combos</td><td>Feature interaction pairs</td></tr>
                     <tr><td><code>starmap()</code></td><td>map() with unpacked args</td><td>Apply function to paired data</td></tr>
-                    <tr><td><code>accumulate()</code></td><td>Running total/custom accumulator</td><td>Cumulative sums, running max</td></tr>
-                    <tr><td><code>tee()</code></td><td>Clone an iterator N times</td><td>Multiple passes over data stream</td></tr>
+                    <tr><td><code>accumulate()</code></td><td>Running accumulator</td><td>Cumulative sums, running max</td></tr>
+                    <tr><td><code>tee()</code></td><td>Clone iterator N times</td><td>Multiple passes over stream</td></tr>
                 </table>
 
-                <h3>8. String Internals & Formatting</h3>
-                <p><strong>f-strings</strong> (3.6+) are the fastest formatting method. They support expressions: <code>f"{accuracy:.2%}"</code> → "95.23%", <code>f"{x=}"</code> (3.8+) → "x=42" for debugging. <strong>Interning:</strong> Python interns string literals and identifiers. <code>'hello' is 'hello'</code> is True because both point to the same interned object.</p>
+                <h3>10. File I/O for Real Projects</h3>
+                <table>
+                    <tr><th>Format</th><th>Read</th><th>Write</th><th>Best For</th></tr>
+                    <tr><td>JSON</td><td><code>json.load(f)</code></td><td><code>json.dump(obj, f)</code></td><td>Configs, API responses</td></tr>
+                    <tr><td>CSV</td><td><code>csv.DictReader(f)</code></td><td><code>csv.DictWriter(f)</code></td><td>Tabular data (small)</td></tr>
+                    <tr><td>YAML</td><td><code>yaml.safe_load(f)</code></td><td><code>yaml.dump(obj, f)</code></td><td>Config files</td></tr>
+                    <tr><td>Pickle</td><td><code>pickle.load(f)</code></td><td><code>pickle.dump(obj, f)</code></td><td>Python objects, models</td></tr>
+                    <tr><td>Parquet</td><td><code>pd.read_parquet()</code></td><td><code>df.to_parquet()</code></td><td>Large DataFrames (fast)</td></tr>
+                    <tr><td>SQLite</td><td><code>sqlite3.connect()</code></td><td>SQL queries</td><td>Local database</td></tr>
+                </table>
 
-                <h3>9. pathlib — Modern File Handling</h3>
-                <p>Stop using <code>os.path.join()</code>. Use <code>pathlib.Path</code> — object-oriented, cross-platform, reads like English. <code>Path('data') / 'train' / 'images'</code> builds paths. <code>path.glob('*.csv')</code> finds files. <code>path.read_text()</code> reads without <code>open()</code>.</p>
+                <h3>11. pathlib — Modern File Handling</h3>
+                <p>Stop using <code>os.path.join()</code>. Use <code>pathlib.Path</code>: <code>Path('data') / 'train' / 'images'</code>. Methods: <code>.glob()</code>, <code>.read_text()</code>, <code>.mkdir(parents=True)</code>, <code>.exists()</code>, <code>.suffix</code>, <code>.stem</code>. Cross-platform, readable, powerful.</p>
 
-                <h3>10. Virtual Environments</h3>
+                <h3>12. Virtual Environments & Dependency Management</h3>
                 <table>
                     <tr><th>Tool</th><th>Best For</th><th>Key Feature</th></tr>
                     <tr><td>venv</td><td>Simple projects</td><td>Built-in, lightweight</td></tr>
-                    <tr><td>conda</td><td>DS/ML (C dependencies)</td><td>Handles CUDA, MKL</td></tr>
+                    <tr><td>conda</td><td>DS/ML (C deps)</td><td>Handles CUDA, MKL, OpenCV</td></tr>
                     <tr><td>poetry</td><td>Modern packaging</td><td>Lock files, deterministic builds</td></tr>
-                    <tr><td>uv</td><td>Speed (Rust-based)</td><td>10-100x faster than pip</td></tr>
+                    <tr><td>uv</td><td>Speed</td><td>10-100x faster pip (Rust-based)</td></tr>
+                    <tr><td>pip-tools</td><td>Requirements pinning</td><td><code>pip-compile</code> for lock files</td></tr>
                 </table>
+
+                <h3>13. Project Structure Template</h3>
+                <div class="code-block">my_project/
+├── src/
+│   └── my_package/
+│       ├── __init__.py
+│       ├── data/           # Data loading & processing
+│       ├── models/         # Model definitions
+│       ├── training/       # Training loops
+│       ├── evaluation/     # Metrics & evaluation
+│       ├── serving/        # API endpoints
+│       └── utils/          # Shared utilities
+├── tests/
+│   ├── conftest.py        # Shared fixtures
+│   ├── test_data.py
+│   └── test_models.py
+├── configs/               # YAML/JSON configs
+├── notebooks/             # EDA notebooks
+├── scripts/               # CLI scripts
+├── pyproject.toml         # Modern Python packaging
+├── Dockerfile
+├── Makefile               # Common commands
+└── README.md</div>
+
+                <h3>14. String Operations for Data Cleaning</h3>
+                <p><strong>f-strings (3.6+):</strong> <code>f"{accuracy:.2%}"</code> → "95.23%". <code>f"{x=}"</code> (3.8+) → "x=42" for debugging. <code>f"{name!r}"</code> → shows repr. <strong>regex:</strong> <code>re.compile(pattern)</code> for repeated use. <code>re.sub()</code> for cleaning. <code>re.findall()</code> for extraction. Always compile patterns used in loops.</p>
+
+                <h3>15. Command-Line Interface (CLI) Tools</h3>
+                <p><strong>argparse:</strong> Built-in CLI parsing. <strong>click:</strong> Decorator-based, more Pythonic. <strong>typer:</strong> Modern, uses type hints. Every production project needs a CLI for: training, evaluation, data processing, deployment scripts.</p>
             </div>`,
         code: `
             <div class="section">
-                <h2>💻 Python Fundamentals — Code Examples</h2>
+                <h2>💻 Python Fundamentals — Project Code</h2>
 
-                <h3>1. Generators — Complete Patterns</h3>
-                <div class="code-block"><span class="comment"># Basic generator — yields values lazily</span>
-<span class="keyword">def</span> <span class="function">read_large_file</span>(filepath):
+                <h3>1. Generator Pipeline — Process Any Size Data</h3>
+                <div class="code-block"><span class="keyword">import</span> json
+<span class="keyword">from</span> pathlib <span class="keyword">import</span> Path
+
+<span class="keyword">def</span> <span class="function">read_jsonl</span>(filepath):
+    <span class="string">"""Read JSON Lines file lazily — handles any size."""</span>
     <span class="keyword">with</span> <span class="function">open</span>(filepath) <span class="keyword">as</span> f:
         <span class="keyword">for</span> line <span class="keyword">in</span> f:
-            <span class="keyword">yield</span> line.strip()
-<span class="comment"># Processes a 10GB file with O(1) memory!</span>
-
-<span class="comment"># Generator pipeline — compose transformations</span>
-<span class="keyword">def</span> <span class="function">pipeline</span>(filepath):
-    lines = read_large_file(filepath)
-    parsed = (<span class="function">json</span>.loads(line) <span class="keyword">for</span> line <span class="keyword">in</span> lines)
-    filtered = (rec <span class="keyword">for</span> rec <span class="keyword">in</span> parsed <span class="keyword">if</span> rec[<span class="string">'score'</span>] > <span class="number">0.5</span>)
-    <span class="keyword">return</span> filtered  <span class="comment"># Still lazy! No work done yet</span>
-
-<span class="comment"># send() — coroutine pattern (advanced)</span>
-<span class="keyword">def</span> <span class="function">running_average</span>():
-    total = count = <span class="number">0</span>
-    avg = <span class="keyword">None</span>
+            <span class="keyword">yield</span> json.loads(line.strip())
+
+<span class="keyword">def</span> <span class="function">filter_records</span>(records, min_score=<span class="number">0.5</span>):
+    <span class="keyword">for</span> rec <span class="keyword">in</span> records:
+        <span class="keyword">if</span> rec.get(<span class="string">'score'</span>, <span class="number">0</span>) >= min_score:
+            <span class="keyword">yield</span> rec
+
+<span class="keyword">def</span> <span class="function">batch</span>(iterable, size=<span class="number">64</span>):
+    <span class="string">"""Batch any iterable into fixed-size chunks."""</span>
+    <span class="keyword">from</span> itertools <span class="keyword">import</span> islice
+    it = <span class="function">iter</span>(iterable)
+    <span class="keyword">while</span> chunk := <span class="function">list</span>(islice(it, size)):
+        <span class="keyword">yield</span> chunk
+
+<span class="comment"># Compose into pipeline — still O(1) memory!</span>
+pipeline = batch(filter_records(read_jsonl(<span class="string">"data.jsonl"</span>)), size=<span class="number">32</span>)
+<span class="keyword">for</span> chunk <span class="keyword">in</span> pipeline:
+    process(chunk)  <span class="comment"># Only 32 records in memory at a time</span></div>
+
+                <h3>2. Coroutine Pattern — Running Statistics</h3>
+                <div class="code-block"><span class="keyword">def</span> <span class="function">running_stats</span>():
+    <span class="string">"""Coroutine that computes running mean & variance."""</span>
+    n = <span class="number">0</span>
+    mean = <span class="number">0.0</span>
+    M2 = <span class="number">0.0</span>
     <span class="keyword">while</span> <span class="keyword">True</span>:
-        value = <span class="keyword">yield</span> avg
-        total += value
-        count += <span class="number">1</span>
-        avg = total / count
-
-ra = running_average()
-<span class="function">next</span>(ra)  <span class="comment"># Prime the coroutine</span>
-ra.send(<span class="number">10</span>)  <span class="comment"># 10.0</span>
-ra.send(<span class="number">20</span>)  <span class="comment"># 15.0</span></div>
-
-                <h3>2. Closures & Mutable Default Trap</h3>
-                <div class="code-block"><span class="comment"># Closure — function capturing external state</span>
-<span class="keyword">def</span> <span class="function">make_multiplier</span>(factor):
-    <span class="keyword">def</span> <span class="function">multiply</span>(x):
-        <span class="keyword">return</span> x * factor  <span class="comment"># 'factor' captured from enclosing scope</span>
-    <span class="keyword">return</span> multiply
-
-double = make_multiplier(<span class="number">2</span>)
-triple = make_multiplier(<span class="number">3</span>)
-<span class="function">print</span>(double(<span class="number">5</span>))  <span class="comment"># 10</span>
-
-<span class="comment"># ⚠️ MUTABLE DEFAULT ARGUMENT — THE #1 PYTHON BUG</span>
-<span class="comment"># BAD: default list is shared across ALL calls!</span>
-<span class="keyword">def</span> <span class="function">bad_append</span>(item, lst=[]):
+        x = <span class="keyword">yield</span> {<span class="string">'mean'</span>: mean, <span class="string">'var'</span>: M2/n <span class="keyword">if</span> n > <span class="number">0</span> <span class="keyword">else</span> <span class="number">0</span>, <span class="string">'n'</span>: n}
+        n += <span class="number">1</span>
+        delta = x - mean
+        mean += delta / n
+        M2 += delta * (x - mean)  <span class="comment"># Welford's algorithm — numerically stable</span>
+
+stats = running_stats()
+<span class="function">next</span>(stats)  <span class="comment"># Prime</span>
+stats.send(<span class="number">10</span>)   <span class="comment"># {'mean': 10.0, 'var': 0, 'n': 1}</span>
+stats.send(<span class="number">20</span>)   <span class="comment"># {'mean': 15.0, 'var': 25.0, 'n': 2}</span></div>
+
+                <h3>3. Custom Exception Hierarchy for Projects</h3>
+                <div class="code-block"><span class="comment"># Define project-specific exceptions</span>
+<span class="keyword">class</span> <span class="class">ProjectError</span>(<span class="function">Exception</span>):
+    <span class="string">"""Base exception for the project."""</span>
+
+<span class="keyword">class</span> <span class="class">DataValidationError</span>(ProjectError):
+    <span class="keyword">def</span> <span class="function">__init__</span>(self, column, expected, actual):
+        self.column = column
+        <span class="keyword">super</span>().__init__(
+            <span class="string">f"Column '{column}': expected {expected}, got {actual}"</span>
+        )
+
+<span class="keyword">class</span> <span class="class">ModelNotTrainedError</span>(ProjectError):
+    <span class="keyword">pass</span>
+
+<span class="comment"># Usage with proper error handling</span>
+<span class="keyword">def</span> <span class="function">load_and_validate</span>(path):
+    <span class="keyword">try</span>:
+        df = pd.read_csv(path)
+    <span class="keyword">except</span> FileNotFoundError:
+        <span class="keyword">raise</span> DataValidationError(<span class="string">"file"</span>, <span class="string">"exists"</span>, <span class="string">"missing"</span>)
+    <span class="keyword">except</span> pd.errors.EmptyDataError:
+        <span class="keyword">raise</span> DataValidationError(<span class="string">"data"</span>, <span class="string">"non-empty"</span>, <span class="string">"empty file"</span>)
+    <span class="keyword">else</span>:
+        <span class="function">print</span>(<span class="string">f"Loaded {len(df)} rows"</span>)
+        <span class="keyword">return</span> df
+    <span class="keyword">finally</span>:
+        <span class="function">print</span>(<span class="string">"Load attempt complete"</span>)</div>
+
+                <h3>4. Closures & Mutable Default Trap</h3>
+                <div class="code-block"><span class="comment"># ⚠️ THE #1 PYTHON BUG — Mutable default argument</span>
+<span class="keyword">def</span> <span class="function">bad_append</span>(item, lst=[]):  <span class="comment"># List shared across ALL calls!</span>
     lst.append(item)
     <span class="keyword">return</span> lst
 bad_append(<span class="number">1</span>)  <span class="comment"># [1]</span>
 bad_append(<span class="number">2</span>)  <span class="comment"># [1, 2] ← SURPRISE!</span>
 
-<span class="comment"># GOOD: use None sentinel</span>
+<span class="comment"># ✅ CORRECT — use None sentinel</span>
 <span class="keyword">def</span> <span class="function">good_append</span>(item, lst=<span class="keyword">None</span>):
     <span class="keyword">if</span> lst <span class="keyword">is</span> <span class="keyword">None</span>:
         lst = []
     lst.append(item)
     <span class="keyword">return</span> lst</div>
 
-                <h3>3. collections In Action</h3>
-                <div class="code-block"><span class="keyword">from</span> collections <span class="keyword">import</span> defaultdict, Counter, namedtuple, deque
+                <h3>5. collections in Action</h3>
+                <div class="code-block"><span class="keyword">from</span> collections <span class="keyword">import</span> defaultdict, Counter, deque
 
-<span class="comment"># defaultdict — Group samples by label</span>
-samples_by_label = defaultdict(list)
-<span class="keyword">for</span> feature, label <span class="keyword">in</span> <span class="function">zip</span>(features, labels):
-    samples_by_label[label].append(feature)
+<span class="comment"># defaultdict — group data without KeyError</span>
+samples_by_label = defaultdict(<span class="keyword">list</span>)
+<span class="keyword">for</span> feat, label <span class="keyword">in</span> <span class="function">zip</span>(features, labels):
+    samples_by_label[label].append(feat)
 
-<span class="comment"># Counter — Class distribution + arithmetic</span>
+<span class="comment"># Counter — class distribution + top-N</span>
 dist = Counter(y_train)
 <span class="function">print</span>(dist.most_common(<span class="number">3</span>))
-<span class="comment"># Counter supports +, -, &, | operations!</span>
+imbalance_ratio = dist.most_common()[<span class="number">0</span>][<span class="number">1</span>] / dist.most_common()[-<span class="number">1</span>][<span class="number">1</span>]
 
-<span class="comment"># deque — Sliding window for streaming data</span>
+<span class="comment"># deque — sliding window for streaming</span>
 window = deque(maxlen=<span class="number">5</span>)
-<span class="keyword">for</span> value <span class="keyword">in</span> data_stream:
-    window.append(value)
+<span class="keyword">for</span> val <span class="keyword">in</span> data_stream:
+    window.append(val)
     moving_avg = <span class="function">sum</span>(window) / <span class="function">len</span>(window)</div>
 
-                <h3>4. Advanced Comprehensions & Unpacking</h3>
-                <div class="code-block"><span class="comment"># Walrus operator (:=) — Assign + use in expression (3.8+)</span>
+                <h3>6. CLI Tool with argparse</h3>
+                <div class="code-block"><span class="keyword">import</span> argparse
+
+<span class="keyword">def</span> <span class="function">main</span>():
+    parser = argparse.ArgumentParser(description=<span class="string">"Train ML model"</span>)
+    parser.add_argument(<span class="string">"--data"</span>, required=<span class="keyword">True</span>, help=<span class="string">"Path to data"</span>)
+    parser.add_argument(<span class="string">"--model"</span>, choices=[<span class="string">"rf"</span>, <span class="string">"xgb"</span>, <span class="string">"lgbm"</span>], default=<span class="string">"rf"</span>)
+    parser.add_argument(<span class="string">"--epochs"</span>, type=<span class="keyword">int</span>, default=<span class="number">10</span>)
+    parser.add_argument(<span class="string">"--lr"</span>, type=<span class="keyword">float</span>, default=<span class="number">0.001</span>)
+    parser.add_argument(<span class="string">"--dry-run"</span>, action=<span class="string">"store_true"</span>)
+    args = parser.parse_args()
+    
+    <span class="function">print</span>(<span class="string">f"Training {args.model} on {args.data}"</span>)
+    <span class="comment"># python train.py --data data.csv --model xgb --epochs 50</span>
+
+<span class="keyword">if</span> __name__ == <span class="string">"__main__"</span>:
+    main()</div>
+
+                <h3>7. Advanced Comprehensions & Modern Python</h3>
+                <div class="code-block"><span class="comment"># Walrus operator (:=) — assign + use (3.8+)</span>
 <span class="keyword">if</span> (n := <span class="function">len</span>(data)) > <span class="number">1000</span>:
     <span class="function">print</span>(<span class="string">f"Large dataset: {n} samples"</span>)
 
-<span class="comment"># Extended unpacking</span>
-first, *middle, last = sorted(scores)
-
 <span class="comment"># Dict merge (3.9+)</span>
-config = defaults | overrides  <span class="comment"># New in 3.9</span>
+config = defaults | overrides
 
-<span class="comment"># match-case (3.10+) — Structural Pattern Matching</span>
+<span class="comment"># match-case — Structural Pattern Matching (3.10+)</span>
 <span class="keyword">match</span> command:
     <span class="keyword">case</span> {<span class="string">"action"</span>: <span class="string">"train"</span>, <span class="string">"model"</span>: model_name}:
         train(model_name)
     <span class="keyword">case</span> {<span class="string">"action"</span>: <span class="string">"predict"</span>, <span class="string">"data"</span>: path}:
-        predict(path)</div>
+        predict(path)
+    <span class="keyword">case</span> _:
+        <span class="function">print</span>(<span class="string">"Unknown command"</span>)
+
+<span class="comment"># Extended unpacking</span>
+first, *middle, last = sorted(scores)
+
+<span class="comment"># Nested dict comprehension</span>
+metrics = {
+    model: {metric: score <span class="keyword">for</span> metric, score <span class="keyword">in</span> results.items()}
+    <span class="keyword">for</span> model, results <span class="keyword">in</span> all_results.items()
+}</div>
+
+                <h3>8. Regex for Data Cleaning</h3>
+                <div class="code-block"><span class="keyword">import</span> re
+
+<span class="comment"># Compile patterns used repeatedly (10x faster)</span>
+EMAIL = re.compile(<span class="string">r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}'</span>)
+PHONE = re.compile(<span class="string">r'\b\d{3}[-.]?\d{3}[-.]?\d{4}\b'</span>)
+
+<span class="comment"># Extract all emails from text</span>
+emails = EMAIL.findall(text)
+
+<span class="comment"># Clean text for NLP</span>
+<span class="keyword">def</span> <span class="function">clean_text</span>(text):
+    text = re.sub(<span class="string">r'http\S+'</span>, <span class="string">''</span>, text)        <span class="comment"># Remove URLs</span>
+    text = re.sub(<span class="string">r'[^a-zA-Z\s]'</span>, <span class="string">''</span>, text)    <span class="comment"># Keep only letters</span>
+    text = re.sub(<span class="string">r'\s+'</span>, <span class="string">' '</span>, text).strip()   <span class="comment"># Normalize whitespace</span>
+    <span class="keyword">return</span> text.lower()</div>
+
+                <h3>9. Configuration Management</h3>
+                <div class="code-block"><span class="keyword">import</span> json, yaml
+<span class="keyword">from</span> pathlib <span class="keyword">import</span> Path
+<span class="keyword">from</span> dataclasses <span class="keyword">import</span> dataclass, asdict
+
+<span class="preprocessor">@dataclass</span>
+<span class="keyword">class</span> <span class="class">Config</span>:
+    model_name: <span class="keyword">str</span> = <span class="string">"random_forest"</span>
+    learning_rate: <span class="keyword">float</span> = <span class="number">0.001</span>
+    batch_size: <span class="keyword">int</span> = <span class="number">32</span>
+    epochs: <span class="keyword">int</span> = <span class="number">100</span>
+    data_path: <span class="keyword">str</span> = <span class="string">"data/train.csv"</span>
+    
+    <span class="preprocessor">@classmethod</span>
+    <span class="keyword">def</span> <span class="function">from_yaml</span>(cls, path):
+        <span class="keyword">with</span> <span class="function">open</span>(path) <span class="keyword">as</span> f:
+            <span class="keyword">return</span> cls(**yaml.safe_load(f))
+    
+    <span class="keyword">def</span> <span class="function">save</span>(self, path):
+        Path(path).write_text(json.dumps(asdict(self), indent=<span class="number">2</span>))
+
+config = Config.from_yaml(<span class="string">"configs/experiment.yaml"</span>)</div>
             </div>`,
         interview: `
             <div class="section">
                 <h2>🎯 Python Fundamentals — Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: What's the difference between a list and a tuple?</strong><p><strong>Answer:</strong> Lists are mutable, tuples immutable. Deeper: tuples are <strong>hashable</strong> (can be dict keys), use <strong>less memory</strong> (no over-allocation), and signal <strong>intent</strong> ("this shouldn't change"). Use tuples for (lat, lon) pairs, function return values, dict keys. Use lists for collections that grow.</p></div>
-                <div class="interview-box"><strong>Q2: How does Python's GIL affect DS workflows?</strong><p><strong>Answer:</strong> The GIL prevents true multi-threading for CPU-bound tasks. But <strong>NumPy, Pandas, and scikit-learn release the GIL</strong> during C-level computations. So vectorized operations ARE parallel at the C level. For pure Python CPU work, use <code>multiprocessing</code>. For I/O, threading works fine.</p></div>
-                <div class="interview-box"><strong>Q3: Explain shallow vs deep copy.</strong><p><strong>Answer:</strong> <code>copy.copy()</code> copies outer container but shares inner objects. <code>copy.deepcopy()</code> recursively copies everything. Real scenario: list of dicts (configs). Shallow copy means modifying one config modifies all. Pandas <code>.copy()</code> is deep by default — but <code>df2 = df</code> is NOT a copy.</p></div>
-                <div class="interview-box"><strong>Q4: What is the mutable default argument trap?</strong><p><strong>Answer:</strong> <code>def f(x, lst=[]):</code> — the default list is created ONCE at function definition and shared across all calls. So <code>f(1); f(2)</code> gives <code>[1, 2]</code> not <code>[2]</code>. Fix: use <code>lst=None</code> then <code>if lst is None: lst = []</code>. This is the #1 Python gotcha in interviews.</p></div>
-                <div class="interview-box"><strong>Q5: What are generators and why are they critical for large-scale data?</strong><p><strong>Answer:</strong> Generators yield values one at a time using <code>yield</code>, consuming O(1) memory. A list of 1B items = ~8GB. A generator = ~100 bytes. Critical for: reading large files, streaming data, batch training. <code>yield from</code> delegates to sub-generators. Generator expressions: <code>(x for x in data)</code>.</p></div>
-                <div class="interview-box"><strong>Q6: Explain the LEGB scope rule.</strong><p><strong>Answer:</strong> Python resolves names in order: <strong>L</strong>ocal → <strong>E</strong>nclosing → <strong>G</strong>lobal → <strong>B</strong>uilt-in. This is why <code>list = [1,2]</code> breaks <code>list()</code>. Use <code>nonlocal</code> for enclosing scope, <code>global</code> for module scope.</p></div>
-                <div class="interview-box"><strong>Q7: How would you handle a 10GB CSV that doesn't fit in memory?</strong><p><strong>Answer:</strong> (1) <code>pd.read_csv(chunksize=50000)</code>, (2) <code>usecols=['needed']</code>, (3) <code>dtype={'col': 'int32'}</code>, (4) Dask for lazy Pandas, (5) DuckDB for SQL on CSV with zero overhead, (6) Polars for fast out-of-core processing.</p></div>
-                <div class="interview-box"><strong>Q8: What's the time complexity of dict lookup vs list search?</strong><p><strong>Answer:</strong> Dict: <strong>O(1)</strong> via hash tables (open addressing). List: <strong>O(n)</strong> linear scan. Dict hashes the key to compute slot index, handles collisions via probing. Sets use the same mechanism. <code>x in my_set</code> is O(1) but <code>x in my_list</code> is O(n).</p></div>
-                <div class="interview-box"><strong>Q9: Explain Python's garbage collection.</strong><p><strong>Answer:</strong> Two mechanisms: (1) <strong>Reference counting</strong> — freed when count hits 0. (2) <strong>Cyclic GC</strong> — detects reference cycles (A→B→A). Runs on 3 generations. Long-lived objects collected less often. <code>gc.collect()</code> forces collection — useful after deleting large ML models.</p></div>
-                <div class="interview-box"><strong>Q10: What is <code>__slots__</code> and when to use it?</strong><p><strong>Answer:</strong> By default, Python objects store attributes in a <code>__dict__</code> (a dict per instance). <code>__slots__</code> replaces this with a fixed-size array. Saves ~40% memory per instance. Use when creating millions of small objects (data points, nodes). Trade-off: can't add attributes dynamically.</p></div>
+                <div class="interview-box"><strong>Q1: List vs tuple — when to use which?</strong><p><strong>Answer:</strong> Tuples: immutable, hashable (dict keys), less memory. Lists: mutable, growable. Use tuples for fixed data (coordinates, config). Use lists for collections that change. Tuples signal "this shouldn't be modified."</p></div>
+                <div class="interview-box"><strong>Q2: How does Python's GIL affect DS?</strong><p><strong>Answer:</strong> GIL prevents multi-threading for CPU-bound Python. But NumPy/Pandas release the GIL during C operations. For pure Python CPU work → multiprocessing. For I/O → threading works. For data science, the GIL rarely matters.</p></div>
+                <div class="interview-box"><strong>Q3: Shallow vs deep copy?</strong><p><strong>Answer:</strong> <code>copy.copy()</code>: outer container copied, inner objects shared. <code>copy.deepcopy()</code>: everything copied recursively. Real trap: <code>df2 = df</code> is NOT a copy — it's aliasing. Use <code>df.copy()</code>.</p></div>
+                <div class="interview-box"><strong>Q4: What is the mutable default argument trap?</strong><p><strong>Answer:</strong> <code>def f(x, lst=[]):</code> — default list created ONCE and shared. Fix: <code>lst=None; if lst is None: lst = []</code>. #1 Python interview gotcha.</p></div>
+                <div class="interview-box"><strong>Q5: Why are generators critical for large data?</strong><p><strong>Answer:</strong> O(1) memory. 1B items as list = 8GB. As generator = 100 bytes. Use for: file processing, streaming, batch training. <code>yield from</code> for composition.</p></div>
+                <div class="interview-box"><strong>Q6: Explain LEGB scope rule.</strong><p><strong>Answer:</strong> Name lookup order: Local → Enclosing → Global → Built-in. <code>nonlocal</code> for enclosing scope, <code>global</code> for module. <code>list = [1]</code> shadows built-in <code>list()</code>.</p></div>
+                <div class="interview-box"><strong>Q7: How to handle a 10GB CSV?</strong><p><strong>Answer:</strong> (1) <code>pd.read_csv(chunksize=N)</code>, (2) <code>usecols=['needed']</code>, (3) <code>dtype={'col':'int32'}</code>, (4) Dask, (5) DuckDB for SQL on CSV, (6) Polars for Rust-speed.</p></div>
+                <div class="interview-box"><strong>Q8: Dict lookup O(1) vs list search O(n)?</strong><p><strong>Answer:</strong> Dicts use hash tables. Key → hash → slot index. O(1) average. Lists scan linearly. <code>x in set</code> is O(1) but <code>x in list</code> is O(n). For 1M items: microseconds vs milliseconds.</p></div>
+                <div class="interview-box"><strong>Q9: Explain Python's garbage collection.</strong><p><strong>Answer:</strong> (1) Reference counting — freed at count=0. (2) Cyclic GC — detects A→B→A cycles. 3 generations. <code>gc.collect()</code> after deleting large models.</p></div>
+                <div class="interview-box"><strong>Q10: What is __slots__?</strong><p><strong>Answer:</strong> Replaces per-instance <code>__dict__</code> with fixed array. ~40% memory savings. Use for millions of small objects. Trade-off: no dynamic attributes.</p></div>
+                <div class="interview-box"><strong>Q11: How do you structure a Python project?</strong><p><strong>Answer:</strong> <code>src/package/</code> layout. <code>pyproject.toml</code> for config. <code>tests/</code> with pytest. <code>configs/</code> for YAML. <code>Makefile</code> for common commands. Separate data, models, training, serving.</p></div>
+                <div class="interview-box"><strong>Q12: What's the difference between <code>is</code> and <code>==</code>?</strong><p><strong>Answer:</strong> <code>==</code> checks value equality. <code>is</code> checks identity (same memory). Use <code>is</code> only for singletons: <code>x is None</code>, <code>x is True</code>. Integer interning makes <code>256 is 256</code> True but <code>1000 is 1000</code> may be False.</p></div>
             </div>`
     },
 
-    "numpy": {
-        concepts: `
+"numpy": {
+    concepts: `
             <div class="section">
                 <h2>🔢 NumPy — Complete Deep Dive</h2>
 
                 <div class="info-box">
-                    <div class="box-title">⚡ Why NumPy Is 50-100x Faster Than Python Lists</div>
-                    <div class="box-content">Three reasons: (1) <strong>Contiguous memory</strong> — CPU cache-friendly, no pointer chasing. (2) <strong>Compiled C loops</strong> — operations run in C, not interpreted Python. (3) <strong>SIMD instructions</strong> — modern CPUs process 4-8 floats simultaneously (AVX).</div>
+                    <div class="box-title">⚡ Why NumPy Is 50-100x Faster</div>
+                    <div class="box-content">(1) <strong>Contiguous memory</strong> — CPU cache-friendly. (2) <strong>Compiled C loops</strong>. (3) <strong>SIMD instructions</strong> — 4-8 floats simultaneously. Python list: array of pointers to objects. NumPy: raw typed data in a block.</div>
                 </div>
 
                 <h3>1. ndarray Internals</h3>
                 <table>
                     <tr><th>Feature</th><th>Python List</th><th>NumPy ndarray</th></tr>
-                    <tr><td>Storage</td><td>Array of pointers to objects</td><td>Contiguous block of raw typed data</td></tr>
-                    <tr><td>Type</td><td>Each element can differ</td><td>Homogeneous — all same dtype</td></tr>
-                    <tr><td>Operations</td><td>Python loop (bytecode)</td><td>Compiled C/Fortran loops</td></tr>
-                    <tr><td>Memory</td><td>~28 bytes per int + pointer</td><td>8 bytes per int64 (no overhead)</td></tr>
-                    <tr><td>SIMD</td><td>Not possible</td><td>Uses CPU vector instructions</td></tr>
+                    <tr><td>Storage</td><td>Pointers to objects</td><td>Contiguous typed data</td></tr>
+                    <tr><td>Memory per int</td><td>~28 bytes + pointer</td><td>8 bytes (int64)</td></tr>
+                    <tr><td>Operations</td><td>Python loop</td><td>Compiled C/Fortran</td></tr>
+                    <tr><td>SIMD</td><td>Impossible</td><td>CPU vector instructions</td></tr>
                 </table>
 
-                <h3>2. Memory Layout: C-Order vs Fortran-Order</h3>
+                <h3>2. Memory Layout & Strides</h3>
                 <div class="info-box">
-                    <div class="box-title">⚡ Performance-Critical Knowledge</div>
-                    <div class="box-content"><strong>C-order (row-major):</strong> Rows stored contiguously. <strong>Fortran-order (col-major):</strong> Columns stored contiguously. NumPy defaults to C-order. <strong>Iterating along the last axis is fastest</strong> (cache-friendly). Fortran-order preferred for LAPACK/BLAS operations.</div>
+                    <div class="box-title">🧠 Strides = The Secret Behind Views</div>
+                    <div class="box-content">Every ndarray has <strong>strides</strong> — bytes to jump in each dimension. For (3,4) float64: strides = (32, 8). Slicing creates <strong>views</strong> (no copy) by adjusting strides. <code>arr[::2]</code> doubles row stride. <strong>C-order</strong> (row-major): rows contiguous. <strong>Fortran-order</strong>: columns contiguous. Iterate along last axis for best performance.</div>
                 </div>
 
-                <h3>3. Strides: The Secret Behind Views</h3>
-                <p>Every ndarray has a <strong>strides</strong> tuple — bytes to jump in each dimension. For a <code>(3,4)</code> float64 array: strides = <code>(32, 8)</code>. Slicing creates <strong>views</strong> (no copy) by adjusting strides. <code>arr[::2]</code> doubles the row stride.</p>
-
-                <h3>4. Broadcasting Rules</h3>
+                <h3>3. Broadcasting Rules</h3>
                 <div class="info-box">
-                    <div class="box-title">🎯 Broadcasting Rules (Right to Left)</div>
-                    <div class="box-content">Two arrays are compatible when, for each trailing dimension: (1) Dimensions are equal, OR (2) One is 1. Example: (5,3,1) + (1,4) → shape (5,3,4). The (1,) dims are "stretched" virtually — no memory copied.</div>
+                    <div class="box-title">🎯 Rules (Right to Left)</div>
+                    <div class="box-content">Two arrays compatible when, for each trailing dim: dims are equal OR one is 1. (5,3,1) + (1,4) → (5,3,4). The "1" dims stretch virtually — no memory copied. Common: <code>X - X.mean(axis=0)</code> → (1000,5) - (5,) works!</div>
                 </div>
 
-                <h3>5. Universal Functions (ufuncs)</h3>
-                <p>Ufuncs are vectorized functions that operate element-wise. They support: <code>.reduce()</code> (fold along axis), <code>.accumulate()</code> (running total), <code>.outer()</code> (outer product), <code>.at()</code> (unbuffered in-place). Example: <code>np.add.reduce(arr)</code> = <code>arr.sum()</code> but works with custom ufuncs too.</p>
+                <h3>4. Universal Functions (ufuncs)</h3>
+                <p>Vectorized element-wise functions. Advanced methods: <code>.reduce()</code> (fold), <code>.accumulate()</code> (running total), <code>.outer()</code> (outer product), <code>.at()</code> (unbuffered in-place). Create custom with <code>np.frompyfunc()</code>.</p>
 
-                <h3>6. Key dtype Choices for DS</h3>
+                <h3>5. dtype Selection for Projects</h3>
                 <table>
                     <tr><th>dtype</th><th>Bytes</th><th>When to Use</th></tr>
-                    <tr><td>float32</td><td>4</td><td>Deep learning (GPU prefers this), 50% less memory</td></tr>
-                    <tr><td>float64</td><td>8</td><td>Default. Scientific computing, high-precision stats</td></tr>
-                    <tr><td>int32</td><td>4</td><td>Indices, counts, most integer data</td></tr>
-                    <tr><td>float16</td><td>2</td><td>Mixed-precision training, inference</td></tr>
+                    <tr><td>float32</td><td>4</td><td>Deep learning, GPU (50% less memory)</td></tr>
+                    <tr><td>float64</td><td>8</td><td>Default. Statistics, scientific computing</td></tr>
+                    <tr><td>float16</td><td>2</td><td>Mixed-precision inference</td></tr>
+                    <tr><td>int32</td><td>4</td><td>Indices, counts</td></tr>
+                    <tr><td>int8</td><td>1</td><td>Quantized models</td></tr>
                     <tr><td>bool</td><td>1</td><td>Masks for filtering</td></tr>
                 </table>
 
-                <h3>7. np.einsum — Einstein Summation</h3>
-                <p><code>np.einsum</code> can express <strong>any</strong> tensor operation: matrix multiply, trace, transpose, batch ops. Often faster than chaining NumPy functions because it avoids intermediate arrays.</p>
+                <h3>6. np.einsum — One Function for All Tensor Ops</h3>
+                <p>Einstein summation: express ANY tensor operation. Matrix multiply: <code>'ik,kj->ij'</code>. Batch matmul: <code>'bij,bjk->bik'</code>. Trace: <code>'ii->'</code>. Often faster than chaining NumPy calls — avoids intermediate arrays.</p>
 
-                <h3>8. Linear Algebra for ML</h3>
+                <h3>7. Linear Algebra for ML Projects</h3>
                 <ul>
                     <li><code>X.T @ X</code> → Gram matrix (basis of linear regression)</li>
-                    <li><code>U, S, Vt = np.linalg.svd(X)</code> → PCA, dimensionality reduction</li>
+                    <li><code>np.linalg.svd(X)</code> → PCA, dimensionality reduction</li>
                     <li><code>np.linalg.eigh(cov)</code> → Covariance eigenvectors</li>
-                    <li><code>np.linalg.norm(X, axis=1)</code> → L2 norms for distance</li>
-                    <li><code>np.linalg.lstsq(X, y)</code> → Stable linear regression (preferred over inv)</li>
+                    <li><code>np.linalg.norm(X, axis=1)</code> → L2 norms for distances</li>
+                    <li><code>np.linalg.lstsq(X, y)</code> → Stable linear regression</li>
+                    <li><code>np.linalg.inv()</code> → AVOID! Use <code>solve()</code> instead (numerically stable)</li>
                 </ul>
 
-                <h3>9. Random Number Generation (Modern API)</h3>
-                <p><code>np.random.default_rng(42)</code> is the modern way (NumPy 1.17+). Uses PCG64 algorithm — better statistical properties, thread-safe. Old <code>np.random.seed(42)</code> is global state, not thread-safe. <strong>Always use <code>default_rng()</code></strong> in new code.</p>
+                <h3>8. Random Number Generation</h3>
+                <p>Modern: <code>rng = np.random.default_rng(42)</code> (NumPy 1.17+). PCG64 algorithm, thread-safe. Old <code>np.random.seed(42)</code> is global, not thread-safe. Always use <code>default_rng()</code> in projects.</p>
+
+                <h3>9. Image Processing with NumPy</h3>
+                <p>Images are just 3D arrays: (height, width, channels). Crop: <code>img[100:200, 50:150]</code>. Resize: scipy. Normalize: <code>img / 255.0</code>. Augment: flip <code>img[:, ::-1]</code>, rotate with <code>scipy.ndimage</code>. Foundation of all computer vision.</p>
             </div>`,
         code: `
             <div class="section">
-                <h2>💻 NumPy Code Examples</h2>
+                <h2>💻 NumPy Project Code</h2>
 
-                <h3>1. Array Creation & Memory Inspection</h3>
+                <h3>1. Feature Engineering with Broadcasting</h3>
                 <div class="code-block"><span class="keyword">import</span> numpy <span class="keyword">as</span> np
 
-<span class="comment"># Memory-efficient creation</span>
-X = np.random.randn(<span class="number">1000</span>, <span class="number">10</span>).astype(np.float32)  <span class="comment"># 40KB vs 80KB</span>
-<span class="function">print</span>(<span class="string">f"Strides: {X.strides}"</span>)       <span class="comment"># (40, 4) bytes</span>
-<span class="function">print</span>(<span class="string">f"Memory: {X.nbytes / 1024:.1f} KB"</span>)</div>
-
-                <h3>2. Broadcasting for Feature Normalization</h3>
-                <div class="code-block"><span class="comment"># Z-score normalization using broadcasting</span>
+<span class="comment"># Z-score normalization</span>
 X = np.random.randn(<span class="number">1000</span>, <span class="number">5</span>)
-X_norm = (X - X.mean(axis=<span class="number">0</span>)) / X.std(axis=<span class="number">0</span>)  <span class="comment"># (1000,5) - (5,) works!</span>
+X_norm = (X - X.mean(axis=<span class="number">0</span>)) / X.std(axis=<span class="number">0</span>)  <span class="comment"># (1000,5) - (5,)</span>
 
 <span class="comment"># Min-Max scaling</span>
-X_scaled = (X - X.min(axis=<span class="number">0</span>)) / (X.max(axis=<span class="number">0</span>) - X.min(axis=<span class="number">0</span>) + <span class="number">1e-8</span>)</div>
+X_scaled = (X - X.min(<span class="number">0</span>)) / (X.max(<span class="number">0</span>) - X.min(<span class="number">0</span>) + <span class="number">1e-8</span>)
+
+<span class="comment"># Pairwise Euclidean distance matrix</span>
+diff = X[:, np.newaxis, :] - X[np.newaxis, :, :]  <span class="comment"># (N,1,D)-(1,N,D)</span>
+dist_matrix = np.sqrt((diff ** <span class="number">2</span>).sum(axis=-<span class="number">1</span>))  <span class="comment"># (N,N)</span></div>
 
-                <h3>3. Advanced Indexing & Boolean Masking</h3>
-                <div class="code-block"><span class="comment"># Boolean mask — filter outliers (3 sigma rule)</span>
+                <h3>2. Boolean Masking & Advanced Indexing</h3>
+                <div class="code-block"><span class="comment"># Remove outliers (3-sigma rule)</span>
 data = np.random.randn(<span class="number">10000</span>)
-clean = data[np.abs(data) < <span class="number">3</span>]
+clean = data[np.abs(data - data.mean()) < <span class="number">3</span> * data.std()]
 
-<span class="comment"># np.where — Conditional replacement</span>
+<span class="comment"># np.where — conditional replacement</span>
 preds = np.array([<span class="number">0.3</span>, <span class="number">0.7</span>, <span class="number">0.1</span>, <span class="number">0.9</span>])
-labels = np.where(preds > <span class="number">0.5</span>, <span class="number">1</span>, <span class="number">0</span>)  <span class="comment"># [0, 1, 0, 1]</span>
+labels = np.where(preds > <span class="number">0.5</span>, <span class="number">1</span>, <span class="number">0</span>)
 
-<span class="comment"># np.select — Multiple conditions</span>
+<span class="comment"># np.select — multiple conditions</span>
 conditions = [data < -<span class="number">1</span>, data > <span class="number">1</span>]
 choices = [<span class="string">'low'</span>, <span class="string">'high'</span>]
-category = np.select(conditions, choices, default=<span class="string">'mid'</span>)</div>
+category = np.select(conditions, choices, default=<span class="string">'mid'</span>)
 
-                <h3>4. np.einsum — One Function to Rule Them All</h3>
+<span class="comment"># Fancy indexing — sample without replacement</span>
+rng = np.random.default_rng(<span class="number">42</span>)
+idx = rng.choice(<span class="function">len</span>(X), size=<span class="number">500</span>, replace=<span class="keyword">False</span>)
+X_sample = X[idx]</div>
+
+                <h3>3. einsum for Complex Operations</h3>
                 <div class="code-block"><span class="comment"># Matrix multiply</span>
-C = np.einsum(<span class="string">'ik,kj->ij'</span>, A, B)  <span class="comment"># same as A @ B</span>
+C = np.einsum(<span class="string">'ik,kj->ij'</span>, A, B)
 
 <span class="comment"># Batch matrix multiply (deep learning)</span>
 batch_result = np.einsum(<span class="string">'bij,bjk->bik'</span>, batch_A, batch_B)
 
 <span class="comment"># Cosine similarity matrix</span>
-X = np.random.randn(<span class="number">100</span>, <span class="number">768</span>)
-sim = np.einsum(<span class="string">'ij,kj->ik'</span>, X, X)</div>
-
-                <h3>5. Memory-Mapped Files for Huge Arrays</h3>
+norms = np.linalg.norm(X, axis=<span class="number">1</span>, keepdims=<span class="keyword">True</span>)
+X_normed = X / norms
+sim = np.einsum(<span class="string">'ij,kj->ik'</span>, X_normed, X_normed)</div>
+
+                <h3>4. Implement Linear Regression from Scratch</h3>
+                <div class="code-block"><span class="comment"># Normal equation: w = (X^T X)^(-1) X^T y</span>
+<span class="comment"># Better: use lstsq for numerical stability</span>
+X_b = np.c_[np.ones((<span class="function">len</span>(X), <span class="number">1</span>)), X]  <span class="comment"># Add bias column</span>
+w, residuals, rank, sv = np.linalg.lstsq(X_b, y, rcond=<span class="keyword">None</span>)
+y_pred = X_b @ w
+mse = ((y - y_pred) ** <span class="number">2</span>).mean()
+r2 = <span class="number">1</span> - ((y - y_pred)**<span class="number">2</span>).sum() / ((y - y.mean())**<span class="number">2</span>).sum()</div>
+
+                <h3>5. Memory-Mapped Files for Huge Data</h3>
                 <div class="code-block"><span class="comment"># Process arrays larger than RAM</span>
 big = np.memmap(<span class="string">'huge.npy'</span>, dtype=np.float32,
     mode=<span class="string">'w+'</span>, shape=(<span class="number">1000000</span>, <span class="number">100</span>))
-subset = big[<span class="number">5000</span>:<span class="number">6000</span>]  <span class="comment"># Only reads 1000 rows from disk</span></div>
+subset = big[<span class="number">5000</span>:<span class="number">6000</span>]  <span class="comment"># Only reads 1000 rows from disk</span>
 
-                <h3>6. Structured Arrays</h3>
-                <div class="code-block"><span class="comment"># Mixed dtypes without Pandas overhead</span>
+<span class="comment"># Structured arrays — mixed types without Pandas</span>
 dt = np.dtype([(<span class="string">'name'</span>, <span class="string">'U10'</span>), (<span class="string">'age'</span>, <span class="string">'i4'</span>), (<span class="string">'score'</span>, <span class="string">'f8'</span>)])
-data = np.array([(<span class="string">'Alice'</span>, <span class="number">30</span>, <span class="number">95.5</span>), (<span class="string">'Bob'</span>, <span class="number">25</span>, <span class="number">87.3</span>)], dtype=dt)
-<span class="function">print</span>(data[<span class="string">'name'</span>])   <span class="comment"># ['Alice' 'Bob']</span>
-<span class="function">print</span>(data[<span class="string">'score'</span>].mean())  <span class="comment"># 91.4</span></div>
+data = np.array([(<span class="string">'Alice'</span>, <span class="number">30</span>, <span class="number">95.5</span>)], dtype=dt)</div>
+
+                <h3>6. Implement PCA from Scratch</h3>
+                <div class="code-block"><span class="keyword">def</span> <span class="function">pca</span>(X, n_components):
+    <span class="comment"># Center the data</span>
+    X_centered = X - X.mean(axis=<span class="number">0</span>)
+    <span class="comment"># Covariance matrix</span>
+    cov = X_centered.T @ X_centered / (<span class="function">len</span>(X) - <span class="number">1</span>)
+    <span class="comment"># Eigendecomposition</span>
+    eigenvalues, eigenvectors = np.linalg.eigh(cov)
+    <span class="comment"># Sort by largest eigenvalue</span>
+    idx = eigenvalues.argsort()[::-<span class="number">1</span>][:n_components]
+    components = eigenvectors[:, idx]
+    <span class="comment"># Project data</span>
+    X_pca = X_centered @ components
+    explained_var = eigenvalues[idx] / eigenvalues.sum()
+    <span class="keyword">return</span> X_pca, explained_var, components</div>
             </div>`,
-        interview: `
+            interview: `
             <div class="section">
                 <h2>🎯 NumPy Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: Why is NumPy faster than Python lists?</strong><p><strong>Answer:</strong> (1) <strong>Contiguous memory</strong> — cache-friendly. (2) <strong>Compiled C loops</strong>. (3) <strong>SIMD instructions</strong> — 4-8 floats simultaneously. Together: 50-100x speedup.</p></div>
-                <div class="interview-box"><strong>Q2: View vs copy — what's the difference?</strong><p><strong>Answer:</strong> Views share data (slicing creates views). Copies duplicate. <code>arr[::2]</code> = view, <code>arr[[0,2,4]]</code> (fancy indexing) = copy. Check with <code>np.shares_memory(a, b)</code>.</p></div>
-                <div class="interview-box"><strong>Q3: Explain broadcasting with example.</strong><p><strong>Answer:</strong> Compare shapes right-to-left. Dims must be equal or one must be 1. <code>(3,1) + (1,4) → (3,4)</code>. No memory copied — strides adjusted internally. Gotcha: <code>(3,) + (3,4)</code> fails — reshape to <code>(3,1)</code> first.</p></div>
-                <div class="interview-box"><strong>Q4: What is axis=0 vs axis=1?</strong><p><strong>Answer:</strong> axis=0 = operate down rows (collapses rows). axis=1 = across columns (collapses columns). For (100,5): <code>mean(axis=0)</code> → (5,) per feature. <code>mean(axis=1)</code> → (100,) per sample.</p></div>
-                <div class="interview-box"><strong>Q5: How to implement PCA with NumPy?</strong><p><strong>Answer:</strong> Center: <code>X_c = X - X.mean(0)</code>. Covariance: <code>cov = X_c.T @ X_c / (n-1)</code>. Eigendecompose: <code>vals, vecs = np.linalg.eigh(cov)</code>. Project: <code>X_pca = X_c @ vecs[:,-k:]</code>. Or use SVD directly.</p></div>
-                <div class="interview-box"><strong>Q6: np.dot vs @ vs einsum?</strong><p><strong>Answer:</strong> <code>np.dot</code>: confusing for 3D+. <code>@</code>: clean matrix multiply, broadcasts. <code>einsum</code>: most flexible. Use <code>@</code> for readability, <code>einsum</code> for complex ops.</p></div>
-                <div class="interview-box"><strong>Q7: How to handle NaN values?</strong><p><strong>Answer:</strong> <code>np.isnan(arr)</code> detects. <code>np.nanmean(arr)</code> — nan-safe aggregation. Gotcha: <code>np.nan == np.nan</code> is <code>False</code>! IEEE 754 standard.</p></div>
-                <div class="interview-box"><strong>Q8: Explain C-order vs Fortran-order performance.</strong><p><strong>Answer:</strong> C-order stores rows contiguously. Iterating along last axis is fastest (cache-friendly). For column-heavy ops, Fortran can be faster. NumPy defaults to C. Convert with <code>np.asfortranarray()</code>.</p></div>
+                <div class="interview-box"><strong>Q1: Why is NumPy faster than Python lists?</strong><p><strong>Answer:</strong> (1) Contiguous memory (cache-friendly). (2) Compiled C loops. (3) SIMD instructions. Together: 50-100x speedup.</p></div>
+                <div class="interview-box"><strong>Q2: View vs copy?</strong><p><strong>Answer:</strong> Slicing = view (shares data). Fancy indexing = copy. Check: <code>np.shares_memory(a, b)</code>. Views are dangerous: modifying view modifies original.</p></div>
+                <div class="interview-box"><strong>Q3: Broadcasting rules?</strong><p><strong>Answer:</strong> Right-to-left: dims must equal or one is 1. (3,1) + (1,4) → (3,4). No memory copied. Gotcha: (3,) + (3,4) fails — reshape to (3,1).</p></div>
+                <div class="interview-box"><strong>Q4: axis=0 vs axis=1?</strong><p><strong>Answer:</strong> axis=0: operate down rows (collapse rows). axis=1: across columns (collapse columns). (100,5): mean(axis=0)→(5,).  mean(axis=1)→(100,).</p></div>
+                <div class="interview-box"><strong>Q5: Implement PCA with NumPy?</strong><p><strong>Answer:</strong> Center, compute covariance, eigendecompose (eigh), sort by eigenvalue, project onto top-k eigenvectors. Or SVD directly.</p></div>
+                <div class="interview-box"><strong>Q6: np.dot vs @ vs einsum?</strong><p><strong>Answer:</strong> <code>@</code>: clean, broadcasts. <code>np.dot</code>: confusing for 3D+. <code>einsum</code>: most flexible, any tensor op. Use @ for readability.</p></div>
+                <div class="interview-box"><strong>Q7: How to handle NaN?</strong><p><strong>Answer:</strong> <code>np.isnan()</code> detects. <code>np.nanmean()</code> ignores NaN. Gotcha: <code>NaN == NaN</code> is False (IEEE 754).</p></div>
+                <div class="interview-box"><strong>Q8: C-order vs Fortran-order?</strong><p><strong>Answer:</strong> C: rows contiguous (default). Fortran: columns contiguous (LAPACK/BLAS). Iterate last axis for speed. Convert: <code>np.asfortranarray()</code>.</p></div>
             </div>`
-    },
+},
 
-    "pandas": {
-        concepts: `
+"pandas": {
+    concepts: `
             <div class="section">
                 <h2>🐼 Pandas — Complete Deep Dive</h2>
 
                 <div class="info-box">
                     <div class="box-title">⚡ DataFrame Internals — BlockManager</div>
-                    <div class="box-content">A DataFrame is NOT a 2D array. Internally, Pandas uses a <strong>BlockManager</strong> — columns of the same dtype are stored together in contiguous NumPy arrays (blocks). This is why <strong>column operations are fast</strong> (same block) but <strong>row iteration is slow</strong> (crosses blocks).</div>
+                    <div class="box-content">A DataFrame is NOT a 2D array. Uses <strong>BlockManager</strong> — same-dtype columns stored in contiguous blocks. <strong>Column operations: fast</strong> (same block). <strong>Row iteration: slow</strong> (crosses blocks). This is why <code>df.iterrows()</code> is 100x slower than vectorized ops.</div>
                 </div>
 
-                <h3>1. .loc vs .iloc — The Golden Rule</h3>
-                <div class="info-box">
-                    <div class="box-title">🎯 Never Confuse These</div>
-                    <div class="box-content"><strong>.loc</strong> = Label-based. Inclusive on both ends. <strong>.iloc</strong> = Integer position. Exclusive on end. <code>df.loc[0:5]</code> includes row 5. <code>df.iloc[0:5]</code> excludes row 5.</div>
+                <h3>1. The Golden Rules</h3>
+                <div class="callout warning">
+                    <div class="callout-title">⚠️ 5 Rules That Prevent 90% of Pandas Bugs</div>
+                    <strong>1.</strong> Use <code>.loc</code> (label) and <code>.iloc</code> (position) — never chain indexing.<br>
+                    <strong>2.</strong> <code>df.loc[0:5]</code> includes 5. <code>df.iloc[0:5]</code> excludes 5.<br>
+                    <strong>3.</strong> <code>df[mask]['col'] = x</code> creates copy. Use <code>df.loc[mask, 'col'] = x</code>.<br>
+                    <strong>4.</strong> <code>df2 = df</code> is NOT a copy. Use <code>df2 = df.copy()</code>.<br>
+                    <strong>5.</strong> Always check <code>df.dtypes</code> and <code>df.isna().sum()</code> first.
                 </div>
 
-                <h3>2. SettingWithCopyWarning — Finally Explained</h3>
-                <p>Chained indexing (<code>df[df.x > 0]['y'] = 5</code>) may create a temporary copy. Fix: <code>df.loc[df.x > 0, 'y'] = 5</code>. In Pandas 2.0+, Copy-on-Write mode eliminates this entirely.</p>
-
-                <h3>3. GroupBy Split-Apply-Combine</h3>
-                <p>The most powerful Pandas operation. (1) <strong>Split</strong> into groups, (2) <strong>Apply</strong> function to each, (3) <strong>Combine</strong> results. GroupBy is <strong>lazy</strong> — no computation until aggregation. Key methods: <code>agg()</code> (reduce), <code>transform()</code> (broadcast), <code>filter()</code> (keep/drop groups), <code>apply()</code> (flexible).</p>
+                <h3>2. GroupBy — Split-Apply-Combine</h3>
+                <p>Most powerful Pandas operation. (1) Split → (2) Apply function → (3) Combine results. GroupBy is <strong>lazy</strong> — no computation until aggregation. Key methods:</p>
+                <table>
+                    <tr><th>Method</th><th>Output Shape</th><th>Use Case</th></tr>
+                    <tr><td><code>agg()</code></td><td>Reduced (one row/group)</td><td>Sum, mean, count per group</td></tr>
+                    <tr><td><code>transform()</code></td><td>Same as input</td><td>Fill with group mean, normalize within group</td></tr>
+                    <tr><td><code>filter()</code></td><td>Subset of groups</td><td>Keep groups with N > 100</td></tr>
+                    <tr><td><code>apply()</code></td><td>Flexible</td><td>Custom function per group</td></tr>
+                </table>
 
-                <h3>4. Pandas 2.0 — Major Changes</h3>
+                <h3>3. Pandas 2.0 — Major Changes</h3>
                 <table>
                     <tr><th>Feature</th><th>Before (1.x)</th><th>After (2.0+)</th></tr>
-                    <tr><td>Backend</td><td>NumPy only</td><td>Apache Arrow backend option</td></tr>
-                    <tr><td>Copy semantics</td><td>Confusing</td><td>Copy-on-Write (explicit)</td></tr>
+                    <tr><td>Backend</td><td>NumPy only</td><td>Apache Arrow option</td></tr>
+                    <tr><td>Copy semantics</td><td>Confusing</td><td>Copy-on-Write</td></tr>
                     <tr><td>String dtype</td><td><code>object</code></td><td><code>string[pyarrow]</code> (faster)</td></tr>
                     <tr><td>Nullable types</td><td>NaN for everything</td><td>pd.NA (proper null)</td></tr>
-                    <tr><td>Index dtypes</td><td>int64 default</td><td>Matches data dtype</td></tr>
                 </table>
 
-                <h3>5. Polars vs Pandas</h3>
+                <h3>4. Polars vs Pandas</h3>
                 <table>
                     <tr><th>Feature</th><th>Pandas</th><th>Polars</th></tr>
-                    <tr><td>Speed</td><td>1x</td><td>5-50x faster (Rust)</td></tr>
-                    <tr><td>Memory</td><td>Higher</td><td>Lower (Arrow-native)</td></tr>
-                    <tr><td>Parallelism</td><td>Single-threaded</td><td>Multi-threaded by default</td></tr>
+                    <tr><td>Speed</td><td>1x</td><td>5-50x (Rust)</td></tr>
+                    <tr><td>Parallelism</td><td>Single-threaded</td><td>Multi-threaded auto</td></tr>
                     <tr><td>API</td><td>Eager</td><td>Lazy + Eager</td></tr>
-                    <tr><td>Ecosystem</td><td>Massive</td><td>Growing</td></tr>
-                    <tr><td>When to use</td><td>EDA, legacy projects</td><td>Large data, production pipelines</td></tr>
+                    <tr><td>Ecosystem</td><td>Massive</td><td>Growing fast</td></tr>
+                    <tr><td>Use when</td><td>EDA, small-med data, legacy</td><td>Large data, production</td></tr>
                 </table>
 
-                <h3>6. Method Chaining</h3>
-                <p>Fluent API style. More readable, no intermediate variables. Use <code>.assign()</code> instead of <code>df['col'] = ...</code>. Use <code>.pipe()</code> for custom functions. Use <code>.query()</code> for readable filtering.</p>
+                <h3>5. Merge/Join Patterns</h3>
+                <table>
+                    <tr><th>Method</th><th>How</th><th>When</th></tr>
+                    <tr><td><code>merge()</code></td><td>SQL-style joins on columns</td><td>Combine tables on shared keys</td></tr>
+                    <tr><td><code>join()</code></td><td>Joins on index</td><td>Index-based combining</td></tr>
+                    <tr><td><code>concat()</code></td><td>Stack along axis</td><td>Append rows/columns</td></tr>
+                </table>
+                <p><strong>Common pitfall:</strong> Merge produces more rows than expected = many-to-many join. Always check: <code>len(merged)</code> vs <code>len(left)</code>.</p>
 
-                <h3>7. Memory Optimization</h3>
+                <h3>6. Memory Optimization Strategies</h3>
                 <table>
-                    <tr><th>Strategy</th><th>Savings</th><th>When to Use</th></tr>
-                    <tr><td>Category dtype</td><td>90%+</td><td>Columns with few unique strings</td></tr>
+                    <tr><th>Strategy</th><th>Savings</th><th>When</th></tr>
+                    <tr><td>Category dtype</td><td>90%+</td><td>Few unique strings</td></tr>
                     <tr><td>Downcast numerics</td><td>50-75%</td><td>int64 → int32/int16</td></tr>
-                    <tr><td>Sparse arrays</td><td>80%+</td><td>Columns mostly zeros/NaN</td></tr>
-                    <tr><td>PyArrow backend</td><td>30-50%</td><td>String-heavy DataFrames</td></tr>
+                    <tr><td>Sparse arrays</td><td>80%+</td><td>Mostly zeros/NaN</td></tr>
+                    <tr><td>PyArrow backend</td><td>30-50%</td><td>String-heavy data</td></tr>
+                    <tr><td>Read only needed columns</td><td>Variable</td><td><code>usecols=['a','b']</code></td></tr>
                 </table>
 
-                <h3>8. Window Functions</h3>
-                <p><code>.rolling(N)</code> — fixed-size sliding window. <code>.expanding()</code> — cumulative from start. <code>.ewm(span=N)</code> — exponentially weighted. All support <code>.mean()</code>, <code>.std()</code>, <code>.apply(func)</code>. Critical for time series feature engineering: lag features, moving averages, volatility.</p>
+                <h3>7. Window Functions for Time Series</h3>
+                <p><code>.rolling(N)</code>: fixed sliding window. <code>.expanding()</code>: cumulative. <code>.ewm(span=N)</code>: exponentially weighted. All support <code>.mean()</code>, <code>.std()</code>, <code>.apply()</code>. Essential for: lag features, moving averages, volatility, Bollinger bands.</p>
+
+                <h3>8. Pivot Tables & Crosstab</h3>
+                <p><code>df.pivot_table(values, index, columns, aggfunc)</code> — summarize data by two categorical dimensions. <code>pd.crosstab()</code> — frequency table of two categorical columns. Essential for EDA and business reporting.</p>
+
+                <h3>9. Method Chaining Pattern</h3>
+                <p>Fluent API: <code>.assign()</code> instead of <code>df['col']=</code>. <code>.pipe(func)</code> for custom. <code>.query('col > 5')</code> for readable filters. No intermediate variables = cleaner, reproducible pipelines.</p>
             </div>`,
         code: `
             <div class="section">
-                <h2>💻 Pandas Code Examples</h2>
+                <h2>💻 Pandas Project Code</h2>
 
-                <h3>1. Method Chaining — Production Pattern</h3>
+                <h3>1. Complete Data Loading & Cleaning Pipeline</h3>
                 <div class="code-block"><span class="keyword">import</span> pandas <span class="keyword">as</span> pd
+<span class="keyword">import</span> numpy <span class="keyword">as</span> np
 
-result = (
-    pd.read_csv(<span class="string">'sales.csv'</span>)
-    .rename(columns=<span class="keyword">str</span>.lower)
-    .assign(
-        date=<span class="keyword">lambda</span> df: pd.to_datetime(df[<span class="string">'date'</span>]),
-        revenue=<span class="keyword">lambda</span> df: df[<span class="string">'price'</span>] * df[<span class="string">'quantity'</span>]
+<span class="keyword">def</span> <span class="function">load_and_clean</span>(path, config):
+    <span class="string">"""Production data loading pipeline."""</span>
+    df = (
+        pd.read_csv(path, usecols=config[<span class="string">'columns'</span>],
+            dtype=config.get(<span class="string">'dtypes'</span>, <span class="keyword">None</span>),
+            parse_dates=config.get(<span class="string">'date_cols'</span>, []))
+        .rename(columns=<span class="keyword">str</span>.lower)
+        .drop_duplicates()
+        .assign(
+            date=<span class="keyword">lambda</span> df: pd.to_datetime(df[<span class="string">'date'</span>]),
+            revenue=<span class="keyword">lambda</span> df: df[<span class="string">'price'</span>] * df[<span class="string">'qty'</span>]
+        )
+        .query(<span class="string">'revenue > 0'</span>)
+        .pipe(optimize_dtypes)
     )
-    .query(<span class="string">'revenue > 100'</span>)
-    .groupby(<span class="string">'month'</span>)
-    .agg({<span class="string">'revenue'</span>: [<span class="string">'sum'</span>, <span class="string">'mean'</span>, <span class="string">'count'</span>]})
-)</div>
+    <span class="keyword">return</span> df</div>
 
                 <h3>2. GroupBy — Beyond Basics</h3>
-                <div class="code-block"><span class="comment"># Named aggregation (clean column names)</span>
+                <div class="code-block"><span class="comment"># Named aggregation</span>
 summary = df.groupby(<span class="string">'category'</span>).agg(
     total=(<span class="string">'revenue'</span>, <span class="string">'sum'</span>),
     avg_price=(<span class="string">'price'</span>, <span class="string">'mean'</span>),
-    n_orders=(<span class="string">'order_id'</span>, <span class="string">'nunique'</span>)
+    n_orders=(<span class="string">'order_id'</span>, <span class="string">'nunique'</span>),
+    top_product=(<span class="string">'product'</span>, <span class="keyword">lambda</span> x: x.value_counts().index[<span class="number">0</span>])
 )
 
-<span class="comment"># Transform — broadcast back to original shape</span>
+<span class="comment"># Transform — normalize within groups</span>
 df[<span class="string">'pct_of_group'</span>] = df.groupby(<span class="string">'cat'</span>)[<span class="string">'rev'</span>].transform(
     <span class="keyword">lambda</span> x: x / x.sum() * <span class="number">100</span>
-)</div>
+)
 
-                <h3>3. Merge Patterns</h3>
-                <div class="code-block"><span class="comment"># LEFT JOIN with indicator</span>
-merged = pd.merge(orders, customers, on=<span class="string">'id'</span>,
-    how=<span class="string">'left'</span>, indicator=<span class="keyword">True</span>)
-orphans = merged[merged[<span class="string">'_merge'</span>] == <span class="string">'left_only'</span>]</div>
-
-                <h3>4. Time Series Operations</h3>
-                <div class="code-block"><span class="comment"># Resample, rolling, lag features</span>
-daily = df.set_index(<span class="string">'date'</span>)
-weekly = daily[<span class="string">'revenue'</span>].resample(<span class="string">'W'</span>).sum()
-df[<span class="string">'ma_7'</span>] = df[<span class="string">'revenue'</span>].rolling(<span class="number">7</span>).mean()
-df[<span class="string">'lag_1'</span>] = df[<span class="string">'revenue'</span>].shift(<span class="number">1</span>)
-df[<span class="string">'pct_chg'</span>] = df[<span class="string">'revenue'</span>].pct_change()</div>
-
-                <h3>5. Memory Optimization</h3>
+<span class="comment"># Filter — keep only groups with enough data</span>
+df_filtered = df.groupby(<span class="string">'user'</span>).filter(<span class="keyword">lambda</span> x: <span class="function">len</span>(x) >= <span class="number">5</span>)</div>
+
+                <h3>3. Time Series Feature Engineering</h3>
+                <div class="code-block"><span class="keyword">def</span> <span class="function">create_time_features</span>(df, date_col, target_col):
+    <span class="string">"""Generate time series features for ML."""</span>
+    df = df.sort_values(date_col).copy()
+    
+    <span class="comment"># Lag features</span>
+    <span class="keyword">for</span> lag <span class="keyword">in</span> [<span class="number">1</span>, <span class="number">3</span>, <span class="number">7</span>, <span class="number">14</span>, <span class="number">30</span>]:
+        df[<span class="string">f'lag_{lag}'</span>] = df[target_col].shift(lag)
+    
+    <span class="comment"># Rolling statistics</span>
+    <span class="keyword">for</span> window <span class="keyword">in</span> [<span class="number">7</span>, <span class="number">14</span>, <span class="number">30</span>]:
+        df[<span class="string">f'rolling_mean_{window}'</span>] = df[target_col].rolling(window).mean()
+        df[<span class="string">f'rolling_std_{window}'</span>] = df[target_col].rolling(window).std()
+    
+    <span class="comment"># Date features</span>
+    df[<span class="string">'dayofweek'</span>] = df[date_col].dt.dayofweek
+    df[<span class="string">'month'</span>] = df[date_col].dt.month
+    df[<span class="string">'is_weekend'</span>] = df[<span class="string">'dayofweek'</span>].isin([<span class="number">5</span>, <span class="number">6</span>]).astype(<span class="keyword">int</span>)
+    
+    <span class="comment"># Percentage change</span>
+    df[<span class="string">'pct_change'</span>] = df[target_col].pct_change()
+    
+    <span class="keyword">return</span> df</div>
+
+                <h3>4. Memory Optimization</h3>
                 <div class="code-block"><span class="keyword">def</span> <span class="function">optimize_dtypes</span>(df):
+    <span class="string">"""Reduce DataFrame memory by 60-80%."""</span>
+    start_mem = df.memory_usage(deep=<span class="keyword">True</span>).sum() / <span class="number">1024</span>**<span class="number">2</span>
+    
     <span class="keyword">for</span> col <span class="keyword">in</span> df.select_dtypes([<span class="string">'int'</span>]).columns:
         df[col] = pd.to_numeric(df[col], downcast=<span class="string">'integer'</span>)
     <span class="keyword">for</span> col <span class="keyword">in</span> df.select_dtypes([<span class="string">'float'</span>]).columns:
         df[col] = pd.to_numeric(df[col], downcast=<span class="string">'float'</span>)
     <span class="keyword">for</span> col <span class="keyword">in</span> df.select_dtypes([<span class="string">'object'</span>]).columns:
-        <span class="keyword">if</span> df[col].nunique() / len(df) < <span class="number">0.5</span>:
+        <span class="keyword">if</span> df[col].nunique() / <span class="function">len</span>(df) < <span class="number">0.5</span>:
             df[col] = df[col].astype(<span class="string">'category'</span>)
-    <span class="keyword">return</span> df
-<span class="comment"># 800 MB → 200 MB typical savings</span></div>
+    
+    end_mem = df.memory_usage(deep=<span class="keyword">True</span>).sum() / <span class="number">1024</span>**<span class="number">2</span>
+    <span class="function">print</span>(<span class="string">f"Memory: {start_mem:.1f}MB → {end_mem:.1f}MB ({100*(1-end_mem/start_mem):.0f}% reduction)"</span>)
+    <span class="keyword">return</span> df</div>
+
+                <h3>5. Merge with Validation</h3>
+                <div class="code-block"><span class="comment"># LEFT JOIN with indicator for debugging</span>
+merged = pd.merge(orders, customers, on=<span class="string">'customer_id'</span>,
+    how=<span class="string">'left'</span>, indicator=<span class="keyword">True</span>, validate=<span class="string">'many_to_one'</span>)
+
+<span class="comment"># Check for orphan records</span>
+orphans = merged[merged[<span class="string">'_merge'</span>] == <span class="string">'left_only'</span>]
+<span class="function">print</span>(<span class="string">f"Orphan orders: {len(orphans)}"</span>)
+
+<span class="comment"># Multi-key merge</span>
+result = pd.merge(df1, df2, on=[<span class="string">'date'</span>, <span class="string">'product_id'</span>],
+    how=<span class="string">'inner'</span>, suffixes=(<span class="string">'_actual'</span>, <span class="string">'_predicted'</span>))</div>
+
+                <h3>6. Pivot Table for Business Reporting</h3>
+                <div class="code-block"><span class="comment"># Revenue by month and category</span>
+pivot = df.pivot_table(
+    values=<span class="string">'revenue'</span>,
+    index=df[<span class="string">'date'</span>].dt.to_period(<span class="string">'M'</span>),
+    columns=<span class="string">'category'</span>,
+    aggfunc=[<span class="string">'sum'</span>, <span class="string">'count'</span>],
+    margins=<span class="keyword">True</span>  <span class="comment"># Add totals row/column</span>
+)
+
+<span class="comment"># Crosstab — frequency of two categorical columns</span>
+ct = pd.crosstab(df[<span class="string">'region'</span>], df[<span class="string">'product'</span>], normalize=<span class="string">'index'</span>)</div>
             </div>`,
-        interview: `
+            interview: `
             <div class="section">
                 <h2>🎯 Pandas Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: SettingWithCopyWarning — cause and fix?</strong><p><strong>Answer:</strong> Chained indexing may modify a copy. Fix: <code>df.loc[mask, 'col'] = val</code>. Pandas 2.0+ Copy-on-Write: <code>pd.options.mode.copy_on_write = True</code>.</p></div>
-                <div class="interview-box"><strong>Q2: merge vs join vs concat?</strong><p><strong>Answer:</strong> <code>merge()</code>: SQL joins on columns. <code>join()</code>: joins on index. <code>concat()</code>: stack along axis. Use merge for column joins, concat for stacking.</p></div>
-                <div class="interview-box"><strong>Q3: apply vs map vs transform?</strong><p><strong>Answer:</strong> <code>map()</code>: Series element-wise. <code>apply()</code>: rows/columns. <code>transform()</code>: same shape output. All are slow — prefer vectorized operations.</p></div>
-                <div class="interview-box"><strong>Q4: GroupBy transform vs agg?</strong><p><strong>Answer:</strong> <code>agg()</code> reduces — one value per group. <code>transform()</code> broadcasts — same shape as input. Use transform for "fill with group mean" patterns.</p></div>
-                <div class="interview-box"><strong>Q5: What is MultiIndex?</strong><p><strong>Answer:</strong> Hierarchical indexing — multiple levels. Use for pivot tables, panel data (entity + time). Access with <code>.xs()</code> or tuple: <code>df.loc[('A', 2023)]</code>. Convert back with <code>.reset_index()</code>.</p></div>
-                <div class="interview-box"><strong>Q6: Pandas vs Polars — when to choose?</strong><p><strong>Answer:</strong> Pandas: mature ecosystem, EDA, small-medium data. Polars: 5-50x faster (Rust), multi-threaded, lazy evaluation, better for large data and production pipelines. Polars for new projects with big data.</p></div>
-                <div class="interview-box"><strong>Q7: How to handle missing data in production?</strong><p><strong>Answer:</strong> (1) <code>dropna(thresh=N)</code>, (2) <code>fillna(method='ffill')</code> for time series, (3) <code>fillna(df.median())</code> for ML, (4) <code>interpolate(method='time')</code>. Always check <code>df.isna().sum()</code> first.</p></div>
+                <div class="interview-box"><strong>Q1: SettingWithCopyWarning?</strong><p><strong>Answer:</strong> Chained indexing modifies copy. Fix: <code>df.loc[mask, 'col'] = val</code>. Pandas 2.0+ Copy-on-Write eliminates this.</p></div>
+                <div class="interview-box"><strong>Q2: merge vs join vs concat?</strong><p><strong>Answer:</strong> merge: SQL joins on columns. join: on index. concat: stack along axis. Use merge for column joins, concat for appending.</p></div>
+                <div class="interview-box"><strong>Q3: apply vs map vs transform?</strong><p><strong>Answer:</strong> map: Series element-wise. apply: rows/columns. transform: same-shape output. All slow — prefer vectorized when possible.</p></div>
+                <div class="interview-box"><strong>Q4: GroupBy transform vs agg?</strong><p><strong>Answer:</strong> agg reduces. transform broadcasts back. Use transform for "fill with group mean" or "normalize within group" patterns.</p></div>
+                <div class="interview-box"><strong>Q5: How to handle missing data?</strong><p><strong>Answer:</strong> (1) <code>dropna(thresh=N)</code>, (2) <code>fillna(method='ffill')</code> for time series, (3) <code>fillna(df.median())</code> for ML, (4) <code>interpolate(method='time')</code>. Always check <code>df.isna().sum()</code> first.</p></div>
+                <div class="interview-box"><strong>Q6: Pandas vs Polars?</strong><p><strong>Answer:</strong> Polars: 5-50x faster (Rust), multi-threaded, lazy eval. Pandas: mature ecosystem, wide compatibility. New projects with big data → Polars.</p></div>
+                <div class="interview-box"><strong>Q7: What is MultiIndex?</strong><p><strong>Answer:</strong> Hierarchical indexing. Use for pivot tables, panel data. Access with <code>.xs()</code> or tuple. Reset with <code>.reset_index()</code>.</p></div>
+                <div class="interview-box"><strong>Q8: How to optimize a 5GB DataFrame?</strong><p><strong>Answer:</strong> (1) Read only needed columns. (2) Downcast dtypes. (3) Category for strings. (4) Sparse for zeros. (5) PyArrow backend. (6) Process in chunks. Can reduce 5GB to 1GB.</p></div>
             </div>`
-    },
+},
 
 "visualization": {
     concepts: `
@@ -548,7 +807,7 @@ df[<span class="string">'pct_chg'</span>] = df[<span class="string">'revenue'</s
 
                 <div class="info-box">
                     <div class="box-title">⚡ The Grammar of Graphics</div>
-                    <div class="box-content">Leland Wilkinson's framework: <strong>Data</strong> (what to plot) + <strong>Aesthetics</strong> (x, y, color, size) + <strong>Geometry</strong> (bars, lines, points) + <strong>Statistics</strong> (binning, smoothing) + <strong>Coordinates</strong> (cartesian, polar) + <strong>Facets</strong> (subplots). Every chart follows this.</div>
+                    <div class="box-content"><strong>Data</strong> + <strong>Aesthetics</strong> (x, y, color, size) + <strong>Geometry</strong> (bars, lines, points) + <strong>Statistics</strong> (binning, smoothing) + <strong>Coordinates</strong> (cartesian, polar) + <strong>Facets</strong> (subplots). Every chart = this framework.</div>
                 </div>
 
                 <h3>1. Choosing the Right Chart</h3>
@@ -558,104 +817,159 @@ df[<span class="string">'pct_chg'</span>] = df[<span class="string">'revenue'</s
                     <tr><td>Relationship?</td><td>Scatter, Hexbin, Regression</td><td>Seaborn/Plotly</td></tr>
                     <tr><td>Comparison?</td><td>Bar, Grouped bar, Violin</td><td>Seaborn</td></tr>
                     <tr><td>Trend over time?</td><td>Line, Area chart</td><td>Plotly/Matplotlib</td></tr>
-                    <tr><td>Correlation matrix?</td><td>Heatmap</td><td>Seaborn</td></tr>
+                    <tr><td>Correlation?</td><td>Heatmap</td><td>Seaborn</td></tr>
                     <tr><td>Part of whole?</td><td>Pie, Treemap, Sunburst</td><td>Plotly</td></tr>
                     <tr><td>Geographic?</td><td>Choropleth, Mapbox</td><td>Plotly/Folium</td></tr>
-                    <tr><td>High-dimensional?</td><td>Parallel coords, UMAP</td><td>Plotly/UMAP</td></tr>
+                    <tr><td>High-dimensional?</td><td>Parallel coords, UMAP</td><td>Plotly</td></tr>
+                    <tr><td>ML results?</td><td>Confusion matrix, ROC, SHAP</td><td>Seaborn/SHAP</td></tr>
                 </table>
 
                 <h3>2. Matplotlib Architecture</h3>
-                <p>Three layers: <strong>Backend</strong> (rendering), <strong>Artist</strong> (everything drawn), <strong>Scripting</strong> (pyplot). Figure contains Axes (subplots). Each Axes has Axis objects. Always prefer OO API (<code>fig, ax = plt.subplots()</code>) over pyplot for production.</p>
-                <p><strong>rcParams:</strong> Control global defaults. Set <code>plt.rcParams['font.size'] = 14</code> once. Create a style file for consistency across all project figures. Use <code>plt.style.use('seaborn-v0_8-whitegrid')</code> for clean defaults.</p>
+                <p>Three layers: <strong>Backend</strong> (rendering), <strong>Artist</strong> (everything drawn), <strong>Scripting</strong> (pyplot). Figure → Axes (subplots) → Axis objects. Always use OO API: <code>fig, ax = plt.subplots()</code>.</p>
+                <p><strong>rcParams:</strong> Global defaults. <code>plt.rcParams['font.size'] = 14</code>. Create style files for project consistency. <code>plt.style.use('seaborn-v0_8-whitegrid')</code>.</p>
 
                 <h3>3. Color Theory for Data</h3>
                 <div class="callout tip">
-                    <div class="callout-title">💡 Color Best Practices</div>
-                    <strong>Sequential:</strong> viridis, plasma (one variable, low→high).<br>
-                    <strong>Diverging:</strong> RdBu, coolwarm (center point matters).<br>
+                    <div class="callout-title">💡 Color Guide</div>
+                    <strong>Sequential:</strong> viridis, plasma (low→high).<br>
+                    <strong>Diverging:</strong> RdBu, coolwarm (center matters).<br>
                     <strong>Categorical:</strong> Set2, tab10 (distinct groups).<br>
-                    Never use rainbow/jet — bad for colorblind users and perceptually non-uniform.
+                    Never use rainbow/jet — bad for colorblind, perceptually non-uniform.
                 </div>
 
                 <h3>4. Seaborn — Statistical Visualization</h3>
-                <p>Three API levels: <strong>Figure-level</strong> (relplot, catplot, displot — own figure), <strong>Axes-level</strong> (scatterplot, boxplot — on existing axes), <strong>Objects API</strong> (0.12+, composable). Seaborn auto-computes statistics (regression lines, confidence intervals, density estimates).</p>
+                <p>Three API levels: <strong>Figure-level</strong> (relplot, catplot, displot), <strong>Axes-level</strong> (scatterplot, boxplot), <strong>Objects API</strong> (0.12+). Auto-computes regression lines, confidence intervals, density estimates.</p>
 
                 <h3>5. Plotly — Interactive Dashboards</h3>
-                <p>JavaScript-powered charts with hover, zoom, selection. <code>plotly.express</code> for quick plots, <code>plotly.graph_objects</code> for full control. Integrates with <strong>Dash</strong> for production dashboards. Supports 3D, maps, and animations. Export to HTML for sharing.</p>
+                <p>JavaScript-powered: hover, zoom, selection. <code>plotly.express</code> for quick plots. <code>plotly.graph_objects</code> for control. Integrates with <strong>Dash</strong> for production dashboards. Supports 3D, maps, animations. Export to HTML.</p>
 
-                <h3>6. Common Mistakes</h3>
+                <h3>6. Visualization for ML Projects</h3>
+                <table>
+                    <tr><th>What to Visualize</th><th>Chart</th><th>Why</th></tr>
+                    <tr><td>Class distribution</td><td>Bar chart</td><td>Detect imbalance</td></tr>
+                    <tr><td>Feature distributions</td><td>Histogram/KDE grid</td><td>Find skew, outliers</td></tr>
+                    <tr><td>Feature correlations</td><td>Heatmap (triangular)</td><td>Multicollinearity</td></tr>
+                    <tr><td>Training curves</td><td>Line plot (loss/acc vs epoch)</td><td>Detect overfit/underfit</td></tr>
+                    <tr><td>Model comparison</td><td>Box plot of CV scores</td><td>Compare variance</td></tr>
+                    <tr><td>Confusion matrix</td><td>Annotated heatmap</td><td>Error analysis</td></tr>
+                    <tr><td>ROC curve</td><td>Line plot + AUC</td><td>Threshold selection</td></tr>
+                    <tr><td>Feature importance</td><td>Horizontal bar</td><td>Model interpretation</td></tr>
+                    <tr><td>SHAP values</td><td>Beeswarm/waterfall</td><td>Individual predictions</td></tr>
+                </table>
+
+                <h3>7. Common Mistakes</h3>
                 <ul>
                     <li>Truncated y-axis exaggerating differences</li>
-                    <li>Pie charts for >5 categories</li>
-                    <li>Rainbow colormaps (use viridis/cividis)</li>
-                    <li>Overplotting — use alpha, hexbin, or KDE</li>
-                    <li>Missing labels, titles, and units</li>
-                    <li>3D charts without rotation (often misleading)</li>
+                    <li>Pie charts for >5 categories — use bar instead</li>
+                    <li>Rainbow/jet colormap — use viridis/cividis</li>
+                    <li>Overplotting — use alpha, hexbin, KDE, or datashader</li>
+                    <li>Missing labels, titles, units</li>
+                    <li>3D charts without interaction — often misleading</li>
+                    <li>Not saving high-DPI figures — use <code>dpi=300</code></li>
                 </ul>
             </div>`,
         code: `
             <div class="section">
-                <h2>💻 Visualization Code Examples</h2>
+                <h2>💻 Visualization Project Code</h2>
 
-                <h3>1. Matplotlib — Publication Quality</h3>
+                <h3>1. Publication-Quality Multi-Subplot Figure</h3>
                 <div class="code-block"><span class="keyword">import</span> matplotlib.pyplot <span class="keyword">as</span> plt
 <span class="keyword">import</span> numpy <span class="keyword">as</span> np
 
-<span class="comment"># Professional multi-subplot figure</span>
-fig, axes = plt.subplots(<span class="number">1</span>, <span class="number">3</span>, figsize=(<span class="number">15</span>, <span class="number">5</span>))
+<span class="comment"># Professional style setup</span>
+plt.rcParams.update({
+    <span class="string">'font.size'</span>: <span class="number">12</span>, <span class="string">'axes.titlesize'</span>: <span class="number">14</span>,
+    <span class="string">'figure.facecolor'</span>: <span class="string">'white'</span>,
+    <span class="string">'axes.spines.top'</span>: <span class="keyword">False</span>, <span class="string">'axes.spines.right'</span>: <span class="keyword">False</span>
+})
+
+fig, axes = plt.subplots(<span class="number">2</span>, <span class="number">2</span>, figsize=(<span class="number">14</span>, <span class="number">10</span>))
 
-<span class="comment"># Distribution with mean line</span>
-data = np.random.randn(<span class="number">1000</span>)
-axes[<span class="number">0</span>].hist(data, bins=<span class="number">30</span>, alpha=<span class="number">0.7</span>, color=<span class="string">'steelblue'</span>, edgecolor=<span class="string">'white'</span>)
-axes[<span class="number">0</span>].axvline(data.mean(), color=<span class="string">'red'</span>, linestyle=<span class="string">'--'</span>, label=<span class="string">'Mean'</span>)
+<span class="comment"># Distribution</span>
+axes[<span class="number">0</span>,<span class="number">0</span>].hist(data, bins=<span class="number">30</span>, alpha=<span class="number">0.7</span>, color=<span class="string">'steelblue'</span>, edgecolor=<span class="string">'white'</span>)
+axes[<span class="number">0</span>,<span class="number">0</span>].axvline(data.mean(), color=<span class="string">'red'</span>, linestyle=<span class="string">'--'</span>, label=<span class="string">'Mean'</span>)
+axes[<span class="number">0</span>,<span class="number">0</span>].set_title(<span class="string">'Distribution'</span>)
 
 <span class="comment"># Scatter with colormap</span>
-x, y = np.random.randn(<span class="number">2</span>, <span class="number">100</span>)
-scatter = axes[<span class="number">1</span>].scatter(x, y, c=y, cmap=<span class="string">'viridis'</span>, alpha=<span class="number">0.7</span>)
-plt.colorbar(scatter, ax=axes[<span class="number">1</span>])
+sc = axes[<span class="number">0</span>,<span class="number">1</span>].scatter(x, y, c=z, cmap=<span class="string">'viridis'</span>, alpha=<span class="number">0.7</span>)
+plt.colorbar(sc, ax=axes[<span class="number">0</span>,<span class="number">1</span>])
 
 <span class="comment"># Line with confidence interval</span>
-x = np.linspace(<span class="number">0</span>, <span class="number">10</span>, <span class="number">100</span>)
-axes[<span class="number">2</span>].plot(x, np.sin(x), <span class="string">'b-'</span>, linewidth=<span class="number">2</span>)
-axes[<span class="number">2</span>].fill_between(x, np.sin(x)-<span class="number">0.3</span>, np.sin(x)+<span class="number">0.3</span>, alpha=<span class="number">0.2</span>)
+axes[<span class="number">1</span>,<span class="number">0</span>].plot(x, y_mean, <span class="string">'b-'</span>, linewidth=<span class="number">2</span>)
+axes[<span class="number">1</span>,<span class="number">0</span>].fill_between(x, y_mean-y_std, y_mean+y_std, alpha=<span class="number">0.2</span>)
+
+<span class="comment"># Bar with error bars</span>
+axes[<span class="number">1</span>,<span class="number">1</span>].bar(categories, values, yerr=errors, capsize=<span class="number">5</span>, color=<span class="string">'coral'</span>)
 
 plt.tight_layout()
 plt.savefig(<span class="string">'figure.png'</span>, dpi=<span class="number">300</span>, bbox_inches=<span class="string">'tight'</span>)</div>
 
-                <h3>2. Seaborn — Statistical Plots</h3>
+                <h3>2. ML Evaluation Dashboard</h3>
                 <div class="code-block"><span class="keyword">import</span> seaborn <span class="keyword">as</span> sns
+<span class="keyword">from</span> sklearn.metrics <span class="keyword">import</span> confusion_matrix, roc_curve, auc
 
-<span class="comment"># Correlation heatmap (upper triangle only)</span>
-fig, ax = plt.subplots(figsize=(<span class="number">10</span>, <span class="number">8</span>))
-mask = np.triu(np.ones_like(df.corr(), dtype=<span class="keyword">bool</span>))
-sns.heatmap(df.corr(), mask=mask, annot=<span class="keyword">True</span>,
-    fmt=<span class="string">'.2f'</span>, cmap=<span class="string">'RdBu_r'</span>, center=<span class="number">0</span>)
+<span class="keyword">def</span> <span class="function">plot_model_evaluation</span>(y_true, y_pred, y_proba):
+    fig, axes = plt.subplots(<span class="number">1</span>, <span class="number">3</span>, figsize=(<span class="number">18</span>, <span class="number">5</span>))
+    
+    <span class="comment"># Confusion Matrix</span>
+    cm = confusion_matrix(y_true, y_pred)
+    sns.heatmap(cm, annot=<span class="keyword">True</span>, fmt=<span class="string">'d'</span>, cmap=<span class="string">'Blues'</span>, ax=axes[<span class="number">0</span>])
+    axes[<span class="number">0</span>].set_title(<span class="string">'Confusion Matrix'</span>)
+    
+    <span class="comment"># ROC Curve</span>
+    fpr, tpr, _ = roc_curve(y_true, y_proba)
+    axes[<span class="number">1</span>].plot(fpr, tpr, label=<span class="string">f'AUC={auc(fpr,tpr):.3f}'</span>)
+    axes[<span class="number">1</span>].plot([<span class="number">0</span>,<span class="number">1</span>], [<span class="number">0</span>,<span class="number">1</span>], <span class="string">'k--'</span>)
+    axes[<span class="number">1</span>].set_title(<span class="string">'ROC Curve'</span>)
+    axes[<span class="number">1</span>].legend()
+    
+    <span class="comment"># Feature Importance</span>
+    importance = model.feature_importances_
+    idx = importance.argsort()
+    axes[<span class="number">2</span>].barh(feature_names[idx], importance[idx])
+    axes[<span class="number">2</span>].set_title(<span class="string">'Feature Importance'</span>)
+    
+    plt.tight_layout()</div>
 
-<span class="comment"># Pair plot — all relationships at once</span>
-sns.pairplot(df, hue=<span class="string">'target'</span>, diag_kind=<span class="string">'kde'</span>)
+                <h3>3. Seaborn — EDA in One Call</h3>
+                <div class="code-block"><span class="comment"># Pair plot — all relationships at once</span>
+sns.pairplot(df, hue=<span class="string">'target'</span>, diag_kind=<span class="string">'kde'</span>,
+    plot_kws={<span class="string">'alpha'</span>: <span class="number">0.6</span>})
 
-<span class="comment"># Violin + strip — distribution + individual points</span>
-sns.violinplot(x=<span class="string">'cat'</span>, y=<span class="string">'val'</span>, data=df, inner=<span class="keyword">None</span>, alpha=<span class="number">0.3</span>)
-sns.stripplot(x=<span class="string">'cat'</span>, y=<span class="string">'val'</span>, data=df, size=<span class="number">3</span>, jitter=<span class="keyword">True</span>)</div>
+<span class="comment"># Correlation heatmap (upper triangle)</span>
+mask = np.triu(np.ones_like(df.corr(), dtype=<span class="keyword">bool</span>))
+sns.heatmap(df.corr(), mask=mask, annot=<span class="keyword">True</span>,
+    fmt=<span class="string">'.2f'</span>, cmap=<span class="string">'RdBu_r'</span>, center=<span class="number">0</span>)</div>
 
-                <h3>3. Plotly — Interactive</h3>
+                <h3>4. Plotly — Interactive Dashboard</h3>
                 <div class="code-block"><span class="keyword">import</span> plotly.express <span class="keyword">as</span> px
+<span class="keyword">from</span> plotly.subplots <span class="keyword">import</span> make_subplots
+<span class="keyword">import</span> plotly.graph_objects <span class="keyword">as</span> go
 
-<span class="comment"># Animated scatter (like Gapminder)</span>
+<span class="comment"># Animated scatter (Gapminder style)</span>
 fig = px.scatter(df, x=<span class="string">'gdp'</span>, y=<span class="string">'life_exp'</span>,
     animation_frame=<span class="string">'year'</span>, size=<span class="string">'pop'</span>,
     color=<span class="string">'continent'</span>, hover_name=<span class="string">'country'</span>)
-fig.show()</div>
+
+<span class="comment"># Training curves dashboard</span>
+fig = make_subplots(rows=<span class="number">1</span>, cols=<span class="number">2</span>,
+    subplot_titles=[<span class="string">'Loss'</span>, <span class="string">'Accuracy'</span>])
+fig.add_trace(go.Scatter(y=train_loss, name=<span class="string">'Train Loss'</span>), row=<span class="number">1</span>, col=<span class="number">1</span>)
+fig.add_trace(go.Scatter(y=val_loss, name=<span class="string">'Val Loss'</span>), row=<span class="number">1</span>, col=<span class="number">1</span>)
+fig.add_trace(go.Scatter(y=train_acc, name=<span class="string">'Train Acc'</span>), row=<span class="number">1</span>, col=<span class="number">2</span>)
+fig.add_trace(go.Scatter(y=val_acc, name=<span class="string">'Val Acc'</span>), row=<span class="number">1</span>, col=<span class="number">2</span>)
+fig.write_html(<span class="string">'training_dashboard.html'</span>)</div>
             </div>`,
             interview: `
             <div class="section">
                 <h2>🎯 Visualization Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: When to use Matplotlib vs Seaborn vs Plotly?</strong><p><strong>Answer:</strong> <strong>Matplotlib:</strong> full control, publication figures. <strong>Seaborn:</strong> statistical EDA, beautiful defaults. <strong>Plotly:</strong> interactive dashboards, stakeholders. Rule: Seaborn for EDA, Matplotlib for papers, Plotly for stakeholders.</p></div>
-                <div class="interview-box"><strong>Q2: How to visualize high-dimensional data?</strong><p><strong>Answer:</strong> (1) PCA/t-SNE/UMAP to 2D, (2) Pair plots, (3) Parallel coordinates, (4) Correlation heatmap, (5) SHAP summary plots.</p></div>
-                <div class="interview-box"><strong>Q3: How to handle overplotting?</strong><p><strong>Answer:</strong> (1) alpha transparency, (2) hexbin, (3) 2D KDE, (4) random sampling, (5) Datashader for millions of points.</p></div>
-                <div class="interview-box"><strong>Q4: What makes good visualization for non-technical stakeholders?</strong><p><strong>Answer:</strong> Clear title stating conclusion, minimal chart junk, annotate key points, consistent color, one insight per chart. Tell a story — what action should they take?</p></div>
-                <div class="interview-box"><strong>Q5: Explain Figure vs Axes in Matplotlib.</strong><p><strong>Answer:</strong> Figure = entire canvas. Axes = single plot area. <code>fig, axes = plt.subplots(2,2)</code> = 4 plots. Always use OO API: <code>ax.plot()</code> not <code>plt.plot()</code>.</p></div>
-                <div class="interview-box"><strong>Q6: How to make accessible visualizations?</strong><p><strong>Answer:</strong> Colorblind-safe palettes (viridis), don't rely on color alone, add shapes/patterns, sufficient contrast, alt text, large fonts (12pt+).</p></div>
+                <div class="interview-box"><strong>Q1: Matplotlib vs Seaborn vs Plotly?</strong><p><strong>Answer:</strong> Matplotlib: full control, papers. Seaborn: statistical EDA, beautiful. Plotly: interactive, stakeholders. Rule: Seaborn→EDA, Matplotlib→papers, Plotly→stakeholders.</p></div>
+                <div class="interview-box"><strong>Q2: How to visualize high-dimensional data?</strong><p><strong>Answer:</strong> (1) PCA/t-SNE/UMAP to 2D, (2) Pair plots, (3) Parallel coordinates, (4) Correlation heatmap, (5) SHAP plots.</p></div>
+                <div class="interview-box"><strong>Q3: Handle overplotting?</strong><p><strong>Answer:</strong> alpha, hexbin, 2D KDE, random sampling, Datashader for millions of points.</p></div>
+                <div class="interview-box"><strong>Q4: Good viz for non-technical audience?</strong><p><strong>Answer:</strong> Title states conclusion. One insight per chart. Annotate key points. Consistent color. Minimal chart junk. Tell a story.</p></div>
+                <div class="interview-box"><strong>Q5: Figure vs Axes?</strong><p><strong>Answer:</strong> Figure = canvas. Axes = plot area. <code>fig, axes = plt.subplots(2,2)</code>. Use OO API: <code>ax.plot()</code> not <code>plt.plot()</code>.</p></div>
+                <div class="interview-box"><strong>Q6: Accessible visualizations?</strong><p><strong>Answer:</strong> Colorblind palettes (viridis), shapes not just color, sufficient contrast, alt text, 12pt+ fonts.</p></div>
+                <div class="interview-box"><strong>Q7: How to visualize model performance?</strong><p><strong>Answer:</strong> Training curves (loss/acc vs epoch), confusion matrix (heatmap), ROC/AUC, feature importance (horizontal bars), SHAP for interpretability.</p></div>
             </div>`
 },
 
@@ -664,100 +978,146 @@ fig.show()</div>
             <div class="section">
                 <h2>🎯 Advanced Python — Complete Engineering Guide</h2>
 
-                <h3>1. Decorators — Beyond Basics</h3>
+                <h3>1. Decorators — Complete Patterns</h3>
                 <div class="info-box">
                     <div class="box-title">⚡ Three Levels of Decorators</div>
-                    <div class="box-content"><strong>Level 1:</strong> Simple wrapper (timing, logging). <strong>Level 2:</strong> Decorator with arguments (factory pattern). <strong>Level 3:</strong> Class-based decorators with state. Always use <code>functools.wraps</code> to preserve function metadata (name, docstring, signature).</div>
+                    <div class="box-content"><strong>Level 1:</strong> Simple wrapper (timing, logging). <strong>Level 2:</strong> With arguments (factory). <strong>Level 3:</strong> Class-based with state. Always use <code>functools.wraps</code>.</div>
                 </div>
+                <p><strong>Common patterns:</strong> Retry with exponential backoff, caching, rate limiting, authentication, input validation, deprecation warnings.</p>
 
                 <h3>2. Context Managers</h3>
-                <p>Managing resources reliably. <code>with</code> blocks guarantee cleanup even on errors. Two approaches: (1) Class-based (<code>__enter__/__exit__</code>), (2) <code>@contextlib.contextmanager</code> with <code>yield</code>. Use for: file handles, DB connections, GPU locks, temporary settings.</p>
+                <p>Guarantee resource cleanup. Two approaches: (1) Class-based (<code>__enter__/__exit__</code>), (2) <code>@contextlib.contextmanager</code> with yield. Use for: files, DB connections, GPU locks, temporary settings, timers.</p>
 
-                <h3>3. Dataclasses vs namedtuple vs Pydantic</h3>
+                <h3>3. Dataclasses vs namedtuple vs Pydantic vs attrs</h3>
                 <table>
-                    <tr><th>Feature</th><th>namedtuple</th><th>dataclass</th><th>Pydantic</th></tr>
-                    <tr><td>Mutable</td><td>✗</td><td>✓ (default)</td><td>✓ (v2)</td></tr>
-                    <tr><td>Validation</td><td>✗</td><td>✗ (manual)</td><td>✓ (automatic)</td></tr>
-                    <tr><td>Default values</td><td>Limited</td><td>✓</td><td>✓</td></tr>
-                    <tr><td>Inheritance</td><td>✗</td><td>✓</td><td>✓</td></tr>
-                    <tr><td>JSON serialization</td><td>Manual</td><td>Manual</td><td>Built-in</td></tr>
-                    <tr><td>Performance</td><td>Fastest</td><td>Fast</td><td>Slower (validation)</td></tr>
-                    <tr><td>Use case</td><td>Immutable records</td><td>Data containers</td><td>API models, configs</td></tr>
+                    <tr><th>Feature</th><th>namedtuple</th><th>dataclass</th><th>Pydantic</th><th>attrs</th></tr>
+                    <tr><td>Mutable</td><td>✗</td><td>✓</td><td>✓ (v2)</td><td>✓</td></tr>
+                    <tr><td>Validation</td><td>✗</td><td>✗</td><td>✓ (auto)</td><td>✓ (validators)</td></tr>
+                    <tr><td>JSON</td><td>✗</td><td>✗</td><td>✓ (built-in)</td><td>via cattrs</td></tr>
+                    <tr><td>Performance</td><td>Fastest</td><td>Fast</td><td>Medium</td><td>Fast</td></tr>
+                    <tr><td>Use for</td><td>Records</td><td>Data containers</td><td>API models</td><td>Complex classes</td></tr>
                 </table>
 
                 <h3>4. Type Hints — Complete Guide</h3>
                 <div class="info-box">
-                    <div class="box-title">🎯 Why Type Hints Matter</div>
-                    <div class="box-content">Type hints enable: IDE autocompletion, static analysis (<strong>mypy</strong>), self-documenting code, and runtime validation (Pydantic). Python doesn't enforce them at runtime — they're optional annotations checked by external tools.</div>
+                    <div class="box-title">🎯 Why Type Hints Matter for Projects</div>
+                    <div class="box-content">Enable: IDE autocompletion, <strong>mypy</strong> static analysis, self-documenting code, Pydantic validation. Python doesn't enforce at runtime — they're for tools and humans.</div>
                 </div>
                 <table>
                     <tr><th>Hint</th><th>Meaning</th><th>Example</th></tr>
-                    <tr><td><code>int, str, float</code></td><td>Basic types</td><td><code>def f(x: int) -> str:</code></td></tr>
                     <tr><td><code>list[int]</code></td><td>List of ints (3.9+)</td><td><code>scores: list[int] = []</code></td></tr>
-                    <tr><td><code>dict[str, Any]</code></td><td>Dict with str keys</td><td><code>config: dict[str, Any]</code></td></tr>
-                    <tr><td><code>Optional[int]</code></td><td>int or None</td><td><code>x: int | None</code> (3.10+)</td></tr>
-                    <tr><td><code>Union[int, str]</code></td><td>int or str</td><td><code>id: int | str</code></td></tr>
-                    <tr><td><code>Callable[[int], str]</code></td><td>Function signature</td><td>Callbacks, decorators</td></tr>
-                    <tr><td><code>TypeVar('T')</code></td><td>Generic type</td><td>Generic containers</td></tr>
+                    <tr><td><code>dict[str, Any]</code></td><td>Dict str keys</td><td><code>config: dict[str, Any]</code></td></tr>
+                    <tr><td><code>int | None</code></td><td>Optional (3.10+)</td><td><code>x: int | None = None</code></td></tr>
+                    <tr><td><code>Callable[[int], str]</code></td><td>Function type</td><td>Callbacks</td></tr>
+                    <tr><td><code>TypeVar</code></td><td>Generic</td><td>Generic containers</td></tr>
+                    <tr><td><code>Literal</code></td><td>Exact values</td><td><code>Literal['train','test']</code></td></tr>
+                    <tr><td><code>TypedDict</code></td><td>Dict with typed keys</td><td>JSON schemas</td></tr>
                 </table>
 
-                <h3>5. async/await — Concurrent Python</h3>
-                <p>Async is for <strong>I/O-bound</strong> tasks (API calls, DB queries, file reads). NOT for CPU-bound work (use multiprocessing). The event loop manages coroutines cooperatively. <code>asyncio.gather()</code> runs multiple coroutines concurrently. <code>aiohttp</code> for async HTTP, <code>asyncpg</code> for async PostgreSQL.</p>
+                <h3>5. async/await — Concurrent I/O</h3>
+                <p>For I/O-bound tasks: API calls, DB queries, file reads. NOT for CPU (use multiprocessing). Event loop manages coroutines cooperatively. <code>asyncio.gather()</code> runs concurrently. Game changer: 100 API calls in ~1s vs 100s sequentially.</p>
 
-                <h3>6. Descriptors — How @property Works</h3>
-                <p>A descriptor is any object implementing <code>__get__</code>, <code>__set__</code>, or <code>__delete__</code>. <code>@property</code> is a descriptor. They control attribute access at the class level. Used in Django ORM fields, SQLAlchemy columns, and dataclass fields.</p>
+                <h3>6. Design Patterns for ML Projects</h3>
+                <table>
+                    <tr><th>Pattern</th><th>Use Case</th><th>Python Implementation</th></tr>
+                    <tr><td>Strategy</td><td>Swap algorithms</td><td>Pass function/class as argument</td></tr>
+                    <tr><td>Factory</td><td>Create objects by name</td><td>Registry dict: <code>models['rf']</code></td></tr>
+                    <tr><td>Observer</td><td>Training callbacks</td><td>Event system with hooks</td></tr>
+                    <tr><td>Pipeline</td><td>Data transformations</td><td>Chain of <code>fit→transform</code></td></tr>
+                    <tr><td>Singleton</td><td>Model cache, DB pool</td><td>Module-level or metaclass</td></tr>
+                    <tr><td>Template</td><td>Training loop</td><td>ABC with abstract methods</td></tr>
+                    <tr><td>Registry</td><td>Auto-register models</td><td>Class decorator + dict</td></tr>
+                </table>
 
-                <h3>7. Metaclasses</h3>
-                <p>Classes are objects too. Metaclasses define how classes behave. <code>type</code> is the default metaclass. Use for: auto-registering subclasses (model registry), enforcing interface standards, singleton pattern. Most developers should use class decorators instead — metaclasses are a last resort.</p>
+                <h3>7. Descriptors — How @property Works</h3>
+                <p>Any object implementing <code>__get__/__set__/__delete__</code>. @property is a descriptor. Control attribute access at class level. Used in Django ORM, SQLAlchemy, dataclass fields.</p>
 
-                <h3>8. __slots__ for Memory Efficiency</h3>
-                <p>By default, instances store attributes in <code>__dict__</code>. <code>__slots__</code> replaces with a fixed tuple. Saves ~40% memory per instance. Use when creating millions of objects. Trade-off: can't add dynamic attributes. Especially useful for data-heavy classes.</p>
+                <h3>8. Metaclasses — Advanced</h3>
+                <p>Classes are objects. Metaclasses define how classes behave. <code>type</code> is the default. Use for: auto-registration, interface enforcement, singleton. Most should use class decorators instead.</p>
+
+                <h3>9. __slots__ for Memory Efficiency</h3>
+                <p>Replaces <code>__dict__</code> with fixed array. ~40% memory savings per instance. Use for millions of small objects. Trade-off: no dynamic attributes.</p>
+
+                <h3>10. Multiprocessing for CPU-Bound Work</h3>
+                <p><code>multiprocessing.Pool</code> or <code>concurrent.futures.ProcessPoolExecutor</code>. Each process has its own GIL. Share data via: <code>multiprocessing.Queue</code>, <code>shared_memory</code>, or serialize (pickle). Overhead: process creation ~100ms. Only use for expensive computations.</p>
             </div>`,
         code: `
             <div class="section">
-                <h2>💻 Advanced Python Code Examples</h2>
+                <h2>💻 Advanced Python Project Code</h2>
 
-                <h3>1. Production Decorator with Parameters</h3>
+                <h3>1. Production Decorator — Retry with Backoff</h3>
                 <div class="code-block"><span class="keyword">from</span> functools <span class="keyword">import</span> wraps
 <span class="keyword">import</span> time, logging
 
-<span class="keyword">def</span> <span class="function">retry</span>(max_attempts=<span class="number">3</span>, delay=<span class="number">1.0</span>):
-    <span class="string">"""Decorator factory: retries on failure."""</span>
+<span class="keyword">def</span> <span class="function">retry</span>(max_attempts=<span class="number">3</span>, delay=<span class="number">1.0</span>, exceptions=(<span class="function">Exception</span>,)):
     <span class="keyword">def</span> <span class="function">decorator</span>(func):
         <span class="preprocessor">@wraps</span>(func)
         <span class="keyword">def</span> <span class="function">wrapper</span>(*args, **kwargs):
             <span class="keyword">for</span> attempt <span class="keyword">in</span> <span class="function">range</span>(max_attempts):
                 <span class="keyword">try</span>:
                     <span class="keyword">return</span> func(*args, **kwargs)
-                <span class="keyword">except</span> <span class="function">Exception</span> <span class="keyword">as</span> e:
+                <span class="keyword">except</span> exceptions <span class="keyword">as</span> e:
                     <span class="keyword">if</span> attempt == max_attempts - <span class="number">1</span>:
                         <span class="keyword">raise</span>
-                    time.sleep(delay * (<span class="number">2</span> ** attempt))  <span class="comment"># Exponential backoff</span>
+                    wait = delay * (<span class="number">2</span> ** attempt)
+                    logging.warning(<span class="string">f"Retry {attempt+1}/{max_attempts}: {e}, waiting {wait}s"</span>)
+                    time.sleep(wait)
         <span class="keyword">return</span> wrapper
     <span class="keyword">return</span> decorator
 
 <span class="preprocessor">@retry</span>(max_attempts=<span class="number">3</span>, delay=<span class="number">0.5</span>)
 <span class="keyword">def</span> <span class="function">fetch_data</span>(url):
-    <span class="keyword">return</span> requests.get(url).json()</div>
+    <span class="keyword">return</span> requests.get(url, timeout=<span class="number">10</span>).json()</div>
 
-                <h3>2. Dataclass with Validation</h3>
-                <div class="code-block"><span class="keyword">from</span> dataclasses <span class="keyword">import</span> dataclass, field
-<span class="keyword">from</span> typing <span class="keyword">import</span> Optional
+                <h3>2. Dataclass for ML Experiments</h3>
+                <div class="code-block"><span class="keyword">from</span> dataclasses <span class="keyword">import</span> dataclass, field, asdict
+<span class="keyword">import</span> json
+<span class="keyword">from</span> datetime <span class="keyword">import</span> datetime
 
 <span class="preprocessor">@dataclass</span>
 <span class="keyword">class</span> <span class="class">Experiment</span>:
     name: <span class="keyword">str</span>
+    model: <span class="keyword">str</span>
     lr: <span class="keyword">float</span> = <span class="number">0.001</span>
     epochs: <span class="keyword">int</span> = <span class="number">100</span>
+    batch_size: <span class="keyword">int</span> = <span class="number">32</span>
     tags: <span class="keyword">list</span>[<span class="keyword">str</span>] = field(default_factory=<span class="keyword">list</span>)
+    timestamp: <span class="keyword">str</span> = field(default_factory=<span class="keyword">lambda</span>: datetime.now().isoformat())
+    metrics: <span class="keyword">dict</span> = field(default_factory=<span class="keyword">dict</span>)
     
     <span class="keyword">def</span> <span class="function">__post_init__</span>(self):
-        <span class="keyword">if</span> self.lr <= <span class="number">0</span>:
-            <span class="keyword">raise</span> <span class="function">ValueError</span>(<span class="string">"lr must be positive"</span>)
+        <span class="keyword">if</span> self.lr <= <span class="number">0</span>: <span class="keyword">raise</span> <span class="function">ValueError</span>(<span class="string">"lr must be positive"</span>)
+    
+    <span class="keyword">def</span> <span class="function">save</span>(self, path):
+        <span class="keyword">with</span> <span class="function">open</span>(path, <span class="string">'w'</span>) <span class="keyword">as</span> f:
+            json.dump(asdict(self), f, indent=<span class="number">2</span>)
+    
+    <span class="preprocessor">@classmethod</span>
+    <span class="keyword">def</span> <span class="function">load</span>(cls, path):
+        <span class="keyword">with</span> <span class="function">open</span>(path) <span class="keyword">as</span> f:
+            <span class="keyword">return</span> cls(**json.load(f))</div>
+
+                <h3>3. Model Registry Pattern</h3>
+                <div class="code-block">MODEL_REGISTRY = {}
+
+<span class="keyword">def</span> <span class="function">register_model</span>(name):
+    <span class="keyword">def</span> <span class="function">decorator</span>(cls):
+        MODEL_REGISTRY[name] = cls
+        <span class="keyword">return</span> cls
+    <span class="keyword">return</span> decorator
 
-exp = Experiment(<span class="string">"bert-finetune"</span>, lr=<span class="number">3e-5</span>, tags=[<span class="string">"nlp"</span>])</div>
+<span class="preprocessor">@register_model</span>(<span class="string">"random_forest"</span>)
+<span class="keyword">class</span> <span class="class">RandomForestModel</span>:
+    <span class="keyword">def</span> <span class="function">train</span>(self, X, y): ...
 
-                <h3>3. async/await for Parallel API Calls</h3>
+<span class="preprocessor">@register_model</span>(<span class="string">"xgboost"</span>)
+<span class="keyword">class</span> <span class="class">XGBoostModel</span>:
+    <span class="keyword">def</span> <span class="function">train</span>(self, X, y): ...
+
+<span class="comment"># Create model by name from config</span>
+model = MODEL_REGISTRY[config[<span class="string">"model_name"</span>]]()</div>
+
+                <h3>4. async — Parallel API Calls</h3>
                 <div class="code-block"><span class="keyword">import</span> asyncio
 <span class="keyword">import</span> aiohttp
 
@@ -768,33 +1128,56 @@ exp = Experiment(<span class="string">"bert-finetune"</span>, lr=<span class="nu
 <span class="keyword">async def</span> <span class="function">fetch_all</span>(urls):
     <span class="keyword">async with</span> aiohttp.ClientSession() <span class="keyword">as</span> session:
         tasks = [fetch(session, url) <span class="keyword">for</span> url <span class="keyword">in</span> urls]
-        <span class="keyword">return</span> <span class="keyword">await</span> asyncio.gather(*tasks)
+        <span class="keyword">return</span> <span class="keyword">await</span> asyncio.gather(*tasks, return_exceptions=<span class="keyword">True</span>)
 
-<span class="comment"># 100 API calls in ~1 second (vs 100 seconds sequentially)</span>
+<span class="comment"># 100 API calls in ~1 second vs 100 seconds</span>
 results = asyncio.run(fetch_all(urls))</div>
 
-                <h3>4. Type-Hinted Protocol (Duck Typing)</h3>
-                <div class="code-block"><span class="keyword">from</span> typing <span class="keyword">import</span> Protocol
-<span class="keyword">import</span> numpy <span class="keyword">as</span> np
+                <h3>5. Pydantic for API Data Validation</h3>
+                <div class="code-block"><span class="keyword">from</span> pydantic <span class="keyword">import</span> BaseModel, Field, field_validator
 
-<span class="keyword">class</span> <span class="class">Predictor</span>(Protocol):
-    <span class="keyword">def</span> <span class="function">predict</span>(self, X: np.ndarray) -> np.ndarray: ...
-
-<span class="keyword">def</span> <span class="function">evaluate</span>(model: Predictor, X: np.ndarray, y: np.ndarray):
-    <span class="comment"># Works with ANY object that has .predict()</span>
-    preds = model.predict(X)
-    <span class="keyword">return</span> (preds == y).mean()</div>
+<span class="keyword">class</span> <span class="class">PredictionRequest</span>(BaseModel):
+    features: <span class="keyword">list</span>[<span class="keyword">float</span>] = Field(..., min_length=<span class="number">1</span>)
+    model_name: <span class="keyword">str</span> = <span class="string">"default"</span>
+    threshold: <span class="keyword">float</span> = Field(<span class="number">0.5</span>, ge=<span class="number">0</span>, le=<span class="number">1</span>)
+    
+    <span class="preprocessor">@field_validator</span>(<span class="string">'features'</span>)
+    <span class="preprocessor">@classmethod</span>
+    <span class="keyword">def</span> <span class="function">check_features</span>(cls, v):
+        <span class="keyword">if</span> <span class="function">any</span>(np.isnan(x) <span class="keyword">for</span> x <span class="keyword">in</span> v):
+            <span class="keyword">raise</span> <span class="function">ValueError</span>(<span class="string">"NaN not allowed"</span>)
+        <span class="keyword">return</span> v
+
+<span class="comment"># Auto-validates on creation</span>
+req = PredictionRequest(features=[<span class="number">1.0</span>, <span class="number">2.0</span>, <span class="number">3.0</span>])</div>
+
+                <h3>6. Context Manager — Timer & GPU Lock</h3>
+                <div class="code-block"><span class="keyword">from</span> contextlib <span class="keyword">import</span> contextmanager
+<span class="keyword">import</span> time
+
+<span class="preprocessor">@contextmanager</span>
+<span class="keyword">def</span> <span class="function">timer</span>(name=<span class="string">"Block"</span>):
+    start = time.perf_counter()
+    <span class="keyword">try</span>:
+        <span class="keyword">yield</span>
+    <span class="keyword">finally</span>:
+        elapsed = time.perf_counter() - start
+        <span class="function">print</span>(<span class="string">f"{name}: {elapsed:.4f}s"</span>)
+
+<span class="keyword">with</span> timer(<span class="string">"Training"</span>):
+    model.fit(X_train, y_train)</div>
             </div>`,
             interview: `
             <div class="section">
                 <h2>🎯 Advanced Python Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: Explain MRO (Method Resolution Order).</strong><p><strong>Answer:</strong> C3 Linearization algorithm for multiple inheritance. Access via <code>ClassName.mro()</code>. Ensures bases searched after subclasses, preserving definition order.</p></div>
-                <div class="interview-box"><strong>Q2: dataclass vs namedtuple vs Pydantic?</strong><p><strong>Answer:</strong> namedtuple: immutable, fastest. dataclass: mutable, flexible, no validation. Pydantic: auto-validation, JSON serialization, API models. Choose based on whether you need validation.</p></div>
-                <div class="interview-box"><strong>Q3: When to use async/await vs threading vs multiprocessing?</strong><p><strong>Answer:</strong> <strong>async:</strong> I/O-bound, many connections (1000s of API calls). <strong>threading:</strong> I/O-bound, simpler code. <strong>multiprocessing:</strong> CPU-bound (bypasses GIL). NumPy already releases GIL internally.</p></div>
-                <div class="interview-box"><strong>Q4: How does @property work internally?</strong><p><strong>Answer:</strong> It's a descriptor — implements <code>__get__</code>, <code>__set__</code>, <code>__delete__</code>. When you access <code>obj.x</code>, Python's attribute lookup finds the descriptor on the class and calls <code>__get__</code>.</p></div>
-                <div class="interview-box"><strong>Q5: Decorator with parameters pattern?</strong><p><strong>Answer:</strong> Three nested functions: (1) Factory takes params, returns decorator. (2) Decorator takes function, returns wrapper. (3) Wrapper executes logic. Use <code>@wraps(func)</code> always.</p></div>
-                <div class="interview-box"><strong>Q6: What is __slots__?</strong><p><strong>Answer:</strong> Replaces <code>__dict__</code> with fixed-size array. Saves ~40% memory per instance. Can't add dynamic attributes. Use for millions of small objects.</p></div>
-                <div class="interview-box"><strong>Q7: Explain closures. Give a real use case.</strong><p><strong>Answer:</strong> A function that captures variables from enclosing scope. The captured variables survive after the enclosing function returns. Use case: factory functions, decorators, callbacks. Example: <code>make_multiplier(3)</code> returns a function that multiplies by 3.</p></div>
+                <div class="interview-box"><strong>Q1: Explain MRO.</strong><p><strong>Answer:</strong> C3 Linearization for multiple inheritance. <code>ClassName.mro()</code> shows order. Subclasses before bases, left-to-right.</p></div>
+                <div class="interview-box"><strong>Q2: dataclass vs Pydantic?</strong><p><strong>Answer:</strong> dataclass: no validation, fast, standard library. Pydantic: auto-validation, JSON serialization, API models. Use Pydantic for external data, dataclass for internal.</p></div>
+                <div class="interview-box"><strong>Q3: When async vs threading vs multiprocessing?</strong><p><strong>Answer:</strong> async: I/O-bound, 1000s connections. threading: I/O, simpler. multiprocessing: CPU-bound (bypasses GIL). NumPy releases GIL internally.</p></div>
+                <div class="interview-box"><strong>Q4: How does @property work?</strong><p><strong>Answer:</strong> It's a descriptor with <code>__get__/__set__</code>. Attribute access triggers descriptor protocol. Used for computed attributes and validation.</p></div>
+                <div class="interview-box"><strong>Q5: Decorator with parameters?</strong><p><strong>Answer:</strong> Three nested functions: factory(params) → decorator(func) → wrapper(*args). Use @wraps(func) always.</p></div>
+                <div class="interview-box"><strong>Q6: What is __slots__?</strong><p><strong>Answer:</strong> Fixed array instead of __dict__. ~40% less memory. No dynamic attributes. Use for millions of objects.</p></div>
+                <div class="interview-box"><strong>Q7: Explain closures with use case.</strong><p><strong>Answer:</strong> Function capturing enclosing scope variables. Use: factory functions, decorators, callbacks. <code>make_multiplier(3)</code> returns function multiplying by 3.</p></div>
+                <div class="interview-box"><strong>Q8: Design patterns in Python vs Java?</strong><p><strong>Answer:</strong> Python makes many patterns trivial: Strategy = pass a function. Singleton = module variable. Factory = dict of classes. Observer = list of callables. Python prefers simplicity.</p></div>
             </div>`
 },
 
@@ -804,81 +1187,118 @@ results = asyncio.run(fetch_all(urls))</div>
                 <h2>🤖 Scikit-learn — Complete ML Engineering</h2>
 
                 <div class="info-box">
-                    <div class="box-title">⚡ The Estimator API — Unified Interface</div>
-                    <div class="box-content"><strong>Estimators</strong> have <code>fit(X, y)</code>. <strong>Transformers</strong> have <code>transform(X)</code>. <strong>Predictors</strong> have <code>predict(X)</code>. This consistency allows seamless swapping and composition via Pipelines.</div>
+                    <div class="box-title">⚡ The Estimator API</div>
+                    <div class="box-content"><strong>Estimators:</strong> <code>fit(X, y)</code>. <strong>Transformers:</strong> <code>transform(X)</code>. <strong>Predictors:</strong> <code>predict(X)</code>. Consistency allows seamless swapping and composition via Pipelines.</div>
                 </div>
 
-                <h3>1. Pipelines — Avoiding Data Leakage</h3>
+                <h3>1. Pipelines — The Foundation of Production ML</h3>
                 <div class="callout warning">
-                    <div class="callout-title">⚠️ The #1 ML Mistake</div>
-                    Fitting a scaler on the ENTIRE dataset before splitting = <strong>data leakage</strong>. Test set statistics leak into training. Fix: put scaling INSIDE a Pipeline, which ensures fit only on training data during cross-validation.
+                    <div class="callout-title">⚠️ Data Leakage — The #1 ML Mistake</div>
+                    Fitting scaler on ENTIRE dataset before split = test set info leaks into training. Fix: put ALL preprocessing inside Pipeline. Pipeline ensures fit only on training folds during CV.
                 </div>
 
-                <h3>2. ColumnTransformer — Different processing per column type</h3>
-                <p>Real data has mixed types. ColumnTransformer applies different transformations to different column sets: StandardScaler for numerics, OneHotEncoder for categoricals, TfidfVectorizer for text. All in one pipeline.</p>
+                <h3>2. ColumnTransformer — Real-World Data</h3>
+                <p>Real data has mixed types. ColumnTransformer applies different transformations per column set: StandardScaler for numerics, OneHotEncoder for categoricals, TfidfVectorizer for text. All in one pipeline.</p>
 
                 <h3>3. Custom Transformers</h3>
-                <p>Inherit from <code>BaseEstimator</code> + <code>TransformerMixin</code>. Implement <code>fit(X, y)</code> and <code>transform(X)</code>. <code>TransformerMixin</code> gives you <code>fit_transform()</code> for free. Use <code>check_is_fitted(self)</code> to validate state.</p>
+                <p>Inherit <code>BaseEstimator + TransformerMixin</code>. Implement <code>fit(X, y)</code> and <code>transform(X)</code>. TransformerMixin gives <code>fit_transform()</code> free. Use <code>check_is_fitted()</code> for safety.</p>
 
                 <h3>4. Cross-Validation Strategies</h3>
                 <table>
-                    <tr><th>Strategy</th><th>When to Use</th><th>Gotcha</th></tr>
-                    <tr><td>KFold</td><td>General purpose</td><td>Doesn't preserve class ratios</td></tr>
-                    <tr><td>StratifiedKFold</td><td>Classification (imbalanced)</td><td>Preserves class distribution</td></tr>
+                    <tr><th>Strategy</th><th>When</th><th>Key Point</th></tr>
+                    <tr><td>KFold</td><td>General</td><td>Doesn't preserve class ratios</td></tr>
+                    <tr><td>StratifiedKFold</td><td>Imbalanced classification</td><td>Preserves class distribution</td></tr>
                     <tr><td>TimeSeriesSplit</td><td>Time-ordered data</td><td>Train always before test</td></tr>
                     <tr><td>GroupKFold</td><td>Grouped data (patients)</td><td>Same group never in train+test</td></tr>
-                    <tr><td>LeaveOneOut</td><td>Very small datasets</td><td>N fits — very slow</td></tr>
                     <tr><td>RepeatedStratifiedKFold</td><td>Robust estimation</td><td>Multiple random splits</td></tr>
                 </table>
 
                 <h3>5. Hyperparameter Tuning</h3>
                 <table>
                     <tr><th>Method</th><th>Pros</th><th>Cons</th></tr>
-                    <tr><td>GridSearchCV</td><td>Exhaustive, simple</td><td>Exponential with params</td></tr>
-                    <tr><td>RandomizedSearchCV</td><td>Faster, continuous distributions</td><td>May miss optimal</td></tr>
-                    <tr><td>Optuna/BayesianOpt</td><td>Smart search, early stopping</td><td>More setup, dependency</td></tr>
-                    <tr><td>Halving*SearchCV</td><td>Successive halving, fast</td><td>Newer, less documented</td></tr>
+                    <tr><td>GridSearchCV</td><td>Exhaustive</td><td>Exponential with params</td></tr>
+                    <tr><td>RandomizedSearchCV</td><td>Faster, continuous dists</td><td>May miss optimal</td></tr>
+                    <tr><td>Optuna</td><td>Smart search, pruning</td><td>Extra dependency</td></tr>
+                    <tr><td>HalvingSearchCV</td><td>Successive halving</td><td>Newer, less docs</td></tr>
+                </table>
+
+                <h3>6. Complete ML Workflow</h3>
+                <div class="info-box">
+                    <div class="box-title">🎯 The Steps</div>
+                    <div class="box-content">
+                        1. EDA → 2. Train/Val/Test split → 3. Build Pipeline (preprocess + model) → 4. Cross-validate multiple models → 5. Select best → 6. Tune hyperparameters → 7. Final evaluation on test set → 8. Save model → 9. Deploy
+                    </div>
+                </div>
+
+                <h3>7. Feature Engineering</h3>
+                <table>
+                    <tr><th>Transformer</th><th>Purpose</th></tr>
+                    <tr><td>PolynomialFeatures</td><td>Interaction & polynomial terms</td></tr>
+                    <tr><td>FunctionTransformer</td><td>Apply any function (log, sqrt)</td></tr>
+                    <tr><td>SplineTransformer</td><td>Non-linear feature basis</td></tr>
+                    <tr><td>KBinsDiscretizer</td><td>Bin continuous into categories</td></tr>
+                    <tr><td>TargetEncoder</td><td>Encode categoricals by target mean</td></tr>
                 </table>
 
-                <h3>6. Feature Engineering in sklearn</h3>
-                <p><code>PolynomialFeatures</code>, <code>FunctionTransformer</code>, <code>SplineTransformer</code>, <code>KBinsDiscretizer</code>. Chain with Pipeline for clean, leak-free preprocessing. Use <code>make_column_selector</code> to auto-select column types.</p>
+                <h3>8. Model Selection Guide</h3>
+                <table>
+                    <tr><th>Data Size</th><th>Model</th><th>Why</th></tr>
+                    <tr><td><1K rows</td><td>Logistic/SVM/KNN</td><td>Simple, less overfitting</td></tr>
+                    <tr><td>1K-100K</td><td>Random Forest, XGBoost</td><td>Best accuracy/speed tradeoff</td></tr>
+                    <tr><td>100K+</td><td>XGBoost, LightGBM</td><td>Handles large data efficiently</td></tr>
+                    <tr><td>Very large</td><td>SGDClassifier/online</td><td>Incremental learning</td></tr>
+                    <tr><td>Tabular</td><td>Gradient Boosting</td><td>Almost always best for tabular</td></tr>
+                </table>
 
-                <h3>7. Model Selection Workflow</h3>
-                <p>Train/Val/Test split → Cross-validate multiple models → Select best → Tune hyperparameters → Final evaluation on test set. Never tune on test data. Use <code>cross_val_score</code> for quick comparison, <code>cross_validate</code> for detailed metrics.</p>
+                <h3>9. Handling Imbalanced Data</h3>
+                <table>
+                    <tr><th>Strategy</th><th>How</th></tr>
+                    <tr><td>class_weight='balanced'</td><td>Built-in for most models</td></tr>
+                    <tr><td>SMOTE</td><td>Synthetic oversampling (imblearn)</td></tr>
+                    <tr><td>Threshold tuning</td><td>Adjust decision threshold from 0.5</td></tr>
+                    <tr><td>Metrics</td><td>Use F1, Precision-Recall AUC (not accuracy)</td></tr>
+                    <tr><td>Ensemble</td><td>BalancedRandomForest</td></tr>
+                </table>
+
+                <h3>10. Model Persistence</h3>
+                <p><code>joblib.dump(model, 'model.pkl')</code> — faster than pickle for NumPy arrays. <code>model = joblib.load('model.pkl')</code>. Always save the entire pipeline (not just model) to include preprocessing. Version your models with timestamps.</p>
             </div>`,
         code: `
             <div class="section">
-                <h2>💻 Scikit-learn Code Examples</h2>
+                <h2>💻 Scikit-learn Project Code</h2>
 
-                <h3>1. Production Pipeline with ColumnTransformer</h3>
+                <h3>1. Production Pipeline — Complete Template</h3>
                 <div class="code-block"><span class="keyword">from</span> sklearn.pipeline <span class="keyword">import</span> Pipeline
-<span class="keyword">from</span> sklearn.compose <span class="keyword">import</span> ColumnTransformer
+<span class="keyword">from</span> sklearn.compose <span class="keyword">import</span> ColumnTransformer, make_column_selector
 <span class="keyword">from</span> sklearn.preprocessing <span class="keyword">import</span> StandardScaler, OneHotEncoder
 <span class="keyword">from</span> sklearn.impute <span class="keyword">import</span> SimpleImputer
 <span class="keyword">from</span> sklearn.ensemble <span class="keyword">import</span> RandomForestClassifier
-
-num_features = [<span class="string">'age'</span>, <span class="string">'income'</span>, <span class="string">'score'</span>]
-cat_features = [<span class="string">'gender'</span>, <span class="string">'city'</span>]
+<span class="keyword">from</span> sklearn.model_selection <span class="keyword">import</span> cross_val_score
 
 preprocessor = ColumnTransformer([
     (<span class="string">'num'</span>, Pipeline([
         (<span class="string">'imputer'</span>, SimpleImputer(strategy=<span class="string">'median'</span>)),
         (<span class="string">'scaler'</span>, StandardScaler())
-    ]), num_features),
+    ]), make_column_selector(dtype_include=<span class="string">'number'</span>)),
+    
     (<span class="string">'cat'</span>, Pipeline([
         (<span class="string">'imputer'</span>, SimpleImputer(strategy=<span class="string">'constant'</span>, fill_value=<span class="string">'missing'</span>)),
-        (<span class="string">'encoder'</span>, OneHotEncoder(handle_unknown=<span class="string">'ignore'</span>))
-    ]), cat_features)
+        (<span class="string">'encoder'</span>, OneHotEncoder(handle_unknown=<span class="string">'ignore'</span>, sparse_output=<span class="keyword">False</span>))
+    ]), make_column_selector(dtype_include=<span class="string">'object'</span>))
 ])
 
 pipe = Pipeline([
     (<span class="string">'preprocessor'</span>, preprocessor),
-    (<span class="string">'classifier'</span>, RandomForestClassifier(n_estimators=<span class="number">100</span>))
+    (<span class="string">'classifier'</span>, RandomForestClassifier(n_estimators=<span class="number">100</span>, n_jobs=-<span class="number">1</span>))
 ])
-pipe.fit(X_train, y_train)  <span class="comment"># No data leakage!</span></div>
+
+<span class="comment"># No data leakage!</span>
+scores = cross_val_score(pipe, X, y, cv=<span class="number">5</span>, scoring=<span class="string">'f1'</span>)
+<span class="function">print</span>(<span class="string">f"F1: {scores.mean():.3f} ± {scores.std():.3f}"</span>)</div>
 
                 <h3>2. Custom Transformer</h3>
                 <div class="code-block"><span class="keyword">from</span> sklearn.base <span class="keyword">import</span> BaseEstimator, TransformerMixin
+<span class="keyword">from</span> sklearn.utils.validation <span class="keyword">import</span> check_is_fitted
 
 <span class="keyword">class</span> <span class="class">OutlierClipper</span>(BaseEstimator, TransformerMixin):
     <span class="keyword">def</span> <span class="function">__init__</span>(self, factor=<span class="number">1.5</span>):
@@ -893,33 +1313,71 @@ pipe.fit(X_train, y_train)  <span class="comment"># No data leakage!</span></div
         <span class="keyword">return</span> self
     
     <span class="keyword">def</span> <span class="function">transform</span>(self, X):
+        check_is_fitted(self)
         <span class="keyword">return</span> np.clip(X, self.lower_, self.upper_)</div>
 
-                <h3>3. Hyperparameter Tuning with Optuna</h3>
+                <h3>3. Model Comparison Framework</h3>
+                <div class="code-block"><span class="keyword">from</span> sklearn.model_selection <span class="keyword">import</span> cross_validate
+
+models = {
+    <span class="string">'Logistic'</span>: LogisticRegression(),
+    <span class="string">'RF'</span>: RandomForestClassifier(n_estimators=<span class="number">100</span>),
+    <span class="string">'XGBoost'</span>: XGBClassifier(n_estimators=<span class="number">100</span>),
+    <span class="string">'LightGBM'</span>: LGBMClassifier(n_estimators=<span class="number">100</span>)
+}
+
+results = {}
+<span class="keyword">for</span> name, model <span class="keyword">in</span> models.items():
+    pipe = Pipeline([(<span class="string">'prep'</span>, preprocessor), (<span class="string">'model'</span>, model)])
+    cv = cross_validate(pipe, X, y, cv=<span class="number">5</span>,
+        scoring=[<span class="string">'accuracy'</span>, <span class="string">'f1'</span>, <span class="string">'roc_auc'</span>], n_jobs=-<span class="number">1</span>)
+    results[name] = {k: v.mean() <span class="keyword">for</span> k, v <span class="keyword">in</span> cv.items()}
+    <span class="function">print</span>(<span class="string">f"{name}: F1={cv['test_f1'].mean():.3f}"</span>)
+
+pd.DataFrame(results).T.sort_values(<span class="string">'test_f1'</span>, ascending=<span class="keyword">False</span>)</div>
+
+                <h3>4. Hyperparameter Tuning with Optuna</h3>
                 <div class="code-block"><span class="keyword">import</span> optuna
 
 <span class="keyword">def</span> <span class="function">objective</span>(trial):
     params = {
         <span class="string">'n_estimators'</span>: trial.suggest_int(<span class="string">'n_estimators'</span>, <span class="number">50</span>, <span class="number">500</span>),
         <span class="string">'max_depth'</span>: trial.suggest_int(<span class="string">'max_depth'</span>, <span class="number">3</span>, <span class="number">15</span>),
-        <span class="string">'learning_rate'</span>: trial.suggest_float(<span class="string">'lr'</span>, <span class="number">1e-3</span>, <span class="number">0.3</span>, log=<span class="keyword">True</span>)
+        <span class="string">'learning_rate'</span>: trial.suggest_float(<span class="string">'lr'</span>, <span class="number">1e-3</span>, <span class="number">0.3</span>, log=<span class="keyword">True</span>),
+        <span class="string">'subsample'</span>: trial.suggest_float(<span class="string">'subsample'</span>, <span class="number">0.6</span>, <span class="number">1.0</span>)
     }
     model = XGBClassifier(**params)
-    score = cross_val_score(model, X, y, cv=<span class="number">5</span>).mean()
+    score = cross_val_score(model, X, y, cv=<span class="number">5</span>, scoring=<span class="string">'f1'</span>).mean()
     <span class="keyword">return</span> score
 
 study = optuna.create_study(direction=<span class="string">'maximize'</span>)
-study.optimize(objective, n_trials=<span class="number">100</span>)</div>
+study.optimize(objective, n_trials=<span class="number">100</span>)
+<span class="function">print</span>(<span class="string">f"Best F1: {study.best_value:.3f}"</span>)
+<span class="function">print</span>(<span class="string">f"Best params: {study.best_params}"</span>)</div>
+
+                <h3>5. Save & Load Pipeline</h3>
+                <div class="code-block"><span class="keyword">import</span> joblib
+<span class="keyword">from</span> datetime <span class="keyword">import</span> datetime
+
+<span class="comment"># Save entire pipeline (includes preprocessing!)</span>
+version = datetime.now().strftime(<span class="string">'%Y%m%d_%H%M'</span>)
+joblib.dump(pipe, <span class="string">f'models/pipeline_{version}.pkl'</span>)
+
+<span class="comment"># Load and predict</span>
+pipe = joblib.load(<span class="string">'models/pipeline_20240315_1430.pkl'</span>)
+predictions = pipe.predict(new_data)  <span class="comment"># Preprocessing included!</span></div>
             </div>`,
             interview: `
             <div class="section">
                 <h2>🎯 Scikit-learn Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: What is data leakage? How to prevent it?</strong><p><strong>Answer:</strong> Info from test set influencing training. Common cause: fitting scaler on full data before split. Fix: put all preprocessing inside a Pipeline which ensures fit only on train folds during cross-validation.</p></div>
-                <div class="interview-box"><strong>Q2: Pipeline vs ColumnTransformer?</strong><p><strong>Answer:</strong> Pipeline: sequential steps (A→B→C). ColumnTransformer: parallel branches (different processing for different column types). Typically ColumnTransformer inside Pipeline.</p></div>
-                <div class="interview-box"><strong>Q3: When to use which cross-validation?</strong><p><strong>Answer:</strong> KFold: general. StratifiedKFold: imbalanced classes. TimeSeriesSplit: temporal. GroupKFold: grouped data (same patient never in both).</p></div>
-                <div class="interview-box"><strong>Q4: GridSearch vs RandomSearch vs Bayesian?</strong><p><strong>Answer:</strong> Grid: exhaustive but exponential. Random: better for many params, samples continuous distributions. Bayesian (Optuna): learns from previous trials, most efficient for expensive models.</p></div>
-                <div class="interview-box"><strong>Q5: How to create a custom transformer?</strong><p><strong>Answer:</strong> Inherit <code>BaseEstimator + TransformerMixin</code>. Implement <code>fit(X, y)</code> (learn params, return self) and <code>transform(X)</code> (apply). TransformerMixin gives <code>fit_transform()</code> free.</p></div>
-                <div class="interview-box"><strong>Q6: Explain fit() vs transform() vs predict().</strong><p><strong>Answer:</strong> <code>fit()</code>: learn parameters from data. <code>transform()</code>: apply learned params to transform data. <code>predict()</code>: generate predictions. fit() is always on train, transform/predict on train+test.</p></div>
+                <div class="interview-box"><strong>Q1: What is data leakage?</strong><p><strong>Answer:</strong> Test set info influencing training. Common: fitting scaler before split. Fix: Pipeline ensures fit only on train folds.</p></div>
+                <div class="interview-box"><strong>Q2: Pipeline vs ColumnTransformer?</strong><p><strong>Answer:</strong> Pipeline: sequential (A→B→C). ColumnTransformer: parallel branches (different processing per column type). Usually CT inside Pipeline.</p></div>
+                <div class="interview-box"><strong>Q3: Which cross-validation when?</strong><p><strong>Answer:</strong> KFold: general. Stratified: imbalanced. TimeSeriesSplit: temporal. GroupKFold: grouped data.</p></div>
+                <div class="interview-box"><strong>Q4: Grid vs Random vs Bayesian?</strong><p><strong>Answer:</strong> Grid: exhaustive, exponential. Random: better for many params. Bayesian (Optuna): learns, most efficient for expensive models.</p></div>
+                <div class="interview-box"><strong>Q5: Custom transformer?</strong><p><strong>Answer:</strong> BaseEstimator + TransformerMixin. Implement fit(X,y) and transform(X). TransformerMixin gives fit_transform free.</p></div>
+                <div class="interview-box"><strong>Q6: How to handle imbalanced data?</strong><p><strong>Answer:</strong> (1) class_weight='balanced'. (2) SMOTE oversampling. (3) Adjust threshold. (4) Use F1/AUC not accuracy. (5) BalancedRandomForest.</p></div>
+                <div class="interview-box"><strong>Q7: When to use which model?</strong><p><strong>Answer:</strong> Tabular: gradient boosting (XGBoost/LightGBM). Small data: Logistic/SVM. Interpretability: Logistic/trees. Speed: LightGBM. Baseline: Random Forest.</p></div>
+                <div class="interview-box"><strong>Q8: fit() vs transform() vs predict()?</strong><p><strong>Answer:</strong> fit: learn params from data. transform: apply params. predict: generate predictions. fit on train only, transform/predict on both.</p></div>
             </div>`
 },
 
@@ -930,133 +1388,205 @@ study.optimize(objective, n_trials=<span class="number">100</span>)</div>
 
                 <div class="info-box">
                     <div class="box-title">⚡ PyTorch Philosophy: Define-by-Run</div>
-                    <div class="box-content">PyTorch builds the computational graph <strong>dynamically</strong> as operations execute (eager mode). This makes debugging natural — use print(), breakpoints, standard Python control flow. TensorFlow originally used static graphs (define-then-run).</div>
+                    <div class="box-content">PyTorch builds the computational graph <strong>dynamically</strong> as operations execute (eager mode). Debug with print(), breakpoints, standard Python control flow.</div>
                 </div>
 
                 <h3>1. Tensors — The Foundation</h3>
                 <table>
-                    <tr><th>Concept</th><th>What It Is</th><th>Key Point</th></tr>
-                    <tr><td>Tensor</td><td>N-dimensional array</td><td>Like NumPy ndarray but GPU-capable</td></tr>
-                    <tr><td>requires_grad</td><td>Track operations for autograd</td><td>Only enable for learnable parameters</td></tr>
+                    <tr><th>Concept</th><th>What</th><th>Key Point</th></tr>
+                    <tr><td>Tensor</td><td>N-dimensional array</td><td>Like NumPy but GPU-capable</td></tr>
+                    <tr><td>requires_grad</td><td>Track for autograd</td><td>Only for learnable params</td></tr>
                     <tr><td>device</td><td>CPU or CUDA</td><td><code>.to('cuda')</code> moves to GPU</td></tr>
                     <tr><td>.detach()</td><td>Stop gradient tracking</td><td>Use for inference/metrics</td></tr>
-                    <tr><td>.item()</td><td>Extract scalar value</td><td>Use for logging loss values</td></tr>
+                    <tr><td>.item()</td><td>Extract scalar</td><td>Use for logging loss</td></tr>
+                    <tr><td>.contiguous()</td><td>Ensure contiguous memory</td><td>Required after transpose/permute</td></tr>
                 </table>
 
                 <h3>2. Autograd — How Backpropagation Works</h3>
                 <div class="info-box">
-                    <div class="box-title">🧠 Computational Graph</div>
-                    <div class="box-content">When <code>requires_grad=True</code>, PyTorch records every operation in a directed acyclic graph (DAG). Each tensor stores its <code>grad_fn</code> — the function that created it. <code>.backward()</code> traverses this graph in reverse, computing gradients via the chain rule. The graph is <strong>destroyed after backward()</strong> (unless <code>retain_graph=True</code>).</div>
+                    <div class="box-title">🧠 Computational Graph (DAG)</div>
+                    <div class="box-content">When <code>requires_grad=True</code>, every operation is recorded. Each tensor stores <code>grad_fn</code>. <code>.backward()</code> traverses graph in reverse (chain rule). Graph <strong>destroyed after backward()</strong> unless <code>retain_graph=True</code>. Gradients ACCUMULATE — must <code>optimizer.zero_grad()</code> before each backward.</div>
                 </div>
-                <p><strong>Gradient accumulation:</strong> By default, <code>.backward()</code> accumulates gradients. You MUST call <code>optimizer.zero_grad()</code> before each backward pass. This is intentional — allows gradient accumulation for larger effective batch sizes.</p>
 
                 <h3>3. nn.Module — Building Blocks</h3>
-                <p>Every model inherits <code>nn.Module</code>. Define layers in <code>__init__</code>, computation in <code>forward()</code>. <code>model.parameters()</code> returns all learnable weights. <code>model.train()</code> and <code>model.eval()</code> toggle BatchNorm/Dropout behavior. <code>model.state_dict()</code> saves/loads weights.</p>
+                <p>Every model inherits <code>nn.Module</code>. Layers in <code>__init__</code>, computation in <code>forward()</code>. <code>model.train()</code>/<code>model.eval()</code> toggle BatchNorm/Dropout. <code>model.parameters()</code> for optimizer. <code>model.state_dict()</code> for save/load. Use <code>nn.Sequential</code> for simple stacks, <code>nn.ModuleList</code>/<code>nn.ModuleDict</code> for dynamic architectures.</p>
 
                 <h3>4. Training Loop — The Standard Pattern</h3>
-                <p>Every PyTorch training follows: (1) Forward pass, (2) Compute loss, (3) <code>optimizer.zero_grad()</code>, (4) <code>loss.backward()</code>, (5) <code>optimizer.step()</code>. No magic — you write it explicitly. This gives full control over learning rate scheduling, gradient clipping, mixed precision, etc.</p>
+                <p>(1) Forward pass → (2) Compute loss → (3) <code>optimizer.zero_grad()</code> → (4) <code>loss.backward()</code> → (5) <code>optimizer.step()</code>. Add: gradient clipping, LR scheduling, mixed precision, logging, checkpointing.</p>
 
                 <h3>5. Custom Datasets & DataLoaders</h3>
-                <p><code>Dataset</code>: override <code>__len__</code> and <code>__getitem__</code>. <code>DataLoader</code>: wraps Dataset with batching, shuffling, multi-worker loading. Use <code>num_workers > 0</code> for parallel data loading. <code>pin_memory=True</code> speeds up CPU→GPU transfer.</p>
+                <p><code>Dataset</code>: override <code>__len__</code> and <code>__getitem__</code>. <code>DataLoader</code>: batching, shuffling, multi-worker. <code>num_workers>0</code> for parallel loading. <code>pin_memory=True</code> for faster GPU transfer. Use <code>collate_fn</code> for variable-length sequences.</p>
 
-                <h3>6. Mixed Precision Training (AMP)</h3>
-                <p>Use <code>torch.cuda.amp</code> for automatic mixed precision. Forward pass in float16 (2x faster on modern GPUs), gradients in float32 (numerical stability). <code>GradScaler</code> prevents underflow. Up to 2-3x speedup with minimal accuracy loss.</p>
+                <h3>6. Learning Rate Scheduling</h3>
+                <table>
+                    <tr><th>Scheduler</th><th>Strategy</th><th>When</th></tr>
+                    <tr><td>StepLR</td><td>Decay every N epochs</td><td>Simple baseline</td></tr>
+                    <tr><td>CosineAnnealingLR</td><td>Cosine decay</td><td>Standard for vision</td></tr>
+                    <tr><td>OneCycleLR</td><td>Warmup + decay</td><td>Best for fast training</td></tr>
+                    <tr><td>ReduceLROnPlateau</td><td>Decay on stall</td><td>When loss plateaus</td></tr>
+                    <tr><td>LinearLR</td><td>Linear warmup</td><td>Transformer models</td></tr>
+                </table>
 
-                <h3>7. Transfer Learning</h3>
-                <p>Load pretrained model → Freeze base layers → Replace final layer → Fine-tune. <code>model.requires_grad_(False)</code> freezes all. Then unfreeze last N layers. Use smaller learning rate for pretrained layers.</p>
+                <h3>7. Mixed Precision Training (AMP)</h3>
+                <p><code>torch.cuda.amp</code>: forward in float16 (2x faster), gradients in float32. <code>GradScaler</code> prevents underflow. 2-3x speedup. Standard practice for any GPU training.</p>
 
-                <h3>8. Hook System for Debugging</h3>
-                <p>Register hooks on modules: <code>register_forward_hook</code>, <code>register_backward_hook</code>. View intermediate activations, gradient magnitudes, feature maps. Essential for debugging vanishing/exploding gradients.</p>
+                <h3>8. Transfer Learning Patterns</h3>
+                <p>Load pretrained → Freeze base → Replace head → Fine-tune with smaller LR. <strong>Discriminative LR:</strong> lower LR for earlier layers. <strong>Progressive unfreezing:</strong> unfreeze layers one at a time. Both work better than fine-tuning everything at once.</p>
 
                 <h3>9. Distributed Training (DDP)</h3>
-                <p><code>DistributedDataParallel</code> is the standard for multi-GPU training. Each GPU runs a copy of the model, gradients are averaged across GPUs (all-reduce). Near-linear scaling. Use <code>torchrun</code> to launch.</p>
+                <p><code>DistributedDataParallel</code>: each GPU runs model copy, gradients averaged via all-reduce. Near-linear scaling. Use <code>torchrun</code> to launch. <code>DistributedSampler</code> for data splitting.</p>
+
+                <h3>10. Debugging & Profiling</h3>
+                <table>
+                    <tr><th>Tool</th><th>Purpose</th></tr>
+                    <tr><td>register_forward_hook</td><td>View intermediate activations</td></tr>
+                    <tr><td>register_backward_hook</td><td>Monitor gradient magnitudes</td></tr>
+                    <tr><td>torch.profiler</td><td>GPU/CPU profiling</td></tr>
+                    <tr><td>torch.cuda.memory_summary()</td><td>GPU memory debugging</td></tr>
+                    <tr><td>detect_anomaly()</td><td>Find NaN/Inf sources</td></tr>
+                </table>
+
+                <h3>11. torch.compile (2.x)</h3>
+                <p>JIT compiles model for 30-60% speedup. <code>model = torch.compile(model)</code>. Uses TorchDynamo + Triton. Works on existing code. The future of PyTorch performance.</p>
             </div>`,
         code: `
             <div class="section">
-                <h2>💻 PyTorch Code Examples</h2>
+                <h2>💻 PyTorch Project Code</h2>
 
-                <h3>1. Complete Training Loop</h3>
+                <h3>1. Complete Training Framework</h3>
                 <div class="code-block"><span class="keyword">import</span> torch
 <span class="keyword">import</span> torch.nn <span class="keyword">as</span> nn
-
-<span class="keyword">class</span> <span class="class">MLP</span>(nn.Module):
-    <span class="keyword">def</span> <span class="function">__init__</span>(self, in_dim, hidden, out_dim):
-        <span class="keyword">super</span>().__init__()
-        self.net = nn.Sequential(
-            nn.Linear(in_dim, hidden),
-            nn.ReLU(),
-            nn.Dropout(<span class="number">0.3</span>),
-            nn.Linear(hidden, out_dim)
-        )
+<span class="keyword">from</span> torch.utils.data <span class="keyword">import</span> DataLoader
+
+<span class="keyword">class</span> <span class="class">Trainer</span>:
+    <span class="keyword">def</span> <span class="function">__init__</span>(self, model, optimizer, criterion, device=<span class="string">'cuda'</span>):
+        self.model = model.to(device)
+        self.optimizer = optimizer
+        self.criterion = criterion
+        self.device = device
+        self.history = {<span class="string">'train_loss'</span>: [], <span class="string">'val_loss'</span>: []}
     
-    <span class="keyword">def</span> <span class="function">forward</span>(self, x):
-        <span class="keyword">return</span> self.net(x)
-
-model = MLP(<span class="number">784</span>, <span class="number">256</span>, <span class="number">10</span>).to(<span class="string">'cuda'</span>)
-optimizer = torch.optim.AdamW(model.parameters(), lr=<span class="number">3e-4</span>)
-criterion = nn.CrossEntropyLoss()
-
-<span class="keyword">for</span> epoch <span class="keyword">in</span> <span class="function">range</span>(<span class="number">10</span>):
-    model.train()
-    <span class="keyword">for</span> X_batch, y_batch <span class="keyword">in</span> train_loader:
-        X_batch = X_batch.to(<span class="string">'cuda'</span>)
-        y_batch = y_batch.to(<span class="string">'cuda'</span>)
-        
-        logits = model(X_batch)
-        loss = criterion(logits, y_batch)
-        
-        optimizer.zero_grad()
-        loss.backward()
-        torch.nn.utils.clip_grad_norm_(model.parameters(), <span class="number">1.0</span>)
-        optimizer.step()</div>
-
-                <h3>2. Custom Dataset</h3>
-                <div class="code-block"><span class="keyword">from</span> torch.utils.data <span class="keyword">import</span> Dataset, DataLoader
-
-<span class="keyword">class</span> <span class="class">TabularDataset</span>(Dataset):
-    <span class="keyword">def</span> <span class="function">__init__</span>(self, df, target_col):
-        self.X = torch.FloatTensor(df.drop(target_col, axis=<span class="number">1</span>).values)
-        self.y = torch.LongTensor(df[target_col].values)
+    <span class="keyword">def</span> <span class="function">train_epoch</span>(self, loader):
+        self.model.train()
+        total_loss = <span class="number">0</span>
+        <span class="keyword">for</span> X, y <span class="keyword">in</span> loader:
+            X, y = X.to(self.device), y.to(self.device)
+            self.optimizer.zero_grad()
+            loss = self.criterion(self.model(X), y)
+            loss.backward()
+            torch.nn.utils.clip_grad_norm_(self.model.parameters(), <span class="number">1.0</span>)
+            self.optimizer.step()
+            total_loss += loss.item() * <span class="function">len</span>(X)
+        <span class="keyword">return</span> total_loss / <span class="function">len</span>(loader.dataset)
+    
+    <span class="preprocessor">@torch.no_grad()</span>
+    <span class="keyword">def</span> <span class="function">evaluate</span>(self, loader):
+        self.model.eval()
+        total_loss = <span class="number">0</span>
+        <span class="keyword">for</span> X, y <span class="keyword">in</span> loader:
+            X, y = X.to(self.device), y.to(self.device)
+            total_loss += self.criterion(self.model(X), y).item() * <span class="function">len</span>(X)
+        <span class="keyword">return</span> total_loss / <span class="function">len</span>(loader.dataset)
+    
+    <span class="keyword">def</span> <span class="function">fit</span>(self, train_loader, val_loader, epochs, patience=<span class="number">5</span>):
+        best_loss = <span class="keyword">float</span>(<span class="string">'inf'</span>)
+        wait = <span class="number">0</span>
+        <span class="keyword">for</span> epoch <span class="keyword">in</span> <span class="function">range</span>(epochs):
+            train_loss = self.train_epoch(train_loader)
+            val_loss = self.evaluate(val_loader)
+            self.history[<span class="string">'train_loss'</span>].append(train_loss)
+            self.history[<span class="string">'val_loss'</span>].append(val_loss)
+            <span class="function">print</span>(<span class="string">f"Epoch {epoch+1}: train={train_loss:.4f} val={val_loss:.4f}"</span>)
+            <span class="keyword">if</span> val_loss < best_loss:
+                best_loss = val_loss
+                torch.save(self.model.state_dict(), <span class="string">'best_model.pt'</span>)
+                wait = <span class="number">0</span>
+            <span class="keyword">else</span>:
+                wait += <span class="number">1</span>
+                <span class="keyword">if</span> wait >= patience:
+                    <span class="function">print</span>(<span class="string">"Early stopping!"</span>)
+                    <span class="keyword">break</span></div>
+
+                <h3>2. Custom Dataset for Any Tabular Data</h3>
+                <div class="code-block"><span class="keyword">class</span> <span class="class">TabularDataset</span>(torch.utils.data.Dataset):
+    <span class="keyword">def</span> <span class="function">__init__</span>(self, df, target, cat_cols=<span class="keyword">None</span>, num_cols=<span class="keyword">None</span>):
+        self.target = torch.FloatTensor(df[target].values)
+        self.num = torch.FloatTensor(df[num_cols].values) <span class="keyword">if</span> num_cols <span class="keyword">else</span> <span class="keyword">None</span>
+        self.cat = torch.LongTensor(df[cat_cols].values) <span class="keyword">if</span> cat_cols <span class="keyword">else</span> <span class="keyword">None</span>
     
     <span class="keyword">def</span> <span class="function">__len__</span>(self):
-        <span class="keyword">return</span> len(self.X)
+        <span class="keyword">return</span> <span class="function">len</span>(self.target)
     
     <span class="keyword">def</span> <span class="function">__getitem__</span>(self, idx):
-        <span class="keyword">return</span> self.X[idx], self.y[idx]
-
-loader = DataLoader(dataset, batch_size=<span class="number">64</span>, shuffle=<span class="keyword">True</span>,
-    num_workers=<span class="number">4</span>, pin_memory=<span class="keyword">True</span>)</div>
+        x = {}
+        <span class="keyword">if</span> self.num <span class="keyword">is not</span> <span class="keyword">None</span>: x[<span class="string">'num'</span>] = self.num[idx]
+        <span class="keyword">if</span> self.cat <span class="keyword">is not</span> <span class="keyword">None</span>: x[<span class="string">'cat'</span>] = self.cat[idx]
+        <span class="keyword">return</span> x, self.target[idx]</div>
 
-                <h3>3. Mixed Precision Training</h3>
+                <h3>3. Mixed Precision + Gradient Accumulation</h3>
                 <div class="code-block"><span class="keyword">from</span> torch.cuda.amp <span class="keyword">import</span> autocast, GradScaler
 
 scaler = GradScaler()
-<span class="keyword">for</span> X, y <span class="keyword">in</span> train_loader:
-    optimizer.zero_grad()
-    <span class="keyword">with</span> autocast():  <span class="comment"># Float16 forward pass</span>
-        logits = model(X.cuda())
-        loss = criterion(logits, y.cuda())
-    scaler.scale(loss).backward()  <span class="comment"># Scaled backward</span>
-    scaler.step(optimizer)
-    scaler.update()</div>
+accum_steps = <span class="number">4</span>  <span class="comment"># Effective batch = batch_size × 4</span>
+
+<span class="keyword">for</span> i, (X, y) <span class="keyword">in</span> <span class="function">enumerate</span>(loader):
+    <span class="keyword">with</span> autocast():
+        loss = model(X.cuda(), y.cuda()) / accum_steps
+    scaler.scale(loss).backward()
+    
+    <span class="keyword">if</span> (i + <span class="number">1</span>) % accum_steps == <span class="number">0</span>:
+        scaler.unscale_(optimizer)
+        torch.nn.utils.clip_grad_norm_(model.parameters(), <span class="number">1.0</span>)
+        scaler.step(optimizer)
+        scaler.update()
+        optimizer.zero_grad()</div>
 
                 <h3>4. Transfer Learning</h3>
                 <div class="code-block"><span class="keyword">import</span> torchvision.models <span class="keyword">as</span> models
 
-<span class="comment"># Load pretrained, freeze, replace head</span>
 model = models.resnet50(weights=<span class="string">'IMAGENET1K_V2'</span>)
 model.requires_grad_(<span class="keyword">False</span>)  <span class="comment"># Freeze all</span>
-model.fc = nn.Linear(<span class="number">2048</span>, <span class="number">10</span>)  <span class="comment"># New trainable head</span></div>
+model.fc = nn.Sequential(
+    nn.Dropout(<span class="number">0.3</span>),
+    nn.Linear(<span class="number">2048</span>, <span class="number">512</span>),
+    nn.ReLU(),
+    nn.Linear(<span class="number">512</span>, num_classes)
+)
+
+<span class="comment"># Discriminative LR: lower for pretrained, higher for new head</span>
+optimizer = torch.optim.AdamW([
+    {<span class="string">'params'</span>: model.layer4.parameters(), <span class="string">'lr'</span>: <span class="number">1e-5</span>},
+    {<span class="string">'params'</span>: model.fc.parameters(), <span class="string">'lr'</span>: <span class="number">1e-3</span>}
+])</div>
+
+                <h3>5. Model Save/Load Best Practices</h3>
+                <div class="code-block"><span class="comment"># Save everything for resuming training</span>
+checkpoint = {
+    <span class="string">'epoch'</span>: epoch,
+    <span class="string">'model_state'</span>: model.state_dict(),
+    <span class="string">'optimizer_state'</span>: optimizer.state_dict(),
+    <span class="string">'scheduler_state'</span>: scheduler.state_dict(),
+    <span class="string">'best_loss'</span>: best_loss,
+    <span class="string">'config'</span>: config
+}
+torch.save(checkpoint, <span class="string">'checkpoint.pt'</span>)
+
+<span class="comment"># Resume training</span>
+ckpt = torch.load(<span class="string">'checkpoint.pt'</span>, map_location=device)
+model.load_state_dict(ckpt[<span class="string">'model_state'</span>])
+optimizer.load_state_dict(ckpt[<span class="string">'optimizer_state'</span>])</div>
             </div>`,
             interview: `
             <div class="section">
                 <h2>🎯 PyTorch Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: How does autograd work?</strong><p><strong>Answer:</strong> PyTorch records operations in a DAG when <code>requires_grad=True</code>. <code>.backward()</code> traverses the graph in reverse, computing gradients via chain rule. Graph is destroyed after backward (dynamic graph).</p></div>
-                <div class="interview-box"><strong>Q2: Why call optimizer.zero_grad()?</strong><p><strong>Answer:</strong> PyTorch accumulates gradients by default. Without zeroing, gradients from previous batch add to current. This is intentional — allows gradient accumulation for larger effective batches.</p></div>
-                <div class="interview-box"><strong>Q3: model.train() vs model.eval()?</strong><p><strong>Answer:</strong> <code>train()</code>: BatchNorm uses batch stats, Dropout is active. <code>eval()</code>: BatchNorm uses running stats, Dropout disabled. Always switch before training/inference.</p></div>
-                <div class="interview-box"><strong>Q4: .detach() vs with torch.no_grad()?</strong><p><strong>Answer:</strong> <code>.detach()</code>: creates a tensor that shares data but doesn't track gradients (single tensor). <code>torch.no_grad()</code>: context manager disabling gradient computation for all operations inside (saves memory during inference).</p></div>
-                <div class="interview-box"><strong>Q5: How to debug vanishing/exploding gradients?</strong><p><strong>Answer:</strong> (1) Register backward hooks to monitor gradient magnitudes. (2) Use <code>torch.nn.utils.clip_grad_norm_</code>. (3) Gradient histograms in TensorBoard. (4) Check if BatchNorm/LayerNorm is applied. (5) Try skip connections (ResNet idea).</p></div>
-                <div class="interview-box"><strong>Q6: DataLoader num_workers — how many?</strong><p><strong>Answer:</strong> Rule of thumb: <code>num_workers = 4 * num_gpus</code>. Too many = CPU overhead, too few = GPU starved. Use <code>pin_memory=True</code> for faster CPU→GPU transfer. Profile to find sweet spot.</p></div>
+                <div class="interview-box"><strong>Q1: How does autograd work?</strong><p><strong>Answer:</strong> Records ops in DAG. .backward() traverses reverse, chain rule. Graph destroyed after backward. Dynamic = rebuilt each forward.</p></div>
+                <div class="interview-box"><strong>Q2: Why zero_grad()?</strong><p><strong>Answer:</strong> Gradients accumulate. Without zeroing, previous batch adds to current. Intentional: enables gradient accumulation for larger effective batch.</p></div>
+                <div class="interview-box"><strong>Q3: .detach() vs torch.no_grad()?</strong><p><strong>Answer:</strong> detach(): single tensor, shares data. no_grad(): context manager for all ops inside, saves memory. Use no_grad() for inference.</p></div>
+                <div class="interview-box"><strong>Q4: How to debug vanishing gradients?</strong><p><strong>Answer:</strong> (1) Backward hooks for gradient magnitudes. (2) clip_grad_norm_. (3) TensorBoard histograms. (4) BatchNorm/LayerNorm. (5) Skip connections.</p></div>
+                <div class="interview-box"><strong>Q5: DataLoader num_workers?</strong><p><strong>Answer:</strong> Rule: 4 × num_gpus. Too many = CPU overhead. pin_memory=True for faster transfers. Profile to find sweet spot.</p></div>
+                <div class="interview-box"><strong>Q6: torch.compile vs eager?</strong><p><strong>Answer:</strong> compile JITs model via TorchDynamo+Triton. 30-60% faster. One line change. The future of PyTorch performance.</p></div>
+                <div class="interview-box"><strong>Q7: How to save/load models?</strong><p><strong>Answer:</strong> state_dict (weights only) vs full checkpoint (weights + optimizer + epoch). Use state_dict for inference, checkpoint for resuming.</p></div>
+                <div class="interview-box"><strong>Q8: Mixed precision — how and why?</strong><p><strong>Answer:</strong> autocast(fp16 forward) + GradScaler(fp32 grads). 2-3x speedup. Minimal accuracy loss. Standard for GPU training.</p></div>
             </div>`
 },
 
@@ -1066,60 +1596,62 @@ model.fc = nn.Linear(<span class="number">2048</span>, <span class="number">10</
                 <h2>🧠 TensorFlow & Keras — Complete Guide</h2>
 
                 <div class="info-box">
-                    <div class="box-title">⚡ TensorFlow 2.x Philosophy</div>
-                    <div class="box-content">TF2 defaults to <strong>eager execution</strong> (like PyTorch). <code>@tf.function</code> compiles to static graph for production speed. Keras is the official high-level API. TF handles the full ML lifecycle: training → saving → serving → monitoring.</div>
+                    <div class="box-title">⚡ TF2 = Eager by Default + @tf.function for Speed</div>
+                    <div class="box-content">TF2 defaults to eager mode (like PyTorch). <code>@tf.function</code> compiles to graph for production. Keras is the official API. TF handles full lifecycle: train → save → serve → monitor.</div>
                 </div>
 
-                <h3>1. Three Ways to Build Models</h3>
+                <h3>1. Three Model APIs</h3>
                 <table>
                     <tr><th>API</th><th>Use Case</th><th>Flexibility</th></tr>
-                    <tr><td>Sequential</td><td>Simple stack of layers</td><td>Low (linear only)</td></tr>
-                    <tr><td>Functional</td><td>Multi-input/output, branching</td><td>Medium</td></tr>
-                    <tr><td>Subclassing</td><td>Custom forward logic</td><td>High (most flexible)</td></tr>
+                    <tr><td>Sequential</td><td>Linear stack</td><td>Low</td></tr>
+                    <tr><td>Functional</td><td>Multi-input/output, branching</td><td>Medium (recommended)</td></tr>
+                    <tr><td>Subclassing</td><td>Custom forward logic</td><td>High</td></tr>
                 </table>
 
-                <h3>2. tf.data — The Data Pipeline</h3>
-                <p>Build efficient input pipelines: <code>tf.data.Dataset</code> chains transformations lazily. Key methods: <code>.map()</code>, <code>.batch()</code>, <code>.shuffle()</code>, <code>.prefetch(tf.data.AUTOTUNE)</code>. Prefetching overlaps data loading with model execution. Supports TFRecord files for large datasets.</p>
+                <h3>2. tf.data Pipeline</h3>
+                <p>Chains transformations lazily. <code>.map()</code>, <code>.batch()</code>, <code>.shuffle()</code>, <code>.prefetch(AUTOTUNE)</code>. Prefetching overlaps loading with GPU execution. <code>.cache()</code> for small datasets. <code>.interleave()</code> for reading multiple files. TFRecord format for large datasets.</p>
 
                 <h3>3. Callbacks — Training Hooks</h3>
                 <table>
                     <tr><th>Callback</th><th>Purpose</th></tr>
-                    <tr><td>ModelCheckpoint</td><td>Save best model (monitor val_loss)</td></tr>
+                    <tr><td>ModelCheckpoint</td><td>Save best model</td></tr>
                     <tr><td>EarlyStopping</td><td>Stop when metric plateaus</td></tr>
                     <tr><td>ReduceLROnPlateau</td><td>Reduce LR when stuck</td></tr>
-                    <tr><td>TensorBoard</td><td>Visualize training metrics</td></tr>
-                    <tr><td>CSVLogger</td><td>Log metrics to CSV</td></tr>
-                    <tr><td>LambdaCallback</td><td>Custom logic per epoch</td></tr>
+                    <tr><td>TensorBoard</td><td>Visualize metrics</td></tr>
+                    <tr><td>CSVLogger</td><td>Log to CSV</td></tr>
+                    <tr><td>LambdaCallback</td><td>Custom per-epoch logic</td></tr>
                 </table>
 
-                <h3>4. Custom Training with GradientTape</h3>
-                <p>For full control: <code>tf.GradientTape()</code> records operations, then <code>tape.gradient(loss, model.trainable_variables)</code> computes gradients. Same pattern as PyTorch's manual loop. Use for: GANs, reinforcement learning, custom loss functions.</p>
+                <h3>4. GradientTape — Custom Training</h3>
+                <p>Record ops → compute gradients → apply. Use for: GANs, RL, custom losses, gradient penalty, multi-loss weighting. Same concept as PyTorch's manual loop.</p>
 
-                <h3>5. SavedModel for Deployment</h3>
-                <p><code>model.save('path')</code> exports as SavedModel format — includes architecture, weights, and computation graph. Ready for TF Serving, TF Lite (mobile), TF.js (browser). Universal deployment format.</p>
+                <h3>5. @tf.function — Production Speed</h3>
+                <p>Trace Python → TF graph. Benefits: optimized execution, XLA, export. Gotchas: Python side effects only during tracing. Use <code>tf.print()</code> in graphs.</p>
 
-                <h3>6. @tf.function — Graph Compilation</h3>
-                <p>Decorating with <code>@tf.function</code> traces Python code into a TF graph. Benefits: optimized execution, XLA compilation, deployment. Gotchas: Python side effects only run during tracing, use <code>tf.print()</code> instead of <code>print()</code>.</p>
+                <h3>6. SavedModel — Universal Deployment</h3>
+                <p><code>model.save('path')</code> exports architecture + weights + computation. Ready for: TF Serving (production), TF Lite (mobile), TF.js (browser). One model, any platform.</p>
 
-                <h3>7. TF vs PyTorch — When to Choose</h3>
+                <h3>7. Keras Tuner — Automated Hyperparameter Search</h3>
+                <p>Build model function → Tuner searches space. Strategies: Random, Hyperband, Bayesian. Integrates with TensorBoard. Alternative to Optuna for Keras models.</p>
+
+                <h3>8. TF vs PyTorch — Decision Guide</h3>
                 <table>
-                    <tr><th>Aspect</th><th>TensorFlow</th><th>PyTorch</th></tr>
-                    <tr><td>Deployment</td><td>TF Serving, TFLite, TF.js</td><td>TorchServe, ONNX</td></tr>
-                    <tr><td>Research</td><td>Less common now</td><td>Dominant in papers</td></tr>
-                    <tr><td>Production</td><td>Mature ecosystem</td><td>Catching up fast</td></tr>
-                    <tr><td>Mobile</td><td>TFLite (mature)</td><td>PyTorch Mobile</td></tr>
-                    <tr><td>Debugging</td><td>Harder (graph mode)</td><td>Easier (eager by default)</td></tr>
+                    <tr><th>Choose TF When</th><th>Choose PyTorch When</th></tr>
+                    <tr><td>Production deployment at scale</td><td>Research & prototyping</td></tr>
+                    <tr><td>Mobile (TFLite mature)</td><td>Hugging Face ecosystem</td></tr>
+                    <tr><td>TPU training</td><td>GPU research</td></tr>
+                    <tr><td>Edge devices</td><td>Custom architectures</td></tr>
+                    <tr><td>Browser (TF.js)</td><td>Academic papers</td></tr>
                 </table>
             </div>`,
         code: `
             <div class="section">
-                <h2>💻 TensorFlow Code Examples</h2>
+                <h2>💻 TensorFlow Project Code</h2>
 
-                <h3>1. Functional API Model</h3>
+                <h3>1. Functional API — Multi-Input Model</h3>
                 <div class="code-block"><span class="keyword">import</span> tensorflow <span class="keyword">as</span> tf
 <span class="keyword">from</span> tensorflow <span class="keyword">import</span> keras
 
-<span class="comment"># Multi-input model</span>
 text_input = keras.Input(shape=(<span class="number">100</span>,), name=<span class="string">'text'</span>)
 num_input = keras.Input(shape=(<span class="number">5</span>,), name=<span class="string">'features'</span>)
 
@@ -1128,7 +1660,9 @@ x1 = keras.layers.GlobalAveragePooling1D()(x1)
 x2 = keras.layers.Dense(<span class="number">32</span>, activation=<span class="string">'relu'</span>)(num_input)
 
 combined = keras.layers.Concatenate()([x1, x2])
-output = keras.layers.Dense(<span class="number">1</span>, activation=<span class="string">'sigmoid'</span>)(combined)
+x = keras.layers.Dense(<span class="number">64</span>, activation=<span class="string">'relu'</span>)(combined)
+x = keras.layers.Dropout(<span class="number">0.3</span>)(x)
+output = keras.layers.Dense(<span class="number">1</span>, activation=<span class="string">'sigmoid'</span>)(x)
 model = keras.Model(inputs=[text_input, num_input], outputs=output)</div>
 
                 <h3>2. Training with Callbacks</h3>
@@ -1143,8 +1677,8 @@ model = keras.Model(inputs=[text_input, num_input], outputs=output)</div>
 
 model.compile(optimizer=<span class="string">'adam'</span>, loss=<span class="string">'binary_crossentropy'</span>,
     metrics=[<span class="string">'accuracy'</span>, keras.metrics.AUC()])
-model.fit(X_train, y_train, epochs=<span class="number">50</span>, validation_split=<span class="number">0.2</span>,
-    callbacks=callbacks)</div>
+model.fit(X_train, y_train, epochs=<span class="number">50</span>,
+    validation_split=<span class="number">0.2</span>, callbacks=callbacks)</div>
 
                 <h3>3. Custom Training Loop (GradientTape)</h3>
                 <div class="code-block"><span class="preprocessor">@tf.function</span>
@@ -1157,25 +1691,37 @@ model.fit(X_train, y_train, epochs=<span class="number">50</span>, validation_sp
     <span class="keyword">return</span> loss</div>
 
                 <h3>4. tf.data Pipeline</h3>
-                <div class="code-block"><span class="comment"># Efficient data pipeline with prefetching</span>
-dataset = (
+                <div class="code-block">dataset = (
     tf.data.Dataset.from_tensor_slices((X, y))
     .shuffle(<span class="number">10000</span>)
     .batch(<span class="number">64</span>)
     .map(<span class="keyword">lambda</span> x, y: (augment(x), y),
         num_parallel_calls=tf.data.AUTOTUNE)
-    .prefetch(tf.data.AUTOTUNE)  <span class="comment"># Overlap loading + training</span>
+    .prefetch(tf.data.AUTOTUNE)
 )</div>
+
+                <h3>5. Custom Callback for Experiment Logging</h3>
+                <div class="code-block"><span class="keyword">class</span> <span class="class">ExperimentLogger</span>(keras.callbacks.Callback):
+    <span class="keyword">def</span> <span class="function">__init__</span>(self, log_path):
+        self.log_path = log_path
+        self.logs_data = []
+    
+    <span class="keyword">def</span> <span class="function">on_epoch_end</span>(self, epoch, logs=<span class="keyword">None</span>):
+        self.logs_data.append({<span class="string">'epoch'</span>: epoch, **logs})
+        pd.DataFrame(self.logs_data).to_csv(self.log_path, index=<span class="keyword">False</span>)
+        <span class="keyword">if</span> logs[<span class="string">'val_loss'</span>] > logs[<span class="string">'loss'</span>] * <span class="number">1.5</span>:
+            <span class="function">print</span>(<span class="string">f"⚠️ Possible overfitting at epoch {epoch}"</span>)</div>
             </div>`,
             interview: `
             <div class="section">
                 <h2>🎯 TensorFlow Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: Sequential vs Functional vs Subclassing?</strong><p><strong>Answer:</strong> Sequential: linear stack. Functional: multi-input/output, shared layers. Subclassing: full Python control, custom forward. Use Functional for most real projects.</p></div>
-                <div class="interview-box"><strong>Q2: What does @tf.function do?</strong><p><strong>Answer:</strong> Compiles Python function into a TF graph. Faster execution, enables XLA optimization, required for SavedModel export. Gotcha: Python code only runs during tracing — side effects behave differently.</p></div>
-                <div class="interview-box"><strong>Q3: How does tf.data improve performance?</strong><p><strong>Answer:</strong> Chains transformations lazily. <code>.prefetch(AUTOTUNE)</code> overlaps data loading with GPU computation. <code>.cache()</code> stores in memory after first epoch. <code>.interleave()</code> reads multiple files concurrently.</p></div>
-                <div class="interview-box"><strong>Q4: EarlyStopping — what to monitor?</strong><p><strong>Answer:</strong> Usually <code>val_loss</code>. Set <code>patience=5-10</code> (epochs without improvement). <code>restore_best_weights=True</code> reverts to best epoch. Combine with <code>ReduceLROnPlateau</code> for better convergence.</p></div>
-                <div class="interview-box"><strong>Q5: When to use GradientTape?</strong><p><strong>Answer:</strong> When Keras <code>.fit()</code> is too restrictive: GANs (two optimizers), RL (custom gradients), multi-loss weighting, gradient penalty, research experiments needing full control.</p></div>
-                <div class="interview-box"><strong>Q6: TF vs PyTorch — when to choose each?</strong><p><strong>Answer:</strong> TF: production deployment (TF Serving, TFLite), mobile apps, TPU training. PyTorch: research, prototyping, Hugging Face ecosystem. Both are converging in features.</p></div>
+                <div class="interview-box"><strong>Q1: Sequential vs Functional vs Subclassing?</strong><p><strong>Answer:</strong> Sequential: linear. Functional: multi-I/O, branching. Subclassing: full Python control. Use Functional for most projects.</p></div>
+                <div class="interview-box"><strong>Q2: What does @tf.function do?</strong><p><strong>Answer:</strong> Traces Python → TF graph. Faster, XLA, export. Gotcha: side effects only during tracing.</p></div>
+                <div class="interview-box"><strong>Q3: tf.data performance?</strong><p><strong>Answer:</strong> prefetch(AUTOTUNE) overlaps loading+training. cache() for small data. interleave() for multiple files.</p></div>
+                <div class="interview-box"><strong>Q4: EarlyStopping config?</strong><p><strong>Answer:</strong> monitor='val_loss', patience=5-10, restore_best_weights=True. Combine with ReduceLROnPlateau.</p></div>
+                <div class="interview-box"><strong>Q5: When GradientTape?</strong><p><strong>Answer:</strong> GANs, RL, custom gradients, multi-loss. When .fit() is too restrictive.</p></div>
+                <div class="interview-box"><strong>Q6: TF vs PyTorch?</strong><p><strong>Answer:</strong> TF: deployment (Serving, Lite, JS), mobile. PyTorch: research, HuggingFace. Both converging.</p></div>
+                <div class="interview-box"><strong>Q7: How to deploy TF model?</strong><p><strong>Answer:</strong> SavedModel → TF Serving (REST/gRPC), TFLite (mobile), TF.js (browser). Docker + TF Serving for production.</p></div>
             </div>`
 },
 
@@ -1186,166 +1732,252 @@ dataset = (
 
                 <div class="info-box">
                     <div class="box-title">⚡ Production = Reliability + Reproducibility + Observability</div>
-                    <div class="box-content">Production code must be <strong>tested</strong> (pytest), <strong>typed</strong> (mypy), <strong>logged</strong> (structured logging), <strong>packaged</strong> (pyproject.toml), <strong>containerized</strong> (Docker), and <strong>monitored</strong> (metrics/alerts). The gap between notebook code and production code is enormous.</div>
+                    <div class="box-content">Production code must be <strong>tested</strong> (pytest), <strong>typed</strong> (mypy), <strong>logged</strong> (structured), <strong>packaged</strong> (pyproject.toml), <strong>containerized</strong> (Docker), and <strong>monitored</strong> (metrics). The gap between notebook and production is enormous.</div>
                 </div>
 
                 <h3>1. pytest — Professional Testing</h3>
                 <table>
                     <tr><th>Feature</th><th>Purpose</th><th>Example</th></tr>
-                    <tr><td>fixtures</td><td>Reusable test setup</td><td><code>@pytest.fixture</code> for test data</td></tr>
-                    <tr><td>parametrize</td><td>Run same test with many inputs</td><td><code>@pytest.mark.parametrize</code></td></tr>
-                    <tr><td>conftest.py</td><td>Shared fixtures across tests</td><td>DB connections, mock data</td></tr>
-                    <tr><td>monkeypatch</td><td>Override functions/env vars</td><td>Mock API calls</td></tr>
-                    <tr><td>tmp_path</td><td>Temporary directory</td><td>Test file I/O without cleanup</td></tr>
-                    <tr><td>markers</td><td>Tag tests (slow, gpu, integration)</td><td><code>pytest -m "not slow"</code></td></tr>
+                    <tr><td>fixtures</td><td>Reusable test setup</td><td><code>@pytest.fixture</code></td></tr>
+                    <tr><td>parametrize</td><td>Many inputs, same test</td><td><code>@pytest.mark.parametrize</code></td></tr>
+                    <tr><td>conftest.py</td><td>Shared fixtures</td><td>DB connections, mock data</td></tr>
+                    <tr><td>monkeypatch</td><td>Override functions/env</td><td>Mock API calls</td></tr>
+                    <tr><td>tmp_path</td><td>Temp directory</td><td>Test file I/O</td></tr>
+                    <tr><td>markers</td><td>Tag tests</td><td><code>pytest -m "not slow"</code></td></tr>
+                    <tr><td>coverage</td><td>Measure test coverage</td><td><code>pytest --cov</code></td></tr>
                 </table>
 
-                <h3>2. Logging Best Practices</h3>
-                <div class="callout tip">
-                    <div class="callout-title">💡 Logging vs Print</div>
-                    Never use <code>print()</code> in production. Use <code>logging</code> module: configurable levels (DEBUG/INFO/WARNING/ERROR), output to files, structured format, no performance cost when disabled.
+                <h3>2. Testing ML Code</h3>
+                <div class="info-box">
+                    <div class="box-title">🎯 What to Test in ML</div>
+                    <div class="box-content">
+                        <strong>Unit:</strong> data transforms, feature engineering, loss functions.<br>
+                        <strong>Integration:</strong> full pipeline end-to-end.<br>
+                        <strong>Model:</strong> output shape, range, determinism with seed.<br>
+                        <strong>Data:</strong> schema validation, distribution shifts, missing patterns.
+                    </div>
                 </div>
+
+                <h3>3. Logging Best Practices</h3>
                 <table>
-                    <tr><th>Level</th><th>When to Use</th></tr>
-                    <tr><td>DEBUG</td><td>Detailed diagnostic (tensor shapes, intermediate values)</td></tr>
-                    <tr><td>INFO</td><td>Normal events (training started, epoch complete)</td></tr>
-                    <tr><td>WARNING</td><td>Something unexpected but handled (missing feature, fallback)</td></tr>
-                    <tr><td>ERROR</td><td>Something failed (model load error, API failure)</td></tr>
-                    <tr><td>CRITICAL</td><td>System-level failure (out of memory, GPU crash)</td></tr>
+                    <tr><th>Level</th><th>When</th></tr>
+                    <tr><td>DEBUG</td><td>Tensor shapes, intermediate values</td></tr>
+                    <tr><td>INFO</td><td>Training started, epoch complete</td></tr>
+                    <tr><td>WARNING</td><td>Unexpected but handled (fallback used)</td></tr>
+                    <tr><td>ERROR</td><td>Model load failure, API error</td></tr>
+                    <tr><td>CRITICAL</td><td>OOM, GPU crash</td></tr>
                 </table>
-
-                <h3>3. Project Structure</h3>
-                <div class="code-block">project/
-├── src/
-│   └── mypackage/
-│       ├── __init__.py
-│       ├── data/
-│       ├── models/
-│       ├── training/
-│       └── serving/
-├── tests/
-├── configs/
-├── pyproject.toml
-├── Dockerfile
-└── README.md</div>
+                <p>Never use <code>print()</code>. Use structured logging (JSON format) for production — parseable by log aggregators (ELK, Datadog).</p>
 
                 <h3>4. FastAPI for Model Serving</h3>
-                <p>Modern async web framework. Auto-generates OpenAPI docs. Type-validated requests via Pydantic. Use for: model inference APIs, data pipelines, webhook handlers. Deploy with Uvicorn + Docker. Add health checks and input validation.</p>
+                <p>Modern async framework. Auto-generates OpenAPI docs. Pydantic validation. Deploy with Uvicorn + Docker. Add: health checks, input validation, error handling, rate limiting, request logging.</p>
+
+                <h3>5. Docker for ML</h3>
+                <p>Containerize everything: Python, CUDA, dependencies. Multi-stage builds: builder (install) → runtime (slim). Pin versions. NVIDIA Container Toolkit for GPU. <code>docker compose</code> for multi-service (API + Redis + DB).</p>
 
-                <h3>5. Docker for ML Projects</h3>
-                <p>Containerize your entire environment: Python version, CUDA drivers, dependencies. Multi-stage builds: builder stage (install deps) → runtime stage (slim image). Use NVIDIA Container Toolkit for GPU access. Pin all dependency versions.</p>
+                <h3>6. pyproject.toml — Modern Packaging</h3>
+                <p>Replaces setup.py/cfg. Project metadata, dependencies, build system, tool configs (pytest, mypy, ruff). <code>[project.optional-dependencies]</code> for dev/test extras. <code>pip install -e ".[dev]"</code> for editable installs.</p>
 
-                <h3>6. Configuration Management</h3>
+                <h3>7. Configuration Management</h3>
                 <table>
                     <tr><th>Tool</th><th>Best For</th><th>Key Feature</th></tr>
-                    <tr><td>Hydra</td><td>ML experiments</td><td>YAML configs, CLI overrides, multi-run</td></tr>
+                    <tr><td>Hydra</td><td>ML experiments</td><td>YAML, CLI overrides, multi-run</td></tr>
                     <tr><td>Pydantic Settings</td><td>App config</td><td>Env var loading, validation</td></tr>
                     <tr><td>python-dotenv</td><td>Simple projects</td><td>.env file loading</td></tr>
-                    <tr><td>dynaconf</td><td>Multi-environment</td><td>dev/staging/prod configs</td></tr>
                 </table>
 
-                <h3>7. CI/CD for ML</h3>
-                <p>Automate: linting (ruff/flake8), type checking (mypy), testing (pytest), building (Docker), deploying. Use GitHub Actions or GitLab CI. Add model validation gate: compare new model metrics against baseline before deployment.</p>
+                <h3>8. CI/CD for ML</h3>
+                <p>GitHub Actions: lint (ruff) → type check (mypy) → test (pytest) → build (Docker) → deploy. Add model validation gate: new model must beat baseline on test metrics before deployment.</p>
 
-                <h3>8. Code Quality Tools</h3>
+                <h3>9. Code Quality Tools</h3>
                 <table>
                     <tr><th>Tool</th><th>Purpose</th></tr>
-                    <tr><td>ruff</td><td>Fast linter + formatter (replaces black, isort, flake8)</td></tr>
-                    <tr><td>mypy</td><td>Static type checking</td></tr>
-                    <tr><td>pre-commit</td><td>Git hooks for auto-formatting</td></tr>
-                    <tr><td>pytest-cov</td><td>Test coverage measurement</td></tr>
+                    <tr><td><strong>ruff</strong></td><td>Fast linter + formatter (replaces black, isort, flake8)</td></tr>
+                    <tr><td><strong>mypy</strong></td><td>Static type checking</td></tr>
+                    <tr><td><strong>pre-commit</strong></td><td>Git hooks for auto-formatting</td></tr>
+                    <tr><td><strong>pytest-cov</strong></td><td>Test coverage</td></tr>
+                    <tr><td><strong>bandit</strong></td><td>Security linting</td></tr>
+                </table>
+
+                <h3>10. MLOps — Model Lifecycle</h3>
+                <table>
+                    <tr><th>Tool</th><th>Purpose</th></tr>
+                    <tr><td>MLflow</td><td>Experiment tracking, model registry</td></tr>
+                    <tr><td>DVC</td><td>Data versioning (like Git for data)</td></tr>
+                    <tr><td>Weights & Biases</td><td>Experiment tracking, visualization</td></tr>
+                    <tr><td>Evidently</td><td>Data drift & model monitoring</td></tr>
+                    <tr><td>Great Expectations</td><td>Data validation</td></tr>
+                </table>
+
+                <h3>11. Database for ML Projects</h3>
+                <table>
+                    <tr><th>DB</th><th>Use Case</th><th>Python Library</th></tr>
+                    <tr><td>SQLite</td><td>Local, small data, prototyping</td><td>sqlite3 (built-in)</td></tr>
+                    <tr><td>PostgreSQL</td><td>Production, ACID, JSON</td><td>psycopg2, SQLAlchemy</td></tr>
+                    <tr><td>Redis</td><td>Caching, queues, sessions</td><td>redis-py</td></tr>
+                    <tr><td>MongoDB</td><td>Flexible schema, documents</td><td>pymongo</td></tr>
+                    <tr><td>Pinecone/Weaviate</td><td>Vector search (embeddings)</td><td>Official SDKs</td></tr>
                 </table>
             </div>`,
         code: `
             <div class="section">
-                <h2>💻 Production Python Code Examples</h2>
+                <h2>💻 Production Python Project Code</h2>
 
-                <h3>1. pytest — ML Testing Patterns</h3>
+                <h3>1. pytest — Complete ML Testing</h3>
                 <div class="code-block"><span class="keyword">import</span> pytest
 <span class="keyword">import</span> numpy <span class="keyword">as</span> np
 
+<span class="comment"># conftest.py — shared fixtures</span>
 <span class="preprocessor">@pytest.fixture</span>
 <span class="keyword">def</span> <span class="function">sample_data</span>():
+    np.random.seed(<span class="number">42</span>)
     X = np.random.randn(<span class="number">100</span>, <span class="number">10</span>)
     y = np.random.randint(<span class="number">0</span>, <span class="number">2</span>, <span class="number">100</span>)
     <span class="keyword">return</span> X, y
 
+<span class="preprocessor">@pytest.fixture</span>
+<span class="keyword">def</span> <span class="function">trained_model</span>(sample_data):
+    X, y = sample_data
+    model = RandomForestClassifier(n_estimators=<span class="number">10</span>)
+    model.fit(X, y)
+    <span class="keyword">return</span> model
+
+<span class="comment"># Test multiple models with one function</span>
 <span class="preprocessor">@pytest.mark.parametrize</span>(<span class="string">"model_cls"</span>, [
-    LogisticRegression,
-    RandomForestClassifier,
-    GradientBoostingClassifier
+    LogisticRegression, RandomForestClassifier, GradientBoostingClassifier
 ])
-<span class="keyword">def</span> <span class="function">test_model_fits</span>(model_cls, sample_data):
+<span class="keyword">def</span> <span class="function">test_model_output</span>(model_cls, sample_data):
     X, y = sample_data
     model = model_cls()
     model.fit(X, y)
     preds = model.predict(X)
     <span class="keyword">assert</span> preds.shape == y.shape
-    <span class="keyword">assert</span> <span class="function">set</span>(preds).issubset({<span class="number">0</span>, <span class="number">1</span>})</div>
+    <span class="keyword">assert</span> <span class="function">set</span>(np.unique(preds)).issubset({<span class="number">0</span>, <span class="number">1</span>})
+
+<span class="comment"># Test data pipeline</span>
+<span class="keyword">def</span> <span class="function">test_pipeline_no_leakage</span>(sample_data, pipeline):
+    X, y = sample_data
+    scores = cross_val_score(pipeline, X, y, cv=<span class="number">3</span>)
+    <span class="keyword">assert</span> <span class="function">all</span>(s >= <span class="number">0</span> <span class="keyword">and</span> s <= <span class="number">1</span> <span class="keyword">for</span> s <span class="keyword">in</span> scores)</div>
 
                 <h3>2. Structured Logging</h3>
-                <div class="code-block"><span class="keyword">import</span> logging
-<span class="keyword">import</span> json
+                <div class="code-block"><span class="keyword">import</span> logging, json, sys
 
 <span class="keyword">class</span> <span class="class">JSONFormatter</span>(logging.Formatter):
     <span class="keyword">def</span> <span class="function">format</span>(self, record):
-        <span class="keyword">return</span> json.dumps({
+        log = {
             <span class="string">'timestamp'</span>: self.formatTime(record),
             <span class="string">'level'</span>: record.levelname,
-            <span class="string">'message'</span>: record.getMessage(),
-            <span class="string">'module'</span>: record.module
-        })
-
-logger = logging.getLogger(<span class="string">'ml_pipeline'</span>)
-logger.setLevel(logging.INFO)
-handler = logging.StreamHandler()
-handler.setFormatter(JSONFormatter())
-logger.addHandler(handler)
-
-logger.info(<span class="string">"Training complete"</span>, extra={<span class="string">'accuracy'</span>: <span class="number">0.95</span>})</div>
-
-                <h3>3. FastAPI Model Serving</h3>
-                <div class="code-block"><span class="keyword">from</span> fastapi <span class="keyword">import</span> FastAPI
-<span class="keyword">from</span> pydantic <span class="keyword">import</span> BaseModel
-
-app = FastAPI(title=<span class="string">"ML API"</span>)
+            <span class="string">'module'</span>: record.module,
+            <span class="string">'message'</span>: record.getMessage()
+        }
+        <span class="keyword">if</span> record.exc_info:
+            log[<span class="string">'exception'</span>] = self.formatException(record.exc_info)
+        <span class="keyword">return</span> json.dumps(log)
+
+<span class="keyword">def</span> <span class="function">setup_logging</span>(level=logging.INFO):
+    handler = logging.StreamHandler(sys.stdout)
+    handler.setFormatter(JSONFormatter())
+    logging.root.handlers = [handler]
+    logging.root.setLevel(level)
+
+logger = logging.getLogger(__name__)
+logger.info(<span class="string">"Training started"</span>, extra={<span class="string">'model'</span>: <span class="string">'xgb'</span>})</div>
+
+                <h3>3. FastAPI — Complete ML API</h3>
+                <div class="code-block"><span class="keyword">from</span> fastapi <span class="keyword">import</span> FastAPI, HTTPException
+<span class="keyword">from</span> pydantic <span class="keyword">import</span> BaseModel, Field
+<span class="keyword">import</span> joblib, numpy <span class="keyword">as</span> np
+
+app = FastAPI(title=<span class="string">"ML Prediction API"</span>)
+model = <span class="keyword">None</span>
+
+<span class="preprocessor">@app.on_event</span>(<span class="string">"startup"</span>)
+<span class="keyword">def</span> <span class="function">load_model</span>():
+    <span class="keyword">global</span> model
+    model = joblib.load(<span class="string">"models/pipeline.pkl"</span>)
 
 <span class="keyword">class</span> <span class="class">PredictRequest</span>(BaseModel):
-    features: <span class="keyword">list</span>[<span class="keyword">float</span>]
-    model_name: <span class="keyword">str</span> = <span class="string">"default"</span>
+    features: <span class="keyword">list</span>[<span class="keyword">float</span>] = Field(..., min_length=<span class="number">1</span>)
+
+<span class="keyword">class</span> <span class="class">PredictResponse</span>(BaseModel):
+    prediction: <span class="keyword">int</span>
+    probability: <span class="keyword">float</span>
+    model_version: <span class="keyword">str</span>
 
-<span class="preprocessor">@app.post</span>(<span class="string">"/predict"</span>)
+<span class="preprocessor">@app.post</span>(<span class="string">"/predict"</span>, response_model=PredictResponse)
 <span class="keyword">async def</span> <span class="function">predict</span>(req: PredictRequest):
-    X = np.array(req.features).reshape(<span class="number">1</span>, -<span class="number">1</span>)
-    pred = model.predict(X)
-    <span class="keyword">return</span> {<span class="string">"prediction"</span>: pred.tolist()}
+    <span class="keyword">try</span>:
+        X = np.array(req.features).reshape(<span class="number">1</span>, -<span class="number">1</span>)
+        pred = model.predict(X)[<span class="number">0</span>]
+        proba = model.predict_proba(X)[<span class="number">0</span>].max()
+        <span class="keyword">return</span> PredictResponse(
+            prediction=<span class="keyword">int</span>(pred), probability=<span class="keyword">float</span>(proba),
+            model_version=<span class="string">"v2.1"</span>
+        )
+    <span class="keyword">except</span> <span class="function">Exception</span> <span class="keyword">as</span> e:
+        <span class="keyword">raise</span> HTTPException(<span class="number">500</span>, detail=<span class="keyword">str</span>(e))
 
 <span class="preprocessor">@app.get</span>(<span class="string">"/health"</span>)
 <span class="keyword">async def</span> <span class="function">health</span>():
-    <span class="keyword">return</span> {<span class="string">"status"</span>: <span class="string">"healthy"</span>}</div>
+    <span class="keyword">return</span> {<span class="string">"status"</span>: <span class="string">"healthy"</span>, <span class="string">"model_loaded"</span>: model <span class="keyword">is not</span> <span class="keyword">None</span>}</div>
 
                 <h3>4. Dockerfile for ML</h3>
                 <div class="code-block"><span class="comment"># Multi-stage build</span>
-FROM python:3.11-slim as builder
+FROM python:3.11-slim AS builder
 COPY requirements.txt .
-RUN pip install --no-cache-dir -r requirements.txt
+RUN pip install --no-cache-dir --target=/deps -r requirements.txt
 
 FROM python:3.11-slim
-COPY --from=builder /usr/local/lib/python3.11 /usr/local/lib/python3.11
+COPY --from=builder /deps /usr/local/lib/python3.11/site-packages
 COPY src/ /app/src/
 COPY models/ /app/models/
 WORKDIR /app
-CMD ["uvicorn", "src.api:app", "--host", "0.0.0.0"]</div>
+EXPOSE 8000
+HEALTHCHECK CMD curl -f http://localhost:8000/health || exit 1
+CMD ["uvicorn", "src.api:app", "--host", "0.0.0.0", "--port", "8000"]</div>
+
+                <h3>5. Makefile for Project Commands</h3>
+                <div class="code-block"><span class="comment"># Makefile — run from project root</span>
+.PHONY: install test lint train serve
+
+install:
+    pip install -e ".[dev]"
+
+test:
+    pytest tests/ -v --cov=src --cov-report=term-missing
+
+lint:
+    ruff check src/ tests/
+    mypy src/
+
+train:
+    python -m src.training.train --config configs/default.yaml
+
+serve:
+    uvicorn src.api:app --reload --port 8000</div>
+
+                <h3>6. MLflow Experiment Tracking</h3>
+                <div class="code-block"><span class="keyword">import</span> mlflow
+
+mlflow.set_experiment(<span class="string">"customer_churn"</span>)
+<span class="keyword">with</span> mlflow.start_run():
+    mlflow.log_params({<span class="string">"model"</span>: <span class="string">"xgb"</span>, <span class="string">"lr"</span>: <span class="number">0.01</span>})
+    model.fit(X_train, y_train)
+    mlflow.log_metrics({<span class="string">"f1"</span>: f1, <span class="string">"auc"</span>: auc_score})
+    mlflow.sklearn.log_model(pipeline, <span class="string">"model"</span>)</div>
             </div>`,
             interview: `
             <div class="section">
                 <h2>🎯 Production Python Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: How do you test ML code?</strong><p><strong>Answer:</strong> (1) Unit tests: data transformations, feature engineering functions. (2) Integration tests: full pipeline end-to-end. (3) Model tests: output shape, range, determinism with seeds. (4) Data tests: schema validation, distribution checks. Use pytest fixtures for reusable test data.</p></div>
-                <div class="interview-box"><strong>Q2: print() vs logging — why?</strong><p><strong>Answer:</strong> Logging: configurable levels, file output, structured format, zero cost when disabled, thread-safe. Print: none of these. Production code must use logging for observability and debugging.</p></div>
-                <div class="interview-box"><strong>Q3: How to serve an ML model in production?</strong><p><strong>Answer:</strong> FastAPI/Flask for REST API. Docker for containerization. Load model at startup (not per request). Add health checks, input validation, error handling, logging, metrics. Use async for high throughput. Consider model registries (MLflow) for versioning.</p></div>
-                <div class="interview-box"><strong>Q4: What goes in pyproject.toml?</strong><p><strong>Answer:</strong> Project metadata, dependencies, build system, tool configs (pytest, mypy, ruff). Replaced setup.py/setup.cfg. Pin dependency versions for reproducibility. Use <code>[project.optional-dependencies]</code> for dev/test extras.</p></div>
-                <div class="interview-box"><strong>Q5: How to manage ML experiment configs?</strong><p><strong>Answer:</strong> Hydra: YAML configs with CLI overrides, multi-run sweeps. Store configs in version control. Never hardcode hyperparameters. Use config groups for model/data/training combos.</p></div>
-                <div class="interview-box"><strong>Q6: What is CI/CD for ML?</strong><p><strong>Answer:</strong> Automate: lint → type-check → test → build → deploy. Add model validation gate: new model must beat baseline on test metrics. Use GitHub Actions. Include data validation (Great Expectations) in pipeline.</p></div>
+                <div class="interview-box"><strong>Q1: How to test ML code?</strong><p><strong>Answer:</strong> Unit: transforms, features. Integration: full pipeline. Model: shape, range, determinism. Data: schema, distributions. Use pytest fixtures.</p></div>
+                <div class="interview-box"><strong>Q2: print() vs logging?</strong><p><strong>Answer:</strong> Logging: levels, file output, structured (JSON), zero cost when disabled, thread-safe. Print: none. Production = logging.</p></div>
+                <div class="interview-box"><strong>Q3: How to serve ML model?</strong><p><strong>Answer:</strong> FastAPI + Docker. Load model at startup. Add health checks, validation, error handling, logging. Async for throughput.</p></div>
+                <div class="interview-box"><strong>Q4: pyproject.toml vs setup.py?</strong><p><strong>Answer:</strong> pyproject.toml: modern standard, all tools in one file. Pin deps. Use optional deps for dev/test. pip install -e ".[dev]".</p></div>
+                <div class="interview-box"><strong>Q5: ML experiment configs?</strong><p><strong>Answer:</strong> Hydra: YAML + CLI overrides + multi-run sweeps. Version control configs. Never hardcode hyperparams.</p></div>
+                <div class="interview-box"><strong>Q6: CI/CD for ML?</strong><p><strong>Answer:</strong> lint → type-check → test → build → deploy. Model validation gate: must beat baseline. GitHub Actions + Docker.</p></div>
+                <div class="interview-box"><strong>Q7: How to handle model versioning?</strong><p><strong>Answer:</strong> MLflow model registry. DVC for data. Git for code. timestamp + metrics in model filename. A/B testing for rollout.</p></div>
+                <div class="interview-box"><strong>Q8: What is data drift?</strong><p><strong>Answer:</strong> Input distribution changes post-deployment. Detect: Evidently, statistical tests. Monitor: feature distributions, prediction distributions. Retrain trigger.</p></div>
             </div>`
 },
 
@@ -1356,82 +1988,103 @@ CMD ["uvicorn", "src.api:app", "--host", "0.0.0.0"]</div>
 
                 <div class="info-box">
                     <div class="box-title">⚡ The Optimization Hierarchy</div>
-                    <div class="box-content"><strong>1. Algorithm</strong> (O(n²) → O(n log n)) > <strong>2. Data structures</strong> (list → set for lookups) > <strong>3. Vectorization</strong> (NumPy) > <strong>4. Compilation</strong> (Numba/Cython) > <strong>5. Parallelization</strong> (multiprocessing/Dask) > <strong>6. Hardware</strong> (GPU). Always start from the top.</div>
+                    <div class="box-content"><strong>1. Algorithm</strong> (O(n²)→O(n log n)) > <strong>2. Data structures</strong> (list→set) > <strong>3. Vectorization</strong> (NumPy) > <strong>4. Compilation</strong> (Numba/Cython) > <strong>5. Parallelization</strong> (multiprocessing) > <strong>6. Hardware</strong> (GPU). Always start from the top.</div>
                 </div>
 
-                <h3>1. Profiling — Measure Before Optimizing</h3>
+                <h3>1. Profiling — Measure First</h3>
                 <table>
-                    <tr><th>Tool</th><th>Type</th><th>When to Use</th><th>Overhead</th></tr>
-                    <tr><td>cProfile</td><td>Function-level</td><td>Find slow functions</td><td>~2x slowdown</td></tr>
-                    <tr><td>line_profiler</td><td>Line-by-line</td><td>Find slow lines in a function</td><td>Higher</td></tr>
-                    <tr><td>Py-Spy</td><td>Sampling profiler</td><td>Production profiling</td><td>Near zero</td></tr>
-                    <tr><td>tracemalloc</td><td>Memory allocation</td><td>Find memory leaks</td><td>Low</td></tr>
-                    <tr><td>memory_profiler</td><td>Line-by-line memory</td><td>Find memory-heavy lines</td><td>High</td></tr>
-                    <tr><td>scalene</td><td>CPU + Memory + GPU</td><td>Comprehensive profiling</td><td>Low</td></tr>
+                    <tr><th>Tool</th><th>Type</th><th>When</th><th>Overhead</th></tr>
+                    <tr><td>cProfile</td><td>Function-level</td><td>Find slow functions</td><td>~2x</td></tr>
+                    <tr><td>line_profiler</td><td>Line-by-line</td><td>Optimize hot function</td><td>Higher</td></tr>
+                    <tr><td>Py-Spy</td><td>Sampling</td><td>Production profiling</td><td>Near zero</td></tr>
+                    <tr><td>tracemalloc</td><td>Memory</td><td>Find leaks</td><td>Low</td></tr>
+                    <tr><td>memory_profiler</td><td>Line memory</td><td>Memory per line</td><td>High</td></tr>
+                    <tr><td>scalene</td><td>CPU+Memory+GPU</td><td>Comprehensive</td><td>Low</td></tr>
                 </table>
 
-                <h3>2. The GIL and Parallelism</h3>
-                <p><strong>GIL</strong> prevents true multi-threading for CPU-bound Python code. But: NumPy, Pandas, and scikit-learn <strong>release the GIL</strong> during C operations. Solutions for parallelism:</p>
+                <h3>2. The GIL — What Every Python Dev Must Know</h3>
+                <div class="info-box">
+                    <div class="box-title">🔒 Global Interpreter Lock</div>
+                    <div class="box-content">GIL prevents true multi-threading for CPU-bound Python. BUT: NumPy, Pandas, scikit-learn <strong>release the GIL</strong> during C operations. Python 3.13: experimental free-threaded CPython (no-GIL).</div>
+                </div>
                 <table>
-                    <tr><th>Tool</th><th>Best For</th><th>How</th></tr>
-                    <tr><td>threading</td><td>I/O-bound (API calls, disk)</td><td>GIL released during I/O waits</td></tr>
-                    <tr><td>multiprocessing</td><td>CPU-bound Python</td><td>Separate processes, separate GIL</td></tr>
-                    <tr><td>concurrent.futures</td><td>Simple parallel patterns</td><td>ThreadPool/ProcessPool executors</td></tr>
-                    <tr><td>asyncio</td><td>Many I/O operations</td><td>Event loop, cooperative multitasking</td></tr>
-                    <tr><td>joblib</td><td>sklearn parallel</td><td>n_jobs parameter</td></tr>
+                    <tr><th>Task Type</th><th>Solution</th><th>Why</th></tr>
+                    <tr><td>I/O-bound</td><td>asyncio / threading</td><td>GIL released during I/O</td></tr>
+                    <tr><td>CPU-bound Python</td><td>multiprocessing</td><td>Separate processes, separate GIL</td></tr>
+                    <tr><td>CPU-bound NumPy</td><td>threading OK</td><td>NumPy releases GIL</td></tr>
+                    <tr><td>Many tasks</td><td>concurrent.futures</td><td>Simple Pool interface</td></tr>
                 </table>
 
                 <h3>3. Numba — JIT Compilation</h3>
-                <p><code>@numba.jit(nopython=True)</code> compiles Python functions to machine code. Supports NumPy arrays and most math operations. 10-100x speedup for loops that can't be vectorized. <code>@numba.vectorize</code> creates custom ufuncs. <code>@numba.cuda.jit</code> runs on GPU.</p>
+                <p><code>@numba.jit(nopython=True)</code>: compile to machine code. 10-100x speedup for loops. Supports NumPy, math. <code>@numba.vectorize</code>: custom ufuncs. <code>@cuda.jit</code>: GPU kernels. Best for: tight loops that can't be vectorized.</p>
 
-                <h3>4. Cython — C-Level Performance</h3>
-                <p>Compiles Python to C extension modules. Add type declarations for massive speedups. Best for: tight loops, calling C libraries, CPython extensions. More setup than Numba but more control.</p>
+                <h3>4. Dask — Parallel Computing</h3>
+                <p>Pandas/NumPy API for data bigger than memory. <code>dask.dataframe</code>, <code>dask.array</code>, <code>dask.delayed</code>. Lazy execution. Task graph scheduler. Scales from laptop to cluster. Alternative: Polars for single-machine parallel.</p>
 
-                <h3>5. Dask — Parallel Computing</h3>
-                <p>Pandas-like API for datasets larger than memory. Key abstractions: <code>dask.dataframe</code> (parallel Pandas), <code>dask.array</code> (parallel NumPy), <code>dask.delayed</code> (custom parallelism). Uses a task scheduler to execute lazily. Scales from laptop to cluster.</p>
+                <h3>5. Ray — Distributed ML</h3>
+                <p>General-purpose distributed framework. Ray Tune (hyperparameter tuning), Ray Serve (model serving), Ray Data. Easier than Dask for ML. Used by OpenAI, Uber.</p>
 
-                <h3>6. Ray — Distributed ML</h3>
-                <p>General-purpose distributed framework. Ray Tune for hyperparameter tuning, Ray Serve for model serving, Ray Data for data processing. Easier than Dask for ML-specific workloads. Used by OpenAI, Uber, Ant Group.</p>
-
-                <h3>7. Memory Optimization</h3>
+                <h3>6. Memory Optimization</h3>
                 <ul>
                     <li><strong>__slots__:</strong> 40% memory savings per instance</li>
-                    <li><strong>Generator expressions:</strong> O(1) memory vs O(n) for lists</li>
-                    <li><strong>dtype downcasting:</strong> float64 → float32 = 50% savings</li>
+                    <li><strong>Generators:</strong> O(1) memory vs O(n) for lists</li>
+                    <li><strong>dtype downcasting:</strong> float64→float32 = 50% savings</li>
                     <li><strong>Category dtype:</strong> Repeated strings → 90% savings</li>
-                    <li><strong>Memory-mapped files:</strong> Process files larger than RAM</li>
-                    <li><strong>del + gc.collect():</strong> Free large objects explicitly</li>
+                    <li><strong>Memory-mapped files:</strong> Process files > RAM</li>
+                    <li><strong>del + gc.collect():</strong> Free large objects</li>
+                    <li><strong>array module:</strong> For simple typed arrays (no NumPy overhead)</li>
                 </ul>
 
+                <h3>7. Caching Strategies</h3>
+                <table>
+                    <tr><th>Tool</th><th>Scope</th><th>Use Case</th></tr>
+                    <tr><td>@functools.lru_cache</td><td>In-memory, function</td><td>Expensive computations</td></tr>
+                    <tr><td>@functools.cache</td><td>Unbounded cache</td><td>Pure functions</td></tr>
+                    <tr><td>joblib.Memory</td><td>Disk cache</td><td>Data processing pipelines</td></tr>
+                    <tr><td>Redis</td><td>External cache</td><td>Multi-process, API responses</td></tr>
+                    <tr><td>diskcache</td><td>Pure Python disk</td><td>Simple persistent cache</td></tr>
+                </table>
+
                 <h3>8. Python 3.12-3.13 Performance</h3>
-                <p><strong>3.12:</strong> Faster interpreter (5-15% overall), better error messages, per-interpreter GIL (experimental). <strong>3.13:</strong> Free-threaded CPython (no-GIL mode experimental), JIT compiler (experimental). The future of Python performance is exciting.</p>
+                <p><strong>3.12:</strong> 5-15% faster, better errors, per-interpreter GIL. <strong>3.13:</strong> Free-threaded (no-GIL experimental), JIT compiler (experimental). The future of Python performance is exciting.</p>
+
+                <h3>9. Common Performance Anti-Patterns</h3>
+                <table>
+                    <tr><th>Anti-Pattern</th><th>Fix</th><th>Speedup</th></tr>
+                    <tr><td><code>for row in df.iterrows()</code></td><td>Vectorized ops</td><td>100-1000x</td></tr>
+                    <tr><td><code>s += "text"</code> in loop</td><td><code>''.join(parts)</code></td><td>100x</td></tr>
+                    <tr><td><code>x in big_list</code></td><td><code>x in big_set</code></td><td>1000x</td></tr>
+                    <tr><td>Python list of floats</td><td>NumPy array</td><td>50-100x</td></tr>
+                    <tr><td>Global imports in function</td><td>Import at top</td><td>Variable</td></tr>
+                    <tr><td>Not using built-ins</td><td><code>sum()</code>, <code>min()</code></td><td>5-10x</td></tr>
+                </table>
             </div>`,
         code: `
             <div class="section">
                 <h2>💻 Performance Code Examples</h2>
 
-                <h3>1. Profiling</h3>
-                <div class="code-block"><span class="keyword">import</span> cProfile
-<span class="keyword">import</span> pstats
+                <h3>1. Profiling Workflow</h3>
+                <div class="code-block"><span class="keyword">import</span> cProfile, pstats
 
-<span class="comment"># Profile a function</span>
+<span class="comment"># Profile and find bottlenecks</span>
 <span class="keyword">with</span> cProfile.Profile() <span class="keyword">as</span> pr:
-    result = expensive_function(data)
+    result = expensive_pipeline(data)
 
 stats = pstats.Stats(pr)
 stats.sort_stats(<span class="string">'cumulative'</span>)
-stats.print_stats(<span class="number">10</span>)  <span class="comment"># Top 10 functions</span>
+stats.print_stats(<span class="number">10</span>)  <span class="comment"># Top 10 slow functions</span>
 
 <span class="comment"># Memory profiling</span>
 <span class="keyword">import</span> tracemalloc
 tracemalloc.start()
-<span class="comment"># ... do work ...</span>
+<span class="comment"># ... process data ...</span>
 snapshot = tracemalloc.take_snapshot()
 <span class="keyword">for</span> stat <span class="keyword">in</span> snapshot.statistics(<span class="string">'filename'</span>)[:<span class="number">5</span>]:
     <span class="function">print</span>(stat)</div>
 
-                <h3>2. Numba JIT — Vectorization Impossible</h3>
+                <h3>2. Numba JIT</h3>
                 <div class="code-block"><span class="keyword">import</span> numba
+<span class="keyword">import</span> numpy <span class="keyword">as</span> np
 
 <span class="preprocessor">@numba.jit</span>(nopython=<span class="keyword">True</span>)
 <span class="keyword">def</span> <span class="function">pairwise_distance</span>(X):
@@ -1444,50 +2097,72 @@ snapshot = tracemalloc.take_snapshot()
                 d += (X[i,k] - X[j,k]) ** <span class="number">2</span>
             D[i,j] = D[j,i] = d ** <span class="number">0.5</span>
     <span class="keyword">return</span> D
-<span class="comment"># 100x faster than pure Python loops!</span></div>
+<span class="comment"># 100x faster than pure Python!</span></div>
+
+                <h3>3. concurrent.futures — Parallel Processing</h3>
+                <div class="code-block"><span class="keyword">from</span> concurrent.futures <span class="keyword">import</span> ProcessPoolExecutor, ThreadPoolExecutor
 
-                <h3>3. Dask for Large Data</h3>
+<span class="comment"># CPU-bound: processes</span>
+<span class="keyword">with</span> ProcessPoolExecutor(max_workers=<span class="number">8</span>) <span class="keyword">as</span> ex:
+    results = <span class="keyword">list</span>(ex.map(process_chunk, data_chunks))
+
+<span class="comment"># I/O-bound: threads</span>
+<span class="keyword">with</span> ThreadPoolExecutor(max_workers=<span class="number">32</span>) <span class="keyword">as</span> ex:
+    results = <span class="keyword">list</span>(ex.map(fetch_url, urls))</div>
+
+                <h3>4. Dask for Large Data</h3>
                 <div class="code-block"><span class="keyword">import</span> dask.dataframe <span class="keyword">as</span> dd
 
-<span class="comment"># Read 100GB of CSV files — lazy!</span>
+<span class="comment"># Read 100GB of CSVs — lazy!</span>
 ddf = dd.read_csv(<span class="string">'data/*.csv'</span>)
 
 <span class="comment"># Same Pandas API — but parallel</span>
 result = (
     ddf.groupby(<span class="string">'category'</span>)
-    .agg({<span class="string">'revenue'</span>: <span class="string">'sum'</span>, <span class="string">'quantity'</span>: <span class="string">'mean'</span>})
-    .compute()  <span class="comment"># Only here does execution happen</span>
+    .agg({<span class="string">'revenue'</span>: <span class="string">'sum'</span>, <span class="string">'qty'</span>: <span class="string">'mean'</span>})
+    .compute()  <span class="comment"># Only here does it execute</span>
 )</div>
 
-                <h3>4. concurrent.futures — Simple Parallelism</h3>
-                <div class="code-block"><span class="keyword">from</span> concurrent.futures <span class="keyword">import</span> ProcessPoolExecutor, ThreadPoolExecutor
+                <h3>5. functools.lru_cache — Memoization</h3>
+                <div class="code-block"><span class="keyword">from</span> functools <span class="keyword">import</span> lru_cache
 
-<span class="comment"># CPU-bound: use ProcessPool</span>
-<span class="keyword">with</span> ProcessPoolExecutor(max_workers=<span class="number">8</span>) <span class="keyword">as</span> executor:
-    results = <span class="keyword">list</span>(executor.map(process_chunk, chunks))
+<span class="preprocessor">@lru_cache</span>(maxsize=<span class="number">1024</span>)
+<span class="keyword">def</span> <span class="function">expensive_feature</span>(customer_id: <span class="keyword">int</span>) -> <span class="keyword">dict</span>:
+    <span class="comment"># DB query, computation, etc.</span>
+    <span class="keyword">return</span> compute_features(customer_id)
 
-<span class="comment"># I/O-bound: use ThreadPool</span>
-<span class="keyword">with</span> ThreadPoolExecutor(max_workers=<span class="number">32</span>) <span class="keyword">as</span> executor:
-    results = <span class="keyword">list</span>(executor.map(fetch_url, urls))</div>
+<span class="comment"># First call: computes. Second call: instant from cache</span>
+<span class="function">print</span>(expensive_feature.cache_info())  <span class="comment"># hits, misses, size</span></div>
 
-                <h3>5. __slots__ for Memory</h3>
+                <h3>6. __slots__ for Memory</h3>
                 <div class="code-block"><span class="keyword">class</span> <span class="class">Point</span>:
     __slots__ = (<span class="string">'x'</span>, <span class="string">'y'</span>, <span class="string">'z'</span>)
     <span class="keyword">def</span> <span class="function">__init__</span>(self, x, y, z):
-        self.x = x
-        self.y = y
-        self.z = z
-<span class="comment"># 1M instances: ~60MB vs ~160MB without __slots__</span></div>
+        self.x, self.y, self.z = x, y, z
+
+<span class="comment"># 1M instances: ~60MB vs ~160MB without __slots__</span>
+points = [Point(i, i*<span class="number">2</span>, i*<span class="number">3</span>) <span class="keyword">for</span> i <span class="keyword">in</span> <span class="function">range</span>(<span class="number">1_000_000</span>)]</div>
+
+                <h3>7. String Performance</h3>
+                <div class="code-block"><span class="comment"># ❌ O(n²) — creates new string each iteration</span>
+result = <span class="string">""</span>
+<span class="keyword">for</span> word <span class="keyword">in</span> words:
+    result += word + <span class="string">" "</span>
+
+<span class="comment"># ✅ O(n) — single allocation at end</span>
+result = <span class="string">" "</span>.join(words)</div>
             </div>`,
             interview: `
             <div class="section">
                 <h2>🎯 Performance Interview Questions</h2>
-                <div class="interview-box"><strong>Q1: Why does Python have a GIL?</strong><p><strong>Answer:</strong> Simplifies reference counting (thread-safe without granular locks). Makes single-threaded code faster. Makes C extension integration easier. Python 3.13 has experimental free-threaded mode (no-GIL).</p></div>
-                <div class="interview-box"><strong>Q2: How to optimize a nested loop?</strong><p><strong>Answer:</strong> (1) Vectorize with NumPy (broadcast). (2) If too complex, use Numba JIT. (3) Cython for C-level types. (4) multiprocessing if iterations are independent.</p></div>
-                <div class="interview-box"><strong>Q3: Threading vs Multiprocessing?</strong><p><strong>Answer:</strong> Threading: I/O-bound (shared memory, low overhead). Multiprocessing: CPU-bound (separate memory, bypasses GIL). For downloading 1000 images → threads. For computing 1000 matrix operations → processes.</p></div>
-                <div class="interview-box"><strong>Q4: What is Numba?</strong><p><strong>Answer:</strong> JIT compiler that translates Python/NumPy to machine code using LLVM. <code>@jit(nopython=True)</code> for 10-100x speedup. Works best with: NumPy arrays, math operations, loops. Doesn't support: Pandas, string manipulation, most Python objects.</p></div>
-                <div class="interview-box"><strong>Q5: How to profile Python code?</strong><p><strong>Answer:</strong> <code>cProfile</code>: function-level (find slow functions). <code>line_profiler</code>: line-by-line. <code>Py-Spy</code>: sampling (production-safe). <code>tracemalloc</code>: memory. <code>scalene</code>: CPU+memory+GPU all-in-one. Always profile before optimizing.</p></div>
-                <div class="interview-box"><strong>Q6: Dask vs Ray vs Spark?</strong><p><strong>Answer:</strong> Dask: familiar Pandas/NumPy API, Python-native, scales well. Ray: ML-focused (tune, serve), lower-level control. Spark: JVM-based, best for very large (TB+) data, enterprise. For Python ML: Dask or Ray. For big data ETL: Spark.</p></div>
+                <div class="interview-box"><strong>Q1: Why the GIL?</strong><p><strong>Answer:</strong> Simplifies reference counting. Makes single-threaded faster. Easier C extensions. Python 3.13 has experimental no-GIL mode.</p></div>
+                <div class="interview-box"><strong>Q2: Optimize nested loop?</strong><p><strong>Answer:</strong> (1) NumPy vectorize. (2) Numba JIT. (3) Cython. (4) multiprocessing if independent.</p></div>
+                <div class="interview-box"><strong>Q3: Threading vs multiprocessing?</strong><p><strong>Answer:</strong> Threading: I/O-bound (shared memory). Multiprocessing: CPU-bound (bypasses GIL). Downloads→threads. Matrix math→processes.</p></div>
+                <div class="interview-box"><strong>Q4: What is Numba?</strong><p><strong>Answer:</strong> JIT compiler: Python→machine code via LLVM. @jit(nopython=True). 10-100x for NumPy loops. No Pandas/strings.</p></div>
+                <div class="interview-box"><strong>Q5: How to profile Python?</strong><p><strong>Answer:</strong> cProfile: functions. line_profiler: lines. Py-Spy: production. tracemalloc: memory. scalene: all-in-one. Profile FIRST, optimize second.</p></div>
+                <div class="interview-box"><strong>Q6: Dask vs Ray vs Spark?</strong><p><strong>Answer:</strong> Dask: Pandas API, Python-native. Ray: ML-focused. Spark: JVM, TB+ data. Python ML: Dask/Ray. Big data ETL: Spark.</p></div>
+                <div class="interview-box"><strong>Q7: Top 3 Python performance tips?</strong><p><strong>Answer:</strong> (1) Use sets not lists for lookups. (2) NumPy not Python loops. (3) Generator expressions for memory. Bonus: lru_cache for expensive functions.</p></div>
+                <div class="interview-box"><strong>Q8: How does lru_cache work?</strong><p><strong>Answer:</strong> Hash-based memoization. Args must be hashable. maxsize=None for unlimited. cache_info() shows hits/misses. Perfect for pure functions.</p></div>
             </div>`
 }
 };

Type	Mutable	Ordered	Hashable	Use Case
list	✓	✓	✗	Sequential data, time series, feature lists
bytearray	✓	✓	✗	Mutable binary buffers
Operation	list	dict	set
Lookup by index/key	O(1)	O(1)	—
Search (x in ...)	O(n)	O(1)	O(1)
Insert/Append	O(1) end, O(n) middle	O(1)	O(1)
Delete	O(n)	O(1)	O(1)
Sort	O(n log n)	—	—
Iteration	O(n)	O(n)	O(n)
Class	Purpose	Why It Matters in DS
defaultdict	Dict with default factory	Group data without KeyError: `defaultdict(list)`
Counter	Count hashable objects	Label distribution: `Counter(y_train)`
namedtuple	Lightweight immutable class	Return multiple values with names, not indices
OrderedDict	Dict remembering insertion order	Legacy (dicts are ordered 3.7+), useful for `move_to_end()`
deque	Double-ended queue	Sliding window computations, BFS algorithms
ChainMap	Stack multiple dicts	Layer config: defaults → env → CLI overrides
Class	Purpose	Project Use Case
defaultdict	Dict with default factory	Group data: `defaultdict(list)`
Counter	Count hashable objects	Label distribution, word frequency
namedtuple	Lightweight immutable class	Return multiple named values
deque	Double-ended queue	Sliding window, BFS, ring buffer
ChainMap	Stack multiple dicts	Config layers: defaults → env → CLI
OrderedDict	Ordered dict (legacy)	`move_to_end()` for LRU cache
Function	What It Does	DS Use Case
`chain()`	Concatenate iterables	Merge multiple data files lazily
`islice()`	Slice any iterator	Take first N records from generator
`groupby()`	Group consecutive elements	Process sorted log entries by date
`product()`	Cartesian product	Generate hyperparameter grid
Function	What It Does	Project Use
`chain()`	Concatenate iterables lazily	Merge data files
`islice()`	Slice any iterator	Take first N from generator
`groupby()`	Group consecutive elements	Process sorted logs by date
`product()`	Cartesian product	Hyperparameter grid
`combinations()`	All r-length combos	Feature interaction pairs
`starmap()`	map() with unpacked args	Apply function to paired data
`accumulate()`	Running total/custom accumulator	Cumulative sums, running max
`tee()`	Clone an iterator N times	Multiple passes over data stream
`accumulate()`	Running accumulator	Cumulative sums, running max
`tee()`	Clone iterator N times	Multiple passes over stream
Format	Read	Write	Best For
JSON	`json.load(f)`	`json.dump(obj, f)`	Configs, API responses
CSV	`csv.DictReader(f)`	`csv.DictWriter(f)`	Tabular data (small)
YAML	`yaml.safe_load(f)`	`yaml.dump(obj, f)`	Config files
Pickle	`pickle.load(f)`	`pickle.dump(obj, f)`	Python objects, models
Parquet	`pd.read_parquet()`	`df.to_parquet()`	Large DataFrames (fast)
SQLite	`sqlite3.connect()`	SQL queries	Local database
Tool	Best For	Key Feature
venv	Simple projects	Built-in, lightweight
conda	DS/ML (C dependencies)	Handles CUDA, MKL
conda	DS/ML (C deps)	Handles CUDA, MKL, OpenCV
poetry	Modern packaging	Lock files, deterministic builds
uv	Speed (Rust-based)	10-100x faster than pip
uv	Speed	10-100x faster pip (Rust-based)
pip-tools	Requirements pinning	`pip-compile` for lock files
Feature	Python List	NumPy ndarray
Storage	Array of pointers to objects	Contiguous block of raw typed data
Type	Each element can differ	Homogeneous — all same dtype
Operations	Python loop (bytecode)	Compiled C/Fortran loops
Memory	~28 bytes per int + pointer	8 bytes per int64 (no overhead)
SIMD	Not possible	Uses CPU vector instructions
Storage	Pointers to objects	Contiguous typed data
Memory per int	~28 bytes + pointer	8 bytes (int64)
Operations	Python loop	Compiled C/Fortran
SIMD	Impossible	CPU vector instructions
dtype	Bytes	When to Use
float32	4	Deep learning (GPU prefers this), 50% less memory
float64	8	Default. Scientific computing, high-precision stats
int32	4	Indices, counts, most integer data
float16	2	Mixed-precision training, inference
float32	4	Deep learning, GPU (50% less memory)
float64	8	Default. Statistics, scientific computing
float16	2	Mixed-precision inference
int32	4	Indices, counts
int8	1	Quantized models
bool	1	Masks for filtering
Method	Output Shape	Use Case
`agg()`	Reduced (one row/group)	Sum, mean, count per group
`transform()`	Same as input	Fill with group mean, normalize within group
`filter()`	Subset of groups	Keep groups with N > 100
`apply()`	Flexible	Custom function per group
Feature	Before (1.x)	After (2.0+)
Backend	NumPy only	Apache Arrow backend option
Copy semantics	Confusing	Copy-on-Write (explicit)
Backend	NumPy only	Apache Arrow option
Copy semantics	Confusing	Copy-on-Write
String dtype	`object`	`string[pyarrow]` (faster)
Nullable types	NaN for everything	pd.NA (proper null)
Index dtypes	int64 default	Matches data dtype