Upload src/physics.py with huggingface_hub

5d6dfb7 verified 28 days ago

12.5 kB

	"""
	physics.py
	==========
	ReRAM / STT-MRAM physics sensor model with Arrhenius-grounded reliability.

	Literature-grounded additions:
	- RC thermal network (Zhang et al. IEEE Trans. Nanotech 2018)
	- Arrhenius retention time (Cheshmikhani & Asadi 2018)
	- Temperature-dependent endurance (Zhang et al.)
	- Read disturb accumulation (STT-MRAM Testing Survey, arXiv 2020)
	"""

	import math
	import warnings
	from dataclasses import dataclass, field
	from collections import deque
	from typing import Dict, Optional
	import numpy as np


	@dataclass
	class ThermalRCParameters:
	"""RC thermal network parameters from Zhang et al. compact model."""
	R_th_jc: float = 2.0 # °C/W, junction-to-case thermal resistance
	R_th_ca: float = 5.0 # °C/W, case-to-ambient thermal resistance
	C_th_j: float = 0.01 # J/°C, junction thermal capacitance
	C_th_c: float = 0.05 # J/°C, case thermal capacitance
	T_ambient: float = 25.0


	@dataclass
	class ArrheniusParameters:
	"""Arrhenius model for retention and endurance."""
	# Retention: tau = tau_0 * exp(Ea_ret / (k_B * T))
	tau_0: float = 1e-9 # seconds, attempt time
	Ea_ret: float = 0.4 # eV, retention activation energy (typical STT-MRAM)
	# Endurance: N_end decreases with temperature (Arrhenius: exp(+Ea/(kT)))
	N_0: float = 1e15 # cycles at reference temp
	Ea_end: float = 0.15 # eV, endurance activation energy (lower = less sensitive)
	# Read disturb: beta per read at reference temp
	beta_0: float = 1e-12 # disturb probability per read at 300K
	Ea_read: float = 0.2 # eV, read disturb activation energy


	k_B_eV = 8.617333e-5 # Boltzmann constant in eV/K


	class PhysicsSensorModel:
	"""
	v3: RC thermal network + Arrhenius retention + temperature-dependent endurance
	+ read disturb counter + write-error rate model (Werner/Prejbeanu STT-MRAM)
	+ array-level parasitic effects (G-1, G-3).
	"""
	def __init__(self,
	V_th_nominal=0.6,
	T_ambient=25.0,
	R_HRS=1e6,
	R_LRS=1e4,
	alpha_drift=0.003,
	sigma_0=0.02,
	alpha_thermal=0.08,
	T_ref=25.0,
	max_endurance_base=1e6,
	# New: RC thermal + Arrhenius
	thermal_params: Optional[ThermalRCParameters] = None,
	arrhenius_params: Optional[ArrheniusParameters] = None,
	# G-1: Write-error rate model (Werner et al. PRB 2005 / Prejbeanu IEDM 2013)
	t_pulse_ns: float = 10.0, # write pulse width
	Delta_E0: float = 60.0, # energy barrier at T_ref (k_B*T units)
	# G-3: Array-level parasitic effects
	R_line_ohm: float = 2.0, # BL/WL line resistance per cell (Ω)
	N_cols: int = 512, # crossbar columns
	N_rows: int = 512, # crossbar rows
	sneak_ratio: float = 0.05, # sneak path current ratio
	):
	self.V_th_nominal = V_th_nominal
	self.T_ambient = T_ambient
	self.T_current = T_ambient
	# Case temperature for RC network
	self.T_case = T_ambient
	self.R_HRS = R_HRS
	self.R_LRS = R_LRS
	self.alpha_drift = alpha_drift
	self.sigma_0 = sigma_0
	self.alpha_thermal = alpha_thermal
	self.T_ref = T_ref
	self.max_endurance_base = max_endurance_base
	self.cycle_count = 0
	self.write_cycles = 0
	self.read_cycles = 0 # NEW: read disturb tracking
	self.fault_history = deque(maxlen=200)
	self.voltage_history = deque(maxlen=200)
	self.temp_history = deque(maxlen=200)

	self.thermal = thermal_params or ThermalRCParameters(T_ambient=T_ambient)
	self.arrhenius = arrhenius_params or ArrheniusParameters()

	# G-1: Write-error rate parameters
	self.t_pulse_ns = t_pulse_ns
	self.Delta_E0 = Delta_E0

	# G-3: Array-level parasitic effects
	self.R_line_ohm = R_line_ohm
	self.N_cols = N_cols
	self.N_rows = N_rows
	self.sneak_ratio = sneak_ratio

	# ---- RC Thermal Network (Zhang et al. compact model) ----
	def update_temperature(self, workload_intensity: float,
	compute_target: str = "PIM",
	dt_s: float = 1e-3) -> float:
	"""
	Newtonian cooling via 2-node RC network.
	P_gen depends on compute_target and workload_intensity.
	"""
	# Power generation (W) — PIM is higher due to crossbar current
	power_rates = {"PIM": 0.3, "CPU": 0.08, "GPU": 0.15}
	P_gen = power_rates.get(compute_target, 0.1) * workload_intensity

	# Junction temperature update
	dT_j = dt_s / self.thermal.C_th_j * (
	P_gen - (self.T_current - self.T_case) / self.thermal.R_th_jc
	)
	# Case temperature update
	dT_c = dt_s / self.thermal.C_th_c * (
	(self.T_current - self.T_case) / self.thermal.R_th_jc -
	(self.T_case - self.thermal.T_ambient) / self.thermal.R_th_ca
	)

	self.T_current = max(self.thermal.T_ambient, self.T_current + dT_j)
	self.T_case = max(self.thermal.T_ambient, self.T_case + dT_c)
	self.temp_history.append(self.T_current)
	return self.T_current

	def get_threshold_voltage(self, deterministic: bool = False) -> float:
	dT = self.T_current - self.T_ref
	drift = self.alpha_drift * dT
	if deterministic:
	jitter = 0.0
	else:
	sigma_sq = self.sigma_0 ** 2 * np.exp(self.alpha_thermal * dT)
	jitter = np.random.normal(0.0, np.sqrt(max(sigma_sq, 0.0)))
	V_th = self.V_th_nominal + drift + jitter
	self.voltage_history.append(V_th)
	self.cycle_count += 1
	return float(V_th)

	def get_fault_density(self) -> float:
	"""
	Includes:
	- Arrhenius temperature acceleration
	- Wear factor (write cycles vs temperature-dependent endurance)
	- Read disturb accumulation
	"""
	base_fault_rate = 0.001
	dT = self.T_current - self.T_ref
	acceleration = np.exp(0.05 * dT)

	# Temperature-dependent endurance (Arrhenius)
	T_kelvin = self.T_current + 273.15
	T_ref_k = self.T_ref + 273.15
	N_endurance = (self.max_endurance_base *
	math.exp(-self.arrhenius.Ea_end / k_B_eV *
	(1.0 / T_kelvin - 1.0 / T_ref_k)))
	wear_factor = 1.0 + (self.write_cycles / max(N_endurance, 1.0)) * 5.0

	# Read disturb (Arrhenius)
	beta_T = (self.arrhenius.beta_0 *
	math.exp(self.arrhenius.Ea_read / k_B_eV *
	(1.0 / T_ref_k - 1.0 / T_kelvin)))
	read_disturb = beta_T * self.read_cycles

	fault_density = min(
	base_fault_rate * acceleration * wear_factor + read_disturb, 1.0)
	self.fault_history.append(fault_density)
	return float(fault_density)

	def get_retention_time(self) -> float:
	"""
	Arrhenius retention time.
	tau_ret = tau_0 * exp(Ea_ret / (k_B * T))
	"""
	T_kelvin = self.T_current + 273.15
	tau = (self.arrhenius.tau_0 *
	math.exp(self.arrhenius.Ea_ret / (k_B_eV * T_kelvin)))
	return float(tau)

	def get_resistance_ratio(self) -> float:
	dT = self.T_current - self.T_ref
	R_HRS_T = self.R_HRS * np.exp(-0.01 * dT)
	R_LRS_T = self.R_LRS * np.exp(0.005 * dT)
	return float(R_HRS_T / R_LRS_T)

	def get_read_margin(self) -> float:
	return float(np.clip((self.get_resistance_ratio() - 1) / 99, 0, 1))

	def get_thermal_reliability(self) -> float:
	t_factor = np.clip(1.0 - (self.T_current - self.T_ambient) / 75.0, 0, 1)
	if len(self.voltage_history) >= 10:
	recent_vth = list(self.voltage_history)[-10:]
	vth_std = np.std(recent_vth)
	v_factor = np.clip(1.0 - vth_std / 0.1, 0, 1)
	else:
	v_factor = 0.8
	margin_factor = self.get_read_margin()
	endurance_factor = np.clip(
	1.0 - self.write_cycles / self.get_temperature_dependent_endurance(), 0, 1)

	return (0.35 * t_factor + 0.25 * v_factor +
	0.25 * margin_factor + 0.15 * endurance_factor)

	def get_temperature_dependent_endurance(self) -> float:
	"""Arrhenius temperature-dependent endurance (decreases with temperature)."""
	T_kelvin = self.T_current + 273.15
	T_ref_k = self.T_ref + 273.15
	# At higher T, (1/T - 1/T_ref) < 0, giving exp(negative) < 1 → lower endurance
	return (self.max_endurance_base *
	math.exp(self.arrhenius.Ea_end / k_B_eV *
	(1.0 / T_kelvin - 1.0 / T_ref_k)))

	def record_write(self, num_writes: int = 1):
	self.write_cycles += num_writes

	def record_read(self, num_reads: int = 1):
	"""NEW: track read disturb accumulation."""
	self.read_cycles += num_reads

	# ---- G-1: Write-Error Rate Model (Werner et al. PRB 2005 / Prejbeanu IEDM 2013) ----
	def get_write_error_rate(self) -> float:
	"""
	Thermal-activation model for STT-MRAM write errors (Werner/Prejbeanu).
	P_error = f(ΔE, T, t_pulse). ΔE ~ 15-40 k_B*T for practical devices.
	Higher T → lower barrier → exponentially higher error rate.
	Shorter pulse → incomplete switching → higher error.
	"""
	T_k = self.T_current + 273.15
	T_ref_k = self.T_ref + 273.15
	# Barrier scales inversely with temperature
	delta_E = self.Delta_E0 * (T_ref_k / T_k)
	# Short-pulse penalty: shorter than critical ~10 ns → errors rise
	t_crit = 10.0
	pulse_penalty = 1.0 + max(0.0, (t_crit - self.t_pulse_ns) / t_crit) * 2.0
	# Base error rate at T_ref is ~1e-9; scales as exp(-delta_E)
	p_error = 1e-6 * np.exp(-delta_E + self.Delta_E0) * pulse_penalty
	return float(np.clip(p_error, 1e-12, 0.5))

	def get_effective_write_yield(self, n_bits: int = 1_048_576) -> float:
	"""Yield = (1 - P_error)^n_bits for an n_bits-wide write."""
	per = self.get_write_error_rate()
	return float((1.0 - per) ** n_bits)

	# ---- G-3: Array-Level Parasitic Effects ----
	def get_effective_read_voltage(self, V_applied: float = 0.2,
	row_idx: int = 0, col_idx: int = 0) -> float:
	"""
	Voltage drop across BL/WL line resistance. Worst-case at far corner.
	IR_drop = I_cell * R_line * (row + col). Sneak paths add parallel load.
	"""
	# Select cell resistance (average)
	R_cell = (self.R_HRS + self.R_LRS) / 2.0
	I_cell = V_applied / R_cell
	# IR drop along lines increases with distance from driver
	ir_drop = I_cell * self.R_line_ohm * (row_idx + col_idx)
	# Sneak path loading: more unselected cells near far corner → more leakage
	n_unselected = (self.N_rows - row_idx) * (self.N_cols - col_idx)
	sneak_factor = 1.0 / (1.0 + self.sneak_ratio * n_unselected / max(1, self.N_rows + self.N_cols))
	V_eff = (V_applied - ir_drop) * sneak_factor
	return float(np.clip(V_eff, 0.01, V_applied))

	def get_sneak_path_penalty(self) -> float:
	"""Returns a fault-density multiplier from sneak path current."""
	return 1.0 + self.sneak_ratio * (self.N_rows * self.N_cols) / 262144.0

	def snapshot(self, deterministic: bool = True) -> Dict[str, float]:
	snap = {
	"temperature_c": self.T_current,
	"temperature_case": self.T_case,
	"v_threshold": self.get_threshold_voltage(deterministic=deterministic),
	"fault_density": self.get_fault_density(),
	"read_margin": self.get_read_margin(),
	"reliability": self.get_thermal_reliability(),
	"retention_time_s": self.get_retention_time(),
	"endurance_remaining": self.get_temperature_dependent_endurance() - self.write_cycles,
	# G-1
	"write_error_rate": self.get_write_error_rate(),
	"write_yield_1Mbit": self.get_effective_write_yield(),
	# G-3
	"effective_read_v": self.get_effective_read_voltage(),
	"sneak_penalty": self.get_sneak_path_penalty(),
	}
	return snap