Spaces:

Sazzz02
/

final_dr

Sleeping

App Files Files Community

final_dr / app.py

Sazzz02

Upload app.py

0e1d3d0 verified 2 months ago

raw

history blame contribute delete

56.1 kB

	"""
	╔══════════════════════════════════════════════════════════════╗
	║ PharmaBridge — Cross-Medical-System Drug Intelligence ║
	║ Hugging Face Spaces \| Gradio 4.x \| Master's Thesis ║
	╚══════════════════════════════════════════════════════════════╝
	7 Tabs:
	1. Smart Drug Search — TF-IDF cosine retrieval with cards UI
	2. Cross-System Compare — Side-by-side 5-system radar comparison
	3. Dataset Analytics — 3 sub-tabs of Plotly dashboards
	4. Drug Fingerprint — Single drug deep-dive profile
	5. FDA Live Intelligence — OpenFDA API (Labels / Events / NDC)
	6. AI Medical Q&A — HuggingFace Inference API (Mistral-7B)
	7. Drug Explorer — Paginated browse & filter table
	"""

	import gradio as gr
	import pandas as pd
	import numpy as np
	import plotly.graph_objects as go
	import plotly.express as px
	from plotly.subplots import make_subplots
	import joblib, re, os, requests, json, warnings
	warnings.filterwarnings("ignore")

	from sklearn.feature_extraction.text import TfidfVectorizer
	from sklearn.metrics.pairwise import cosine_similarity

	# ────────────────────────────────────────────────────────────────
	# 0. LOAD / REBUILD MODELS
	# ────────────────────────────────────────────────────────────────

	def _clean(text):
	if pd.isna(text): return ""
	t = str(text).strip()
	if t in ["FALSE","False","false","nan","NaN",""]: return ""
	return re.sub(r"\s+"," ", re.sub(r"[^a-z0-9\s\+\-\./]"," ", t.lower())).strip()

	def _build_text(row):
	s = row["medical_system"]
	d = _clean(row.get("Dosages Description",""))
	g = _clean(row.get("Generic Name and Strength",""))
	b = _clean(row.get("Brand Name",""))
	n = _clean(row.get("Generic Name",""))
	if s == "Allopathic": return " ".join(filter(None,[n,d,s.lower()]))
	if s in ("Ayurvedic","Herbal"): return " ".join(filter(None,[g,d,s.lower()]))
	if s == "Homeopathic": return " ".join(filter(None,[b,d,s.lower()]))
	return " ".join(filter(None,[g,d,s.lower()])) # Unani

	print("⏳ Loading PharmaBridge models…")
	try:
	VEC = joblib.load("models/tfidf_vectorizer.pkl")
	MAT = joblib.load("models/tfidf_matrix.pkl")
	DF = pd.read_csv("models/drug_database.csv")
	print("✅ PKL models loaded.")
	except Exception as e:
	print(f"⚠️ PKL not found ({e}), rebuilding from CSV…")
	raw = pd.read_csv("merged_pharma_dataset.csv")
	DF = raw.copy()
	DF["drug_text"] = DF.apply(_build_text, axis=1)
	DF = DF.rename(columns={
	"Brand Name":"brand_name","Generic Name":"generic_name",
	"Dosages Description":"dosage_form","Strength":"strength",
	"Name of the Manufacturer":"manufacturer",
	"Generic Name and Strength":"gns",
	})
	VEC = TfidfVectorizer(ngram_range=(1,2),max_features=15000,
	stop_words=None,sublinear_tf=True,min_df=1)
	MAT = VEC.fit_transform(DF["drug_text"])
	print("✅ Rebuilt from CSV.")

	# Normalise column names
	_REMAP = {"Brand Name":"brand_name","Generic Name":"generic_name",
	"Dosages Description":"dosage_form","Strength":"strength",
	"Name of the Manufacturer":"manufacturer","Generic Name and Strength":"gns"}
	for o,n in _REMAP.items():
	if o in DF.columns and n not in DF.columns:
	DF.rename(columns={o:n},inplace=True)
	for c in ["brand_name","generic_name","dosage_form","strength","manufacturer","gns","drug_text"]:
	if c not in DF.columns: DF[c] = ""
	if "drug_text" not in DF.columns or DF["drug_text"].str.len().sum()==0:
	DF["drug_text"] = DF.apply(_build_text, axis=1)

	DF = DF.reset_index(drop=True)

	SYSTEMS = ["All Systems","Allopathic","Ayurvedic","Unani","Homeopathic","Herbal"]
	SC = {"Allopathic":"#3B82F6","Ayurvedic":"#10B981",
	"Unani":"#F59E0B","Homeopathic":"#8B5CF6","Herbal":"#EF4444"}
	EMOJI = {"Allopathic":"💊","Ayurvedic":"🌿","Unani":"☘️","Homeopathic":"💧","Herbal":"🌱"}

	# Pre-compute for analytics
	_SYS_VC = DF["medical_system"].value_counts()
	_DOS_VC = DF["dosage_form"].value_counts()
	_MFR_VC = DF["manufacturer"].value_counts()
	_SYS_MFR = DF.groupby("medical_system")["manufacturer"].nunique()
	_FEAT = np.array(VEC.get_feature_names_out())

	# ────────────────────────────────────────────────────────────────
	# 1. RETRIEVAL HELPERS
	# ────────────────────────────────────────────────────────────────

	def _encode(q):
	q2 = re.sub(r"[^a-z0-9\s\+\-\./]"," ",q.lower())
	return VEC.transform([re.sub(r"\s+"," ",q2).strip()])

	def _recommend(query, system, top_n, min_s):
	sims = cosine_similarity(_encode(query), MAT).flatten()
	if system not in ("All Systems","All",""):
	mask = DF["medical_system"]==system
	sims[~mask.values]=0
	idx=[i for i in sims.argsort()[-(top_n*4):][::-1] if sims[i]>=min_s][:top_n]
	if not idx: return pd.DataFrame()
	r=DF.iloc[idx].copy(); r["score"]=[round(float(sims[i]),4) for i in idx]
	return r.sort_values("score",ascending=False).reset_index(drop=True)

	def _cross(query, tps):
	sims = cosine_similarity(_encode(query), MAT).flatten()
	rows=[]
	for sys in ["Allopathic","Ayurvedic","Unani","Homeopathic","Herbal"]:
	sc=sims.copy(); sc[~(DF["medical_system"]==sys).values]=0
	for i in [i for i in sc.argsort()[-tps:][::-1] if sims[i]>0.01]:
	d=DF.iloc[i].to_dict(); d["score"]=round(float(sims[i]),4); rows.append(d)
	if not rows: return pd.DataFrame()
	return (pd.DataFrame(rows)
	.sort_values(["medical_system","score"],ascending=[True,False])
	.reset_index(drop=True))

	# ────────────────────────────────────────────────────────────────
	# 2. TAB 1 — SMART DRUG SEARCH
	# ────────────────────────────────────────────────────────────────

	def tab1(query, system, top_n, min_s):
	if not query.strip():
	return '<div class="ph">🔍 Type a drug name, compound, or symptom above and press Search</div>', None, ""

	r = _recommend(query, system, int(top_n), float(min_s))
	if r.empty:
	return f'<div class="ph">No results found for <b>{query}</b>. Try lowering the similarity threshold.</div>', None, ""

	cards = f'<div class="rh">Found <b>{len(r)}</b> results for "<b>{query}</b>"</div><div class="grid">'
	for _, row in r.iterrows():
	sys = str(row.get("medical_system",""))
	c = SC.get(sys,"#6B7280")
	em = EMOJI.get(sys,"💊")
	bn = str(row.get("brand_name","—"))
	gn = str(row.get("gns","")) or str(row.get("generic_name","—"))
	dos = str(row.get("dosage_form","—"))
	mfr = str(row.get("manufacturer","—"))[:38]
	sc_v = float(row.get("score",0))
	pct = int(sc_v*100)
	cards += f"""
	<div class="card" style="border-left:4px solid {c}">
	<div class="ch">
	<span class="sbadge" style="background:{c}18;color:{c};border:1px solid {c}35">{em} {sys}</span>
	<span class="spct" style="background:{c}12;color:{c}">{pct}%</span>
	</div>
	<div class="bn">{bn}</div>
	<div class="gn">{gn[:70]+'…' if len(gn)>70 else gn}</div>
	<div class="meta">💊 {dos}  ·  🏭 {mfr}</div>
	<div class="bar"><div class="fill" style="width:{pct}%;background:{c}"></div></div>
	</div>"""
	cards += "</div>"

	fig = px.bar(
	r.head(15), x="score", y="brand_name", color="medical_system",
	color_discrete_map=SC, orientation="h",
	labels={"score":"Similarity Score","brand_name":""},
	title=f'Similarity Scores — "{query}"',
	)
	fig.update_layout(
	height=max(340,len(r.head(15))*30+90),
	paper_bgcolor="rgba(0,0,0,0)", plot_bgcolor="rgba(0,0,0,0)",
	font=dict(family="Inter,sans-serif",size=11),
	legend=dict(orientation="h",yanchor="bottom",y=1.02,title=None),
	margin=dict(l=0,r=10,t=50,b=10), yaxis=dict(autorange="reversed"),
	xaxis=dict(range=[0,1],gridcolor="#f1f5f9"),
	)
	dist = r["medical_system"].value_counts().to_dict()
	stat = " · ".join(f"{k} {v}" for k,v in dist.items())
	return cards, fig, f"📊 {stat}"


	# ────────────────────────────────────────────────────────────────
	# 3. TAB 2 — CROSS-SYSTEM COMPARE
	# ────────────────────────────────────────────────────────────────

	def tab2(query, tps):
	if not query.strip():
	return '<div class="ph">Enter a query to compare drugs across all 5 medical traditions</div>', None

	r = _cross(query, int(tps))
	if r.empty:
	return '<div class="ph">No cross-system results found.</div>', None

	html = f'<div class="cph">Cross-system view for <b>"{query}"</b></div><div class="cgrid">'
	for sys in ["Allopathic","Ayurvedic","Unani","Homeopathic","Herbal"]:
	sub = r[r["medical_system"]==sys]
	c = SC[sys]; em=EMOJI[sys]
	html += f'<div class="scol" style="border-top:3px solid {c}"><div class="stitle" style="color:{c}">{em} {sys}</div>'
	if sub.empty:
	html += '<div class="nr">No match found</div>'
	else:
	for _,row in sub.iterrows():
	bn = str(row.get("brand_name","—"))
	gn = str(row.get("gns","")) or str(row.get("generic_name","—"))
	dos = str(row.get("dosage_form","—"))
	sc_ = int(float(row.get("score",0))*100)
	html += f"""<div class="cc" style="border-left:3px solid {c}38">
	<div class="cbn">{bn}</div>
	<div class="cgn">{gn[:48]+'…' if len(gn)>48 else gn}</div>
	<div class="cm">{dos} · {sc_}%</div>
	<div class="sbar"><div class="sfill" style="width:{sc_}%;background:{c}"></div></div>
	</div>"""
	html += "</div>"
	html += "</div>"

	# Radar chart
	avgs={s: float(r[r["medical_system"]==s]["score"].mean()) if not r[r["medical_system"]==s].empty else 0
	for s in ["Allopathic","Ayurvedic","Unani","Homeopathic","Herbal"]}
	cats=list(avgs.keys()); vals=list(avgs.values())
	fig=go.Figure(go.Scatterpolar(
	r=vals+[vals[0]], theta=cats+[cats[0]], fill="toself",
	fillcolor="rgba(59,130,246,0.12)", line=dict(color="#3B82F6",width=2.5),
	marker=dict(size=9,color=[SC[s] for s in cats]+[SC[cats[0]]]),
	))
	fig.update_layout(
	polar=dict(radialaxis=dict(visible=True,range=[0,1],gridcolor="#e5e7eb"),
	angularaxis=dict(gridcolor="#e5e7eb",tickfont=dict(size=12))),
	title=dict(text=f'Cross-System Radar — "{query}"',font=dict(size=13,color="#1e293b")),
	paper_bgcolor="rgba(0,0,0,0)", font=dict(family="Inter,sans-serif"),
	height=380, showlegend=False, margin=dict(l=50,r=50,t=60,b=30),
	)
	return html, fig


	# ────────────────────────────────────────────────────────────────
	# 4. TAB 3 — DATASET ANALYTICS (3 sub-views)
	# ────────────────────────────────────────────────────────────────

	def _overview_fig():
	fig=make_subplots(rows=2,cols=3,
	subplot_titles=["System Share","Top 12 Dosage Forms","Manufacturers per System",
	"Top 15 Manufacturers","System × Dosage Heatmap","TF-IDF Vocab Share"],
	specs=[[{"type":"domain"},{"type":"xy"},{"type":"xy"}],
	[{"type":"xy"},{"type":"xy"},{"type":"domain"}]],
	vertical_spacing=0.14,horizontal_spacing=0.08)

	# 1 donut
	fig.add_trace(go.Pie(
	labels=_SYS_VC.index.tolist(),values=_SYS_VC.values.tolist(),hole=0.55,
	marker=dict(colors=[SC.get(s,"#aaa") for s in _SYS_VC.index],
	line=dict(color="white",width=2.5)),
	textinfo="label+percent",textfont=dict(size=10),showlegend=False,
	),row=1,col=1)

	# 2 dosage bar
	td=_DOS_VC.head(12)
	fig.add_trace(go.Bar(
	x=td.values[::-1],y=td.index[::-1].tolist(),orientation="h",
	marker=dict(color=px.colors.sequential.Blues_r[:12],line=dict(color="white",width=1)),
	text=[f"{v:,}" for v in td.values[::-1]],textposition="outside",showlegend=False,
	),row=1,col=2)

	# 3 mfr per system
	fig.add_trace(go.Bar(
	x=_SYS_MFR.index.tolist(),y=_SYS_MFR.values.tolist(),
	marker=dict(color=[SC.get(s,"#aaa") for s in _SYS_MFR.index],
	line=dict(color="white",width=2)),
	text=_SYS_MFR.values.tolist(),textposition="outside",showlegend=False,
	),row=1,col=3)

	# 4 top 15 mfr
	tm=_MFR_VC.head(15)
	fig.add_trace(go.Bar(
	y=[m[:28] for m in tm.index[::-1].tolist()],x=tm.values[::-1].tolist(),
	orientation="h",
	marker=dict(color=tm.values[::-1].tolist(),colorscale="Viridis",
	showscale=False,line=dict(color="white",width=1)),
	showlegend=False,
	),row=2,col=1)

	# 5 heatmap
	top8=_DOS_VC.head(8).index.tolist()
	sysl=["Allopathic","Ayurvedic","Unani","Homeopathic","Herbal"]
	piv=pd.crosstab(DF["medical_system"],DF["dosage_form"])
	z=[[int(piv[d].get(s,0)) if d in piv.columns else 0 for d in top8] for s in sysl]
	fig.add_trace(go.Heatmap(
	z=z,x=[d[:12] for d in top8],y=sysl,colorscale="YlOrRd",
	text=z,texttemplate="%{text}",textfont=dict(size=9),
	showscale=True,colorbar=dict(thickness=10,x=0.65,len=0.42),
	),row=2,col=2)

	# 6 vocab share
	vtoks={s:int((np.asarray(MAT[(DF["medical_system"]==s).values].mean(axis=0)).flatten()>0.001).sum())
	for s in ["Allopathic","Ayurvedic","Unani","Homeopathic","Herbal"]}
	fig.add_trace(go.Pie(
	labels=list(vtoks.keys()),values=list(vtoks.values()),hole=0.5,
	marker=dict(colors=[SC.get(s,"#aaa") for s in vtoks],
	line=dict(color="white",width=2)),
	textinfo="label+value",textfont=dict(size=10),showlegend=False,
	),row=2,col=3)

	fig.update_layout(
	height=720,paper_bgcolor="rgba(0,0,0,0)",plot_bgcolor="rgba(0,0,0,0)",
	font=dict(family="Inter,sans-serif",size=11),
	title=dict(text="PharmaBridge — Dataset Intelligence Dashboard",
	font=dict(size=16,color="#1e293b"),x=0.5),
	margin=dict(l=10,r=10,t=80,b=10),
	)
	fig.update_xaxes(showgrid=True,gridcolor="#f1f5f9",zeroline=False)
	fig.update_yaxes(showgrid=False)
	return fig

	def _deep_fig(sel):
	sub = DF if sel=="All" else DF[DF["medical_system"]==sel]
	c = SC.get(sel,"#3B82F6")
	fig=make_subplots(rows=2,cols=2,
	subplot_titles=[f"Top 20 Compounds ({sel})","Dosage Form Split",
	"Top 10 Manufacturers","Brand Count Comparison"],
	specs=[[{"type":"xy"},{"type":"domain"}],[{"type":"xy"},{"type":"xy"}]],
	vertical_spacing=0.16,horizontal_spacing=0.10)

	# compound
	if sel=="Homeopathic": comp=sub["brand_name"].value_counts().head(20)
	elif sel=="Allopathic": comp=sub["generic_name"].dropna().value_counts().head(20)
	else: comp=sub["gns"].dropna().value_counts().head(20)
	fig.add_trace(go.Bar(
	x=comp.values[::-1].tolist(),y=comp.index[::-1].tolist(),orientation="h",
	marker=dict(color=c,opacity=0.85,line=dict(color="white",width=1)),
	text=comp.values[::-1].tolist(),textposition="outside",showlegend=False,
	),row=1,col=1)

	# dosage donut
	dos=sub["dosage_form"].value_counts().head(8)
	fig.add_trace(go.Pie(
	labels=dos.index.tolist(),values=dos.values.tolist(),hole=0.48,
	marker=dict(colors=px.colors.qualitative.Set3[:len(dos)],
	line=dict(color="white",width=2)),
	textinfo="label+percent",textfont=dict(size=10),showlegend=False,
	),row=1,col=2)

	# top mfr
	mf=sub["manufacturer"].value_counts().head(10)
	fig.add_trace(go.Bar(
	x=mf.values[::-1].tolist(),y=[m[:26] for m in mf.index[::-1].tolist()],
	orientation="h",
	marker=dict(color=mf.values[::-1].tolist(),colorscale="Blues",
	showscale=False,line=dict(color="white",width=1)),
	showlegend=False,
	),row=2,col=1)

	# brand count
	bc=DF.groupby("medical_system")["brand_name"].nunique().sort_values(ascending=False)
	fig.add_trace(go.Bar(
	x=bc.index.tolist(),y=bc.values.tolist(),
	marker=dict(color=[c if s==sel else "#cbd5e1" for s in bc.index],
	line=dict(color="white",width=2)),
	text=bc.values.tolist(),textposition="outside",showlegend=False,
	),row=2,col=2)

	fig.update_layout(
	height=680,paper_bgcolor="rgba(0,0,0,0)",plot_bgcolor="rgba(0,0,0,0)",
	font=dict(family="Inter,sans-serif",size=11),
	title=dict(text=f"Deep Dive: {sel}",font=dict(size=15,color="#1e293b"),x=0.5),
	margin=dict(l=10,r=10,t=70,b=10),
	)
	fig.update_xaxes(showgrid=True,gridcolor="#f1f5f9",zeroline=False)
	fig.update_yaxes(showgrid=False)
	return fig

	def _treemap_fig():
	samp=DF.groupby(["medical_system","dosage_form"]).size().reset_index(name="count")
	samp=samp[samp["count"]>=5]
	fig=px.treemap(samp,path=["medical_system","dosage_form"],values="count",
	color="medical_system",color_discrete_map=SC,
	title="Drug Hierarchy: Medical System → Dosage Form")
	fig.update_traces(textinfo="label+value+percent parent",textfont=dict(size=12))
	fig.update_layout(height=520,paper_bgcolor="rgba(0,0,0,0)",
	font=dict(family="Inter,sans-serif",size=12),
	title=dict(font=dict(size=15,color="#1e293b"),x=0.5),
	margin=dict(l=10,r=10,t=60,b=10))
	return fig

	def tab3_deep_update(sel):
	return _deep_fig(sel)


	# ────────────────────────────────────────────────────────────────
	# 5. TAB 4 — DRUG FINGERPRINT (single drug profile)
	# ────────────────────────────────────────────────────────────────

	def tab4_fingerprint(brand_query):
	"""Search for a specific drug and show a rich visual profile card + radar of its TF-IDF feature weights."""
	if not brand_query.strip():
	return '<div class="ph">Enter a brand name to see its full drug profile</div>', None

	# Find best match
	sims = cosine_similarity(_encode(brand_query), MAT).flatten()
	idx = int(sims.argsort()[-1])
	row = DF.iloc[idx]
	sc_v = float(sims[idx])

	if sc_v < 0.01:
	return f'<div class="ph">No drug found matching "<b>{brand_query}</b>".</div>', None

	sys_n = str(row.get("medical_system",""))
	c = SC.get(sys_n,"#6B7280")
	em = EMOJI.get(sys_n,"💊")
	bn = str(row.get("brand_name","—"))
	gn = str(row.get("gns","")) or str(row.get("generic_name","—"))
	dos = str(row.get("dosage_form","—"))
	mfr = str(row.get("manufacturer","—"))
	clu = str(row.get("cluster","—"))
	dart = str(row.get("DAR","—")) if "DAR" in row.index else "—"
	txt = str(row.get("drug_text",""))

	# Siblings (same gns/cluster)
	sib_mask = (DF["medical_system"]==sys_n) & (DF["gns"]==str(row.get("gns","")))
	sib_count = sib_mask.sum()-1

	html = f"""
	<div class="fp-card" style="border:2px solid {c}40;background:white;border-radius:16px;overflow:hidden">
	<div class="fp-banner" style="background:linear-gradient(135deg,{c},{c}99);padding:20px 24px;color:white">
	<div style="font-size:0.85rem;opacity:0.85;margin-bottom:4px">{em} {sys_n}</div>
	<div style="font-size:1.7rem;font-weight:800;letter-spacing:-0.5px">{bn}</div>
	<div style="font-size:0.95rem;opacity:0.9;margin-top:4px">{gn[:80]}</div>
	<div style="margin-top:12px;background:rgba(255,255,255,0.2);border-radius:20px;padding:5px 14px;
	display:inline-block;font-size:0.8rem;font-weight:600">
	{int(sc_v*100)}% match confidence
	</div>
	</div>
	<div style="padding:20px 24px;display:grid;grid-template-columns:1fr 1fr;gap:14px">
	<div class="fp-row"><span class="fp-k">💊 Dosage Form</span><span class="fp-v">{dos}</span></div>
	<div class="fp-row"><span class="fp-k">🏭 Manufacturer</span><span class="fp-v">{mfr[:40]}</span></div>
	<div class="fp-row"><span class="fp-k">🧬 Medical System</span><span class="fp-v">{sys_n}</span></div>
	<div class="fp-row"><span class="fp-k">📂 Cluster</span><span class="fp-v">#{clu}</span></div>
	<div class="fp-row"><span class="fp-k">📋 DAR Number</span><span class="fp-v">{dart}</span></div>
	<div class="fp-row"><span class="fp-k">👥 Same-compound drugs</span><span class="fp-v">{sib_count}</span></div>
	</div>
	<div style="padding:0 24px 20px;font-size:0.82rem;color:#64748b">
	<b>Drug Text (TF-IDF input):</b> <code style="background:#f1f5f9;padding:3px 8px;border-radius:6px">{txt[:120]}</code>
	</div>
	</div>"""

	# Top TF-IDF features for this drug
	vec_row = MAT[idx]
	feat_idx = np.asarray(vec_row.todense()).flatten().argsort()[-20:][::-1]
	feat_scores = np.asarray(vec_row.todense()).flatten()[feat_idx]
	feat_labels = _FEAT[feat_idx]
	mask = feat_scores > 0
	feat_labels = feat_labels[mask]; feat_scores = feat_scores[mask]

	fig = go.Figure(go.Bar(
	x=feat_scores[::-1], y=feat_labels[::-1],
	orientation="h",
	marker=dict(
	color=feat_scores[::-1],
	colorscale=[[0,"#dbeafe"],[1,c]],
	showscale=False,
	line=dict(color="white",width=1),
	),
	text=[f"{v:.3f}" for v in feat_scores[::-1]],
	textposition="outside",
	))
	fig.update_layout(
	title=dict(text=f"TF-IDF Feature Fingerprint: {bn}",
	font=dict(size=13,color="#1e293b")),
	height=max(300, len(feat_labels)*28+80),
	paper_bgcolor="rgba(0,0,0,0)",plot_bgcolor="rgba(0,0,0,0)",
	font=dict(family="Inter,sans-serif",size=11),
	margin=dict(l=10,r=60,t=50,b=10),
	xaxis=dict(gridcolor="#f1f5f9",title="TF-IDF Weight"),
	yaxis=dict(title=""),
	)
	return html, fig


	# ────────────────────────────────────────────────────────────────
	# 6. TAB 5 — FDA LIVE INTELLIGENCE
	# ────────────────────────────────────────────────────────────────

	FDA_NAME_MAP={
	"Paracetamol":"acetaminophen","Azithromycin":"azithromycin",
	"Ciprofloxacin":"ciprofloxacin","Amoxicillin":"amoxicillin",
	"Omeprazole":"omeprazole","Metformin":"metformin",
	"Atorvastatin":"atorvastatin","Amlodipine":"amlodipine",
	"Ceftriaxone":"ceftriaxone","Diclofenac":"diclofenac sodium",
	"Esomeprazole":"esomeprazole","Cefixime":"cefixime",
	"Salbutamol":"albuterol","Ibuprofen":"ibuprofen",
	"Metronidazole":"metronidazole","Cefuroxime":"cefuroxime",
	}

	def _fda_fetch(drug, endpoint):
	term=FDA_NAME_MAP.get(drug,drug.lower())
	base=f"https://api.fda.gov/drug/{endpoint}.json"
	for field in [f"openfda.generic_name:{term}",f"openfda.brand_name:{term}"]:
	try:
	r=requests.get(base,params={"search":field,"limit":"3"},timeout=9)
	if r.status_code==200:
	res=r.json().get("results",[])
	if res: return res, term
	except: pass
	return [], term

	def tab5_fda(drug, ep_label):
	if not drug.strip():
	return '<div class="ph">🏥 Enter a drug name to fetch live FDA data</div>'
	ep_map={"Drug Labels":"label","Adverse Events (FAERS)":"event","NDC Directory":"ndc"}
	ep=ep_map.get(ep_label,"label")
	results,term=_fda_fetch(drug,ep)

	if not results:
	return f"""<div class="fda-miss">
	<div style="font-size:2.5rem;margin-bottom:12px">🔍</div>
	<div><b>No FDA data found for "{drug}"</b></div>
	<div style="color:#64748b;font-size:0.88rem;margin-top:8px;line-height:1.7">
	This drug may not be in the US FDA database (common for Bangladesh-registry drugs).<br>
	<b>Try:</b> Paracetamol · Azithromycin · Ciprofloxacin · Omeprazole · Metformin · Ibuprofen
	</div></div>"""

	html=f"""<div class="fda-hdr">
	<span class="fda-badge">🇺🇸 FDA {ep_label}</span>
	<b>{drug}</b> → searched as <code>{term}</code>
	<span class="fda-cnt">{len(results)} record(s)</span>
	</div>"""

	if ep=="label":
	for i,res in enumerate(results[:3],1):
	o=res.get("openfda",{})
	brand=", ".join(o.get("brand_name",["—"])[:2])
	gen =", ".join(o.get("generic_name",["—"])[:2])
	mfr =", ".join(o.get("manufacturer_name",["—"])[:1])
	purp =str(res.get("purpose",["—"])[0])[:280] if res.get("purpose") else "—"
	ind =str(res.get("indications_and_usage",["—"])[0])[:380] if res.get("indications_and_usage") else "—"
	warn =str(res.get("warnings",["—"])[0])[:280] if res.get("warnings") else "—"
	html+=f"""<div class="fda-card">
	<div class="fda-num">📄 Record {i}</div>
	<table class="fda-tbl">
	<tr><td class="fk">Brand Name</td><td>{brand}</td></tr>
	<tr><td class="fk">Generic Name</td><td>{gen}</td></tr>
	<tr><td class="fk">Manufacturer</td><td>{mfr}</td></tr>
	<tr><td class="fk">Purpose</td><td>{purp}</td></tr>
	<tr><td class="fk">Indications</td><td>{ind}</td></tr>
	<tr><td class="fk">Warnings</td><td>{warn}</td></tr>
	</table></div>"""

	elif ep=="event":
	for i,res in enumerate(results[:3],1):
	pt=res.get("patient",{})
	rxn=", ".join(r.get("reactionmeddrapt","") for r in pt.get("reaction",[])[:6])
	drg=", ".join(d.get("medicinalproduct","") for d in pt.get("drug",[])[:4])
	sev="⚠️ Serious" if res.get("serious")=="1" else "ℹ️ Non-Serious"
	html+=f"""<div class="fda-card">
	<div class="fda-num">Event {i} — {sev}</div>
	<table class="fda-tbl">
	<tr><td class="fk">Reactions</td><td>{rxn or '—'}</td></tr>
	<tr><td class="fk">Drugs Involved</td><td>{drg or '—'}</td></tr>
	</table></div>"""

	elif ep=="ndc":
	for i,res in enumerate(results[:3],1):
	html+=f"""<div class="fda-card">
	<div class="fda-num">NDC {i}</div>
	<table class="fda-tbl">
	<tr><td class="fk">NDC Code</td><td>{res.get('product_ndc','—')}</td></tr>
	<tr><td class="fk">Brand</td><td>{res.get('brand_name','—')}</td></tr>
	<tr><td class="fk">Generic</td><td>{res.get('generic_name','—')}</td></tr>
	<tr><td class="fk">Dosage Form</td><td>{res.get('dosage_form','—')}</td></tr>
	<tr><td class="fk">Route</td><td>{res.get('route','—')}</td></tr>
	<tr><td class="fk">Labeler</td><td>{res.get('labeler_name','—')}</td></tr>
	</table></div>"""
	return html


	# ────────────────────────────────────────────────────────────────
	# 7. TAB 6 — AI MEDICAL Q&A (HuggingFace Inference API)
	# ────────────────────────────────────────────────────────────────

	SYS_PROMPT=(
	"You are PharmaBridge AI — a knowledgeable, friendly pharmaceutical assistant. "
	"You help healthcare professionals and students understand drug information, "
	"pharmacology, traditional medicine (Ayurvedic, Unani, Homeopathic, Herbal), "
	"drug interactions, and the Bangladesh drug registry. "
	"Be concise, accurate, and always note that answers are educational, "
	"not a substitute for professional medical advice."
	)

	HF_MODELS=[
	"mistralai/Mistral-7B-Instruct-v0.3",
	"HuggingFaceH4/zephyr-7b-beta",
	"google/flan-t5-xxl",
	]

	def tab6_ai(question, history):
	if not question.strip():
	return history, ""
	history=history or []

	prompt=f"<s>[INST] {SYS_PROMPT}\n\nQuestion: {question} [/INST]"
	headers={"Content-Type":"application/json"}
	answer=""

	for model_url in [f"https://api-inference.huggingface.co/models/{m}" for m in HF_MODELS]:
	payload={
	"inputs": prompt,
	"parameters":{"max_new_tokens":500,"temperature":0.65,
	"top_p":0.9,"repetition_penalty":1.1,
	"return_full_text":False},
	}
	# flan-t5 uses different format
	if "flan" in model_url:
	payload={"inputs":f"As a pharmacist, answer clearly: {question}",
	"parameters":{"max_new_tokens":350}}
	try:
	r=requests.post(model_url,headers=headers,json=payload,timeout=28)
	if r.status_code==200:
	d=r.json()
	txt=(d[0].get("generated_text","") if isinstance(d,list) else d.get("generated_text","")).strip()
	if len(txt)>30:
	answer=txt; break
	except: continue

	if not answer:
	answer=(
	"⚠️ The AI model is warming up (HuggingFace free tier cold-start). "
	"Please wait ~20 seconds and try again.\n\n"
	"Meanwhile, you can:\n"
	"- Use the Smart Search tab to look up this drug directly\n"
	"- Use the FDA Live Data tab for official drug information"
	)

	history.append((question, answer))
	return history, ""

	def tab6_clear():
	return [], ""


	# ────────────────────────────────────────────────────────────────
	# 8. TAB 7 — DRUG EXPLORER (browse & filter)
	# ────────────────────────────────────────────────────────────────

	_ALL_DOS=["All"]+sorted(DF["dosage_form"].dropna().unique().tolist())

	def _dos_choices(sys):
	if sys=="All":
	return gr.update(choices=_ALL_DOS, value="All")
	opts=["All"]+sorted(DF[DF["medical_system"]==sys]["dosage_form"].dropna().unique().tolist())
	return gr.update(choices=opts, value="All")

	def tab7_explore(system, dosage, search, page):
	sub=DF.copy()
	if system!="All": sub=sub[sub["medical_system"]==system]
	if dosage !="All": sub=sub[sub["dosage_form"]==dosage]
	if search.strip():
	t=search.lower().strip()
	sub=sub[sub["brand_name"].str.lower().str.contains(t,na=False)\|
	sub["gns"].str.lower().str.contains(t,na=False)\|
	sub["generic_name"].str.lower().str.contains(t,na=False)\|
	sub["manufacturer"].str.lower().str.contains(t,na=False)]

	total=len(sub); PG=20
	page=max(1,int(page)); maxp=max(1,(total+PG-1)//PG); page=min(page,maxp)
	sl=sub.iloc[(page-1)PG:pagePG]

	if sl.empty:
	return '<div class="ph">No records match your filters.</div>', "0 records"

	rows=""
	for _,row in sl.iterrows():
	sys_n=str(row.get("medical_system",""))
	c=SC.get(sys_n,"#6B7280"); em=EMOJI.get(sys_n,"💊")
	bn=str(row.get("brand_name","—"))
	gn=str(row.get("gns","")) or str(row.get("generic_name","—"))
	dos_v=str(row.get("dosage_form","—"))
	mfr=str(row.get("manufacturer","—"))[:36]
	rows+=f"""<tr>
	<td><b>{bn}</b></td>
	<td style="max-width:190px">{gn[:46]}</td>
	<td>{dos_v}</td>
	<td><span class="sb2" style="background:{c}18;color:{c};border:1px solid {c}30">{em} {sys_n}</span></td>
	<td style="color:#64748b">{mfr}</td>
	</tr>"""

	tbl=f"""<table class="xtbl">
	<thead><tr><th>Brand Name</th><th>Compound / Identity</th>
	<th>Dosage Form</th><th>System</th><th>Manufacturer</th></tr></thead>
	<tbody>{rows}</tbody></table>"""

	return tbl, f"Page {page} / {maxp} · {total:,} records"


	# ────────────────────────────────────────────────────────────────
	# 9. CSS
	# ────────────────────────────────────────────────────────────────

	CSS="""
	@import url('https://fonts.googleapis.com/css2?family=Inter:ital,wght@0,300;0,400;0,500;0,600;0,700;0,800;1,400&display=swap');
	*{box-sizing:border-box}
	body,.gradio-container{font-family:'Inter',sans-serif!important;background:#f0f4f8!important}

	/* ── HEADER ─────────────────────────────────────────────── */
	.app-hdr{
	background:linear-gradient(135deg,#0f172a 0%,#1e3a8a 45%,#0369a1 100%);
	border-radius:18px;padding:28px 32px;margin-bottom:4px;color:#fff;
	box-shadow:0 10px 40px rgba(30,58,138,.35);
	}
	.app-title{font-size:2.1rem;font-weight:800;letter-spacing:-1px;margin:0}
	.app-sub{font-size:1rem;opacity:.82;margin:6px 0 0}
	.hbadges{display:flex;gap:8px;margin-top:14px;flex-wrap:wrap}
	.hbadge{background:rgba(255,255,255,.16);border:1px solid rgba(255,255,255,.28);
	border-radius:20px;padding:4px 13px;font-size:.78rem;font-weight:500}
	.stats-row{display:flex;gap:10px;margin-top:16px;flex-wrap:wrap}
	.stat{background:rgba(255,255,255,.12);border-radius:12px;padding:8px 16px;text-align:center;min-width:88px}
	.sn{font-size:1.45rem;font-weight:800;display:block}
	.sl{font-size:.7rem;opacity:.78;text-transform:uppercase;letter-spacing:.5px}

	/* ── TABS ────────────────────────────────────────────────── */
	.tab-nav button{font-weight:500!important;font-size:.88rem!important;border-radius:8px 8px 0 0!important}
	.tab-nav button.selected{color:#1d4ed8!important;border-bottom:3px solid #1d4ed8!important;font-weight:700!important}

	/* ── INPUTS ──────────────────────────────────────────────── */
	.gr-input,textarea,.gr-dropdown select{
	border-radius:10px!important;border:1.5px solid #e2e8f0!important;
	font-family:'Inter',sans-serif!important;transition:border-color .2s!important;
	}
	.gr-input:focus,textarea:focus{border-color:#3b82f6!important;box-shadow:0 0 0 3px rgba(59,130,246,.1)!important}
	.gr-button-primary{
	background:linear-gradient(135deg,#1d4ed8,#0891b2)!important;
	border:none!important;border-radius:10px!important;font-weight:700!important;
	letter-spacing:.2px!important;box-shadow:0 4px 14px rgba(29,78,216,.3)!important;
	transition:transform .15s,box-shadow .15s!important;
	}
	.gr-button-primary:hover{transform:translateY(-1px)!important;box-shadow:0 6px 22px rgba(29,78,216,.4)!important}

	/* ── PLACEHOLDERS ────────────────────────────────────────── */
	.ph{text-align:center;color:#94a3b8;padding:60px 20px;font-size:.98rem;
	background:#f8fafc;border-radius:14px;border:2px dashed #e2e8f0}

	/* ── RESULT CARDS ────────────────────────────────────────── */
	.rh{font-size:.93rem;color:#475569;padding:10px 0 14px;
	border-bottom:1px solid #e2e8f0;margin-bottom:14px}
	.grid{display:grid;grid-template-columns:repeat(auto-fill,minmax(270px,1fr));gap:12px}
	.card{background:#fff;border-radius:13px;padding:14px 16px;
	box-shadow:0 1px 4px rgba(0,0,0,.06);transition:transform .15s,box-shadow .15s}
	.card:hover{transform:translateY(-2px);box-shadow:0 5px 18px rgba(0,0,0,.10)}
	.ch{display:flex;justify-content:space-between;align-items:center;margin-bottom:8px}
	.sbadge{font-size:.71rem;font-weight:600;padding:3px 9px;border-radius:20px;white-space:nowrap}
	.spct{font-size:.74rem;font-weight:700;padding:3px 9px;border-radius:20px}
	.bn{font-size:1.05rem;font-weight:700;color:#1e293b;margin-bottom:4px}
	.gn{font-size:.81rem;color:#64748b;margin-bottom:9px;min-height:1.2em}
	.meta{font-size:.77rem;color:#94a3b8;margin-bottom:10px;line-height:1.8}
	.bar{height:4px;background:#f1f5f9;border-radius:2px;overflow:hidden}
	.fill{height:100%;border-radius:2px;transition:width .4s}

	/* ── CROSS COMPARE ───────────────────────────────────────── */
	.cph{font-size:.96rem;color:#475569;padding:10px 0 16px;font-weight:500}
	.cgrid{display:grid;grid-template-columns:repeat(5,1fr);gap:11px}
	@media(max-width:900px){.cgrid{grid-template-columns:repeat(2,1fr)}}
	.scol{background:#fff;border-radius:13px;padding:14px;box-shadow:0 1px 4px rgba(0,0,0,.06)}
	.stitle{font-weight:700;font-size:.93rem;margin-bottom:12px}
	.nr{color:#94a3b8;font-size:.84rem;padding:10px 0}
	.cc{padding:10px;margin-bottom:8px;border-radius:9px;background:#f8fafc}
	.cbn{font-weight:700;font-size:.88rem;color:#1e293b}
	.cgn{font-size:.77rem;color:#64748b;margin:3px 0}
	.cm{font-size:.74rem;color:#94a3b8}
	.sbar{height:3px;background:#f1f5f9;border-radius:2px;overflow:hidden;margin-top:6px}
	.sfill{height:100%;border-radius:2px}

	/* ── FINGERPRINT ─────────────────────────────────────────── */
	.fp-banner{border-radius:0}
	.fp-row{display:flex;flex-direction:column;background:#f8fafc;border-radius:10px;padding:10px 14px}
	.fp-k{font-size:.74rem;color:#64748b;font-weight:600;text-transform:uppercase;letter-spacing:.4px}
	.fp-v{font-size:.95rem;color:#1e293b;font-weight:500;margin-top:2px}

	/* ── FDA ─────────────────────────────────────────────────── */
	.fda-hdr{background:linear-gradient(135deg,#eff6ff,#e0f2fe);border-radius:11px;
	padding:14px 18px;margin-bottom:14px;display:flex;align-items:center;
	gap:10px;flex-wrap:wrap;font-size:.88rem;color:#1e293b}
	.fda-badge{background:#1d4ed8;color:#fff;padding:4px 11px;border-radius:20px;
	font-size:.77rem;font-weight:600}
	.fda-cnt{margin-left:auto;background:#dcfce7;color:#166534;padding:3px 10px;
	border-radius:20px;font-size:.77rem;font-weight:600}
	.fda-miss{text-align:center;padding:40px;color:#64748b;background:#f8fafc;
	border-radius:14px;border:2px dashed #e2e8f0}
	.fda-card{background:#fff;border-radius:13px;padding:18px;margin-bottom:12px;
	box-shadow:0 1px 4px rgba(0,0,0,.06)}
	.fda-num{font-weight:700;font-size:.88rem;color:#1d4ed8;margin-bottom:10px}
	.fda-tbl{width:100%;border-collapse:collapse;font-size:.84rem}
	.fda-tbl tr{border-bottom:1px solid #f1f5f9}
	.fda-tbl tr:last-child{border-bottom:none}
	.fk{color:#64748b;font-weight:600;padding:6px 14px 6px 0;white-space:nowrap;
	vertical-align:top;width:130px}
	.fda-tbl td:last-child{color:#1e293b;padding:6px 0;line-height:1.55}

	/* ── CHATBOT ─────────────────────────────────────────────── */
	.chatbot{border-radius:13px!important;border:1.5px solid #e2e8f0!important}

	/* ── EXPLORER TABLE ──────────────────────────────────────── */
	.xtbl{width:100%;border-collapse:collapse;font-size:.83rem}
	.xtbl thead{background:linear-gradient(135deg,#0f172a,#1d4ed8);color:#fff}
	.xtbl th{padding:11px 14px;text-align:left;font-weight:600;letter-spacing:.3px}
	.xtbl tbody tr{border-bottom:1px solid #f1f5f9;transition:background .15s}
	.xtbl tbody tr:hover{background:#f8fafc}
	.xtbl td{padding:9px 14px;color:#1e293b;vertical-align:top}
	.sb2{font-size:.71rem;font-weight:600;padding:2px 8px;border-radius:20px;white-space:nowrap}

	code{background:#f1f5f9;padding:2px 7px;border-radius:5px;font-size:.84em;color:#0891b2}
	"""

	# ────────────────────────────────────────────────────────────────
	# 10. BUILD GRADIO APP
	# ────────────────────────────────────────────────────────────────

	HEADER = f"""
	<div class="app-hdr">
	<div class="app-title">💊 PharmaBridge</div>
	<div class="app-sub">Cross-Medical-System Drug Intelligence Engine · Bangladesh National Drug Registry</div>
	<div class="hbadges">
	<span class="hbadge">🔬 TF-IDF + Cosine Similarity</span>
	<span class="hbadge">🧠 SVD + K-Means Clustering</span>
	<span class="hbadge">🌐 OpenFDA Live API</span>
	<span class="hbadge">🤖 Mistral-7B AI Assistant</span>
	<span class="hbadge">📊 Interactive Dashboards</span>
	</div>
	<div class="stats-row">
	<div class="stat"><span class="sn">53,584</span><span class="sl">Total Drugs</span></div>
	<div class="stat"><span class="sn">5</span><span class="sl">Med. Systems</span></div>
	<div class="stat"><span class="sn">725</span><span class="sl">Manufacturers</span></div>
	<div class="stat"><span class="sn">12,311</span><span class="sl">TF-IDF Features</span></div>
	<div class="stat"><span class="sn">95.5%</span><span class="sl">Precision@10</span></div>
	<div class="stat"><span class="sn">0.2159</span><span class="sl">Silhouette</span></div>
	</div>
	</div>
	"""

	with gr.Blocks(css=CSS, title="PharmaBridge", theme=gr.themes.Base(
	primary_hue=gr.themes.colors.blue,
	font=gr.themes.GoogleFont("Inter"),
	)) as app:

	gr.HTML(HEADER)

	with gr.Tabs(elem_classes="tab-nav"):

	# ── TAB 1 ─────────────────────────────────────────────────
	with gr.Tab("🔍 Smart Search"):
	with gr.Row(equal_height=True):
	with gr.Column(scale=4):
	t1q = gr.Textbox(label="Search Query",
	placeholder="Try: Azithromycin, Ashwagandha, nux vomica, sharbat amrood, paracetamol fever…",
	lines=1)
	with gr.Column(scale=1):
	t1sys = gr.Dropdown(choices=SYSTEMS, value="All Systems", label="System")
	with gr.Column(scale=1):
	t1btn = gr.Button("🔍 Search", variant="primary", scale=1)
	with gr.Row():
	t1n = gr.Slider(5,50,value=12,step=1,label="Max Results")
	t1s = gr.Slider(0.0,0.5,value=0.04,step=0.01,label="Min Similarity")
	t1stat = gr.Markdown("")
	t1cards = gr.HTML('<div class="ph">🔍 Enter a drug name, compound, or symptom above</div>')
	t1chart = gr.Plot(label="Score Distribution")

	t1btn.click(tab1,[t1q,t1sys,t1n,t1s],[t1cards,t1chart,t1stat])
	t1q.submit(tab1,[t1q,t1sys,t1n,t1s],[t1cards,t1chart,t1stat])

	gr.Examples([
	["Azithromycin 500mg","Allopathic"],
	["Ashwagandha capsule","Ayurvedic"],
	["Nux Vomica liquid","Homeopathic"],
	["Sharbat Amrood","Unani"],
	["Moringa leaf powder","Herbal"],
	["antibiotic tablet","All Systems"],
	["digestive capsule","All Systems"],
	], inputs=[t1q,t1sys], label="Quick Examples")

	# ── TAB 2 ─────────────────────────────────────────────────
	with gr.Tab("⚖️ Cross-System Compare"):
	with gr.Row(equal_height=True):
	with gr.Column(scale=5):
	t2q = gr.Textbox(label="Query",
	placeholder="e.g. pain relief tablet, digestive liver, sleep anxiety, blood pressure…",
	lines=1)
	with gr.Column(scale=1):
	t2n = gr.Slider(1,5,value=3,step=1,label="Results / System")
	with gr.Column(scale=1):
	t2btn = gr.Button("⚖️ Compare", variant="primary")
	t2cards = gr.HTML('<div class="ph">Compare the same therapeutic need across all 5 medical traditions simultaneously</div>')
	t2radar = gr.Plot(label="Cross-System Similarity Radar")

	t2btn.click(tab2,[t2q,t2n],[t2cards,t2radar])
	t2q.submit(tab2,[t2q,t2n],[t2cards,t2radar])
	gr.Examples([
	["digestive liver tablet"],["pain anti-inflammatory"],
	["antibiotic infection"],["blood pressure"],
	["cough respiratory"],["sleep anxiety stress"],
	], inputs=[t2q])

	# ── TAB 3 ─────────────────────────────────────────────────
	with gr.Tab("📊 Dataset Analytics"):
	with gr.Tabs():
	with gr.Tab("🌐 Overview Dashboard"):
	ov_btn = gr.Button("📊 Render Dashboard", variant="primary")
	ov_fig = gr.Plot()
	ov_btn.click(_overview_fig,[],[ov_fig])
	app.load(_overview_fig,[],[ov_fig])

	with gr.Tab("🔎 System Deep Dive"):
	with gr.Row():
	dd_sys = gr.Dropdown(
	choices=["All","Allopathic","Ayurvedic","Unani","Homeopathic","Herbal"],
	value="Allopathic", label="Select System")
	dd_btn = gr.Button("Analyze", variant="primary")
	dd_fig = gr.Plot()
	dd_btn.click(_deep_fig,[dd_sys],[dd_fig])
	dd_sys.change(_deep_fig,[dd_sys],[dd_fig])
	app.load(lambda:_deep_fig("Allopathic"),[],[dd_fig])

	with gr.Tab("🗺️ Treemap Explorer"):
	tm_btn = gr.Button("🗺️ Render Treemap", variant="primary")
	tm_fig = gr.Plot()
	tm_btn.click(_treemap_fig,[],[tm_fig])
	app.load(_treemap_fig,[],[tm_fig])

	# ── TAB 4 ─────────────────────────────────────────────────
	with gr.Tab("🧬 Drug Fingerprint"):
	gr.Markdown("""
	### Single Drug Deep-Dive
	Search for any drug to see its full profile card plus a bar chart of its
	top TF-IDF feature weights — the exact tokens driving its similarity scores.
	""")
	with gr.Row(equal_height=True):
	fp_q = gr.Textbox(label="Brand Name or Compound",
	placeholder="e.g. Azithromycin, Ashwagandha, Nux Vomica, Sharbat Amrood…", lines=1)
	fp_btn = gr.Button("🧬 Profile", variant="primary")
	fp_card = gr.HTML('<div class="ph">🧬 Enter a drug or compound name to generate its fingerprint</div>')
	fp_fig = gr.Plot(label="TF-IDF Feature Fingerprint")

	fp_btn.click(tab4_fingerprint,[fp_q],[fp_card,fp_fig])
	fp_q.submit(tab4_fingerprint,[fp_q],[fp_card,fp_fig])
	gr.Examples([
	["Azithromycin"],["Ashwagandha"],["Nux Vomica"],
	["Sharbat Amrood"],["Moringa"],["Paracetamol"],
	], inputs=[fp_q])

	# ── TAB 5 ─────────────────────────────────────────────────
	with gr.Tab("🏥 FDA Live Data"):
	gr.Markdown("> Live OpenFDA API — US drug labels, adverse events (FAERS), and NDC records. "
	"~40% of Bangladesh registry drugs appear here. Bangladeshi names auto-mapped to FDA terms.")
	with gr.Row(equal_height=True):
	fda_drug = gr.Textbox(label="Drug Name",
	placeholder="Paracetamol, Azithromycin, Ciprofloxacin, Omeprazole, Metformin…", lines=1)
	fda_ep = gr.Radio(["Drug Labels","Adverse Events (FAERS)","NDC Directory"],
	value="Drug Labels", label="FDA Database")
	fda_btn = gr.Button("🔎 Fetch", variant="primary")
	fda_out = gr.HTML('<div class="ph">🏥 Enter a drug name and click Fetch</div>')
	fda_btn.click(tab5_fda,[fda_drug,fda_ep],[fda_out])
	fda_drug.submit(tab5_fda,[fda_drug,fda_ep],[fda_out])
	gr.Examples([["Paracetamol"],["Azithromycin"],["Ciprofloxacin"],
	["Omeprazole"],["Metformin"],["Ibuprofen"]], inputs=[fda_drug])

	# ── TAB 6 ─────────────────────────────────────────────────
	with gr.Tab("🤖 AI Medical Q&A"):
	gr.Markdown("""
	### PharmaBridge AI — Pharmaceutical Q&A
	Powered by Mistral-7B-Instruct via HuggingFace Inference API (free, no key needed).
	Ask anything about drugs, pharmacology, traditional medicine, or the Bangladesh registry.

	> ⚠️ Educational only — not a substitute for professional medical advice. Model may take ~20s to cold-start.
	""")
	ai_bot = gr.Chatbot(label="PharmaBridge AI", height=450, elem_classes="chatbot")
	with gr.Row():
	ai_inp = gr.Textbox(label="Your Question", lines=2, scale=5,
	placeholder="e.g. What is Ashwagandha used for? / Side effects of Azithromycin? / What is Unani medicine?")
	with gr.Column(scale=1):
	ai_send = gr.Button("Send 💬", variant="primary")
	ai_clear = gr.Button("Clear 🗑️")
	ai_send.click(tab6_ai,[ai_inp,ai_bot],[ai_bot,ai_inp])
	ai_inp.submit(tab6_ai,[ai_inp,ai_bot],[ai_bot,ai_inp])
	ai_clear.click(tab6_clear,[],[ai_bot,ai_inp])
	gr.Examples([
	["What is Ashwagandha used for in Ayurvedic medicine?"],
	["Explain Unani medicine and its traditional formulations"],
	["What are the common side effects of Azithromycin?"],
	["How does TF-IDF cosine similarity work for drug retrieval?"],
	["What is Homeopathic potency and how are remedies prepared?"],
	["Compare Allopathic and Herbal medicine approaches"],
	], inputs=[ai_inp])

	# ── TAB 7 ─────────────────────────────────────────────────
	with gr.Tab("📋 Drug Explorer"):
	with gr.Row():
	ex_sys = gr.Dropdown(["All","Allopathic","Ayurvedic","Unani","Homeopathic","Herbal"],
	value="All", label="System")
	ex_dos = gr.Dropdown(choices=_ALL_DOS, value="All", label="Dosage Form")
	ex_srch = gr.Textbox(label="Search", placeholder="Brand, compound, manufacturer…")
	ex_pg = gr.Number(value=1, label="Page", minimum=1, precision=0)
	ex_btn = gr.Button("🔍 Browse Database", variant="primary")
	ex_info = gr.Markdown("")
	ex_tbl = gr.HTML('<div class="ph">Click Browse to explore all 53,584 drug records</div>')

	ex_sys.change(_dos_choices,[ex_sys],[ex_dos])
	ex_btn.click(tab7_explore,[ex_sys,ex_dos,ex_srch,ex_pg],[ex_tbl,ex_info])
	ex_srch.submit(tab7_explore,[ex_sys,ex_dos,ex_srch,ex_pg],[ex_tbl,ex_info])

	# ── TAB 8 ─────────────────────────────────────────────────
	with gr.Tab("ℹ️ About"):
	gr.Markdown(f"""
	## PharmaBridge — Cross-Medical-System Drug Intelligence

	PharmaBridge is a master's thesis project — the first NLP-based drug recommendation system
	spanning all 5 major South Asian pharmaceutical traditions simultaneously using the
	Bangladesh National Drug Registry (53,584 records).

	---

	### Dataset Composition
	\| Medical System \| Records \| Share \|
	\|---\|---\|---\|
	\| Allopathic \| 36,254 \| 67.7% \|
	\| Unani \| 8,460 \| 15.8% \|
	\| Ayurvedic \| 5,262 \| 9.8% \|
	\| Homeopathic \| 2,580 \| 4.8% \|
	\| Herbal \| 1,028 \| 1.9% \|
	\| Total \| 53,584 \| 100% \|

	### Technical Architecture
	\| Component \| Configuration \|
	\|---\|---\|
	\| Vectorization \| TF-IDF, bigrams (1,2), max_features=15,000, sublinear_tf=True \|
	\| Retrieval \| Cosine Similarity on sparse matrix (53,584 × 12,311) \|
	\| Dim. Reduction \| TruncatedSVD, 50 components, 26.2% variance \|
	\| Clustering \| K-Means K=10 (elbow-selected), Silhouette=0.2159 \|

	### Evaluation Results
	\| Metric \| Value \|
	\|---\|---\|
	\| Precision@5 \| 97.00% \|
	\| Precision@10 \| 95.50% \|
	\| Precision@20 \| 90.55% \|
	\| Silhouette Score \| 0.2159 \|

	### App Features
	\| Tab \| Feature \|
	\|---\|---\|
	\| 🔍 Smart Search \| TF-IDF cosine retrieval with rich card UI + bar chart \|
	\| ⚖️ Cross-System Compare \| Side-by-side 5-system view + radar chart \|
	\| 📊 Dataset Analytics \| Overview dashboard, deep-dive, treemap \|
	\| 🧬 Drug Fingerprint \| Single drug profile + TF-IDF feature bar chart \|
	\| 🏥 FDA Live Data \| OpenFDA labels / adverse events / NDC lookup \|
	\| 🤖 AI Medical Q&A \| Mistral-7B via HuggingFace Inference API \|
	\| 📋 Drug Explorer \| Paginated browse & filter across all 53,584 records \|

	---
	> Disclaimer: For research and educational purposes only.
	> Not intended for clinical decision-making.
	> Always consult a qualified healthcare professional for medical advice.
	""")

	if __name__ == "__main__":
	app.launch()