Spaces:

SiddhJagani
/

Github

Sleeping

App Files Files Community

Github / src /streamlit_app.py

SiddhJagani

Update src/streamlit_app.py

61c0e4c verified 3 months ago

raw

history blame contribute delete

14 kB

	import zipfile
	import os
	import hashlib
	import requests
	from pathlib import Path
	import streamlit as st
	from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
	from llama_index.core.node_parser import SentenceSplitter
	from llama_index.core.llms import CustomLLM, LLMMetadata, CompletionResponse
	import logging
	from typing import List, Any, Generator, AsyncGenerator
	import shutil
	import json # ✅ added for parsing streaming chunks

	# --------------------------------------------------------------
	# 1. SILENCE NOISY LOGS
	# --------------------------------------------------------------
	logging.getLogger("llama_index").setLevel(logging.CRITICAL)

	# --------------------------------------------------------------
	# 2. IMPORT FAST EMBEDDER (ModernBERT CPU-Compatible)
	# --------------------------------------------------------------
	from embedder import embedder # <-- CPU ModernBERT embedder (not MLX)

	# --------------------------------------------------------------
	# 3. LLAMA-INDEX EMBEDDING WRAPPER
	# --------------------------------------------------------------
	from llama_index.core.embeddings import BaseEmbedding


	class LlamaIndexWrapper(BaseEmbedding):
	def __init__(self, dim: int = 768):
	super().__init__()
	self._dimension = dim

	def _get_query_embedding(self, query: str) -> List[float]:
	return embedder.embed_query(query)

	def _get_text_embedding(self, text: str) -> List[float]:
	return embedder.embed_query(text)

	def _get_text_embedding_batch(
	self, texts: List[str], **kwargs: Any
	) -> List[List[float]]:
	return embedder.embed_documents(texts)

	async def _aget_query_embedding(self, query: str) -> List[float]:
	return self._get_query_embedding(query)

	async def _aget_text_embedding(self, text: str) -> List[float]:
	return self._get_text_embedding(text)

	async def _aget_text_embedding_batch(
	self, texts: List[str], **kwargs: Any
	) -> List[List[float]]:
	return self._get_text_embedding_batch(texts, **kwargs)

	@property
	def dimension(self) -> int:
	return self._dimension


	embed_model = LlamaIndexWrapper(dim=768)

	# --------------------------------------------------------------
	# 4. CONFIG
	# --------------------------------------------------------------
	TEMP_DIR = "temp_repo"
	OUTPUT_DIR = "output"
	LLM_API = os.getenv("BaseURL") # <- LM Studio endpoint

	# --------------------------------------------------------------
	# 5. HELPER — convert any Response to string
	# --------------------------------------------------------------
	def to_text(resp):
	"""Convert LlamaIndex Response or string-like objects safely to text."""
	if resp is None:
	return ""
	if hasattr(resp, "response"):
	return resp.response
	if hasattr(resp, "text"):
	return resp.text
	return str(resp)


	# --------------------------------------------------------------
	# 6. AUTO-DETECT MODEL (optional – HF Space only has one)
	# --------------------------------------------------------------
	def get_hf_model():
	return "openai/gpt-4o" # Fixed for your endpoint


	# --------------------------------------------------------------
	# 7. CUSTOM LLM – HUGGING FACE SPACE (streaming + auth)
	# --------------------------------------------------------------
	class HFChatLLM(CustomLLM):
	model_name: str
	temperature: float = 0.7
	context_window: int = 32768
	num_output: int = -1
	model_config = {"extra": "allow"}

	def __init__(self, model_name: str, temperature: float = 0.7):
	super().__init__(model_name=model_name, temperature=temperature)
	self.base_url = "https://siddhjagani-backend.hf.space/v1/chat/completions"
	self.headers = {
	"Authorization": os.getenv("API_KEY"),
	"Content-Type": "application/json",
	}

	@property
	def metadata(self) -> LLMMetadata:
	return LLMMetadata(context_window=self.context_window, num_output=self.num_output)

	# ------------------------------------------------------------------
	# SYNC COMPLETE
	# ------------------------------------------------------------------
	def complete(self, prompt: str, **kwargs: Any) -> CompletionResponse:
	payload = {
	"model": self.model_name,
	"messages": [{"role": "user", "content": prompt}],
	"temperature": self.temperature,
	"max_tokens": self.num_output if self.num_output > 0 else 2048,
	"stream": False,
	**kwargs,
	}
	try:
	resp = requests.post(self.base_url, headers=self.headers, json=payload, timeout=300)
	resp.raise_for_status()
	text = resp.json()["choices"][0]["message"]["content"]
	except Exception as e:
	text = f"[HF LLM Error]: {e}"
	return CompletionResponse(text=text)

	# ------------------------------------------------------------------
	# STREAMING (token-by-token)
	# ------------------------------------------------------------------
	def stream_complete(self, prompt: str, **kwargs: Any) -> Generator[CompletionResponse, None, None]:
	payload = {
	"model": self.model_name,
	"messages": [{"role": "user", "content": prompt}],
	"temperature": self.temperature,
	"max_tokens": self.num_output if self.num_output > 0 else 2048,
	"stream": True,
	**kwargs,
	}
	try:
	with requests.post(
	self.base_url, headers=self.headers, json=payload, stream=True, timeout=300
	) as resp:
	resp.raise_for_status()
	for line in resp.iter_lines(decode_unicode=True):
	if not line or not line.startswith("data: "):
	continue
	data = line.removeprefix("data: ").strip()
	if data == "[DONE]":
	break
	try:
	chunk = json.loads(data)
	delta = chunk["choices"][0]["delta"].get("content", "")
	if delta:
	yield CompletionResponse(text=delta)
	except Exception:
	continue
	except Exception as e:
	yield CompletionResponse(text=f"[Streaming Error]: {e}\n")

	async def acomplete(self, prompt: str, **kwargs: Any) -> CompletionResponse:
	return self.complete(prompt, **kwargs)

	async def astream_complete(self, prompt: str, **kwargs: Any) -> AsyncGenerator[CompletionResponse, None]:
	yield self.complete(prompt, **kwargs)

	# --------------------------------------------------------------
	# 8. EXTRACT ZIP (clean old files first)
	# --------------------------------------------------------------
	def extract_repo(zip_path: str):
	os.makedirs(TEMP_DIR, exist_ok=True)
	for item in os.listdir(TEMP_DIR):
	p = os.path.join(TEMP_DIR, item)
	if os.path.isdir(p):
	shutil.rmtree(p)
	else:
	os.unlink(p)

	with zipfile.ZipFile(zip_path, "r") as z:
	z.extractall(TEMP_DIR)

	st.success(f"✅ Extracted → `{TEMP_DIR}`")


	# --------------------------------------------------------------
	# 9. BUILD INDEX (NO CACHING)
	# --------------------------------------------------------------
	def build_index(_repo_hash: str):
	if not os.path.isdir(TEMP_DIR) or not os.listdir(TEMP_DIR):
	st.error("No files extracted!")
	return None

	storage_dir = "storage"
	if os.path.exists(storage_dir):
	shutil.rmtree(storage_dir)

	docs = SimpleDirectoryReader(
	TEMP_DIR,
	recursive=True,
	exclude=[
	".test.py", "__pycache__", ".pyc", "*.log",
	".mp3", ".wav", ".m4a", ".mp4", ".mov", ".avi", ".flac", ".ogg",
	"node_modules", ".git", ".venv", "*.md"
	],
	).load_data()

	if not docs:
	st.error("No documents loaded!")
	return None

	splitter = SentenceSplitter(chunk_size=1024, chunk_overlap=50)
	nodes = splitter.get_nodes_from_documents(docs)

	index = VectorStoreIndex(nodes, embed_model=embed_model, embed_batch_size=16)
	st.success("✅ Index built fresh (no caching)!")
	return index


	# --------------------------------------------------------------
	# 10. MAIN STREAMLIT APP
	# --------------------------------------------------------------
	def main():
	st.title("🤖 AI Codebase → Docs Agent (ModernBERT CPU + LM-Studio Streaming)")

	# Fixed model
	selected_model = get_hf_model()
	st.info(f"Using Openai's model: `{selected_model}`")

	# Create LLM
	llm = HFChatLLM(model_name=selected_model, temperature=0.7)

	uploaded = st.file_uploader("📦 Upload GitHub Repo (.zip)", type="zip")
	if not uploaded:
	st.info("Upload a .zip → Click Start Analysis")
	return

	zip_path = "repo.zip"
	with open(zip_path, "wb") as f:
	f.write(uploaded.getbuffer())

	if st.button("🚀 Start Analysis"):
	with st.spinner("Extracting repository..."):
	extract_repo(zip_path)

	repo_hash = hashlib.md5(open(zip_path, "rb").read()).hexdigest()

	with st.spinner("Building knowledge base..."):
	index = build_index(repo_hash)
	if not index:
	return
	engine = index.as_query_engine(llm=llm)

	# === 1. Overview (Streamed) ===
	with st.expander("📘 1. Project Overview", expanded=True):
	placeholder = st.empty()
	streamed_text = ""
	for token in llm.stream_complete(
	"Analyze the codebase and summarize:\n"
	"- Project name\n- Description\n- Tech stack\n- Entry point\n- Folder structure overview."
	):
	streamed_text += token.text
	placeholder.markdown(streamed_text)
	st.session_state.overview = streamed_text

	# === 2. Generate README (Streamed) ===
	with st.expander("🧾 2. Generate README.md", expanded=True):
	placeholder = st.empty()
	streamed_text = ""
	for token in llm.stream_complete(
	f"Using this project overview:\n{st.session_state.overview}\n\n"
	"Generate a professional and structured README.md including:\n"
	"- # Title\n- ## Description\n- ## Features\n- ## Installation\n"
	"- ## Usage\n- ## API Reference\n- ## Folder Structure\n- ## Contributing\n- ## License\n"
	"Ensure Markdown syntax is perfect with spacing and headers."
	):
	streamed_text += token.text
	placeholder.markdown(streamed_text)
	st.session_state.readme = streamed_text

	# === 3. Verification & Auto-Fix (normal) ===
	with st.expander("🔍 3. Self-Verification & Auto-Fix", expanded=True):
	check = to_text(engine.query(
	f"README:\n{st.session_state.readme}\n\n"
	"Review all code files and verify README accuracy.\n"
	"If issues are found, summarize them clearly. Otherwise say 'ALL CORRECT'."
	))
	st.markdown(check)

	if "all correct" not in check.lower():
	st.warning("Fixing README automatically...")
	fixed = to_text(engine.query(
	f"Fix and improve the README.md based on these verification results:\n{check}\n\n"
	f"Original README:\n{st.session_state.readme}\n\n"
	"Ensure the final version is perfectly formatted Markdown."
	))
	st.success("✅ Fixed README generated!")
	st.markdown("Final README.md:")
	st.markdown(fixed)
	st.session_state.readme_fixed = fixed
	else:
	st.session_state.readme_fixed = st.session_state.readme
	st.success("✅ README verified as correct!")

	# === 4. Architecture Diagram (stream optional) ===
	with st.expander("🧩 4. Architecture Diagram", expanded=True):
	placeholder = st.empty()
	streamed_text = ""
	for token in llm.stream_complete(
	"Generate a Mermaid flowchart of the application's architecture:\n"
	"- Components and relationships\n- Data flow\n- APIs / Services / DB\n"
	"Return only valid Markdown with ```mermaid code block."
	):
	streamed_text += token.text
	placeholder.code(streamed_text, language="mermaid")
	diag = streamed_text

	# === 5. Export ===
	os.makedirs(OUTPUT_DIR, exist_ok=True)
	readme_original_path = Path(f"{OUTPUT_DIR}/README_original.md")
	readme_fixed_path = Path(f"{OUTPUT_DIR}/README_final.md")
	diagram_path = Path(f"{OUTPUT_DIR}/ARCHITECTURE.mmd")

	readme_original_path.write_text(st.session_state.readme)
	readme_fixed_path.write_text(st.session_state.readme_fixed)
	diagram_path.write_text(diag)

	st.success(f"📁 Exported all files → `{OUTPUT_DIR}/`")

	# Download buttons
	st.markdown("### 📥 Download Your Files")
	for label, path, fname, mime in [
	("⬇️ Download Final README.md", readme_fixed_path, "README.md", "text/markdown"),
	("⬇️ Download Original README.md", readme_original_path, "README_original.md", "text/markdown"),
	("⬇️ Download Architecture Diagram (.mmd)", diagram_path, "ARCHITECTURE.mmd", "text/plain"),
	]:
	with open(path, "rb") as f:
	st.download_button(label=label, data=f, file_name=fname, mime=mime)

	st.info("✅ You can also find these files saved in the `output/` folder locally.")


	# --------------------------------------------------------------
	if __name__ == "__main__":
	main()