Spaces:

Anupam251272
/

AI-Case-Study-Generator

Runtime error

App Files Files Community

AI-Case-Study-Generator / app.py

Anupam251272

Create app.py

4ec1d8c verified about 1 year ago

raw

history blame contribute delete

7.38 kB

	import os
	import gradio as gr
	import pdfplumber
	import requests
	import faiss
	import json
	import torch
	from bs4 import BeautifulSoup
	from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
	from sentence_transformers import SentenceTransformer
	import numpy as np
	import tempfile
	import logging
	from datetime import datetime
	from typing import List, Dict

	# Optimize CUDA memory management
	os.environ['PYTORCH_CUDA_ALLOC_CONF'] = 'expandable_segments:True'

	# Configure logging
	logging.basicConfig(level=logging.INFO)
	logger = logging.getLogger(__name__)

	class CaseStudyGenerator:
	def __init__(self):
	self.model_name = "facebook/opt-2.7b"
	self.tokenizer = AutoTokenizer.from_pretrained(self.model_name)
	self.device = "cuda" if torch.cuda.is_available() else "cpu"

	# Clear any reserved memory
	if self.device == "cuda":
	torch.cuda.empty_cache()
	torch.cuda.ipc_collect()

	model_kwargs = {
	'torch_dtype': torch.float16 if self.device == "cuda" else torch.float32
	}

	try:
	self.model = AutoModelForCausalLM.from_pretrained(self.model_name, **model_kwargs)
	if self.device == "cuda":
	self.model = self.model.to(self.device)
	self.model.gradient_checkpointing_enable()
	except RuntimeError as e:
	logger.warning(f"Memory issue detected: {e}, attempting 8-bit loading.")

	try:
	from transformers import BitsAndBytesConfig
	quantization_config = BitsAndBytesConfig(load_in_8bit=True)
	self.model = AutoModelForCausalLM.from_pretrained(self.model_name, quantization_config=quantization_config)
	except ImportError:
	logger.error("Missing 'bitsandbytes'. Install it using 'pip install -U bitsandbytes'")
	logger.info("Switching to CPU to continue operations.")
	self.device = "cpu"
	self.model = AutoModelForCausalLM.from_pretrained(self.model_name, torch_dtype=torch.float32)

	self.generator = pipeline(
	"text-generation",
	model=self.model,
	tokenizer=self.tokenizer,
	device=0 if self.device == "cuda" else -1,
	max_length=2048,
	num_return_sequences=1,
	temperature=0.8,
	top_p=0.95,
	do_sample=True,
	pad_token_id=self.tokenizer.eos_token_id
	)

	self.embedding_model = SentenceTransformer('all-MiniLM-L6-v2')
	self.dimension = 384
	self.index = faiss.IndexFlatL2(self.dimension)
	self.stored_texts: List[Dict] = []

	def clean_url(self, url: str) -> str:
	if not url.startswith(('http://', 'https://')):
	return ""
	return url.split('?')[0][:100]

	def fetch_articles(self, topic: str) -> List[str]:
	try:
	search_url = f"https://www.google.com/search?q={topic.replace(' ', '+')}+case+study+manufacturing+strategy"
	headers = {"User-Agent": "Mozilla/5.0"}
	response = requests.get(search_url, headers=headers, timeout=10)
	response.raise_for_status()

	soup = BeautifulSoup(response.text, "html.parser")
	articles = [self.clean_url(link.get("href", "")) for link in soup.find_all("a") if "google" not in link.get("href", "")]
	return articles[:5] or ["No articles found"]
	except Exception as e:
	logger.error(f"Error fetching articles: {str(e)}")
	return ["Error fetching articles"]

	def process_pdf(self, pdf_file) -> str:
	try:
	if pdf_file is None:
	return "No PDF provided"

	with tempfile.NamedTemporaryFile(delete=False, suffix='.pdf') as temp_pdf:
	temp_pdf.write(pdf_file.read())
	temp_path = temp_pdf.name

	text = []
	with pdfplumber.open(temp_path) as pdf:
	text = [page.extract_text().strip() for page in pdf.pages if page.extract_text()]

	os.unlink(temp_path)
	return "\n".join(text) or "No text extracted from PDF"
	except Exception as e:
	logger.error(f"Error processing PDF: {str(e)}")
	return "Error processing PDF"

	def generate_case_study(self, topic: str, pdf=None) -> str:
	try:
	if self.device == "cuda":
	torch.cuda.empty_cache()

	articles = self.fetch_articles(topic)
	pdf_text = self.process_pdf(pdf) if pdf else "No PDF provided"

	prompt = f"""Write a professional case study about {topic}.
	Background Information:
	- Topic: {topic}
	- Supporting Documents: {pdf_text[:500]}
	- Related Sources: {', '.join(articles)}

	Format your response as:
	1. Executive Summary
	2. Company Background
	3. Challenge Analysis
	4. Strategic Implementation
	5. Results and Impact
	6. Key Learnings
	"""

	output = self.generator(
	prompt,
	max_new_tokens=1024,
	num_return_sequences=1,
	temperature=0.8,
	top_p=0.95,
	do_sample=True,
	repetition_penalty=1.2,
	no_repeat_ngram_size=3
	)

	case_study = output[0]['generated_text'].replace(prompt, "").strip()
	embedding = self.embedding_model.encode([case_study])[0]
	self.index.add(embedding.reshape(1, -1))

	self.stored_texts.append({
	"timestamp": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
	"topic": topic,
	"content": case_study
	})

	return case_study
	except Exception as e:
	logger.error(f"Error generating case study: {str(e)}")
	return f"Error generating case study: {str(e)}"

	def retrieve_past_case_studies(self) -> str:
	try:
	if not self.stored_texts:
	return "No case studies generated yet."

	result = ""
	for idx, case in enumerate(self.stored_texts[-5:], start=1):
	result += f"Case Study {idx}\nTopic: {case['topic']}\nGenerated on: {case['timestamp']}\n\n{case['content']}\n\n=== End of Case Study ===\n\n"
	return result
	except Exception as e:
	logger.error(f"Error retrieving past case studies: {str(e)}")
	return "Error retrieving past case studies"

	# Gradio interface
	with gr.Blocks() as app:
	gr.Markdown("# AI Case Study Generator (Optimized for GPU-T4 & CPU)")
	with gr.Row():
	topic = gr.Textbox(label="Enter Topic")
	pdf = gr.File(label="Upload PDF", type="binary")
	with gr.Row():
	generate_btn = gr.Button("Generate Case Study")
	retrieve_btn = gr.Button("Retrieve Past Case Studies")
	output = gr.Textbox(label="Generated Case Study", lines=20)
	past_cases = gr.Textbox(label="Past Case Studies", lines=20)

	generator = CaseStudyGenerator()
	generate_btn.click(generator.generate_case_study, inputs=[topic, pdf], outputs=output)
	retrieve_btn.click(generator.retrieve_past_case_studies, outputs=past_cases)

	# Launch the application
	if __name__ == "__main__":
	app.launch(share=True) # Remove enable_queue
	# or, If using Gradio 3.x or later, use:
	# app.queue().launch(share=True)