Spaces:

Sazzz02
/

MAILER

Runtime error

App Files Files Community

MAILER / app.py

Sazzz02

Update app.py

998dbea verified 6 months ago

raw

history blame contribute delete

3.86 kB

	import os
	import sys
	import uuid
	import chromadb
	import pandas as pd
	from flask import Flask, request, render_template
	from langchain_groq import ChatGroq
	from langchain_community.document_loaders import WebBaseLoader
	from langchain_core.prompts import PromptTemplate
	from langchain_core.output_parsers import JsonOutputParser
	from langchain_core.output_parsers import StrOutputParser

	# Flask app initialization
	app = Flask(__name__)

	# Get API key from environment variables
	GROQ_API_KEY = os.environ.get("GROQ_API_KEY")

	# Set a writable directory for ChromaDB in the container
	CHROMA_DB_PATH = os.path.join(os.path.sep, "tmp", "vectorstore")

	# --- Initialize Vector Database on Startup ---
	try:
	df = pd.read_csv("my_portfolio.csv")
	except FileNotFoundError:
	print("❌ Error: my_portfolio.csv not found.")
	sys.exit(1)

	# --- Change the client initialization to a writable directory ---
	client = chromadb.PersistentClient(CHROMA_DB_PATH)
	collection = client.get_or_create_collection(name="portfolio")

	if collection.count() != len(df):
	if collection.count() > 0:
	collection.delete(ids=collection.get()['ids'])

	for _, row in df.iterrows():
	collection.add(
	documents=row["Techstack"],
	metadatas={"links": row["Links"]},
	ids=[str(uuid.uuid4())]
	)
	print("✅ Vector database populated with portfolio data.")
	else:
	print("✅ Vector database already exists.")

	@app.route('/')
	def index():
	return render_template('robot_ui.html')

	@app.route('/generate', methods=['POST'])
	def generate_content():
	if not GROQ_API_KEY:
	return "❌ Error: Groq API key is not set. Please add it to Render's environment variables.", 500

	job_url = request.form.get('job_url')
	if not job_url:
	return "Please provide a job URL.", 400

	# --- Validate Groq API Key ---
	try:
	llm = ChatGroq(
	temperature=0,
	groq_api_key=GROQ_API_KEY,
	model_name="llama3-70b-8192"
	)
	llm.invoke("Test LLM connection.")
	except Exception as e:
	return f"❌ Error: Invalid Groq API key or model unavailable. Details: {e}", 500

	# --- Scrape and Extract Job Information ---
	try:
	loader = WebBaseLoader(job_url)
	page_data = loader.load().pop().page_content
	except Exception as e:
	return f"❌ Error scraping URL. Please check the URL. Error: {e}", 500

	prompt_extract = PromptTemplate.from_template(
	"""### SCRAPED TEXT FROM WEBSITE: {page_data}
	### INSTRUCTION: Extract the job posting details and return them in JSON format with keys: `role`, `experience`, `skills` and `description`. Only return the valid JSON.
	### VALID JSON (NO PREAMBLE):"""
	)
	json_parser = JsonOutputParser()
	chain_extract = prompt_extract \| llm \| json_parser
	job = chain_extract.invoke(input={'page_data': page_data})

	# --- Find Relevant Portfolio Links ---
	job_skills = job.get('skills', [])
	relevant_links = collection.query(query_texts=job_skills, n_results=2).get('metadatas', [])

	# --- Generate Cold Email ---
	prompt_email = PromptTemplate.from_template(
	"""### JOB DESCRIPTION: {job_description}
	### INSTRUCTION: You are Mohan, a business development executive at AtliQ. Write a cold email to the client, describing AtliQ's capabilities in fulfilling their needs. Also add the most relevant ones from the following links to showcase Atliq's portfolio: {link_list}
	### EMAIL (NO PREAMBLE):"""
	)
	chain_email = prompt_email \| llm \| StrOutputParser()
	email_content = chain_email.invoke({
	"job_description": str(job),
	"link_list": relevant_links
	})

	return email_content

	if __name__ == '__main__':
	app.run(host='0.0.0.0', port=int(os.environ.get('PORT', 8080)))