Spaces:

omgy
/

pcsales

Sleeping

App Files Files Community

pcsales / OLD /__dbmlsystem.py

omgy

Upload 52 files

97000ce verified 4 months ago

raw

history blame contribute delete

23.6 kB

	import streamlit as st
	import pandas as pd
	import numpy as np
	import plotly.express as px
	import plotly.graph_objects as go
	from datetime import datetime, timedelta
	from sklearn.ensemble import RandomForestClassifier, RandomForestRegressor
	from sklearn.model_selection import train_test_split
	from sklearn.preprocessing import StandardScaler
	from sklearn.cluster import KMeans
	import warnings
	warnings.filterwarnings('ignore')

	# Set page configuration
	st.set_page_config(
	page_title="Calcium Supplement Sales Automation",
	page_icon="🐄",
	layout="wide",
	initial_sidebar_state="expanded"
	)

	# App title
	st.title("🐄 Calcium Supplement Sales Automation Dashboard")
	st.markdown("---")

	# Your exact ML functions
	def enhanced_analyze_sales_data(data1, data2):
	"""
	Enhanced analysis with ML components for better predictions
	"""

	data1['Date'] = pd.to_datetime(data1['Date'])
	data2['Date'] = pd.to_datetime(data2['Date'])

	# Calculate basic metrics
	data1['Conversion_Rate'] = (data1['Contact_In_Group'] / data1['Sabhasad'] * 100).round(2)
	data1['Conversion_Rate'] = data1['Conversion_Rate'].replace([np.inf, -np.inf], 0).fillna(0)
	data1['Untapped_Potential'] = data1['Sabhasad'] - data1['Contact_In_Group']
	data1['Sales_Per_Contact'] = (data1['Total_L'] / data1['Contact_In_Group']).round(2)
	data1['Sales_Per_Contact'] = data1['Sales_Per_Contact'].replace([np.inf, -np.inf], 0).fillna(0)

	# Analyze recent sales
	recent_sales = data2.groupby('Village').agg({
	'Total_L': ['sum', 'count'],
	'Date': 'max'
	}).reset_index()

	recent_sales.columns = ['Village', 'Recent_Sales_L', 'Recent_Customers', 'Last_Sale_Date']
	recent_sales['Days_Since_Last_Sale'] = (datetime.now() - recent_sales['Last_Sale_Date']).dt.days

	# Merge data
	analysis_df = data1.merge(recent_sales, on='Village', how='left')
	analysis_df['Recent_Sales_L'] = analysis_df['Recent_Sales_L'].fillna(0)
	analysis_df['Recent_Customers'] = analysis_df['Recent_Customers'].fillna(0)
	analysis_df['Days_Since_Last_Sale'] = analysis_df['Days_Since_Last_Sale'].fillna(999)

	# ML Component 1: Village Clustering for Segmentation
	analysis_df = apply_village_clustering(analysis_df)

	# ML Component 2: Predict Sales Potential
	analysis_df = predict_sales_potential(analysis_df)

	# ML Component 3: Action Recommendation Classifier
	analysis_df = predict_recommended_actions(analysis_df)

	# Generate recommendations based on ML predictions
	recommendations = generate_ml_recommendations(analysis_df)

	return recommendations, analysis_df

	def apply_village_clustering(analysis_df):
	"""
	Use K-Means clustering to segment villages into groups
	"""
	# Prepare features for clustering
	cluster_features = analysis_df[[
	'Conversion_Rate', 'Untapped_Potential', 'Sales_Per_Contact',
	'Recent_Sales_L', 'Days_Since_Last_Sale'
	]].fillna(0)

	# Standardize features
	scaler = StandardScaler()
	scaled_features = scaler.fit_transform(cluster_features)

	# Apply K-Means clustering
	kmeans = KMeans(n_clusters=4, random_state=42, n_init=10)
	clusters = kmeans.fit_predict(scaled_features)

	# Add clusters to dataframe
	analysis_df['Cluster'] = clusters

	# Name the clusters based on characteristics
	cluster_names = {
	0: 'High Potential - Low Engagement',
	1: 'Steady Performers',
	2: 'Underperforming',
	3: 'New/Developing'
	}

	analysis_df['Segment'] = analysis_df['Cluster'].map(cluster_names)

	return analysis_df

	def predict_sales_potential(analysis_df):
	"""
	Predict sales potential for each village using Random Forest
	"""
	# Prepare features for prediction
	prediction_features = analysis_df[[
	'Sabhasad', 'Contact_In_Group', 'Conversion_Rate',
	'Untapped_Potential', 'Recent_Sales_L', 'Days_Since_Last_Sale'
	]].fillna(0)

	# Target variable: Total_L (current sales)
	target = analysis_df['Total_L'].fillna(0)

	# Only train if we have enough data
	if len(prediction_features) > 10:
	# Split data
	X_train, X_test, y_train, y_test = train_test_split(
	prediction_features, target, test_size=0.2, random_state=42
	)

	# Train model
	model = RandomForestRegressor(n_estimators=100, random_state=42)
	model.fit(X_train, y_train)

	# Make predictions
	predictions = model.predict(prediction_features)

	# Calculate feature importance
	feature_importance = pd.DataFrame({
	'feature': prediction_features.columns,
	'importance': model.feature_importances_
	}).sort_values('importance', ascending=False)

	# Add predictions to dataframe
	analysis_df['Predicted_Sales'] = predictions
	analysis_df['Sales_Gap'] = analysis_df['Predicted_Sales'] - analysis_df['Total_L']
	else:
	# Fallback if not enough data
	analysis_df['Predicted_Sales'] = analysis_df['Total_L']
	analysis_df['Sales_Gap'] = 0

	return analysis_df

	def predict_recommended_actions(analysis_df):
	"""
	Use ML to predict the best action for each village
	"""
	# Define actions based on rules (for training data)
	analysis_df['Action_Label'] = np.where(
	analysis_df['Conversion_Rate'] < 20, 'Send Marketing Team',
	np.where(
	analysis_df['Untapped_Potential'] > 30, 'Call Mantri for Follow-up',
	np.where(
	analysis_df['Days_Since_Last_Sale'] > 30, 'Check on Mantri',
	np.where(
	analysis_df['Sales_Per_Contact'] > 10, 'Provide More Stock',
	'Regular Follow-up'
	)
	)
	)
	)

	# Prepare features for classification
	classification_features = analysis_df[[
	'Conversion_Rate', 'Untapped_Potential', 'Sales_Per_Contact',
	'Recent_Sales_L', 'Days_Since_Last_Sale', 'Sales_Gap'
	]].fillna(0)

	# Target variable: Action_Label
	target = analysis_df['Action_Label']

	# Only train if we have enough data
	if len(classification_features) > 10 and len(target.unique()) > 1:
	# Split data
	X_train, X_test, y_train, y_test = train_test_split(
	classification_features, target, test_size=0.2, random_state=42, stratify=target
	)

	# Train classifier
	clf = RandomForestClassifier(n_estimators=100, random_state=42)
	clf.fit(X_train, y_train)

	# Make predictions
	predictions = clf.predict(classification_features)
	prediction_proba = clf.predict_proba(classification_features)

	# Add predictions to dataframe
	analysis_df['ML_Recommended_Action'] = predictions
	analysis_df['Action_Confidence'] = np.max(prediction_proba, axis=1)
	else:
	# Fallback to rule-based if not enough data
	analysis_df['ML_Recommended_Action'] = analysis_df['Action_Label']
	analysis_df['Action_Confidence'] = 1.0

	return analysis_df

	def generate_ml_recommendations(analysis_df):
	"""
	Generate recommendations based on ML predictions
	"""
	recommendations = []

	for _, row in analysis_df.iterrows():
	village = row['Village']
	mantri = row['Mantri_Name']
	mobile = row['Mantri_Mobile']
	taluka = row['Taluka']
	district = row['District']
	segment = row['Segment']
	action = row['ML_Recommended_Action']
	confidence = row['Action_Confidence']

	# Generate reason based on ML prediction
	if action == 'Send Marketing Team':
	reason = f"ML predicts marketing team needed (Confidence: {confidence:.2f}). Segment: {segment}"
	priority = 'High'
	elif action == 'Call Mantri for Follow-up':
	reason = f"ML predicts mantri follow-up needed (Confidence: {confidence:.2f}). Segment: {segment}"
	priority = 'High'
	elif action == 'Check on Mantri':
	reason = f"ML suggests checking on mantri (Confidence: {confidence:.2f}). Segment: {segment}"
	priority = 'Medium'
	elif action == 'Provide More Stock':
	reason = f"ML predicts stock increase needed (Confidence: {confidence:.2f}). Segment: {segment}"
	priority = 'Medium'
	else:
	reason = f"ML recommends regular follow-up (Confidence: {confidence:.2f}). Segment: {segment}"
	priority = 'Low'

	recommendations.append({
	'Village': village,
	'Taluka': taluka,
	'District': district,
	'Mantri': mantri,
	'Mobile': mobile,
	'Action': action,
	'Reason': reason,
	'Priority': priority,
	'Confidence': confidence,
	'Segment': segment,
	'Sales_Gap': row.get('Sales_Gap', 0)
	})

	return pd.DataFrame(recommendations)

	def generate_ml_mantri_messages(recommendations):
	"""
	Generate personalized messages based on ML recommendations
	"""
	messages = []

	for _, row in recommendations.iterrows():
	if row['Action'] == 'Send Marketing Team':
	message = f"""
	Namaste {row['Mantri']} Ji!

	Our AI system has identified that your village {row['Village']} has high potential for growth.
	We're sending our marketing team to conduct demo sessions and help you reach more customers.

	Based on our analysis:
	- Segment: {row['Segment']}
	- Confidence: {row['Confidence']*100:.1f}%

	Please prepare for their visit and notify potential customers.

	Dhanyavaad,
	Calcium Supplement Team
	"""
	elif row['Action'] == 'Call Mantri for Follow-up':
	message = f"""
	Namaste {row['Mantri']} Ji!

	Our AI analysis shows significant untapped potential in {row['Village']}.
	We recommend focusing on follow-up with these customers:

	- Segment: {row['Segment']}
	- Confidence: {row['Confidence']*100:.1f}%

	A special commission offer is available for your next 10 customers.

	Dhanyavaad,
	Calcium Supplement Team
	"""
	elif row['Action'] == 'Check on Mantri':
	message = f"""
	Namaste {row['Mantri']} Ji!

	Our system shows reduced activity in {row['Village']}.
	Is everything alright? Do you need any support from our team?

	- Segment: {row['Segment']}
	- Confidence: {row['Confidence']*100:.1f}%

	Please let us know how we can help.

	Dhanyavaad,
	Calcium Supplement Team
	"""
	elif row['Action'] == 'Provide More Stock':
	message = f"""
	Namaste {row['Mantri']} Ji!

	Great news! Our AI predicts increased demand in {row['Village']}.
	Would you like us to send additional stock?

	- Segment: {row['Segment']}
	- Confidence: {row['Confidence']*100:.1f}%
	- Predicted Sales Gap: {row['Sales_Gap']:.1f}L

	Please confirm your additional requirements.

	Dhanyavaad,
	Calcium Supplement Team
	"""
	else:
	message = f"""
	Namaste {row['Mantri']} Ji!

	Our system shows steady performance in {row['Village']}.
	Keep up the good work!

	- Segment: {row['Segment']}
	- Confidence: {row['Confidence']*100:.1f}%

	As always, let us know if you need any support.

	Dhanyavaad,
	Calcium Supplement Team
	"""

	messages.append({
	'Mantri': row['Mantri'],
	'Mobile': row['Mobile'],
	'Village': row['Village'],
	'Action': row['Action'],
	'Message': message,
	'Priority': row['Priority'],
	'Confidence': row['Confidence']
	})

	return pd.DataFrame(messages)

	# Visualization functions
	def plot_village_performance(analysis_df):
	"""Create performance visualization for villages"""
	fig = px.scatter(analysis_df,
	x='Conversion_Rate',
	y='Untapped_Potential',
	size='Total_L',
	color='Segment',
	hover_name='Village',
	title='Village Performance Analysis',
	labels={'Conversion_Rate': 'Conversion Rate (%)',
	'Untapped_Potential': 'Untapped Potential'})

	fig.update_layout(height=500)
	return fig

	def plot_sales_trends(analysis_df):
	"""Create sales trends visualization"""
	fig = px.bar(analysis_df,
	x='Village',
	y='Total_L',
	color='Segment',
	title='Total Sales by Village',
	labels={'Total_L': 'Total Sales (L)', 'Village': 'Village'})

	fig.update_layout(height=400, xaxis_tickangle=-45)
	return fig

	def plot_priority_matrix(recommendations):
	"""Create priority matrix visualization"""
	priority_order = {'High': 3, 'Medium': 2, 'Low': 1}
	recommendations['Priority_Value'] = recommendations['Priority'].map(priority_order)

	fig = px.treemap(recommendations,
	path=['Priority', 'Village'],
	values='Priority_Value',
	color='Priority_Value',
	color_continuous_scale='RdYlGn_r',
	title='Action Priority Matrix')

	fig.update_layout(height=500)
	return fig

	def display_key_metrics(analysis_df):
	"""Display key performance metrics"""
	col1, col2, col3, col4 = st.columns(4)

	with col1:
	st.metric("Total Villages", len(analysis_df))
	with col2:
	avg_conversion = analysis_df['Conversion_Rate'].mean()
	st.metric("Avg Conversion Rate", f"{avg_conversion:.1f}%")
	with col3:
	total_untapped = analysis_df['Untapped_Potential'].sum()
	st.metric("Total Untapped Potential", f"{total_untapped}")
	with col4:
	total_sales = analysis_df['Total_L'].sum()
	st.metric("Total Sales (L)", f"{total_sales}")

	# Initialize session state
	if 'data1' not in st.session_state:
	st.session_state.data1 = None
	if 'data2' not in st.session_state:
	st.session_state.data2 = None
	if 'analysis_df' not in st.session_state:
	st.session_state.analysis_df = None
	if 'recommendations' not in st.session_state:
	st.session_state.recommendations = None
	if 'ml_messages' not in st.session_state:
	st.session_state.ml_messages = None

	# Sidebar
	with st.sidebar:
	st.header("Data Input")

	# File uploaders
	st.subheader("Upload Village Data (Data1)")
	uploaded_data1 = st.file_uploader("CSV or Excel file", type=["csv", "xlsx"], key="data1")

	st.subheader("Upload Sales Data (Data2)")
	uploaded_data2 = st.file_uploader("CSV or Excel file", type=["csv", "xlsx"], key="data2")

	if st.button("Load Data and Run ML Analysis"):
	if uploaded_data1 and uploaded_data2:
	try:
	# Load data
	if uploaded_data1.name.endswith('.csv'):
	data1 = pd.read_csv(uploaded_data1)
	else:
	data1 = pd.read_excel(uploaded_data1)

	if uploaded_data2.name.endswith('.csv'):
	data2 = pd.read_csv(uploaded_data2)
	else:
	data2 = pd.read_excel(uploaded_data2)

	# Store in session state
	st.session_state.data1 = data1
	st.session_state.data2 = data2

	# Run ML analysis
	with st.spinner("Running ML analysis..."):
	recommendations, analysis_df = enhanced_analyze_sales_data(data1, data2)
	st.session_state.analysis_df = analysis_df
	st.session_state.recommendations = recommendations

	ml_messages = generate_ml_mantri_messages(recommendations)
	st.session_state.ml_messages = ml_messages

	st.success("ML analysis completed successfully!")

	except Exception as e:
	st.error(f"Error processing data: {str(e)}")
	else:
	st.error("Please upload both files to proceed")

	# Main content
	if st.session_state.analysis_df is not None and st.session_state.recommendations is not None:
	# Display dashboard
	tab1, tab2, tab3, tab4 = st.tabs(["Dashboard", "Village Analysis", "Actions & Messages", "Team Dispatch"])

	with tab1:
	st.header("ML-Powered Performance Dashboard")
	display_key_metrics(st.session_state.analysis_df)

	col1, col2 = st.columns(2)

	with col1:
	st.plotly_chart(plot_village_performance(st.session_state.analysis_df), use_container_width=True)

	with col2:
	st.plotly_chart(plot_priority_matrix(st.session_state.recommendations), use_container_width=True)

	st.plotly_chart(plot_sales_trends(st.session_state.analysis_df), use_container_width=True)

	with tab2:
	st.header("Village Analysis with ML Segmentation")

	selected_village = st.selectbox("Select Village", st.session_state.analysis_df['Village'].unique())
	village_data = st.session_state.analysis_df[st.session_state.analysis_df['Village'] == selected_village].iloc[0]

	col1, col2 = st.columns(2)

	with col1:
	st.subheader("Village Details")
	st.write(f"Village: {village_data['Village']}")
	st.write(f"Taluka: {village_data['Taluka']}")
	st.write(f"District: {village_data['District']}")
	st.write(f"Mantri: {village_data['Mantri_Name']}")
	st.write(f"Mantri Mobile: {village_data['Mantri_Mobile']}")
	st.write(f"Segment: {village_data.get('Segment', 'N/A')}")
	st.write(f"ML Recommended Action: {village_data.get('ML_Recommended_Action', 'N/A')}")
	st.write(f"Action Confidence: {village_data.get('Action_Confidence', 'N/A'):.2f}")

	with col2:
	st.subheader("Performance Metrics")
	st.write(f"Sabhasad: {village_data['Sabhasad']}")
	st.write(f"Contacted: {village_data['Contact_In_Group']}")
	st.write(f"Conversion Rate: {village_data['Conversion_Rate']}%")
	st.write(f"Untapped Potential: {village_data['Untapped_Potential']}")
	st.write(f"Total Sales: {village_data['Total_L']}L")
	st.write(f"Sales per Contact: {village_data['Sales_Per_Contact']}L")
	st.write(f"Predicted Sales: {village_data.get('Predicted_Sales', 'N/A'):.1f}L")
	st.write(f"Sales Gap: {village_data.get('Sales_Gap', 'N/A'):.1f}L")

	with tab3:
	st.header("ML-Based Actions & Messages")

	st.subheader("ML-Generated Recommendations")
	st.dataframe(st.session_state.recommendations)

	# Download recommendations
	csv_data = st.session_state.recommendations.to_csv(index=False)
	st.download_button(
	label="Download Recommendations as CSV",
	data=csv_data,
	file_name="ml_sales_recommendations.csv",
	mime="text/csv"
	)

	st.subheader("Generate ML-Powered Messages")
	selected_mantri = st.selectbox("Select Mantri", st.session_state.recommendations['Mantri'].unique())
	mantri_data = st.session_state.recommendations[
	st.session_state.recommendations['Mantri'] == selected_mantri].iloc[0]

	message_df = st.session_state.ml_messages[
	st.session_state.ml_messages['Mantri'] == selected_mantri]

	if not message_df.empty:
	message = message_df.iloc[0]['Message']
	st.text_area("ML-Generated Message", message, height=300)

	if st.button("Send Message"):
	st.success(f"Message sent to {mantri_data['Mantri']} at {mantri_data['Mobile']}")

	st.subheader("Bulk Message Sender")
	if st.button("Generate All ML Messages"):
	st.session_state.all_messages = st.session_state.ml_messages

	if 'all_messages' in st.session_state:
	st.dataframe(st.session_state.all_messages[['Mantri', 'Village', 'Action', 'Priority', 'Confidence']])

	if st.button("Send All ML Messages"):
	progress_bar = st.progress(0)
	for i, row in st.session_state.all_messages.iterrows():
	# Simulate sending message
	progress_bar.progress((i + 1) / len(st.session_state.all_messages))
	st.success("All ML-powered messages sent successfully!")

	with tab4:
	st.header("Marketing Team Dispatch with ML Insights")

	st.subheader("Villages Needing Team Visit (ML Identified)")
	high_priority = st.session_state.recommendations[
	st.session_state.recommendations['Action'] == 'Send Marketing Team']

	if not high_priority.empty:
	for _, row in high_priority.iterrows():
	with st.expander(f"{row['Village']} - {row['Mantri']} (Confidence: {row['Confidence']:.2f})"):
	st.write(f"Reason: {row['Reason']}")
	st.write(f"Segment: {row['Segment']}")
	st.write(f"Sales Gap: {row['Sales_Gap']:.1f}L")

	dispatch_date = st.date_input("Dispatch Date", key=f"date_{row['Village']}")
	team_size = st.slider("Team Size", 1, 5, 2, key=f"size_{row['Village']}")

	if st.button("Schedule Dispatch", key=f"dispatch_{row['Village']}"):
	st.success(f"Team dispatch scheduled for {row['Village']} on {dispatch_date}")
	else:
	st.info("No villages currently require immediate team dispatch based on ML analysis.")

	st.subheader("ML Performance Insights")
	st.write("Based on our machine learning analysis, here are key insights:")

	# Show segment distribution
	segment_counts = st.session_state.analysis_df['Segment'].value_counts()
	fig = px.pie(values=segment_counts.values, names=segment_counts.index,
	title="Village Segment Distribution")
	st.plotly_chart(fig, use_container_width=True)

	# Show confidence distribution
	fig = px.histogram(st.session_state.recommendations, x='Confidence',
	title='Confidence Distribution of ML Recommendations')
	st.plotly_chart(fig, use_container_width=True)

	else:
	st.info("Please upload your data files using the sidebar and click 'Load Data and Run ML Analysis' to get started.")

	# Footer
	st.markdown("---")
	st.markdown("ML-Powered Calcium Supplement Sales Automation System \| For internal use only")