Spaces:

Shipmaster1
/

yt_linkedin_post

Sleeping

App Files Files Community

T-K-O-H commited on May 12, 2025

Commit

50bca05

1 Parent(s): ef853e9

huggingface issue 43

Browse files

Files changed (2) hide show

app.py +106 -30
requirements.txt +13 -23

app.py CHANGED Viewed

@@ -25,6 +25,8 @@ from datasets import Dataset
 # import plotly.graph_objects as go
 import numpy as np
 from langchain_community.vectorstores import FAISS
 from langchain_chroma import Chroma
 from langchain.schema import Document
 from datetime import datetime
@@ -32,6 +34,10 @@ from langchain_community.embeddings import HuggingFaceEmbeddings
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 # from ragas import evaluate
 # Load environment variables
 load_dotenv(verbose=True)
@@ -1084,8 +1090,6 @@ def create_ui():
         def process_with_loading(url, state):
             """Process video with loading indicators."""
             try:
-                print(f"Starting processing for URL: {url}")  # Debug log
                 # Initialize state if needed
                 if "improvement_plan" not in state:
                     state["improvement_plan"] = {}
@@ -1098,10 +1102,9 @@ def create_ui():
                 # Show loading indicators
                 loading_states, message = update_loading_state("transcript")
-                print("Fetching transcript...")  # Debug log
                 yield [
                     "",  # error
-                    "Starting process...",  # status
                     message,  # transcript (loading)
                     "",  # enhanced
                     "",  # linkedin
@@ -1115,13 +1118,7 @@ def create_ui():
                 # Get transcript
                 state["video_url"] = url
-                transcript_state = get_transcript(state)
-                if "error" in transcript_state and transcript_state["error"]:
-                    print(f"Error in transcript: {transcript_state['error']}")  # Debug log
-                    raise Exception(transcript_state["error"])
-                transcript_text = transcript_state["transcript"]
-                print(f"Transcript length: {len(transcript_text)}")  # Debug log
                 # Show enhancing state
                 loading_states, message = update_loading_state("enhance")
@@ -1142,12 +1139,7 @@ def create_ui():
                 # Enhance content
                 state["transcript"] = transcript_text
                 enhanced_state = enhance_content(state)
-                if "error" in enhanced_state and enhanced_state["error"]:
-                    print(f"Error in enhancement: {enhanced_state['error']}")  # Debug log
-                    raise Exception(enhanced_state["error"])
                 enhanced_text = enhanced_state["enhanced"]
-                print("Content enhanced successfully")  # Debug log
                 # Show formatting state
                 loading_states, message = update_loading_state("format")
@@ -1168,12 +1160,7 @@ def create_ui():
                 # Format LinkedIn post
                 state["enhanced"] = enhanced_text
                 linkedin_state = format_linkedin_post(state)
-                if "error" in linkedin_state and linkedin_state["error"]:
-                    print(f"Error in formatting: {linkedin_state['error']}")  # Debug log
-                    raise Exception(linkedin_state["error"])
                 linkedin_text = linkedin_state["linkedin_post"]
-                print("LinkedIn post formatted successfully")  # Debug log
                 # Show verifying state
                 loading_states, message = update_loading_state("verify")
@@ -1183,7 +1170,7 @@ def create_ui():
                     transcript_text,
                     enhanced_text,
                     linkedin_text,
-                    "🔍 Verifying...",  # verification (loading)
                     "",
                     "",
                     "",
@@ -1195,15 +1182,109 @@ def create_ui():
                 state["linkedin_post"] = linkedin_text
                 final_state = verify_content(state)
                 verification_text = format_verification_text(final_state.get("verification", {}))
-                print("Content verified successfully")  # Debug log
                 # Update improvement plan and research results
                 improvement_plan_text = format_improvement_plan(final_state.get("improvement_plan", {}))
                 research_results_text = format_research_results(safe_json_loads(final_state.get("research_context", "{}")))
                 # Complete
                 loading_states, _ = update_loading_state("done")
-                final_result = [
                     "",
                     "✅ Processing complete!",
                     transcript_text,
@@ -1216,13 +1297,10 @@ def create_ui():
                     final_state,
                     *loading_states
                 ]
-                print("Processing completed successfully")  # Debug log
-                yield final_result
             except Exception as e:
-                print(f"Error in processing: {str(e)}")  # Debug log
                 loading_states, _ = update_loading_state("done")
-                error_result = [
                     f"⚠️ Error: {str(e)}",
                     "❌ Processing failed",
                     state.get("transcript", ""),
@@ -1235,7 +1313,6 @@ def create_ui():
                     state,
                     *loading_states
                 ]
-                yield error_result
         # Set up event handlers
         youtube_convert_btn.click(
@@ -1610,7 +1687,6 @@ Important:
 if __name__ == "__main__":
     print_graph()  # Print the graph visualization
     demo = create_ui()
-    demo.queue()  # Enable queuing for better handling of concurrent requests
     demo.launch(
         server_name="0.0.0.0",
         server_port=None,  # Let Gradio find an available port

 # import plotly.graph_objects as go
 import numpy as np
 from langchain_community.vectorstores import FAISS
+import asyncio
+import nest_asyncio
 from langchain_chroma import Chroma
 from langchain.schema import Document
 from datetime import datetime
 from langchain.text_splitter import RecursiveCharacterTextSplitter
 # from ragas import evaluate
+# # Configure asyncio
+# nest_asyncio.apply()
+# asyncio.set_event_loop(asyncio.new_event_loop())
 # Load environment variables
 load_dotenv(verbose=True)
         def process_with_loading(url, state):
             """Process video with loading indicators."""
             try:
                 # Initialize state if needed
                 if "improvement_plan" not in state:
                     state["improvement_plan"] = {}
                 # Show loading indicators
                 loading_states, message = update_loading_state("transcript")
                 yield [
                     "",  # error
+                    "Processing...",  # status
                     message,  # transcript (loading)
                     "",  # enhanced
                     "",  # linkedin
                 # Get transcript
                 state["video_url"] = url
+                transcript_text = get_transcript(state)["transcript"]
                 # Show enhancing state
                 loading_states, message = update_loading_state("enhance")
                 # Enhance content
                 state["transcript"] = transcript_text
                 enhanced_state = enhance_content(state)
                 enhanced_text = enhanced_state["enhanced"]
                 # Show formatting state
                 loading_states, message = update_loading_state("format")
                 # Format LinkedIn post
                 state["enhanced"] = enhanced_text
                 linkedin_state = format_linkedin_post(state)
                 linkedin_text = linkedin_state["linkedin_post"]
                 # Show verifying state
                 loading_states, message = update_loading_state("verify")
                     transcript_text,
                     enhanced_text,
                     linkedin_text,
+                    "🔍 Verifying...\n⚖️ Analyzing accuracy...",  # verification (loading)
                     "",
                     "",
                     "",
                 state["linkedin_post"] = linkedin_text
                 final_state = verify_content(state)
                 verification_text = format_verification_text(final_state.get("verification", {}))
                 # Update improvement plan and research results
                 improvement_plan_text = format_improvement_plan(final_state.get("improvement_plan", {}))
                 research_results_text = format_research_results(safe_json_loads(final_state.get("research_context", "{}")))
+                # Check if enhancement is needed
+                if final_state.get("needs_improvement", False):
+                    # Show planning state
+                    loading_states, message = update_loading_state("plan")
+                    yield [
+                        "",
+                        f"Creating improvement plan (Attempt {final_state.get('enhancement_attempts', 1)}/3)...",
+                        transcript_text,
+                        enhanced_text,
+                        linkedin_text,
+                        verification_text,
+                        improvement_plan_text,
+                        research_results_text,
+                        "",
+                        state,
+                        *loading_states
+                    ]
+                    # Show researching state
+                    loading_states, message = update_loading_state("research")
+                    yield [
+                        "",
+                        f"Researching content (Attempt {final_state.get('enhancement_attempts', 1)}/3)...",
+                        transcript_text,
+                        enhanced_text,
+                        linkedin_text,
+                        verification_text,
+                        improvement_plan_text,
+                        research_results_text,
+                        "",
+                        state,
+                        *loading_states
+                    ]
+                    # Research content
+                    state = research_content(state)
+                    research_results_text = format_research_results(safe_json_loads(state.get("research_context", "{}")))
+                    # Show enhancing again state
+                    loading_states, message = update_loading_state("enhance")
+                    yield [
+                        "",
+                        f"Enhancing content again (Attempt {final_state.get('enhancement_attempts', 1)}/3)...",
+                        transcript_text,
+                        enhanced_text,
+                        linkedin_text,
+                        verification_text,
+                        improvement_plan_text,
+                        research_results_text,
+                        "",
+                        state,
+                        *loading_states
+                    ]
+                    # Enhance again
+                    state = enhance_again(state)
+                    enhanced_text = state["enhanced"]
+                    # Update LinkedIn post
+                    state["enhanced"] = enhanced_text
+                    linkedin_state = format_linkedin_post(state)
+                    linkedin_text = linkedin_state["linkedin_post"]
+                    # Verify again
+                    state["linkedin_post"] = linkedin_text
+                    final_state = verify_content(state)
+                    verification_text = format_verification_text(final_state.get("verification", {}))
+                    improvement_plan_text = format_improvement_plan(final_state.get("improvement_plan", {}))
+                    research_results_text = format_research_results(safe_json_loads(final_state.get("research_context", "{}")))
+                # After research and enhancement, create improved LinkedIn post
+                if final_state.get("needs_improvement", False):
+                    # Show improved post loading state
+                    loading_states, message = update_loading_state("improved")
+                    yield [
+                        "",
+                        f"Creating improved LinkedIn post (Attempt {final_state.get('enhancement_attempts', 1)}/3)...",
+                        transcript_text,
+                        enhanced_text,
+                        linkedin_text,
+                        verification_text,
+                        improvement_plan_text,
+                        research_results_text,
+                        message,  # improved linkedin (loading)
+                        state,
+                        *loading_states
+                    ]
+                    # Create improved LinkedIn post
+                    improved_state = format_linkedin_post(final_state)
+                    improved_text = improved_state["linkedin_post"]
+                    # Update final state
+                    final_state["improved_linkedin"] = improved_text
                 # Complete
                 loading_states, _ = update_loading_state("done")
+                yield [
                     "",
                     "✅ Processing complete!",
                     transcript_text,
                     final_state,
                     *loading_states
                 ]
             except Exception as e:
                 loading_states, _ = update_loading_state("done")
+                yield [
                     f"⚠️ Error: {str(e)}",
                     "❌ Processing failed",
                     state.get("transcript", ""),
                     state,
                     *loading_states
                 ]
         # Set up event handlers
         youtube_convert_btn.click(
 if __name__ == "__main__":
     print_graph()  # Print the graph visualization
     demo = create_ui()
     demo.launch(
         server_name="0.0.0.0",
         server_port=None,  # Let Gradio find an available port

requirements.txt CHANGED Viewed

@@ -1,4 +1,3 @@
-# Core dependencies
 gradio>=4.0.0
 python-dotenv>=1.0.0
 sentence-transformers>=2.2.2
@@ -7,35 +6,26 @@ langchain>=0.1.0
 langchain-openai>=0.0.5
 langchain-core>=0.1.0
 langgraph>=0.0.11
-# Unused dependencies
-# PyPDF2>=3.0.0
-# requests>=2.31.0
-# beautifulsoup4>=4.12.0
-# trafilatura>=1.6.1
-# Vector store and embeddings
 chromadb>=0.4.22
 tiktoken>=0.6.0
-protobuf==3.20.3
-# Evaluation tools (currently not used)
-# ragas>=0.1.0
-# datasets>=2.15.0
-# plotly>=5.18.0
-# Core ML dependencies
 numpy>=1.24.0
 faiss-cpu>=1.7.4
 langchain-community>=0.0.10
 langchain-chroma>=0.0.1
 openai>=1.6.0
 typing-extensions>=4.5.0
-# asyncio>=3.4.3
-# ML model dependencies
 torch>=2.0.0
 transformers>=4.36.0
-tqdm>=4.66.0
-# scikit-learn>=1.3.0
-# pandas>=2.1.0

 gradio>=4.0.0
 python-dotenv>=1.0.0
 sentence-transformers>=2.2.2
 langchain-openai>=0.0.5
 langchain-core>=0.1.0
 langgraph>=0.0.11
+#PyPDF2>=3.0.0
+#requests>=2.31.0
+#beautifulsoup4>=4.12.0
+#trafilatura>=1.6.1
 chromadb>=0.4.22
 tiktoken>=0.6.0
+#protobuf==3.20.3
+#ragas>=0.1.0
+#datasets>=2.15.0
+#plotly>=5.18.0
 numpy>=1.24.0
 faiss-cpu>=1.7.4
 langchain-community>=0.0.10
 langchain-chroma>=0.0.1
 openai>=1.6.0
 typing-extensions>=4.5.0
+asyncio>=3.4.3
 torch>=2.0.0
 transformers>=4.36.0
+#tqdm>=4.66.0
+#scikit-learn>=1.3.0
+#pandas>=2.1.0
+nest_asyncio>=1.5.8