Spaces:

PranavReddy18
/

Summarize_youtube

Sleeping

App Files Files Community

PranavReddy18 commited on Dec 29, 2024

Commit

70ab642

verified ·

1 Parent(s): 20c5de5

Upload 2 files

Browse files

Files changed (2) hide show

app.py +83 -0
youtube_cookies.txt +6 -0

app.py ADDED Viewed

	@@ -0,0 +1,83 @@

+import validators
+import streamlit as st
+from langchain.prompts import PromptTemplate
+from langchain_groq import ChatGroq
+from langchain.chains.summarize import load_summarize_chain
+from langchain.docstore.document import Document
+from langchain_community.document_loaders import UnstructuredURLLoader
+import yt_dlp
+# Streamlit App Configuration
+st.set_page_config(page_title="LangChain: Summarize Text From YT or Website", page_icon="🦜")
+st.title("🦜 LangChain: Summarize Text From YT or Website")
+st.subheader('Summarize URL')
+# Hardcoded Groq API Key (use environment variables in production)
+GROQ_API_KEY = "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"
+# URL input field
+generic_url = st.text_input("URL", label_visibility="collapsed")
+# Gemma Model Using Groq API
+llm = ChatGroq(model="mixtral-8x7b-32768", groq_api_key=GROQ_API_KEY)
+prompt_template = """
+Provide a summary of the following content in 300 words:
+Content:{text}
+"""
+prompt = PromptTemplate(template=prompt_template, input_variables=["text"])
+def load_youtube_data(url):
+    try:
+        ydl_opts = {
+            'cookies': 'C:\\Users\\saipr\\anaconda3\\LANGCHAIN\\Text_Summarisation\\youtube_cookies.txt',
+            'quiet': True   # Path to your exported cookies file
+        }
+        with yt_dlp.YoutubeDL(ydl_opts) as ydl:
+            info = ydl.extract_info(url, download=False)
+            title = info.get('title', 'No Title')
+            description = info.get('description', 'No Description')
+            content = f"Title: {title}\n\nDescription: {description}"
+            return [Document(page_content=content, metadata={"title": title})]
+    except Exception as e:
+        raise ValueError(f"Failed to extract YouTube data: {str(e)}")
+def load_website_data(url):
+    loader = UnstructuredURLLoader(
+        urls=[url],
+        ssl_verify=False,
+        headers={"User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 13_5_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36"}
+    )
+    docs = loader.load()
+    return [Document(page_content=doc.page_content, metadata=doc.metadata) for doc in docs]
+if st.button("Summarize the Content from YT or Website"):
+    # Validate URL input
+    if not generic_url.strip():
+        st.error("Please provide a URL to get started")
+    elif not validators.url(generic_url):
+        st.error("Please enter a valid URL. It can be a YouTube video URL or website URL.")
+    else:
+        try:
+            with st.spinner("Processing..."):
+                # Load data based on URL type
+                if "youtube.com" in generic_url or "youtu.be" in generic_url:
+                    try:
+                        docs = load_youtube_data(generic_url)
+                    except ValueError as e:
+                        st.error(f"Authentication required or unable to process the video: {e}")
+                        docs = []
+                else:
+                    docs = load_website_data(generic_url)
+                # Proceed if docs are available
+                if docs:
+                    chain = load_summarize_chain(llm, chain_type="stuff", prompt=prompt)
+                    output_summary = chain.run(docs)
+                    st.success(output_summary)
+                else:
+                    st.error("No content could be summarized.")
+        except Exception as e:
+            st.exception(f"Exception: {e}")

youtube_cookies.txt ADDED Viewed

	@@ -0,0 +1,6 @@

+# Netscape HTTP Cookie File
+# This is a generated file! Do not edit.
+youtube.com    TRUE    /    FALSE    1680999487    CONSENT    YES+cb.20230328-07-p0.en+FX+306
+youtube.com    TRUE    /    FALSE    1680999487    YSC    L1bQ2Wkm8J0
+youtube.com    TRUE    /    FALSE    1680999487    PREF    f1=50000000