Spaces:

tx3bas
/

suggest

Sleeping

App Files Files Community

tx3bas commited on Sep 17, 2024

Commit

ce5ecf0

verified ·

1 Parent(s): aaffc09

Update app.py

Browse files

Files changed (1) hide show

app.py +82 -117

app.py CHANGED Viewed

@@ -3,6 +3,18 @@ import requests
 import urllib.parse
 import re
 import xmltodict
 # Función para obtener sugerencias de DuckDuckGo
 def fetch_duckduckgo_suggestions(query, lang_code="es"):
@@ -41,11 +53,9 @@ def fetch_youtube_suggestions(query, lang_code="es"):
     if response.status_code == 200:
         try:
-            # Extraer las sugerencias del formato window.google.ac.h(["..."])
             match = re.search(r'window\.google\.ac\.h\(\["[^"]*",\[(.*?)\],', response.text)
             if match:
                 suggestions_data = match.group(1)
-                # Extraemos las sugerencias
                 suggestions = re.findall(r'\["([^"]+)"', suggestions_data)
                 return suggestions
             else:
@@ -58,7 +68,7 @@ def fetch_youtube_suggestions(query, lang_code="es"):
         return []
 # Función para obtener sugerencias de Bing
-def fetch_bing_suggestions(query, market="en-US"):
     url = "https://api.bing.com/qsml.aspx"
     params = {
         "Market": market,
@@ -88,7 +98,7 @@ def fetch_bing_suggestions(query, market="en-US"):
         return []
 # Función para obtener sugerencias de Amazon
-def fetch_amazon_suggestions(query, market_id="ATVPDKIKX0DER", alias="aps"):
     url = "https://completion.amazon.com/api/2017/suggestions"
     params = {
         "mid": market_id,
@@ -100,7 +110,6 @@ def fetch_amazon_suggestions(query, market_id="ATVPDKIKX0DER", alias="aps"):
     if response.status_code == 200:
         try:
             data = response.json()
-            # Extraemos las sugerencias desde el JSON bajo la clave 'suggestions'
             return [item['value'] for item in data.get('suggestions', [])]
         except ValueError:
             print("Error decodificando JSON de Amazon")
@@ -110,83 +119,71 @@ def fetch_amazon_suggestions(query, market_id="ATVPDKIKX0DER", alias="aps"):
 # Función para expandir la palabra clave
 def expand_keyword(keyword):
-    expanded_keywords = [keyword]
-    for letter in 'abcdefghijklmnopqrstuvwxyz*_':
-        expanded_keywords.append(keyword + " " + letter)
-        expanded_keywords.append(letter + " " + keyword)
     return expanded_keywords
 # Función principal
 def main(keyword):
     expanded_keywords = expand_keyword(keyword)
     all_suggestions = {}
-    google_suggestions_all = []
-    duckduckgo_suggestions_all = []
-    youtube_suggestions_all = []
-    bing_suggestions_all = []
-    amazon_suggestions_all = []
-    # Obtener sugerencias de DuckDuckGo
-    for exp_keyword in expanded_keywords:
-        suggestions = fetch_duckduckgo_suggestions(exp_keyword)
-        duckduckgo_suggestions_all.extend(suggestions)  # Agregar todas las sugerencias
-        for suggestion in suggestions:
-            if suggestion in all_suggestions:
-                all_suggestions[suggestion] += 1
-            else:
-                all_suggestions[suggestion] = 1
-    # Obtener sugerencias de Google
-    for exp_keyword in expanded_keywords:
-        suggestions = fetch_google_suggestions(exp_keyword)
-        google_suggestions_all.extend(suggestions)  # Agregar todas las sugerencias
-        for suggestion in suggestions:
-            if suggestion in all_suggestions:
-                all_suggestions[suggestion] += 1
-            else:
-                all_suggestions[suggestion] = 1
-    # Obtener sugerencias de YouTube
-    for exp_keyword in expanded_keywords:
-        suggestions = fetch_youtube_suggestions(exp_keyword)
-        youtube_suggestions_all.extend(suggestions)  # Agregar todas las sugerencias
-        for suggestion in suggestions:
-            if suggestion in all_suggestions:
-                all_suggestions[suggestion] += 1
-            else:
-                all_suggestions[suggestion] = 1
-    # Obtener sugerencias de Bing
-    for exp_keyword in expanded_keywords:
-        suggestions = fetch_bing_suggestions(exp_keyword)
-        bing_suggestions_all.extend(suggestions)
-        for suggestion in suggestions:
-            if suggestion in all_suggestions:
-                all_suggestions[suggestion] += 1
-            else:
-                all_suggestions[suggestion] = 1
-    # Obtener sugerencias de Amazon
     for exp_keyword in expanded_keywords:
-        suggestions = fetch_amazon_suggestions(exp_keyword)
-        amazon_suggestions_all.extend(suggestions)
-        for suggestion in suggestions:
-            if suggestion in all_suggestions:
-                all_suggestions[suggestion] += 1
-            else:
-                all_suggestions[suggestion] = 1
-    # Filtrar las top 10 de cada plataforma con su número de repeticiones
-    google_top_10 = list(set(google_suggestions_all))[:10]
-    duckduckgo_top_10 = list(set(duckduckgo_suggestions_all))[:10]
-    youtube_top_10 = list(set(youtube_suggestions_all))[:10]
-    bing_top_10 = list(set(bing_suggestions_all))[:10]
-    amazon_top_10 = list(set(amazon_suggestions_all))[:10]
     # Ordenar y filtrar las sugerencias más frecuentes combinadas
     sorted_suggestions = sorted(all_suggestions.items(), key=lambda item: item[1], reverse=True)
-    combined_top_10_suggestions = [sug for sug, freq in sorted_suggestions if freq >= 2][:10]
-    suggestions_str = ", ".join(combined_top_10_suggestions)
     # Crear la lista de todas las palabras clave con su número de repeticiones
     all_suggestions_str = "<ul>"
@@ -194,57 +191,25 @@ def main(keyword):
         all_suggestions_str += f"<li>{suggestion} - {freq} repeticiones</li>"
     all_suggestions_str += "</ul>"
-    # Crear el HTML de salida con un botón de copia
     html_output = f"""
     <div>
-        <b>Sugerencias combinadas de Google, DuckDuckGo, YouTube, Bing y Amazon (Top 10 combinadas):</b> <span id='suggestions_text'>{suggestions_str}</span>
         <button class="lg secondary svelte-cmf5ev" style="font-size: small; padding: 2px; color: #808080ba; border: none; margin-left: 5px;"
         onclick='navigator.clipboard.writeText(document.getElementById("suggestions_text").innerText).then(() => alert("Texto copiado al portapapeles"))'>&nbsp;✂&nbsp;</button>
     </div>
-    <h4>Top 10 Sugerencias de Google:</h4>
-    <ul>
     """
-    for suggestion in google_top_10:
-        freq = all_suggestions[suggestion]
-        html_output += f"<li>{suggestion} ({freq})</li>"
-    html_output += "</ul>"
-    html_output += """
-    <h4>Top 10 Sugerencias de DuckDuckGo:</h4>
-    <ul>
-    """
-    for suggestion in duckduckgo_top_10:
-        freq = all_suggestions[suggestion]
-        html_output += f"<li>{suggestion} ({freq})</li>"
-    html_output += "</ul>"
-    html_output += """
-    <h4>Top 10 Sugerencias de YouTube:</h4>
-    <ul>
-    """
-    for suggestion in youtube_top_10:
-        freq = all_suggestions[suggestion]
-        html_output += f"<li>{suggestion} ({freq})</li>"
-    html_output += "</ul>"
-    html_output += """
-    <h4>Top 10 Sugerencias de Bing:</h4>
-    <ul>
-    """
-    for suggestion in bing_top_10:
-        freq = all_suggestions[suggestion]
-        html_output += f"<li>{suggestion} ({freq})</li>"
-    html_output += "</ul>"
-    html_output += """
-    <h4>Top 10 Sugerencias de Amazon:</h4>
-    <ul>
-    """
-    for suggestion in amazon_top_10:
-        freq = all_suggestions[suggestion]
-        html_output += f"<li>{suggestion} ({freq})</li>"
-    html_output += "</ul>"
     # Agregar la lista completa de todas las palabras clave
     html_output += """
@@ -260,8 +225,8 @@ iface = gr.Interface(
     inputs="text",
     outputs="html",
     title="<div style='margin:0 auto;text-align:center'><div style='margin:0 auto;text-align:center'><img style='width:100px;display: inline-table;margin-bottom:-10px' src='https://artxeweb.com/media/files/search.jpg'><p>Sugerencias Combinadas de Google, DuckDuckGo, YouTube, Bing y Amazon</p></div>",
-    description="<p style='margin-bottom:10px;text-align:center;background: #ffffff; padding: 8px; border-radius: 8px; border-width: 1px; border: solid 1px #e5e7eb;'>Ingrese una palabra clave para obtener sugerencias de búsqueda relacionadas de Google, DuckDuckGo, YouTube, Bing y Amazon. Se mostrarán las 10 primeras sugerencias combinadas y también las 10 principales de cada plataforma por separado.</p>",
     article="<div style='margin-top:10px'><p style='text-align: center !important; background: #ffffff; padding: 5px 30px; border-radius: 8px; border-width: 1px; border: solid 1px #e5e7eb; width: fit-content; margin: auto;'>Desarrollada por <a style='text-decoration: none !important; color: #e12a31 !important;' href='https://artxeweb.com'>© Artxe Web</a></p></div>"
 )
-iface.launch()

 import urllib.parse
 import re
 import xmltodict
+from itertools import product
+import nltk
+from nltk.corpus import stopwords
+from nltk.stem import SnowballStemmer
+# Descargar recursos de NLTK
+nltk.download('stopwords', quiet=True)
+nltk.download('punkt', quiet=True)
+# Inicializar el stemmer y la lista de stopwords
+stemmer = SnowballStemmer("spanish")
+stop_words = set(stopwords.words('spanish'))
 # Función para obtener sugerencias de DuckDuckGo
 def fetch_duckduckgo_suggestions(query, lang_code="es"):
     if response.status_code == 200:
         try:
             match = re.search(r'window\.google\.ac\.h\(\["[^"]*",\[(.*?)\],', response.text)
             if match:
                 suggestions_data = match.group(1)
                 suggestions = re.findall(r'\["([^"]+)"', suggestions_data)
                 return suggestions
             else:
         return []
 # Función para obtener sugerencias de Bing
+def fetch_bing_suggestions(query, market="es-ES"):
     url = "https://api.bing.com/qsml.aspx"
     params = {
         "Market": market,
         return []
 # Función para obtener sugerencias de Amazon
+def fetch_amazon_suggestions(query, market_id="A1F83G8C2ARO7P", alias="aps"):
     url = "https://completion.amazon.com/api/2017/suggestions"
     params = {
         "mid": market_id,
     if response.status_code == 200:
         try:
             data = response.json()
             return [item['value'] for item in data.get('suggestions', [])]
         except ValueError:
             print("Error decodificando JSON de Amazon")
 # Función para expandir la palabra clave
 def expand_keyword(keyword):
+    # Tokenizar la palabra clave
+    tokens = nltk.word_tokenize(keyword.lower())
+    # Eliminar stopwords y aplicar stemming
+    tokens = [stemmer.stem(token) for token in tokens if token not in stop_words]
+    # Generar variaciones
+    variations = []
+    for i in range(1, len(tokens) + 1):
+        variations.extend(list(product(tokens, repeat=i)))
+    # Convertir tuplas a strings
+    expanded_keywords = [" ".join(variation) for variation in variations]
+    # Añadir variaciones con prefijos y sufijos
+    prefixes = ['como', 'que', 'donde', 'cuando', 'por que', 'cual']
+    suffixes = ['gratis', 'online', 'pdf', 'precios', 'opiniones']
+    for prefix in prefixes:
+        expanded_keywords.append(f"{prefix} {keyword}")
+    for suffix in suffixes:
+        expanded_keywords.append(f"{keyword} {suffix}")
+    # Añadir plurales (simplificado)
+    expanded_keywords.extend([f"{kw}s" for kw in expanded_keywords])
+    # Eliminar duplicados y la palabra clave original vacía
+    expanded_keywords = list(set(expanded_keywords) - {''})
     return expanded_keywords
 # Función principal
 def main(keyword):
     expanded_keywords = expand_keyword(keyword)
     all_suggestions = {}
+    platform_suggestions = {
+        'Google': set(),
+        'DuckDuckGo': set(),
+        'YouTube': set(),
+        'Bing': set(),
+        'Amazon': set()
+    }
+    # Obtener sugerencias de todas las plataformas
     for exp_keyword in expanded_keywords:
+        for platform, fetch_func in [
+            ('Google', fetch_google_suggestions),
+            ('DuckDuckGo', fetch_duckduckgo_suggestions),
+            ('YouTube', fetch_youtube_suggestions),
+            ('Bing', fetch_bing_suggestions),
+            ('Amazon', fetch_amazon_suggestions)
+        ]:
+            suggestions = fetch_func(exp_keyword)
+            platform_suggestions[platform].update(suggestions)
+            for suggestion in suggestions:
+                if suggestion in all_suggestions:
+                    all_suggestions[suggestion] += 1
+                else:
+                    all_suggestions[suggestion] = 1
     # Ordenar y filtrar las sugerencias más frecuentes combinadas
     sorted_suggestions = sorted(all_suggestions.items(), key=lambda item: item[1], reverse=True)
+    combined_top_suggestions = [sug for sug, freq in sorted_suggestions if freq >= 2][:50]  # Aumentado a top 50
+    suggestions_str = ", ".join(combined_top_suggestions)
     # Crear la lista de todas las palabras clave con su número de repeticiones
     all_suggestions_str = "<ul>"
         all_suggestions_str += f"<li>{suggestion} - {freq} repeticiones</li>"
     all_suggestions_str += "</ul>"
+    # Crear el HTML de salida
     html_output = f"""
     <div>
+        <b>Top 50 Sugerencias combinadas:</b> <span id='suggestions_text'>{suggestions_str}</span>
         <button class="lg secondary svelte-cmf5ev" style="font-size: small; padding: 2px; color: #808080ba; border: none; margin-left: 5px;"
         onclick='navigator.clipboard.writeText(document.getElementById("suggestions_text").innerText).then(() => alert("Texto copiado al portapapeles"))'>&nbsp;✂&nbsp;</button>
     </div>
     """
+    # Agregar las top sugerencias de cada plataforma
+    for platform, suggestions in platform_suggestions.items():
+        html_output += f"""
+        <h4>Top 20 Sugerencias de {platform}:</h4>
+        <ul>
+        """
+        for suggestion in list(suggestions)[:20]:
+            freq = all_suggestions[suggestion]
+            html_output += f"<li>{suggestion} ({freq})</li>"
+        html_output += "</ul>"
     # Agregar la lista completa de todas las palabras clave
     html_output += """
     inputs="text",
     outputs="html",
     title="<div style='margin:0 auto;text-align:center'><div style='margin:0 auto;text-align:center'><img style='width:100px;display: inline-table;margin-bottom:-10px' src='https://artxeweb.com/media/files/search.jpg'><p>Sugerencias Combinadas de Google, DuckDuckGo, YouTube, Bing y Amazon</p></div>",
+    description="<p style='margin-bottom:10px;text-align:center;background: #ffffff; padding: 8px; border-radius: 8px; border-width: 1px; border: solid 1px #e5e7eb;'>Ingrese una palabra clave para obtener sugerencias de búsqueda relacionadas de Google, DuckDuckGo, YouTube, Bing y Amazon. Se mostrarán las 50 primeras sugerencias combinadas y también las 20 principales de cada plataforma por separado.</p>",
     article="<div style='margin-top:10px'><p style='text-align: center !important; background: #ffffff; padding: 5px 30px; border-radius: 8px; border-width: 1px; border: solid 1px #e5e7eb; width: fit-content; margin: auto;'>Desarrollada por <a style='text-decoration: none !important; color: #e12a31 !important;' href='https://artxeweb.com'>© Artxe Web</a></p></div>"
 )
+iface.launch()