webmetaextractor

Runtime error

App Files Files Community

zvl commited on Feb 17, 2025

Commit

2ac5167

verified ·

1 Parent(s): 29a9ab8

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -41

app.py CHANGED Viewed

@@ -21,47 +21,6 @@ model = HfApiModel(
     custom_role_conversions=None,
 )
-@tool
-def save_scraped_data_as_markdown(scraped_data: dict, filename: str = None) -> str:
-    """
-    Guarda el contenido scrapeado en un archivo Markdown bien formateado.
-    Args:
-        scraped_data (dict): Diccionario que contiene:
-            - 'url' (str): La URL de la página de la cual se extrajo el contenido.
-            - 'scraped_data' (list[str]): Lista de fragmentos de texto extraídos.
-        filename (str, optional): Nombre del archivo Markdown de salida. Si no se proporciona, se genera uno usando la fecha y hora actual.
-    Returns:
-        str: Mensaje indicando si el archivo se guardó correctamente o si ocurrió algún error.
-    """
-    try:
-        url = scraped_data.get("url", "Unknown")
-        content_list = scraped_data.get("scraped_data", [])
-        if not content_list:
-            return "No data available to save in Markdown."
-        formatted_content = "\n\n".join(content_list)
-        # Construir el contenido Markdown
-        markdown_content = f"# Content extracted from {url}\n\n"
-        markdown_content += "## Full Content\n\n"
-        markdown_content += formatted_content
-        # Generar un nombre de archivo con timestamp si no se proporciona
-        if not filename:
-            timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
-            filename = f"scraped_{timestamp}.md"
-        with open(filename, "w", encoding="utf-8") as file:
-            file.write(markdown_content)
-        return f"Scraped content has been saved in {filename}"
-    except Exception as e:
-        return f"Error generating Markdown file: {str(e)}"
 @tool
 def summarize_text(text):
@@ -144,6 +103,47 @@ def extract_metadata_from_url(url: str) -> dict:
     except requests.exceptions.RequestException as e:
         return {"error": f"Error al acceder a la URL: {str(e)}"}
 @tool
 def get_current_time_in_timezone(timezone: str) -> str:

     custom_role_conversions=None,
 )
 @tool
 def summarize_text(text):
     except requests.exceptions.RequestException as e:
         return {"error": f"Error al acceder a la URL: {str(e)}"}
+@tool
+def save_scraped_data_as_markdown(scraped_data: dict, filename: str = None) -> str:
+    """
+    Guarda el contenido scrapeado en un archivo Markdown bien formateado.
+    Args:
+        scraped_data (dict): Diccionario que contiene:
+            - 'url' (str): La URL de la página de la cual se extrajo el contenido.
+            - 'scraped_data' (list[str]): Lista de fragmentos de texto extraídos.
+        filename (str, optional): Nombre del archivo Markdown de salida. Si no se proporciona, se genera uno usando la fecha y hora actual.
+    Returns:
+        str: Mensaje indicando si el archivo se guardó correctamente o si ocurrió algún error.
+    """
+    try:
+        url = scraped_data.get("url", "Unknown")
+        content_list = scraped_data.get("scraped_data", [])
+        if not content_list:
+            return "No data available to save in Markdown."
+        formatted_content = "\n\n".join(content_list)
+        # Construir el contenido Markdown
+        markdown_content = f"# Content extracted from {url}\n\n"
+        markdown_content += "## Full Content\n\n"
+        markdown_content += formatted_content
+        # Generar un nombre de archivo con timestamp si no se proporciona
+        if not filename:
+            timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")
+            filename = f"scraped_{timestamp}.md"
+        with open(filename, "w", encoding="utf-8") as file:
+            file.write(markdown_content)
+        return f"Scraped content has been saved in {filename}"
+    except Exception as e:
+        return f"Error generating Markdown file: {str(e)}"
 @tool
 def get_current_time_in_timezone(timezone: str) -> str: