Spaces:

Loren
/

api_search_articles

Sleeping

Loren commited on Oct 3

Commit

e8ff22d

verified ·

1 Parent(s): 483f33e

Upload 2 files

Files changed (2) hide show

script/create_sqlite_db.py CHANGED Viewed

@@ -1,21 +1,27 @@
 import sqlite3
 import pandas as pd
 import itertools
 import ast
 import uuid
 from pathlib import Path
 # Initialisations
 print("Initialisations ...")
 DATA_DIR = Path("../data")   # dossier parent du script
-PARQUET_FILE = DATA_DIR / "medium_articles.parquet"
-SQLITE_FILE = DATA_DIR / "articles.db"
 # Créer le dossier data s'il n'existe pas
 DATA_DIR.mkdir(exist_ok=True)
 # Chargement des données
 print("Chargement des données ...")
-df = pd.read_parquet(PARQUET_FILE)
 # Initialisations de la base SQLite
 print("Initialisations de la base SQLite ...")
@@ -96,4 +102,15 @@ for _, row in df.iterrows():
 conn.commit()
 conn.close()
 print("Traitement terminé.")

 import sqlite3
 import pandas as pd
+import os
 import itertools
 import ast
 import uuid
+from huggingface_hub import hf_hub_download, upload_file
 from pathlib import Path
 # Initialisations
 print("Initialisations ...")
+hf_token = os.environ["API_HF_TOKEN"]
 DATA_DIR = Path("../data")   # dossier parent du script
+parquet_path = hf_hub_download(repo_id="Loren/articles_data",
+                               filename="mon_fichier.parquet")
+REPO_ID = "Loren/articles_db"  # dataset HF
+DB_NAME = 'articles.db'
+SQLITE_FILE = DATA_DIR / DB_NAME
 # Créer le dossier data s'il n'existe pas
 DATA_DIR.mkdir(exist_ok=True)
 # Chargement des données
 print("Chargement des données ...")
+df = pd.read_parquet(parquet_path)
 # Initialisations de la base SQLite
 print("Initialisations de la base SQLite ...")
 conn.commit()
 conn.close()
+# Upload dans le dataset hugging face
+print("Upload dans le dataset hugging face ...")
+upload_file(
+    path_or_fileobj=SQLITE_FILE,
+    path_in_repo=DB_NAME,
+    repo_id=REPO_ID,
+    repo_type="dataset",
+    token=hf_token
+)
 print("Traitement terminé.")

script/test_api.py ADDED Viewed

+import requests
+BASE_URL = "http://localhost:8000"  # ⚠️ changer en URL HF Space si déployé
+def test_get_tags():
+    print("🔍 Test: /get_tags")
+    resp = requests.get(f"{BASE_URL}/get_tags")
+    if resp.status_code != 200:
+        print("❌ Erreur", resp.status_code, resp.text)
+        return
+    tags = resp.json().get("tags", [])
+    print(f"✅ {len(tags)} tags récupérés : {tags[:10]}...")  # affiche 10 premiers
+    return tags
+def test_get_articles_with_tags(tags):
+    if not tags:
+        print("⚠️ Aucun tag trouvé, test sauté")
+        return
+    print("\n🔍 Test: /get_articles_with_tags")
+    params = {"tags": tags}
+    resp = requests.get(f"{BASE_URL}/get_articles_with_tags", params=params)
+    if resp.status_code != 200:
+        print("❌ Erreur", resp.status_code, resp.text)
+        return
+    data = resp.json()
+    print(f"✅ Articles trouvés: {len(data['articles'])}")
+def main():
+    tags = test_get_tags()
+    test_get_articles_with_tags(tags)
+if __name__ == "__main__":
+    main()