Spaces:

Rulga
/

status-law-gbot

Running

Rulga commited on Mar 27

Commit

f33b7bd

1 Parent(s): 2a3ccaf

Update imports and refactor model configuration to use ACTIVE_MODEL for improved clarity and consistency

Files changed (2) hide show

src/knowledge_base/dataset.py CHANGED Viewed

@@ -10,7 +10,7 @@ from datetime import datetime
 from huggingface_hub import HfApi, HfFolder
 from langchain_community.vectorstores import FAISS
 from config.settings import VECTOR_STORE_PATH, HF_TOKEN, EMBEDDING_MODEL
-from langchain.embeddings import HuggingFaceEmbeddings
 class DatasetManager:
     def __init__(self, dataset_name="Rulga/status-law-knowledge-base", token: Optional[str] = None):

 from huggingface_hub import HfApi, HfFolder
 from langchain_community.vectorstores import FAISS
 from config.settings import VECTOR_STORE_PATH, HF_TOKEN, EMBEDDING_MODEL
+from langchain_community.embeddings import HuggingFaceEmbeddings  # Updated import
 class DatasetManager:
     def __init__(self, dataset_name="Rulga/status-law-knowledge-base", token: Optional[str] = None):

src/training/model_manager.py CHANGED Viewed

@@ -9,7 +9,7 @@ from typing import List, Dict, Any, Tuple, Optional
 import logging
 from huggingface_hub import HfApi, snapshot_download
 from transformers import AutoModelForCausalLM, AutoTokenizer
-from config.settings import MODEL_PATH, MODELS_REGISTRY_PATH, MODEL_CONFIG
 logging.basicConfig(
     level=logging.INFO,
@@ -184,7 +184,7 @@ def get_model(
         (model, tokenizer, model_info)
     """
     try:
-        model_path = MODEL_CONFIG["training"]["fine_tuned_path"] if version else MODEL_CONFIG["training"]["base_model_path"]
         tokenizer = AutoTokenizer.from_pretrained(
             model_path,
@@ -197,7 +197,7 @@ def get_model(
             device_map="auto" if device == "cuda" else None
         )
-        return model, tokenizer, MODEL_CONFIG
     except Exception as e:
         logger.error(f"Error loading model: {str(e)}")
@@ -209,10 +209,10 @@ if __name__ == "__main__":
     # Register base model from config
     success, message = manager.register_model(
-        model_id=MODEL_CONFIG["id"].split("/")[-1],  # Extract model name from full HF path
-        version=MODEL_CONFIG["type"],
-        source=MODEL_CONFIG["id"],
-        description=MODEL_CONFIG["description"],
         is_active=True
     )
     print(message)

 import logging
 from huggingface_hub import HfApi, snapshot_download
 from transformers import AutoModelForCausalLM, AutoTokenizer
+from config.settings import MODEL_PATH, MODELS_REGISTRY_PATH, MODELS, ACTIVE_MODEL
 logging.basicConfig(
     level=logging.INFO,
         (model, tokenizer, model_info)
     """
     try:
+        model_path = ACTIVE_MODEL["training"]["fine_tuned_path"] if version else ACTIVE_MODEL["training"]["base_model_path"]
         tokenizer = AutoTokenizer.from_pretrained(
             model_path,
             device_map="auto" if device == "cuda" else None
         )
+        return model, tokenizer, ACTIVE_MODEL
     except Exception as e:
         logger.error(f"Error loading model: {str(e)}")
     # Register base model from config
     success, message = manager.register_model(
+        model_id=ACTIVE_MODEL["id"].split("/")[-1],  # Extract model name from full HF path
+        version=ACTIVE_MODEL["type"],
+        source=ACTIVE_MODEL["id"],
+        description=ACTIVE_MODEL["description"],
         is_active=True
     )
     print(message)