Spaces:

Tiberiw
/

thesis

Paused

App Files Files Community

Tiberiw commited on Jul 2, 2025

Commit

d7d57ec

1 Parent(s): 9c92b55

Update application file

Browse files

Files changed (1) hide show

app.py +25 -5

app.py CHANGED Viewed

@@ -15,6 +15,13 @@ transcriber = None
 @asynccontextmanager
 async def lifespan(app: FastAPI):
     global transcriber
     device = "cuda:0" if torch.cuda.is_available() else "cpu"
     torch_dtype = torch.float16 if device == "cuda:0" else torch.float32
     load_dotenv(override=True)  # Load environment variables from .env file
@@ -26,13 +33,26 @@ async def lifespan(app: FastAPI):
     if hf_token is None:
         raise ValueError("Hugging Face token not found. Please set the HUGGING_FACE_TOKEN environment variable.")
-    BASE_MODEL_PATH = "openai/whisper-base"
     # BASE_MODEL_PATH = "openai/whisper-large-v3-turbo"
-    ADAPTER_AND_PROCESSOR_PATH = "Tiberiw/whisper-base-lora-finetuned-custom-v1"
     # ADAPTER_AND_PROCESSOR_PATH = "Tiberiw/whisper-large-turbo-lora-finetuned-v3"
-    processor = WhisperProcessor.from_pretrained(ADAPTER_AND_PROCESSOR_PATH, token=hf_token)
-    base_model = WhisperForConditionalGeneration.from_pretrained(BASE_MODEL_PATH, torch_dtype=torch_dtype)
-    final_model = PeftModel.from_pretrained(base_model, ADAPTER_AND_PROCESSOR_PATH, token=hf_token)
     transcriber = pipeline(
         "automatic-speech-recognition",
         model=final_model,

 @asynccontextmanager
 async def lifespan(app: FastAPI):
     global transcriber
+    cache_dir = os.path.join(os.getcwd(), "hf_cache")
+    os.makedirs(cache_dir, exist_ok=True)
+    os.environ["HF_HOME"] = cache_dir
+    os.environ["TRANSFORMERS_CACHE"] = cache_dir
+    os.environ["HF_HUB_CACHE"] = cache_dir
     device = "cuda:0" if torch.cuda.is_available() else "cpu"
     torch_dtype = torch.float16 if device == "cuda:0" else torch.float32
     load_dotenv(override=True)  # Load environment variables from .env file
     if hf_token is None:
         raise ValueError("Hugging Face token not found. Please set the HUGGING_FACE_TOKEN environment variable.")
+    BASE_MODEL_PATH = "openai/whisper-large-v3-turbo"
     # BASE_MODEL_PATH = "openai/whisper-large-v3-turbo"
+    ADAPTER_AND_PROCESSOR_PATH = "Tiberiw/whisper-large-turbo-lora-finetuned-v3"
     # ADAPTER_AND_PROCESSOR_PATH = "Tiberiw/whisper-large-turbo-lora-finetuned-v3"
+    processor = WhisperProcessor.from_pretrained(
+            ADAPTER_AND_PROCESSOR_PATH,
+            token=hf_token,
+            cache_dir=cache_dir
+        )
+    base_model = WhisperForConditionalGeneration.from_pretrained(
+        BASE_MODEL_PATH,
+        torch_dtype=torch_dtype,
+        cache_dir=cache_dir
+    )
+    final_model = PeftModel.from_pretrained(
+        base_model,
+        ADAPTER_AND_PROCESSOR_PATH,
+        token=hf_token,
+        cache_dir=cache_dir
+    )
     transcriber = pipeline(
         "automatic-speech-recognition",
         model=final_model,