Spaces:

junipark
/

gemma_sprint

Paused

halyn commited on Oct 3, 2024

Commit

7f83f4e

1 Parent(s): 32cdfb4

add google token

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import io
 import streamlit as st
 from PyPDF2 import PdfReader
 from langchain.text_splitter import CharacterTextSplitter
@@ -37,10 +38,15 @@ def create_knowledge_base(chunks):
 # Hugging Face 모델 로드
 def load_model():
-    model_name = "google/gemma-2-2b"  # 텍스트 생성 모델 사용
-    tokenizer = AutoTokenizer.from_pretrained(model_name, clean_up_tokenization_spaces=False)
-    model = AutoModelForCausalLM.from_pretrained(model_name)
-    return pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=150, temperature=0.1)
 # QA 체인 설정
 def setup_qa_chain():

 import io
+import os
 import streamlit as st
 from PyPDF2 import PdfReader
 from langchain.text_splitter import CharacterTextSplitter
 # Hugging Face 모델 로드
 def load_model():
+    model_name = "google/gemma-2-2b"  # Hugging Face 모델 ID
+    access_token = os.getenv("HF_TOKEN")
+    try:
+        tokenizer = AutoTokenizer.from_pretrained(model_name, use_auth_token=access_token, clean_up_tokenization_spaces=False)
+        model = AutoModelForCausalLM.from_pretrained(model_name, use_auth_token=access_token)
+        return pipeline("text-generation", model=model, tokenizer=tokenizer, max_new_tokens=150, temperature=0.1)
+    except Exception as e:
+        print(f"Error loading model: {e}")
+        return None
 # QA 체인 설정
 def setup_qa_chain():