Spaces:

DivingFox
/

Praktikum

Sleeping

App Files Files Community

DivingFox commited on Jun 19, 2025

Commit

45aa061

verified ·

1 Parent(s): d40b2b5

Update src/streamlit_app.py

Browse files

fix app to use local dataset

Files changed (1) hide show

src/streamlit_app.py +56 -30

src/streamlit_app.py CHANGED Viewed

@@ -21,6 +21,8 @@ from transformers import AutoTokenizer, AutoModelForCausalLM
 from PIL import Image
 from torchvision import transforms
 from io import BytesIO
 # streamlit_config_dir = "/tmp/.streamlit"
 # st.sidebar.write("Streamlit config dir exists:", os.path.exists(streamlit_config_dir))
@@ -29,58 +31,76 @@ from io import BytesIO
 torch.classes.__path__ = []
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
 @st.cache_resource
 def load_caption_model():
     # load medicap
     ckpt_name = 'aehrc/medicap'
-    medicap = transformers.AutoModel.from_pretrained(ckpt_name, trust_remote_code=True)
     medicap = medicap.to(device)
     medicap.eval()
     # transform image
-    image_processor = transformers.AutoFeatureExtractor.from_pretrained(ckpt_name)
-    medicap_transforms = transforms.Compose(
-        [
-            transforms.Resize(size=image_processor.size['shortest_edge']),
-            transforms.CenterCrop(size=[
-                image_processor.size['shortest_edge'],
-                image_processor.size['shortest_edge'],
-            ]
-            ),
-            transforms.ToTensor(),
-            transforms.Normalize(
-                mean=image_processor.image_mean,
-                std=image_processor.image_std,
-            ),
-        ]
-    )
     # tokenizer
-    medicap_tokenizer = transformers.AutoTokenizer.from_pretrained(ckpt_name)
     return medicap, medicap_transforms, medicap_tokenizer
 def generate_image_caption(image, model, transformer, tokenizer):
-    image = transformer(image)
-    image = image.unsqueeze(0)
     outputs = model.generate(
         pixel_values=image.to(device),
         bos_token_id=tokenizer.bos_token_id,
         eos_token_id=tokenizer.eos_token_id,
         pad_token_id=tokenizer.pad_token_id,
-        return_dict_in_generate=True,
-        use_cache=True,
-        max_length=256,
         num_beams=4,
         output_attentions=False
     )
-    return tokenizer.decode(outputs.sequences[0], skip_special_tokens=True)
 @st.cache_resource
 def load_qa_model():
     model_name = "microsoft/BioGPT-Large-PubMedQA"
-    biogpt_tokenizer = AutoTokenizer.from_pretrained(model_name)
-    biogpt = AutoModelForCausalLM.from_pretrained(model_name)
     biogpt = biogpt.to(device)
     biogpt.eval()
@@ -93,7 +113,7 @@ def generate_answer(description, question, model, tokenizer):
     generated_output = model.generate(
         input_ids,
-        max_new_tokens=100,  # Max new tokens for the bot's response
     )
     response = tokenizer.decode(generated_output[0], skip_special_tokens=True)
@@ -103,10 +123,16 @@ def generate_answer(description, question, model, tokenizer):
 st.set_page_config(page_title="Image Caption + QA", layout="centered")
 st.title("🖼️ Caption-Based Question Answering")
-uploaded_file = st.file_uploader("Choose Image", type = ["jpg", "jpeg", "png"])
-if uploaded_file is not None:
-    img = Image.open(uploaded_file)
     st.image(img)
     # image description
     medicap, medicap_transforms, medicap_tokenizer = load_caption_model()

 from PIL import Image
 from torchvision import transforms
 from io import BytesIO
+from pathlib import Path
+import pandas as pd
 # streamlit_config_dir = "/tmp/.streamlit"
 # st.sidebar.write("Streamlit config dir exists:", os.path.exists(streamlit_config_dir))
 torch.classes.__path__ = []
 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
+# load dataframe
+data = {
+    "path": [
+        'test/s55512076.jpg',
+        'test/s55786650.jpg',
+        'test/s56188631.jpg',
+        'test/s53690114.jpg',
+        'test/s52070116.jpg'],
+    "text": ['Comparison is made to prior study performed a day earlier. Lines and tubes are in unchanged standard position. Multifocal consolidations in the right upper and lower lobes bilaterally left greater than right are unchanged. Severe cardiomegaly is stable. There are no new lung abnormalities. Probably small right pleural effusion is unchanged.',
+            'As compared to the previous radiograph, there is no relevant change. The monitoring and support devices are constant. Low lung volumes, borderline size of the cardiac silhouette. Mild pulmonary edema. Moderate retrocardiac atelectasis. No evidence of pneumonia.',
+            'AP chest compared to ___ through ___. Elevation of the right lung base and hemidiaphragm has been pronounced since at least ___, accounting for atelectasis at the lung base. The right upper lung and the entire left lung are clear and the left lung is hyperinflated suggesting airway obstruction or emphysema. Heart is normal size. There is no pneumonia or pulmonary edema. No pleural effusion or pneumothorax.',
+            'Compared to prior study there is no significant interval change.',
+            'In comparison to prior radiograph of 1 day earlier, there has been improved aeration at both lung bases. No other relevant change since recent study.'],
+}
+# prepare data
+mimic_df_test = pd.DataFrame.from_dict(data)
+def load_images(path):
+  img = Image.open(path)
+  img = img.convert('RGB')
+  return img
 @st.cache_resource
 def load_caption_model():
     # load medicap
     ckpt_name = 'aehrc/medicap'
+    local_folder = "model2/"
+    if os.path.exists(local_folder):
+        medicap = transformers.AutoModel.from_pretrained(local_folder, trust_remote_code=True)
+    else:
+        medicap = transformers.AutoModel.from_pretrained(ckpt_name, trust_remote_code=True)
     medicap = medicap.to(device)
     medicap.eval()
     # transform image
+    medicap_transforms = transformers.AutoFeatureExtractor.from_pretrained(ckpt_name)
     # tokenizer
+    medicap_tokenizer = transformers.GPT2Tokenizer.from_pretrained(ckpt_name)
     return medicap, medicap_transforms, medicap_tokenizer
 def generate_image_caption(image, model, transformer, tokenizer):
+    image = transformer(image, return_tensors="pt")
+    image = image["pixel_values"]
     outputs = model.generate(
         pixel_values=image.to(device),
         bos_token_id=tokenizer.bos_token_id,
         eos_token_id=tokenizer.eos_token_id,
         pad_token_id=tokenizer.pad_token_id,
+        max_length=128,
         num_beams=4,
         output_attentions=False
     )
+    return tokenizer.decode(outputs[0], skip_special_tokens=True)
 @st.cache_resource
 def load_qa_model():
     model_name = "microsoft/BioGPT-Large-PubMedQA"
+    local_folder = "BioGPT-Large-PubMedQA/"
+    if os.path.exists(local_folder):
+        biogpt_tokenizer = AutoTokenizer.from_pretrained(local_folder)
+        biogpt = AutoModelForCausalLM.from_pretrained(local_folder)
+    else:
+        biogpt_tokenizer = AutoTokenizer.from_pretrained(model_name)
+        biogpt = AutoModelForCausalLM.from_pretrained(model_name)
     biogpt = biogpt.to(device)
     biogpt.eval()
     generated_output = model.generate(
         input_ids,
+        max_new_tokens=128,  # Max new tokens for the bot's response
     )
     response = tokenizer.decode(generated_output[0], skip_special_tokens=True)
 st.set_page_config(page_title="Image Caption + QA", layout="centered")
 st.title("🖼️ Caption-Based Question Answering")
+# Dropdown list
+options = range(len(mimic_df_test))
+choice = st.selectbox("Choose an action:", options)
+if choice is not None:
+    data = mimic_df_test.iloc[choice]
+    label = data['text']
+    img = Image.open(Path(data['path']))
     st.image(img)
+    st.subheader("📝 Original Description")
+    st.info(label)
     # image description
     medicap, medicap_transforms, medicap_tokenizer = load_caption_model()