Spaces:

kgauvin603
/

NotesTranscriber

Sleeping

App Files Files Community

kgauvin603 commited on Apr 11, 2025

Commit

0b8af4e

verified ·

1 Parent(s): 702bcc4

Update app.py

Browse files

Files changed (1) hide show

app.py +14 -21

app.py CHANGED Viewed

@@ -4,7 +4,7 @@ from datetime import datetime
 from openai import OpenAI
 import gradio as gr
-# === Initialize OpenAI Client using Environment Variable ===
 openai_api_key = os.environ.get("OPENAI_API_KEY")
 if not openai_api_key:
     raise ValueError("OPENAI_API_KEY environment variable is not set.")
@@ -27,20 +27,19 @@ user_prompt_template = (
     "author, but enhance readability and flow. Do not add embellishments or AI-style phrasing."
 )
-# === Image processing ===
-def encode_image_to_base64(image_file):
-    image_bytes = image_file.read()
-    return base64.b64encode(image_bytes).decode("utf-8")
-# === Transcription function ===
 def transcribe_images(files):
     if not files:
         return "No images uploaded."
     results = []
     for file in files:
-        encoded_image = encode_image_to_base64(file)
-        image_url = f"data:image/jpeg;base64,{encoded_image}"
         response = client.chat.completions.create(
             model="gpt-4-turbo",
@@ -55,25 +54,19 @@ def transcribe_images(files):
         )
         timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
-        result_text = f"🗓️ Transcribed on: {timestamp}\n\n{response.choices[0].message.content}"
-        results.append(result_text)
     return "\n\n---\n\n".join(results)
-# === Gradio Interface using UploadButton ===
 with gr.Blocks() as app:
-    with gr.Row():
-        uploader = gr.UploadButton(
-            label="Upload handwritten note images",
-            file_types=[".jpg", ".jpeg", ".png"],
-            multifile=True
-        )
-    output_box = gr.Textbox(label="Transcribed Output", lines=30)
-    uploader.change(fn=transcribe_images, inputs=uploader, outputs=output_box)
 # === Launch ===
 if __name__ == "__main__":
     app.launch()

 from openai import OpenAI
 import gradio as gr
+# === OpenAI API Setup ===
 openai_api_key = os.environ.get("OPENAI_API_KEY")
 if not openai_api_key:
     raise ValueError("OPENAI_API_KEY environment variable is not set.")
     "author, but enhance readability and flow. Do not add embellishments or AI-style phrasing."
 )
+# === Encode uploaded file ===
+def encode_image_to_base64(file):
+    return base64.b64encode(file.read()).decode("utf-8")
+# === Transcription logic ===
 def transcribe_images(files):
     if not files:
         return "No images uploaded."
     results = []
     for file in files:
+        encoded = encode_image_to_base64(file)
+        image_url = f"data:image/jpeg;base64,{encoded}"
         response = client.chat.completions.create(
             model="gpt-4-turbo",
         )
         timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
+        result = f"🗓️ Transcribed on: {timestamp}\n\n{response.choices[0].message.content}"
+        results.append(result)
     return "\n\n---\n\n".join(results)
+# === Interface ===
 with gr.Blocks() as app:
+    gr.Markdown("## Handwritten Note Transcriber\nUpload one or more handwritten note images for professional transcription.")
+    input_files = gr.File(label="Upload images", type="file", file_types=[".jpg", ".jpeg", ".png"], multiple=True)
+    output_text = gr.Textbox(label="Transcription Output", lines=30)
+    input_files.change(fn=transcribe_images, inputs=input_files, outputs=output_text)
 # === Launch ===
 if __name__ == "__main__":
     app.launch()