Spaces:

davidlee831117
/

autoLS

Sleeping

App Files Files Community

davidlee831117 commited on Sep 1, 2025

Commit

e507f42

verified ·

1 Parent(s): cee002e

Update app.py

Browse files

Files changed (1) hide show

app.py +136 -99

app.py CHANGED Viewed

@@ -6,11 +6,10 @@ from io import BytesIO
 from PIL import Image
 from urllib.parse import urlparse, parse_qs
 import google.generativeai as genai
-import time
 import tempfile
-import uuid
-# --- 修正後的 API 設定與函式 ---
 # 全域變數來儲存 API 金鑰
 GEMINI_API_KEY = os.environ.get("GEMINI_API_KEY")
@@ -26,12 +25,29 @@ print(f"Debug: Top-level Loaded GEMINI_API_KEY (first 5 chars): {GEMINI_API_KEY[
 if not GEMINI_API_KEY:
     raise ValueError("ERROR: GEMINI_API_KEY environment variable is not set. Please set it correctly.")
-# 配置 Gemini API，使用 genai.configure() 替代 genai.Client()
 genai.configure(api_key=GEMINI_API_KEY)
 def generate_content(text, images, model="gemini-1.5-pro-latest"):
     """
-    使用官方 genai.generate_content 函式呼叫 API。
     """
     try:
         # contents 是文字和圖片的列表
@@ -49,7 +65,6 @@ def generate_content(text, images, model="gemini-1.5-pro-latest"):
         # 檢查回應中是否有內容
         if not response.candidates:
-            # 如果沒有候選內容，檢查是否有安全政策問題
             if hasattr(response, 'prompt_feedback') and 'safety_ratings' in response.prompt_feedback:
                 for rating in response.prompt_feedback['safety_ratings']:
                     if rating['block_reason']:
@@ -76,50 +91,88 @@ def generate_content(text, images, model="gemini-1.5-pro-latest"):
         print(f"Error calling Gemini API: {e}")
         return None, f"API 呼叫失敗: {e}"
-def load_uploaded_images(uploaded_files):
-    """載入並顯示上傳的圖片。"""
-    if not uploaded_files:
-        return []
-    loaded_images = []
-    for file in uploaded_files:
-        try:
-            img = Image.open(file.name)
-            if img.mode == "RGBA":
-                img = img.convert("RGBA")
-            loaded_images.append(img)
-        except Exception as e:
-            print(f"Failed to load image {file.name}: {e}")
-    return loaded_images
-def process_image_and_prompt(uploaded_files, prompt, gemini_api_key):
-    """處理圖片和提示詞，並呼叫 API。"""
     try:
-        if not uploaded_files:
-            raise gr.Error("請至少上傳一張圖片。", duration=5)
-        images = load_uploaded_images(uploaded_files)
-        # 這裡我們使用一個公開、穩定的多模態模型
-        # gemini-1.5-pro-latest 支援圖片輸入
-        model = "gemini-1.5-pro-latest"
-        image_path, text_response = generate_content(text=prompt, images=images, model=model)
-        uploaded_images = images # 確保畫廊顯示所有上傳的圖片
-        if image_path:
-            result_img = Image.open(image_path)
-            if result_img.mode == "RGBA":
-                result_img = result_img.convert("RGBA")
-            return uploaded_images, [result_img], ""
-        else:
-            return uploaded_images, None, text_response
     except Exception as e:
-        raise gr.Error(f"處理錯誤: {e}", duration=5)
-# --- Gradio 介面設定（這部分與你的程式碼完全相同）---
 with gr.Blocks(css_paths="style.css",) as demo:
     gr.HTML(
     """
@@ -128,7 +181,7 @@ with gr.Blocks(css_paths="style.css",) as demo:
           <img src="https://www.gstatic.com/lamda/images/gemini_favicon_f069958c85030456e93de685481c559f160ea06b.png" alt="Gemini logo">
       </div>
       <div>
-          <h1>Gemini for Image Editing</h1>
           <p>Powered by <a href="https://gradio.app/">Gradio</a>⚡️|
            <a href="https://huggingface.co/spaces/ameerazam08/Gemini-Image-Edit?duplicate=true">Duplicate</a> this Repo |
           <a href="https://aistudio.google.com/apikey">Get an API Key</a> |
@@ -149,64 +202,48 @@ with gr.Blocks(css_paths="style.css",) as demo:
     with gr.Accordion("📌 Usage Instructions", open=False, elem_classes="instructions-accordion"):
         gr.Markdown("""
     ### 📌 Usage
-      - Upload an image and enter a prompt to generate outputs.
-    - If text is returned instead of an image, it will appear in the text output.
-    - Upload Only PNG Image
-    - ❌ **Do not use NSFW images!**
     """)
     with gr.Row(elem_classes="main-content"):
         with gr.Column(elem_classes="input-column"):
-            image_input = gr.File(
-                file_types=["image"],
-                file_count="multiple",
-                label="Upload Images ",
-                elem_id="image-input",
-                elem_classes="upload-box"
-            )
-            gemini_api_key = gr.Textbox(
-                lines=1,
-                placeholder="Enter Gemini API Key (optional)",
-                label="Gemini API Key (optional)",
-                elem_classes="api-key-input"
-            )
-            prompt_input = gr.Textbox(
-                lines=2,
-                placeholder="Enter prompt here...",
-                label="Prompt",
-                elem_classes="prompt-input"
-            )
-            submit_btn = gr.Button("Generate", elem_classes="generate-btn")
         with gr.Column(elem_classes="output-column"):
-            uploaded_gallery = gr.Gallery(label="Uploaded Images", elem_classes="uploaded-gallery")
-            output_gallery = gr.Gallery(label="Generated Outputs", elem_classes="output-gallery")
-            output_text = gr.Textbox(
-                label="Gemini Output",
-                placeholder="Text response will appear here if no image is generated.",
-                elem_classes="output-text"
             )
-    submit_btn.click(
-        fn=process_image_and_prompt,
-        inputs=[image_input, prompt_input, gemini_api_key],
-        outputs=[uploaded_gallery, output_gallery, output_text],
-    )
-    image_input.upload(
-        fn=load_uploaded_images,
-        inputs=[image_input],
-        outputs=[uploaded_gallery],
     )
-    gr.Markdown("## Try these examples", elem_classes="gr-examples-header")
-    examples = [
-        ["data/1.webp", 'change text to "AMEER"'],
-        ["data/2.webp", "remove the spoon from hand only"],
-        ["data/3.webp", 'change text to "Make it "'],
-        ["data/1.jpg", "add joker style only on face"],
-        ["data/1777043.jpg", "add lipstick on lip only"],
-        ["data/76860.jpg", "add lipstick on lip only"],
-        ["data/2807615.jpg", "make it happy looking face only"],
-    ]
-    gr.Examples(
-        examples=examples,
-        inputs=[image_input, prompt_input,],
-        elem_id="examples-grid"
     )
 demo.queue(max_size=50).launch(mcp_server=True, share=True)

 from PIL import Image
 from urllib.parse import urlparse, parse_qs
 import google.generativeai as genai
 import tempfile
+import time
+import base64
+import mimetypes
 # 全域變數來儲存 API 金鑰
 GEMINI_API_KEY = os.environ.get("GEMINI_API_KEY")
 if not GEMINI_API_KEY:
     raise ValueError("ERROR: GEMINI_API_KEY environment variable is not set. Please set it correctly.")
+# 配置 Gemini API，這是最簡潔穩定的方式
 genai.configure(api_key=GEMINI_API_KEY)
+def load_image_from_url(url: str):
+    """從 URL 下載圖片並以 PIL Image 格式回傳。"""
+    try:
+        headers = {'User-Agent': 'Mozilla/5.0'}
+        response = requests.get(url, timeout=20, headers=headers)
+        response.raise_for_status()  # 檢查請求是否成功
+        image = Image.open(BytesIO(response.content)).convert("RGB")
+        print(f"Debug: Successfully loaded image from URL: {url}")
+        return image
+    except requests.exceptions.HTTPError as e:
+        print(f"Error downloading image from {url}: HTTP Error {e.response.status_code}")
+        return None
+    except Exception as e:
+        print(f"An unexpected error occurred: {e}")
+        return None
 def generate_content(text, images, model="gemini-1.5-pro-latest"):
     """
+    使用官方 genai.generate_content 函式呼叫 API，
+    這段邏輯來自你提供的 Hugging Face 範例，並已優化。
     """
     try:
         # contents 是文字和圖片的列表
         # 檢查回應中是否有內容
         if not response.candidates:
             if hasattr(response, 'prompt_feedback') and 'safety_ratings' in response.prompt_feedback:
                 for rating in response.prompt_feedback['safety_ratings']:
                     if rating['block_reason']:
         print(f"Error calling Gemini API: {e}")
         return None, f"API 呼叫失敗: {e}"
+def read_google_sheet(sheet_url):
+    """從 Google Sheet 讀取資料。"""
     try:
+        def build_csv_url(url: str) -> str:
+            parsed = urlparse(url)
+            path_parts = parsed.path.strip("/").split("/")
+            doc_id = None
+            if len(path_parts) >= 3 and path_parts[0] == "spreadsheets" and path_parts[1] == "d":
+                doc_id = path_parts[2]
+            qs_gid = parse_qs(parsed.query).get("gid", [None])[0]
+            frag_gid = None
+            if parsed.fragment:
+                frag_qs = parse_qs(parsed.fragment)
+                frag_gid = frag_qs.get("gid", [None])[0]
+            gid = qs_gid or frag_gid or "0"
+            if doc_id:
+                return f"https://docs.google.com/spreadsheets/d/{doc_id}/export?format=csv&gid={gid}"
+            if "/export" in parsed.path and "format=csv" in parsed.query:
+                return url
+            return url.replace("/edit#gid=0", "/export?format=csv&gid=0")
+        csv_url = build_csv_url(sheet_url)
+        df = pd.read_csv(csv_url, engine='python', on_bad_lines='warn')
+        return df
+    except Exception as e:
+        raise gr.Error(f"Error reading Google Sheet: {e}")
+def process_sheet_data(sheet_url):
+    """處理試算表資料，為 Gradio DataFrame 準備。"""
+    try:
+        df = read_google_sheet(sheet_url)
+        if df.shape[1] < 3:
+            error_msg = f"Error: Google Sheet has only {df.shape[1]} columns, but 3 are expected (White Background URL, Reference Image URL, Prompt)."
+            raise gr.Error(error_msg)
+        data_list = []
+        for i, row in df.iterrows():
+            if pd.notna(row.iloc[0]) and pd.notna(row.iloc[1]) and pd.notna(row.iloc[2]):
+                data_list.append([i, row.iloc[0], row.iloc[1], row.iloc[2]])
+        return data_list
     except Exception as e:
+        raise gr.Error(f"Error processing sheet data: {e}")
+def generate_image_for_row(row_index, dataframe_data):
+    """根據 Gradio DataFrame 的行索引生成圖片。"""
+    df = pd.DataFrame(dataframe_data, columns=["Index", "白背圖URL", "參考圖URL", "提示詞"])
+    if not (0 <= row_index < len(df)):
+        return None, "Error: Invalid row index."
+    row = df.iloc[int(row_index)]
+    white_background_url = row['白背圖URL']
+    reference_image_url = row['參考圖URL']
+    prompt = row['提示詞']
+    # 從 URL 下載圖片
+    wb_image = load_image_from_url(white_background_url)
+    ref_image = load_image_from_url(reference_image_url)
+    if wb_image is None or ref_image is None:
+        return None, "Error: One or more images failed to load from URL."
+    images = [wb_image, ref_image]
+    # 使用你提供的函式來呼叫 API
+    image_path, text_response = generate_content(text=prompt, images=images)
+    if image_path:
+        # 如果成功生成圖片，返回圖片路徑和操作日誌
+        output_dir = "generated_images"
+        os.makedirs(output_dir, exist_ok=True)
+        final_output_path = os.path.join(output_dir, os.path.basename(image_path))
+        os.rename(image_path, final_output_path) # 將暫存檔移動到正式目錄
+        return final_output_path, text_response
+    else:
+        # 如果沒有生成圖片，返回 None 和操作日誌
+        return None, text_response
+# --- Gradio 介面設定（保留你原來的樣式） ---
 with gr.Blocks(css_paths="style.css",) as demo:
     gr.HTML(
     """
           <img src="https://www.gstatic.com/lamda/images/gemini_favicon_f069958c85030456e93de685481c559f160ea06b.png" alt="Gemini logo">
       </div>
       <div>
+          <h1>Gemini Image Generator</h1>
           <p>Powered by <a href="https://gradio.app/">Gradio</a>⚡️|
            <a href="https://huggingface.co/spaces/ameerazam08/Gemini-Image-Edit?duplicate=true">Duplicate</a> this Repo |
           <a href="https://aistudio.google.com/apikey">Get an API Key</a> |
     with gr.Accordion("📌 Usage Instructions", open=False, elem_classes="instructions-accordion"):
         gr.Markdown("""
     ### 📌 Usage
+      - Input a Google Sheet URL containing image URLs and a prompt.
+    - Select a row to generate an output.
     """)
     with gr.Row(elem_classes="main-content"):
         with gr.Column(elem_classes="input-column"):
+            sheet_url_input = gr.Textbox(label="Google Sheet URL", value="https://docs.google.com/spreadsheets/d/1G3olHxydDIbnyXdh5nnw5TG0akZFeMeYm-25JmCGDLg/edit?gid=0#gid=0")
+            process_button = gr.Button("處理試算表", elem_classes="generate-btn")
+            with gr.Row():
+                row_index_input = gr.Number(label="要生成的行數", precision=0, value=0)
+                generate_selected_button = gr.Button("生成所選行的圖片", elem_classes="generate-btn")
         with gr.Column(elem_classes="output-column"):
+            output_dataframe = gr.DataFrame(
+                headers=["Index", "白背圖URL", "參考圖URL", "提示詞"],
+                col_count=(4, "fixed"),
+                interactive=False,
+                label="已處理的試算表數據"
             )
+            generated_image_output = gr.Image(label="生成的圖片", elem_classes="output-gallery")
+            operation_log_output = gr.Textbox(
+                label="操作日誌",
+                lines=10,
+                placeholder="文字回應和日誌會顯示在這裡。"
+            )
+    processed_df_state = gr.State()
+    process_button.click(
+        fn=process_sheet_data,
+        inputs=sheet_url_input,
+        outputs=output_dataframe
+    ).success(
+        fn=lambda x: x,
+        inputs=output_dataframe,
+        outputs=processed_df_state
     )
+    generate_selected_button.click(
+        fn=generate_image_for_row,
+        inputs=[row_index_input, processed_df_state],
+        outputs=[generated_image_output, operation_log_output]
     )
 demo.queue(max_size=50).launch(mcp_server=True, share=True)