Spaces:

google
/

embeddinggemma-tuning-lab

Running

App Files Files Community

bebechien commited on Jan 14

Commit

72b6692

verified ·

1 Parent(s): fc5f2ab

Fix hub ui

Browse files

Files changed (2) hide show

src/model_trainer.py +29 -9
src/ui.py +63 -23

src/model_trainer.py CHANGED Viewed

@@ -4,7 +4,7 @@ from datasets import Dataset
 from sentence_transformers import SentenceTransformerTrainer, SentenceTransformerTrainingArguments
 from sentence_transformers.losses import MultipleNegativesRankingLoss
 from transformers import TrainerCallback, TrainingArguments
-from typing import List, Callable, Optional
 from pathlib import Path
 from .config import AppConfig
@@ -57,7 +57,22 @@ def get_top_hits(
     return "\n".join(result)
-def upload_model_to_hub(folder_path: Path, repo_name: str, token: str) -> str:
     """
     Uploads a local model folder to the Hugging Face Hub.
     Creates the repository if it doesn't exist.
@@ -65,12 +80,16 @@ def upload_model_to_hub(folder_path: Path, repo_name: str, token: str) -> str:
     try:
         api = HfApi(token=token)
-        # Get the authenticated user's username
-        user_info = api.whoami()
-        username = user_info['name']
         # Construct the full repo ID
-        repo_id = f"{username}/{repo_name}"
         print(f"Preparing to upload to: {repo_id}")
         # Create the repo (safe if it already exists)
@@ -88,8 +107,9 @@ def upload_model_to_hub(folder_path: Path, repo_name: str, token: str) -> str:
             token=token
         )
         tags = info.card_data.tags
-        tags.append("embeddinggemma-tuning-lab")
-        metadata_update(repo_id, {"tags": tags}, overwrite=True, token=token)
         return f"✅ Success! Model published at: {url}"
     except Exception as e:
@@ -169,4 +189,4 @@ def train_with_dataset(
     # Save the final fine-tuned model
     trainer.save_model()
-    print(f"Model saved locally to: {output_dir}")

 from sentence_transformers import SentenceTransformerTrainer, SentenceTransformerTrainingArguments
 from sentence_transformers.losses import MultipleNegativesRankingLoss
 from transformers import TrainerCallback, TrainingArguments
+from typing import List, Callable, Optional, Union
 from pathlib import Path
 from .config import AppConfig
     return "\n".join(result)
+def get_available_namespaces(token: str) -> List[str]:
+    """
+    Returns a list of namespaces (user and organizations) the user can write to.
+    First item is always the authenticated user's username.
+    """
+    try:
+        api = HfApi(token=token)
+        info = api.whoami()
+        username = info['name']
+        orgs = [org['name'] for org in info.get('orgs', [])]
+        return [username] + orgs
+    except Exception as e:
+        print(f"Error fetching namespaces: {e}")
+        return []
+def upload_model_to_hub(folder_path: Path, repo_name: str, token: str, entity: Optional[str] = None) -> str:
     """
     Uploads a local model folder to the Hugging Face Hub.
     Creates the repository if it doesn't exist.
     try:
         api = HfApi(token=token)
+        # Determine the entity (namespace) to use
+        if entity:
+            namespace = entity
+        else:
+            # Fallback to the authenticated user's username
+            user_info = api.whoami()
+            namespace = user_info['name']
         # Construct the full repo ID
+        repo_id = f"{namespace}/{repo_name}"
         print(f"Preparing to upload to: {repo_id}")
         # Create the repo (safe if it already exists)
             token=token
         )
         tags = info.card_data.tags
+        if "embeddinggemma-tuning-lab" not in tags:
+            tags.append("embeddinggemma-tuning-lab")
+            metadata_update(repo_id, {"tags": tags}, overwrite=True, token=token)
         return f"✅ Success! Model published at: {url}"
     except Exception as e:
     # Save the final fine-tuned model
     trainer.save_model()
+    print(f"Model saved locally to: {output_dir}")

src/ui.py CHANGED Viewed

@@ -4,6 +4,7 @@ from datetime import datetime
 from .config import AppConfig
 from .session_manager import HackerNewsFineTuner
 # --- Constants for Labels ---
 LABEL_FAV = "👍"
@@ -45,13 +46,27 @@ def on_app_load(app, profile: Optional[gr.OAuthProfile] = None):
     # Return 7 items: App state, Data updates (3), Hub updates (2), Username state (1)
     return app, stories, labels, text_update, repo_update, push_update, username
-def update_repo_preview(username, repo_name):
-    """Updates the markdown preview to show 'username/repo_name'."""
-    if not username:
-        return "⚠️ Sign in to see the target repository path."
     clean_repo = repo_name.strip() if repo_name else "..."
-    return f"Target Repository: **`{username}/{clean_repo}`**"
 def import_wrapper(app, file):
     return app.import_additional_dataset(file)
@@ -62,11 +77,12 @@ def export_wrapper(app):
 def download_model_wrapper(app):
     return app.download_model()
-def push_to_hub_wrapper(app, repo_name, oauth_token: Optional[gr.OAuthToken]):
     if oauth_token is None:
         return "⚠️ You must be logged in to push to the Hub. Please sign in above."
     token_str = oauth_token.token
-    return app.upload_model(repo_name, token_str)
 def training_wrapper(app, stories: List[str], labels: Dict[int, str]):
     """
@@ -126,7 +142,7 @@ def build_interface() -> gr.Blocks:
             with gr.Accordion("0️⃣ Step 0: Sign In (Optional)", open=True):
                 gr.Markdown("Sign in to Hugging Face if you plan to push your fine-tuned model to the Hub later (Step 3).")
                 with gr.Row():
-                    gr.LoginButton(value="Sign in with Hugging Face")
                     with gr.Column(scale=3):
                         gr.Markdown("")
@@ -200,11 +216,19 @@ def build_interface() -> gr.Blocks:
                 gr.Markdown("Push your fine-tuned model to your personal Hugging Face account.")
                 with gr.Row():
-                    repo_name_input = gr.Textbox(label="Target Repository Name", value="my-embeddinggemma-news-vibe", placeholder="e.g., my-embeddinggemma-news-vibe", interactive=False)
-                    push_to_hub_btn = gr.Button("Save to Hugging Face Hub", variant="secondary", interactive=False)
-                repo_id_preview = gr.Markdown("Target Repository: (Waiting for input...)")
                 push_status = gr.Markdown("")
             # --- Step 4: Downloads ---
@@ -242,15 +266,25 @@ def build_interface() -> gr.Blocks:
                 fn=on_app_load,
                 inputs=[session_state],
                 outputs=[session_state, stories_state, labels_state, output, repo_name_input, push_to_hub_btn, username_state]
-            ).then(
-                fn=update_repo_preview,
-                inputs=[username_state, repo_name_input],
-                outputs=[repo_id_preview]
             ).then(
                 fn=lambda: [gr.update(interactive=True)]*2, outputs=[clear_reload_btn, run_training_btn]
             )
-            # 2. Reset / Refresh / Clear Selections
             # ----------------
             clear_reload_btn.click(
                 fn=lambda: set_interactivity(False), outputs=action_buttons
@@ -279,7 +313,7 @@ def build_interface() -> gr.Blocks:
                 outputs=[reset_counter, labels_state]
             )
-            # 3. Import Data
             # ----------------
             import_file.change(
                 fn=import_wrapper,
@@ -287,7 +321,7 @@ def build_interface() -> gr.Blocks:
                 outputs=[download_status]
             )
-            # 4. Run Training
             # ----------------
             run_training_btn.click(
                 fn=lambda: set_interactivity(False), outputs=action_buttons
@@ -304,7 +338,7 @@ def build_interface() -> gr.Blocks:
                 outputs=[repo_name_input, push_to_hub_btn]
             )
-            # 5. Downloads
             # ----------------
             download_dataset_btn.click(
                 fn=export_wrapper,
@@ -345,11 +379,17 @@ def build_interface() -> gr.Blocks:
                 outputs=[repo_name_input, push_to_hub_btn]
             )
-            # 6. Push to Hub
             # ----------------
             repo_name_input.change(
                 fn=update_repo_preview,
-                inputs=[username_state, repo_name_input],
                 outputs=[repo_id_preview]
             )
@@ -359,7 +399,7 @@ def build_interface() -> gr.Blocks:
                 fn=lambda: gr.update(interactive=False), outputs=push_to_hub_btn
             ).then(
                 fn=push_to_hub_wrapper,
-                inputs=[session_state, repo_name_input],
                 outputs=[push_status]
             ).then(
                 fn=lambda: set_interactivity(True), outputs=action_buttons
@@ -413,4 +453,4 @@ def build_interface() -> gr.Blocks:
                     outputs=[vibe_score, vibe_status, style_thml, session_info_display]
                 )
-    return demo

 from .config import AppConfig
 from .session_manager import HackerNewsFineTuner
+from .model_trainer import get_available_namespaces
 # --- Constants for Labels ---
 LABEL_FAV = "👍"
     # Return 7 items: App state, Data updates (3), Hub updates (2), Username state (1)
     return app, stories, labels, text_update, repo_update, push_update, username
+def update_repo_preview(entity_name, repo_name):
+    """Updates the markdown preview to show 'entity/repo_name'."""
+    if not entity_name:
+        return "⚠️ Please select a namespace (User or Org)."
     clean_repo = repo_name.strip() if repo_name else "..."
+    return f"Target Repository: **`{entity_name}/{clean_repo}`**"
+def fetch_orgs_wrapper(oauth_token: Optional[gr.OAuthToken]):
+    if not oauth_token:
+        return gr.update(choices=[], value=None), "⚠️ Login required to fetch organizations."
+    try:
+        namespaces = get_available_namespaces(oauth_token.token)
+        if not namespaces:
+            return gr.update(choices=[], value=None), "❌ Failed to fetch namespaces."
+        # Default to the first one (username)
+        return gr.update(choices=namespaces, value=namespaces[0]), "✅ Organizations loaded."
+    except Exception as e:
+        return gr.update(choices=[], value=None), f"❌ Error: {str(e)}"
 def import_wrapper(app, file):
     return app.import_additional_dataset(file)
 def download_model_wrapper(app):
     return app.download_model()
+def push_to_hub_wrapper(app, entity_name, repo_name, oauth_token: Optional[gr.OAuthToken]):
     if oauth_token is None:
         return "⚠️ You must be logged in to push to the Hub. Please sign in above."
     token_str = oauth_token.token
+    # Pass the selected entity
+    return app.upload_model(repo_name, token_str, entity=entity_name)
 def training_wrapper(app, stories: List[str], labels: Dict[int, str]):
     """
             with gr.Accordion("0️⃣ Step 0: Sign In (Optional)", open=True):
                 gr.Markdown("Sign in to Hugging Face if you plan to push your fine-tuned model to the Hub later (Step 3).")
                 with gr.Row():
+                    login_btn = gr.LoginButton(value="Sign in with Hugging Face")
                     with gr.Column(scale=3):
                         gr.Markdown("")
                 gr.Markdown("Push your fine-tuned model to your personal Hugging Face account.")
                 with gr.Row():
+                    # Entity (User/Org) Selection
+                    with gr.Column(scale=1):
+                         with gr.Row():
+                            entity_dropdown = gr.Dropdown(label="Owner / Organization", choices=[], interactive=True, scale=4)
+                            refresh_orgs_btn = gr.Button("🔄", scale=1, size="sm")
+                    # Repo Name
+                    with gr.Column(scale=2):
+                        repo_name_input = gr.Textbox(label="Target Repository Name", value="my-embeddinggemma-news-vibe", placeholder="e.g., my-embeddinggemma-news-vibe", interactive=False)
+                push_to_hub_btn = gr.Button("Save to Hugging Face Hub", variant="secondary", interactive=False)
+                repo_id_preview = gr.Markdown("Target Repository: (Waiting for input...)")
                 push_status = gr.Markdown("")
             # --- Step 4: Downloads ---
                 fn=on_app_load,
                 inputs=[session_state],
                 outputs=[session_state, stories_state, labels_state, output, repo_name_input, push_to_hub_btn, username_state]
             ).then(
                 fn=lambda: [gr.update(interactive=True)]*2, outputs=[clear_reload_btn, run_training_btn]
             )
+            # 2. Login Trigger -> Auto Fetch Orgs
+            # ----------------
+            # We can try to fetch orgs automatically if the token is available
+            refresh_orgs_btn.click(
+                fn=fetch_orgs_wrapper,
+                inputs=[login_btn], # Gr.LoginButton acts as the OAuthToken input in this context? No, usually gr.OAuthToken is implicit or separate
+                outputs=[entity_dropdown, push_status]
+            ).then(
+                 fn=update_repo_preview,
+                 inputs=[entity_dropdown, repo_name_input],
+                 outputs=[repo_id_preview]
+            )
+            # 3. Reset / Refresh / Clear Selections
             # ----------------
             clear_reload_btn.click(
                 fn=lambda: set_interactivity(False), outputs=action_buttons
                 outputs=[reset_counter, labels_state]
             )
+            # 4. Import Data
             # ----------------
             import_file.change(
                 fn=import_wrapper,
                 outputs=[download_status]
             )
+            # 5. Run Training
             # ----------------
             run_training_btn.click(
                 fn=lambda: set_interactivity(False), outputs=action_buttons
                 outputs=[repo_name_input, push_to_hub_btn]
             )
+            # 6. Downloads
             # ----------------
             download_dataset_btn.click(
                 fn=export_wrapper,
                 outputs=[repo_name_input, push_to_hub_btn]
             )
+            # 7. Push to Hub
             # ----------------
+            # Update preview on Name change or Entity change
             repo_name_input.change(
                 fn=update_repo_preview,
+                inputs=[entity_dropdown, repo_name_input],
+                outputs=[repo_id_preview]
+            )
+            entity_dropdown.change(
+                fn=update_repo_preview,
+                inputs=[entity_dropdown, repo_name_input],
                 outputs=[repo_id_preview]
             )
                 fn=lambda: gr.update(interactive=False), outputs=push_to_hub_btn
             ).then(
                 fn=push_to_hub_wrapper,
+                inputs=[session_state, entity_dropdown, repo_name_input], # Pass entity dropdown
                 outputs=[push_status]
             ).then(
                 fn=lambda: set_interactivity(True), outputs=action_buttons
                     outputs=[vibe_score, vibe_status, style_thml, session_info_display]
                 )
+    return demo