Spaces:

DocSA
/

LP_2-test

Running

App Files Files Community

DocUA commited on 13 days ago

Commit

a09e8cb

1 Parent(s): 5c25abd

Enhance provider management: normalize response keys, add availability checks, and improve Gradio interface for AI providers

Browse files

Files changed (4) hide show

app.py +25 -10
interface.py +35 -4
main.py +35 -0
test_providers.py +45 -0

app.py CHANGED Viewed

@@ -12,8 +12,12 @@ os.environ['GRADIO_SERVER_PORT'] = '7860'
 # Avoid uvloop shutdown warnings on HF Spaces
 os.environ.setdefault('UVICORN_LOOP', 'asyncio')
-import nest_asyncio
-nest_asyncio.apply()
 # Add project root to Python path
 project_root = Path(__file__).parent
@@ -93,14 +97,25 @@ if __name__ == "__main__":
     # Run diagnostics only when executed directly
     run_network_diagnostics()
-    print("🚀 Starting Legal Position AI Analyzer on Hugging Face Spaces...")
     # Must call launch() explicitly — Gradio 6 does not auto-launch.
     # ssr_mode=False avoids the "shareable link" error on HF Spaces containers.
-    demo.launch(
-        server_name="0.0.0.0",
-        server_port=7860,
-        share=False,
-        show_error=True,
-        ssr_mode=False,
-    )

 # Avoid uvloop shutdown warnings on HF Spaces
 os.environ.setdefault('UVICORN_LOOP', 'asyncio')
+# Apply nest_asyncio only if needed (some Python versions have conflicts)
+# try:
+#     import nest_asyncio
+#     nest_asyncio.apply()
+# except Exception as e:
+#     print(f"[WARNING] Could not apply nest_asyncio: {e}")
 # Add project root to Python path
 project_root = Path(__file__).parent
     # Run diagnostics only when executed directly
     run_network_diagnostics()
+    print("🚀 Starting Legal Position AI Analyzer...")
+    # Detect if running on HF Spaces or locally
+    is_hf_space = os.environ.get('SPACE_ID') is not None
     # Must call launch() explicitly — Gradio 6 does not auto-launch.
     # ssr_mode=False avoids the "shareable link" error on HF Spaces containers.
+    if is_hf_space:
+        # On HF Spaces, use fixed port 7860
+        demo.launch(
+            server_name="0.0.0.0",
+            server_port=7860,
+            share=False,
+            show_error=True,
+            ssr_mode=False,
+        )
+    else:
+        # Locally, let Gradio find an available port
+        demo.launch(
+            share=False,
+            show_error=True,
+        )

interface.py CHANGED Viewed

@@ -14,7 +14,8 @@ from main import (
     generate_legal_position,
     search_with_ai_action,
     analyze_action,
-    search_with_raw_text
 )
 from prompts import SYSTEM_PROMPT, LEGAL_POSITION_PROMPT, PRECEDENT_ANALYSIS_TEMPLATE
 from src.session.manager import get_session_manager
@@ -32,6 +33,12 @@ def load_help_content() -> str:
         return f"Помилка завантаження довідки: {str(e)}"
 def update_generation_model_choices(provider: str) -> gr.Dropdown:
     """Update generation model choices based on provider selection."""
     if provider == ModelProvider.OPENAI.value:
@@ -466,6 +473,18 @@ def create_gradio_interface() -> gr.Blocks:
     except Exception:
         _default_provider = "anthropic"
     # Get default generation model for the provider
     _gen_models = get_generation_models_by_provider(_default_provider)
     if DEFAULT_GENERATION_MODEL and DEFAULT_GENERATION_MODEL.value in _gen_models:
@@ -538,6 +557,18 @@ def create_gradio_interface() -> gr.Blocks:
             </div>
             """
         )
         # Session state - generates unique ID for each browser session
         session_id_state = gr.State(value=generate_session_id)
@@ -563,7 +594,7 @@ def create_gradio_interface() -> gr.Blocks:
                         gr.Markdown("### 🤖 Налаштування моделі")
                         with gr.Row():
                             generation_provider_dropdown = gr.Dropdown(
-                                choices=[p.value for p in ModelProvider],
                                 value=_default_provider,
                                 label="Провайдер AI",
                                 container=False,
@@ -680,7 +711,7 @@ def create_gradio_interface() -> gr.Blocks:
                 with gr.Row():
                     analysis_provider_dropdown = gr.Dropdown(
-                        choices=[p.value for p in ModelProvider],
                         value=_default_provider,
                         label="Провайдер AI",
                         scale=1
@@ -781,7 +812,7 @@ def create_gradio_interface() -> gr.Blocks:
                 with gr.Row():
                     batch_provider_dropdown = gr.Dropdown(
-                        choices=[p.value for p in ModelProvider],
                         value=_default_provider,
                         label="Провайдер AI",
                         scale=1

     generate_legal_position,
     search_with_ai_action,
     analyze_action,
+    search_with_raw_text,
+    get_available_providers
 )
 from prompts import SYSTEM_PROMPT, LEGAL_POSITION_PROMPT, PRECEDENT_ANALYSIS_TEMPLATE
 from src.session.manager import get_session_manager
         return f"Помилка завантаження довідки: {str(e)}"
+def get_available_provider_choices() -> list:
+    """Get list of available AI providers based on API key availability."""
+    available = get_available_providers()
+    return [p.value for p in ModelProvider if available.get(p.value, False)]
 def update_generation_model_choices(provider: str) -> gr.Dropdown:
     """Update generation model choices based on provider selection."""
     if provider == ModelProvider.OPENAI.value:
     except Exception:
         _default_provider = "anthropic"
+    # Get available providers based on API key availability
+    _available_providers = get_available_provider_choices()
+    # If default provider is not available, use first available one
+    if _default_provider not in _available_providers:
+        if _available_providers:
+            _default_provider = _available_providers[0]
+            print(f"[WARNING] Default provider not available, using: {_default_provider}")
+        else:
+            print("[ERROR] No AI providers available! Please set at least one API key.")
+            _default_provider = "anthropic"  # Fallback for UI rendering
     # Get default generation model for the provider
     _gen_models = get_generation_models_by_provider(_default_provider)
     if DEFAULT_GENERATION_MODEL and DEFAULT_GENERATION_MODEL.value in _gen_models:
             </div>
             """
         )
+        # Show provider availability status
+        _all_providers = {p.value for p in ModelProvider}
+        _unavailable = _all_providers - set(_available_providers)
+        if _unavailable:
+            unavailable_list = ", ".join(sorted(_unavailable))
+            gr.Info(
+                f"⚠️ Недоступні провайдери (відсутні API ключі): {unavailable_list}\n"
+                f"Додайте відповідні API ключі в налаштуваннях HF Space для активації.",
+                title="Інформація про провайдери",
+                duration=10
+            )
         # Session state - generates unique ID for each browser session
         session_id_state = gr.State(value=generate_session_id)
                         gr.Markdown("### 🤖 Налаштування моделі")
                         with gr.Row():
                             generation_provider_dropdown = gr.Dropdown(
+                                choices=_available_providers,
                                 value=_default_provider,
                                 label="Провайдер AI",
                                 container=False,
                 with gr.Row():
                     analysis_provider_dropdown = gr.Dropdown(
+                        choices=_available_providers,
                         value=_default_provider,
                         label="Провайдер AI",
                         scale=1
                 with gr.Row():
                     batch_provider_dropdown = gr.Dropdown(
+                        choices=_available_providers,
                         value=_default_provider,
                         label="Провайдер AI",
                         scale=1

main.py CHANGED Viewed

@@ -236,6 +236,31 @@ def check_provider_available(provider: str) -> Tuple[bool, str]:
     return True, ""
 class RetrieverEvent(Event):
     """Event class for retriever operations."""
     nodes: list[NodeWithScore]
@@ -716,6 +741,9 @@ def generate_legal_position(
                 print(f"[DEBUG] OpenAI response length: {len(response_text) if response_text else 0}")
                 json_response = extract_json_from_text(response_text)
                 if json_response and all(key in json_response for key in ["title", "text", "proceeding", "category"]):
                     return json_response
                 else:
@@ -784,6 +812,9 @@ def generate_legal_position(
                 print(f"[DEBUG] DeepSeek response length: {len(response_text) if response_text else 0}")
                 json_response = extract_json_from_text(response_text)
                 if json_response and all(key in json_response for key in ["title", "text", "proceeding", "category"]):
                     return json_response
                 else:
@@ -872,6 +903,8 @@ def generate_legal_position(
                 json_response = extract_json_from_text(response_text)
                 if json_response:
                     # Validate required fields
                     required = ["title", "text", "proceeding", "category"]
                     missing = [f for f in required if f not in json_response]
@@ -959,6 +992,8 @@ def generate_legal_position(
                 json_response = extract_json_from_text(response_text)
                 if json_response:
                     # Перевіряємо наявність всіх необхідних полів
                     required_fields = ["title", "text", "proceeding", "category"]
                     if all(field in json_response for field in required_fields):

     return True, ""
+def normalize_response_keys(response_dict: Dict[str, Any]) -> Dict[str, Any]:
+    """
+    Normalize keys in the response dictionary to match the expected format.
+    Handles variations like 'text_lp' -> 'text' and 'proceeding_type' -> 'proceeding'.
+    """
+    if not response_dict:
+        return response_dict
+    # Map common variations to standard keys
+    key_mapping = {
+        "text_lp": "text",
+        "legal_position_text": "text",
+        "lp_text": "text",
+        "proceeding_type": "proceeding",
+        "type_of_proceeding": "proceeding"
+    }
+    normalized = response_dict.copy()
+    for variant, standard in key_mapping.items():
+        if variant in normalized and standard not in normalized:
+            normalized[standard] = normalized.pop(variant)
+    return normalized
 class RetrieverEvent(Event):
     """Event class for retriever operations."""
     nodes: list[NodeWithScore]
                 print(f"[DEBUG] OpenAI response length: {len(response_text) if response_text else 0}")
                 json_response = extract_json_from_text(response_text)
+                if json_response:
+                    json_response = normalize_response_keys(json_response)
                 if json_response and all(key in json_response for key in ["title", "text", "proceeding", "category"]):
                     return json_response
                 else:
                 print(f"[DEBUG] DeepSeek response length: {len(response_text) if response_text else 0}")
                 json_response = extract_json_from_text(response_text)
+                if json_response:
+                    json_response = normalize_response_keys(json_response)
                 if json_response and all(key in json_response for key in ["title", "text", "proceeding", "category"]):
                     return json_response
                 else:
                 json_response = extract_json_from_text(response_text)
                 if json_response:
+                    json_response = normalize_response_keys(json_response)
                     # Validate required fields
                     required = ["title", "text", "proceeding", "category"]
                     missing = [f for f in required if f not in json_response]
                 json_response = extract_json_from_text(response_text)
                 if json_response:
+                    json_response = normalize_response_keys(json_response)
                     # Перевіряємо наявність всіх необхідних полів
                     required_fields = ["title", "text", "proceeding", "category"]
                     if all(field in json_response for field in required_fields):

test_providers.py ADDED Viewed

	@@ -0,0 +1,45 @@

+#!/usr/bin/env python3
+"""
+Test script to check available AI providers
+"""
+import os
+from dotenv import load_dotenv
+# Load environment variables
+load_dotenv()
+def get_available_providers():
+    """Get status of all AI providers."""
+    return {
+        "openai": bool(os.getenv("OPENAI_API_KEY")),
+        "anthropic": bool(os.getenv("ANTHROPIC_API_KEY")),
+        "gemini": bool(os.getenv("GEMINI_API_KEY")),
+        "deepseek": bool(os.getenv("DEEPSEEK_API_KEY"))
+    }
+if __name__ == "__main__":
+    providers = get_available_providers()
+    print("=" * 50)
+    print("🔑 API Keys Status")
+    print("=" * 50)
+    for provider, available in providers.items():
+        status = "✅ Available" if available else "❌ Missing"
+        print(f"{provider.upper():12} : {status}")
+    print("=" * 50)
+    available_list = [p for p, avail in providers.items() if avail]
+    unavailable_list = [p for p, avail in providers.items() if not avail]
+    print(f"\n✅ Available providers: {', '.join(available_list) if available_list else 'None'}")
+    print(f"❌ Unavailable providers: {', '.join(unavailable_list) if unavailable_list else 'None'}")
+    if not available_list:
+        print("\n⚠️ WARNING: No AI providers available!")
+        print("Please set at least one API key in your .env file:")
+        print("  - OPENAI_API_KEY")
+        print("  - ANTHROPIC_API_KEY")
+        print("  - GEMINI_API_KEY")
+        print("  - DEEPSEEK_API_KEY")