Spaces:

DocSA
/

LP_2-test

Running

App Files Files Community

DocUA commited on 4 days ago

Commit

a765e3e

1 Parent(s): 492b465

feat: Оновлення UI для GPT-5.2 та додавання контролю MaxTokens

Browse files

Files changed (7) hide show

HELP.md +29 -18
config/environments/default.yaml +19 -15
config/models.py +6 -7
interface.py +75 -17
main.py +47 -28
prompts.py +20 -10
test_anthropic_rest.py +51 -0

HELP.md CHANGED Viewed

@@ -40,14 +40,20 @@
 - **Модель генерації**: Виберіть конкретну модель (наприклад, GPT-4o, Claude 3.5 Sonnet, Gemini 3.0 Flash)
 **Рекомендації:**
-- Для швидкої роботи: Gemini 3.0 Flash, GPT-4o-mini
-- Для якісних результатів: Claude 3.5 Sonnet, GPT-4o
 - Для економії: DeepSeek Chat
-#### 2. Режим Thinking (для Gemini 3+ та Claude 4.5+)
-- Увімкніть для глибшого аналізу складних рішень
-- Рівні thinking (Gemini): Minimal → Low → Medium → High
-- Бюджет токенів (Claude): 1000-20000
 #### 3. Спосіб вводу даних
@@ -134,10 +140,11 @@
 #### 1. Попередні кроки
 ⚠️ Спочатку потрібно виконати пошук у закладці "Пошук"
-#### 2. Вибір моделі аналізу
 - Оберіть провайдер та модель для аналізу
-- Може відрізнятися від моделі генерації
-- Рекомендовано: GPT-4o, Claude 3.5 Sonnet
 #### 3. Уточнююче питання (опціонально)
 Додайте конкретне питання для AI, наприклад:
@@ -334,28 +341,32 @@ df['text'] = df['parsed'].apply(lambda x: x['text'])
 ### OpenAI
 **Моделі:**
-- GPT-4o - найпотужніша модель
 - GPT-4o-mini - баланс ціна/якість
-- GPT-4.1 - нова версія GPT-4
 - Fine-tuned моделі - власні налаштовані моделі
 **Особливості:**
 - Швидка обробка
-- Висока якість
-- Підтримка JSON Schema
 **API Key:** `OPENAI_API_KEY`
 ### Anthropic (Claude)
 **Моделі:**
-- Claude 3.5 Sonnet - рекомендована
-- Claude 4.5 Sonnet - з Extended Thinking
 **Особливості:**
-- Детальний аналіз
-- Extended Thinking для складних завдань
-- Великий контекст (200K токенів)
 **API Key:** `ANTHROPIC_API_KEY`

 - **Модель генерації**: Виберіть конкретну модель (наприклад, GPT-4o, Claude 3.5 Sonnet, Gemini 3.0 Flash)
 **Рекомендації:**
+- Для швидкої роботи: Gemini 3.0 Flash, GPT-5 Mini, GPT-4o-mini
+- Для якісних результатів: GPT-5.2, Claude Sonnet 4.6, GPT-4o
 - Для економії: DeepSeek Chat
+#### 2. Додаткові параметри (Температура, Thinking Mode, Verbosity)
+- **Температура генерації**: дозволяє налаштовувати креативність моделі від 0.0 (строга) до 2.0 (креативна).
+- **Режим Thinking (для OpenAI GPT-5+, Gemini 3+ та Claude 4.5/4.6)**:
+  - Увімкніть для глибшого аналізу складних рішень.
+- **Тип Thinking (Claude)**:
+  - **Adaptive**: модель сама обирає глибину міркувань (працює для моделей 4.6).
+  - **Enabled**: класичний режим із жорстким бюджетом токенів (для моделей 4.5 та 4.6).
+- **Рівні Thinking (OpenAI / Gemini)**: none → low → medium → high → xhigh (у GPT-5.2)
+- **Verbosity (OpenAI GPT-5)**: керування багатослівністю (low, medium, high)
+- **Бюджет токенів (Claude 4.5 або Enabled)**: 1024-32000
 #### 3. Спосіб вводу даних
 #### 1. Попередні кроки
 ⚠️ Спочатку потрібно виконати пошук у закладці "Пошук"
+#### 2. Вибір моделі аналізу та налаштувань
 - Оберіть провайдер та модель для аналізу
+- Рекомендовано: GPT-5.2, Claude Sonnet 4.6
+- **Температура аналізу**: налаштування креативності порівняння.
+- **Max Tokens (ліміт відповіді)**: максимальний обсяг деталізації аналізу (від 512 до 32768).
 #### 3. Уточнююче питання (опціонально)
 Додайте конкретне питання для AI, наприклад:
 ### OpenAI
 **Моделі:**
+- GPT-5.2 - остання потужна модель (рекомендована)
+- GPT-5 Mini - швидка і потужна модель нового покоління
+- GPT-4o - попередня потужна модель
 - GPT-4o-mini - баланс ціна/якість
+- GPT-4.1 - версія GPT-4 (reasoning)
 - Fine-tuned моделі - власні налаштовані моделі
 **Особливості:**
 - Швидка обробка
+- Підтримка Reasoning Effort (до `xhigh` в GPT-5.2) та Verbosity
+- Висока якість структурованих даних (JSON Schema)
 **API Key:** `OPENAI_API_KEY`
 ### Anthropic (Claude)
 **Моделі:**
+- Claude Sonnet 4.6 - рекомендована (за замовчуванням)
+- Claude Opus 4.6 - найпотужніша
+- Claude Haiku 4.5 - швидка модель
 **Особливості:**
+- Детальний аналіз та структурування
+- **Adaptive Thinking** у серії 4.6 для гнучкого використання ресурсів
+- **Extended Thinking** у серії 4.5 для складних завдань
+- Великий контекст
 **API Key:** `ANTHROPIC_API_KEY`

config/environments/default.yaml CHANGED Viewed

@@ -23,10 +23,10 @@ llama_index:
 # Generation Settings
 generation:
   max_tokens:
-    openai: 2048
-    anthropic: 2048
-    gemini: 2048
-    deepseek: 2048
   max_tokens_analysis: 4000
   temperature: 0.5
@@ -46,6 +46,9 @@ models:
     openai:
       - name: "gpt-5.2"
         display_name: "GPT-5.2"
       - name: "gpt-4.1"
         display_name: "GPT-4.1"
       - name: "ft:gpt-4o-mini-2024-07-18:personal:lp-1700-part-cd-120:AqhCe5Aq"
@@ -54,13 +57,13 @@ models:
         display_name: "GPT-4o Mini FT2"
     anthropic:
-      - name: "claude-opus-4-5-20251101"
-        display_name: "Claude Opus 4.5"
       - name: "claude-haiku-4-5-20251001"
         display_name: "Claude Haiku 4.5"
-      - name: "claude-sonnet-4-5-20250929"
-        display_name: "Claude Sonnet 4.5"
-        default: true
     gemini:
       - name: "gemini-3-flash-preview"
@@ -77,6 +80,8 @@ models:
     openai:
       - name: "gpt-5.2"
         display_name: "GPT-5.2"
       - name: "gpt-4.1"
         display_name: "GPT-4.1"
       - name: "gpt-4o"
@@ -85,14 +90,13 @@ models:
         display_name: "GPT-4o Mini"
     anthropic:
-      - name: "claude-3-7-sonnet-20250219"
-        display_name: "Claude 3.7 Sonnet"
-      - name: "claude-opus-4-5-20251101"
-        display_name: "Claude Opus 4.5"
       - name: "claude-haiku-4-5-20251001"
         display_name: "Claude Haiku 4.5"
-      - name: "claude-sonnet-4-5-20250929"
-        display_name: "Claude Sonnet 4.5"
     gemini:
       - name: "gemini-3-flash-preview"

 # Generation Settings
 generation:
   max_tokens:
+    openai: 8192
+    anthropic: 16000
+    gemini: 8192
+    deepseek: 8192
   max_tokens_analysis: 4000
   temperature: 0.5
     openai:
       - name: "gpt-5.2"
         display_name: "GPT-5.2"
+        default: true
+      - name: "gpt-5-mini"
+        display_name: "GPT-5 Mini"
       - name: "gpt-4.1"
         display_name: "GPT-4.1"
       - name: "ft:gpt-4o-mini-2024-07-18:personal:lp-1700-part-cd-120:AqhCe5Aq"
         display_name: "GPT-4o Mini FT2"
     anthropic:
+      - name: "claude-opus-4-6"
+        display_name: "Claude Opus 4.6"
+      - name: "claude-sonnet-4-6"
+        display_name: "Claude Sonnet 4.6"
+        default: true
       - name: "claude-haiku-4-5-20251001"
         display_name: "Claude Haiku 4.5"
     gemini:
       - name: "gemini-3-flash-preview"
     openai:
       - name: "gpt-5.2"
         display_name: "GPT-5.2"
+      - name: "gpt-5-mini"
+        display_name: "GPT-5 Mini"
       - name: "gpt-4.1"
         display_name: "GPT-4.1"
       - name: "gpt-4o"
         display_name: "GPT-4o Mini"
     anthropic:
+      - name: "claude-opus-4-6"
+        display_name: "Claude Opus 4.6"
+      - name: "claude-sonnet-4-6"
+        display_name: "Claude Sonnet 4.6"
+        default: true
       - name: "claude-haiku-4-5-20251001"
         display_name: "Claude Haiku 4.5"
     gemini:
       - name: "gemini-3-flash-preview"

config/models.py CHANGED Viewed

@@ -69,23 +69,22 @@ class ModelRegistry:
                 # Generic fine-tuned model
                 return 'GPT4o_FT'
-        # Handle specific models
         if model_name == 'gpt-5.2':
             return 'GPT5_2'
         elif model_name == 'gpt-4.1':
             return 'GPT4_1'
         elif model_name == 'gpt-4o':
             return 'GPT4o'
         elif model_name == 'gpt-4o-mini':
             return 'GPT4o_MINI'
-        elif model_name == 'claude-3-7-sonnet-20250219':
-            return 'CLAUDE_SONNET_3_7'
-        elif model_name == 'claude-opus-4-5-20251101':
-            return 'CLAUDE_OPUS_4_5'
         elif model_name == 'claude-haiku-4-5-20251001':
             return 'CLAUDE_HAIKU_4_5'
-        elif model_name == 'claude-sonnet-4-5-20250929':
-            return 'CLAUDE_SONNET_4_5'
         elif model_name == 'gemini-3-flash-preview':
             return 'GEMINI_3_FLASH'
         elif model_name == 'gemini-3-pro-preview':

                 # Generic fine-tuned model
                 return 'GPT4o_FT'
         if model_name == 'gpt-5.2':
             return 'GPT5_2'
+        elif model_name == 'gpt-5-mini':
+            return 'GPT5_MINI'
         elif model_name == 'gpt-4.1':
             return 'GPT4_1'
         elif model_name == 'gpt-4o':
             return 'GPT4o'
         elif model_name == 'gpt-4o-mini':
             return 'GPT4o_MINI'
+        elif model_name == 'claude-opus-4-6':
+            return 'CLAUDE_OPUS_4_6'
+        elif model_name == 'claude-sonnet-4-6':
+            return 'CLAUDE_SONNET_4_6'
         elif model_name == 'claude-haiku-4-5-20251001':
             return 'CLAUDE_HAIKU_4_5'
         elif model_name == 'gemini-3-flash-preview':
             return 'GEMINI_3_FLASH'
         elif model_name == 'gemini-3-pro-preview':

interface.py CHANGED Viewed

@@ -44,7 +44,7 @@ def update_generation_model_choices(provider: str) -> gr.Dropdown:
     if provider == ModelProvider.OPENAI.value:
         return gr.Dropdown(
             choices=[m.value for m in GenerationModelName if m.value.startswith("ft:") or m.value.startswith("gpt")],
-            value=GenerationModelName.GPT4_1.value,
             label="Модель генерації"
         )
     if provider == ModelProvider.DEEPSEEK.value:
@@ -56,7 +56,7 @@ def update_generation_model_choices(provider: str) -> gr.Dropdown:
     elif provider == ModelProvider.ANTHROPIC.value:
         return gr.Dropdown(
             choices=[m.value for m in GenerationModelName if m.value.startswith("claude")],
-            value=GenerationModelName.CLAUDE_SONNET_4_5.value,
             label="Модель генерації"
         )
     else:  # GEMINI
@@ -66,13 +66,14 @@ def update_generation_model_choices(provider: str) -> gr.Dropdown:
             label="Модель генерації"
         )
-def update_thinking_visibility(provider: str):
     """Show/hide thinking controls based on provider."""
-    return gr.update(visible=(provider in [ModelProvider.GEMINI.value, ModelProvider.ANTHROPIC.value]))
 def update_thinking_level_interactive(thinking_enabled: bool) -> tuple:
     """Enable/disable thinking controls based on checkbox."""
     return (
         gr.Dropdown(interactive=thinking_enabled),
         gr.Slider(interactive=thinking_enabled)
     )
@@ -153,7 +154,7 @@ def update_analysis_model_choices(provider: str) -> gr.Dropdown:
     if provider == ModelProvider.OPENAI.value:
         return gr.Dropdown(
             choices=[m.value for m in AnalysisModelName if m.value.startswith("gpt")],
-            value=AnalysisModelName.GPT4_1.value,
             label="Модель аналізу"
         )
     elif provider == ModelProvider.DEEPSEEK.value:
@@ -165,7 +166,7 @@ def update_analysis_model_choices(provider: str) -> gr.Dropdown:
     elif provider == ModelProvider.ANTHROPIC.value:
         return gr.Dropdown(
             choices=[m.value for m in AnalysisModelName if m.value.startswith("claude")],
-            value=AnalysisModelName.CLAUDE_SONNET_4_5.value,
             label="Модель аналізу"
         )
     else:  # GEMINI
@@ -185,8 +186,12 @@ async def process_input(
         provider: str,
         model_name: str,
         thinking_enabled: bool = False,
         thinking_level: str = "MEDIUM",
         thinking_budget: int = 10000,
         session_id: str = None
 ) -> Tuple[str, Optional[Dict[str, Any]], str]:
     """Process input and generate legal position."""
@@ -242,8 +247,12 @@ async def process_input(
             provider,
             model_name,
             thinking_enabled,
             thinking_level,
             thinking_budget,
             custom_system_prompt,
             custom_lp_prompt
         )
@@ -609,25 +618,52 @@ def create_gradio_interface() -> gr.Blocks:
                             )
                         # Advanced Settings in Accordion to save space
-                        with gr.Accordion("⚙️ Додаткові параметри (Thinking Mode)", open=False) as thinking_accordion:
                             thinking_enabled_checkbox = gr.Checkbox(
                                 label="Увімкнути режим Thinking (глибокий аналіз)",
                                 value=False,
-                                info="Активує розширений ланцюг міркувань для моделей Gemini 3+ та Claude 4.5"
                             )
                             with gr.Row():
                                 thinking_level_dropdown = gr.Dropdown(
-                                    choices=["Minimal", "Low", "Medium", "High"],
-                                    value="Medium",
-                                    label="Рівень Thinking (Gemini)",
                                     interactive=False
                                 )
                                 thinking_budget_slider = gr.Slider(
-                                    minimum=1000,
-                                    maximum=20000,
                                     value=10000,
-                                    step=1000,
-                                    label="Бюджет токенів (Claude)",
                                     interactive=False
                                 )
@@ -722,6 +758,22 @@ def create_gradio_interface() -> gr.Blocks:
                         label="Модель аналізу",
                         scale=1
                     )
                 question_input = gr.Textbox(
                     label="Уточнююче питання для аналізу",
@@ -930,7 +982,7 @@ def create_gradio_interface() -> gr.Blocks:
         thinking_enabled_checkbox.change(
             fn=update_thinking_level_interactive,
             inputs=[thinking_enabled_checkbox],
-            outputs=[thinking_level_dropdown, thinking_budget_slider]
         )
         # generation and analysis
@@ -945,8 +997,12 @@ def create_gradio_interface() -> gr.Blocks:
                 generation_provider_dropdown,
                 generation_model_dropdown,
                 thinking_enabled_checkbox,
                 thinking_level_dropdown,
                 thinking_budget_slider,
                 session_id_state
             ],
             outputs=[position_output, state_lp_json, session_id_state]
@@ -983,7 +1039,9 @@ def create_gradio_interface() -> gr.Blocks:
                 question_input,
                 state_nodes,
                 analysis_provider_dropdown,
-                analysis_model_dropdown
             ],
             outputs=analysis_output
         )

     if provider == ModelProvider.OPENAI.value:
         return gr.Dropdown(
             choices=[m.value for m in GenerationModelName if m.value.startswith("ft:") or m.value.startswith("gpt")],
+            value=GenerationModelName.GPT5_2.value,
             label="Модель генерації"
         )
     if provider == ModelProvider.DEEPSEEK.value:
     elif provider == ModelProvider.ANTHROPIC.value:
         return gr.Dropdown(
             choices=[m.value for m in GenerationModelName if m.value.startswith("claude")],
+            value=GenerationModelName.CLAUDE_SONNET_4_6.value,
             label="Модель генерації"
         )
     else:  # GEMINI
             label="Модель генерації"
         )
+def update_thinking_visibility(provider: str) -> gr.update:
     """Show/hide thinking controls based on provider."""
+    return gr.update(visible=(provider in [ModelProvider.GEMINI.value, ModelProvider.ANTHROPIC.value, ModelProvider.OPENAI.value]))
 def update_thinking_level_interactive(thinking_enabled: bool) -> tuple:
     """Enable/disable thinking controls based on checkbox."""
     return (
+        gr.Dropdown(interactive=thinking_enabled),
         gr.Dropdown(interactive=thinking_enabled),
         gr.Slider(interactive=thinking_enabled)
     )
     if provider == ModelProvider.OPENAI.value:
         return gr.Dropdown(
             choices=[m.value for m in AnalysisModelName if m.value.startswith("gpt")],
+            value=AnalysisModelName.GPT5_2.value,
             label="Модель аналізу"
         )
     elif provider == ModelProvider.DEEPSEEK.value:
     elif provider == ModelProvider.ANTHROPIC.value:
         return gr.Dropdown(
             choices=[m.value for m in AnalysisModelName if m.value.startswith("claude")],
+            value=AnalysisModelName.CLAUDE_SONNET_4_6.value,
             label="Модель аналізу"
         )
     else:  # GEMINI
         provider: str,
         model_name: str,
         thinking_enabled: bool = False,
+        thinking_type: str = "Adaptive",
         thinking_level: str = "MEDIUM",
+        openai_verbosity: str = "medium",
         thinking_budget: int = 10000,
+        temperature: float = 0.5,
+        max_tokens: int = 4000,
         session_id: str = None
 ) -> Tuple[str, Optional[Dict[str, Any]], str]:
     """Process input and generate legal position."""
             provider,
             model_name,
             thinking_enabled,
+            thinking_type,
             thinking_level,
+            openai_verbosity,
             thinking_budget,
+            temperature,
+            max_tokens,
             custom_system_prompt,
             custom_lp_prompt
         )
                             )
                         # Advanced Settings in Accordion to save space
+                        with gr.Accordion("⚙️ Додаткові параметри", open=False) as thinking_accordion:
+                            with gr.Row():
+                                generation_temp_slider = gr.Slider(
+                                    minimum=0.0,
+                                    maximum=2.0,
+                                    value=0.5,
+                                    step=0.1,
+                                    label="Температура генерації (креативність)"
+                                )
+                                generation_max_tokens_slider = gr.Slider(
+                                    minimum=512,
+                                    maximum=32768,
+                                    value=4000,
+                                    step=512,
+                                    label="Max Tokens (ліміт відповіді)"
+                                )
                             thinking_enabled_checkbox = gr.Checkbox(
                                 label="Увімкнути режим Thinking (глибокий аналіз)",
                                 value=False,
+                                info="Активує розширений ланцюг міркувань (Gemini 3+, Claude 4.5/4.6)"
                             )
                             with gr.Row():
+                                thinking_type_dropdown = gr.Dropdown(
+                                    choices=["Adaptive", "Enabled"],
+                                    value="Adaptive",
+                                    label="Тип Thinking (Claude)",
+                                    interactive=False
+                                )
                                 thinking_level_dropdown = gr.Dropdown(
+                                    choices=["none", "low", "medium", "high", "xhigh"],
+                                    value="medium",
+                                    label="Рівень Thinking (OpenAI/Gemini)",
                                     interactive=False
                                 )
+                                openai_verbosity_dropdown = gr.Dropdown(
+                                    choices=["low", "medium", "high"],
+                                    value="medium",
+                                    label="Verbosity (OpenAI GPT-5)",
+                                    interactive=True
+                                )
                                 thinking_budget_slider = gr.Slider(
+                                    minimum=1024,
+                                    maximum=32000,
                                     value=10000,
+                                    step=1024,
+                                    label="Бюджет токенів (Claude 4.5)",
                                     interactive=False
                                 )
                         label="Модель аналізу",
                         scale=1
                     )
+                with gr.Accordion("⚙️ Налаштування аналізу", open=False):
+                    with gr.Row():
+                        analysis_temp_slider = gr.Slider(
+                            minimum=0.0,
+                            maximum=2.0,
+                            value=0.5,
+                            step=0.1,
+                            label="Температура аналізу"
+                        )
+                        analysis_max_tokens_slider = gr.Slider(
+                            minimum=512,
+                            maximum=32768,
+                            value=4000,
+                            step=512,
+                            label="Max Tokens (ліміт відповіді)"
+                        )
                 question_input = gr.Textbox(
                     label="Уточнююче питання для аналізу",
         thinking_enabled_checkbox.change(
             fn=update_thinking_level_interactive,
             inputs=[thinking_enabled_checkbox],
+            outputs=[thinking_type_dropdown, thinking_level_dropdown, thinking_budget_slider]
         )
         # generation and analysis
                 generation_provider_dropdown,
                 generation_model_dropdown,
                 thinking_enabled_checkbox,
+                thinking_type_dropdown,
                 thinking_level_dropdown,
+                openai_verbosity_dropdown,
                 thinking_budget_slider,
+                generation_temp_slider,
+                generation_max_tokens_slider,
                 session_id_state
             ],
             outputs=[position_output, state_lp_json, session_id_state]
                 question_input,
                 state_nodes,
                 analysis_provider_dropdown,
+                analysis_model_dropdown,
+                analysis_temp_slider,
+                analysis_max_tokens_slider
             ],
             outputs=analysis_output
         )

main.py CHANGED Viewed

@@ -272,9 +272,11 @@ class RetrieverEvent(Event):
 class LLMAnalyzer:
     """Class for handling different LLM providers."""
-    def __init__(self, provider: Any, model_name: Any):
         self.provider = provider
         self.model_name = model_name
         if provider == ModelProvider.OPENAI:
             if not OPENAI_API_KEY:
@@ -342,7 +344,7 @@ class LLMAnalyzer:
             # Reasoning models usually require temperature=1.0 or none
             if not is_reasoning_model:
-                completion_params["temperature"] = 0
             # Add GPT-5.2 specific parameters
             if "gpt-5" in model_val.lower():
@@ -397,7 +399,7 @@ class LLMAnalyzer:
             # Use JSON mode and temperature only for non-reasoning models
             if not is_reasoning:
                 completion_params["response_format"] = {'type': 'json_object'}
-                completion_params["temperature"] = 0
             # Retry logic for DeepSeek analysis
             max_retries = 3
@@ -429,7 +431,8 @@ class LLMAnalyzer:
         try:
             response = self.client.messages.create(
                 model=self.model_name,
-                max_tokens=MAX_TOKENS_ANALYSIS,
                 system=SYSTEM_PROMPT,
                 messages=[{"role": "user", "content": prompt}]
             )
@@ -473,8 +476,8 @@ class LLMAnalyzer:
             ]
             generate_content_config = types.GenerateContentConfig(
-                temperature=GENERATION_TEMPERATURE,
-                max_output_tokens=MAX_TOKENS_ANALYSIS,
                 system_instruction=[
                     types.Part.from_text(text=SYSTEM_PROMPT),
                 ],
@@ -529,9 +532,11 @@ class PrecedentAnalysisWorkflow(Workflow):
     """Workflow for analyzing legal precedents."""
     def __init__(self, provider: Any = ModelProvider.OPENAI,
-                 model_name: Any = AnalysisModelName.GPT4o_MINI):
         super().__init__()
-        self.analyzer = LLMAnalyzer(provider, model_name)
     @step
     async def analyze(self, ctx: Context, ev: StartEvent) -> StopEvent:
@@ -612,8 +617,12 @@ def generate_legal_position(
         provider: str,
         model_name: str,
         thinking_enabled: bool = False,
         thinking_level: str = "MEDIUM",
         thinking_budget: int = 10000,
         custom_system_prompt: Optional[str] = None,
         custom_lp_prompt: Optional[str] = None
 ) -> Dict:
@@ -746,17 +755,17 @@ def generate_legal_position(
                 # Set tokens based on model capabilities
                 if is_reasoning_model:
-                    completion_params["max_completion_tokens"] = MAX_TOKENS_CONFIG["openai"]
                 else:
-                    completion_params["max_tokens"] = MAX_TOKENS_CONFIG["openai"]
-                    completion_params["temperature"] = GENERATION_TEMPERATURE
                 # Handle thinking/reasoning for GPT-5.2 and other reasoning models
                 if thinking_enabled and is_reasoning_model:
                     # GPT-5.2 specific parameters
                     if "gpt-5" in model_name.lower():
                         completion_params["reasoning_effort"] = thinking_level.lower()
-                        completion_params["verbosity"] = "medium"  # Can be "low", "medium", "high"
                         completion_params["store"] = False
                     else:
                         # For other reasoning models (gpt-4.1, o1, etc.)
@@ -848,16 +857,15 @@ def generate_legal_position(
                     messages.append({"role": "user", "content": combined_content})
                 else:
                     messages.append({"role": "system", "content": system_prompt})
-                    messages.append({"role": "user", "content": content})
                 completion_params = {
                     "model": model_name,
                     "messages": messages,
-                    "max_tokens": MAX_TOKENS_CONFIG["deepseek"],
                 }
                 if not is_reasoning:
-                    completion_params["temperature"] = GENERATION_TEMPERATURE
                 # Execute with retries
                 for attempt in range(max_retries):
@@ -919,18 +927,25 @@ def generate_legal_position(
             # Prepare message creation parameters
             message_params = {
                 "model": model_name,
-                "max_tokens": MAX_TOKENS_CONFIG["anthropic"],
                 "system": system_prompt,
                 "messages": messages,
-                "temperature": GENERATION_TEMPERATURE
             }
-            # Add thinking config if enabled (only for Claude 4.5+ models)
-            if thinking_enabled and "claude" in model_name.lower() and "-4-5-" in model_name:
-                message_params["thinking"] = {
-                    "type": "enabled",
-                    "budget_tokens": int(thinking_budget)
-                }
             # Retry logic for connection errors
             max_retries = 3
@@ -1029,8 +1044,8 @@ def generate_legal_position(
                 # Build config based on model version
                 config_params = {
-                    "temperature": GENERATION_TEMPERATURE,
-                    "max_output_tokens": MAX_TOKENS_CONFIG["gemini"],
                     "system_instruction": [
                         types.Part.from_text(text=system_prompt),
                     ],
@@ -1207,13 +1222,17 @@ async def analyze_action(
         question: str,
         nodes: List[NodeWithScore],
         provider: str,
-        model_name: str
 ) -> str:
     """Analyze search results using AI."""
     try:
         workflow = PrecedentAnalysisWorkflow(
             provider=ModelProvider(provider),
-            model_name=AnalysisModelName(model_name)
         )
         query = (

 class LLMAnalyzer:
     """Class for handling different LLM providers."""
+    def __init__(self, provider: Any, model_name: Any, temperature: float = GENERATION_TEMPERATURE, max_tokens: Optional[int] = None):
         self.provider = provider
         self.model_name = model_name
+        self.temperature = temperature
+        self.max_tokens = max_tokens
         if provider == ModelProvider.OPENAI:
             if not OPENAI_API_KEY:
             # Reasoning models usually require temperature=1.0 or none
             if not is_reasoning_model:
+                completion_params["temperature"] = self.temperature
             # Add GPT-5.2 specific parameters
             if "gpt-5" in model_val.lower():
             # Use JSON mode and temperature only for non-reasoning models
             if not is_reasoning:
                 completion_params["response_format"] = {'type': 'json_object'}
+                completion_params["temperature"] = self.temperature
             # Retry logic for DeepSeek analysis
             max_retries = 3
         try:
             response = self.client.messages.create(
                 model=self.model_name,
+                max_tokens=self.max_tokens or MAX_TOKENS_ANALYSIS,
+                temperature=self.temperature,
                 system=SYSTEM_PROMPT,
                 messages=[{"role": "user", "content": prompt}]
             )
             ]
             generate_content_config = types.GenerateContentConfig(
+                temperature=self.temperature,
+                max_output_tokens=self.max_tokens or MAX_TOKENS_ANALYSIS,
                 system_instruction=[
                     types.Part.from_text(text=SYSTEM_PROMPT),
                 ],
     """Workflow for analyzing legal precedents."""
     def __init__(self, provider: Any = ModelProvider.OPENAI,
+                 model_name: Any = AnalysisModelName.GPT4o_MINI,
+                 temperature: float = GENERATION_TEMPERATURE,
+                 max_tokens: Optional[int] = None):
         super().__init__()
+        self.analyzer = LLMAnalyzer(provider, model_name, temperature, max_tokens)
     @step
     async def analyze(self, ctx: Context, ev: StartEvent) -> StopEvent:
         provider: str,
         model_name: str,
         thinking_enabled: bool = False,
+        thinking_type: str = "Adaptive",
         thinking_level: str = "MEDIUM",
+        openai_verbosity: str = "medium",
         thinking_budget: int = 10000,
+        temperature: float = GENERATION_TEMPERATURE,
+        max_tokens: Optional[int] = None,
         custom_system_prompt: Optional[str] = None,
         custom_lp_prompt: Optional[str] = None
 ) -> Dict:
                 # Set tokens based on model capabilities
                 if is_reasoning_model:
+                    completion_params["max_completion_tokens"] = max_tokens or MAX_TOKENS_CONFIG["openai"]
                 else:
+                    completion_params["max_tokens"] = max_tokens or MAX_TOKENS_CONFIG["openai"]
+                    completion_params["temperature"] = temperature
                 # Handle thinking/reasoning for GPT-5.2 and other reasoning models
                 if thinking_enabled and is_reasoning_model:
                     # GPT-5.2 specific parameters
                     if "gpt-5" in model_name.lower():
                         completion_params["reasoning_effort"] = thinking_level.lower()
+                        completion_params["verbosity"] = openai_verbosity.lower()
                         completion_params["store"] = False
                     else:
                         # For other reasoning models (gpt-4.1, o1, etc.)
                     messages.append({"role": "user", "content": combined_content})
                 else:
                     messages.append({"role": "system", "content": system_prompt})
                 completion_params = {
                     "model": model_name,
                     "messages": messages,
+                    "max_tokens": max_tokens or MAX_TOKENS_CONFIG["deepseek"],
+                    "frequency_penalty": 0.0,
                 }
                 if not is_reasoning:
+                    completion_params["temperature"] = temperature
                 # Execute with retries
                 for attempt in range(max_retries):
             # Prepare message creation parameters
             message_params = {
                 "model": model_name,
+                "max_tokens": max_tokens or MAX_TOKENS_CONFIG["anthropic"],
                 "system": system_prompt,
                 "messages": messages,
+                "temperature": temperature
             }
+            # Add thinking config if enabled
+            if thinking_enabled and "claude" in model_name.lower():
+                # For Claude 4.6 models, we can use Adaptive
+                if thinking_type.lower() == "adaptive" and getattr(model_name, "find", lambda x: -1)("-4-6") != -1:
+                    message_params["thinking"] = {"type": "adaptive"}
+                    message_params["temperature"] = 1.0
+                else:
+                    # 'Enabled' type works for both 4.5 and 4.6 models
+                    message_params["thinking"] = {
+                        "type": "enabled",
+                        "budget_tokens": max(1024, int(thinking_budget))
+                    }
+                    message_params["temperature"] = 1.0
             # Retry logic for connection errors
             max_retries = 3
                 # Build config based on model version
                 config_params = {
+                    "temperature": temperature,
+                    "max_output_tokens": max_tokens or MAX_TOKENS_CONFIG["gemini"],
                     "system_instruction": [
                         types.Part.from_text(text=system_prompt),
                     ],
         question: str,
         nodes: List[NodeWithScore],
         provider: str,
+        model_name: str,
+        temperature: float = GENERATION_TEMPERATURE,
+        max_tokens: Optional[int] = None
 ) -> str:
     """Analyze search results using AI."""
     try:
         workflow = PrecedentAnalysisWorkflow(
             provider=ModelProvider(provider),
+            model_name=AnalysisModelName(model_name),
+            temperature=temperature,
+            max_tokens=max_tokens
         )
         query = (

prompts.py CHANGED Viewed

@@ -8,7 +8,8 @@ SYSTEM_PROMPT = """<role>
 </role>"""
 # Main prompt template
-LEGAL_POSITION_PROMPT = """<task>
 На основі наданого тексту судового рішення сформулюй правову позицію,
 яка містить:
 1. **Заголовок** — стисле формулювання суті правової позиції
@@ -27,27 +28,35 @@ LEGAL_POSITION_PROMPT = """<task>
 <rules>
 <rule id="abstraction">
-Формулюй правову позицію як АБСТРАКТНЕ ПРАВИЛО, придатне для застосування
 до аналогічних справ. Не згадуй конкретних осіб, назви підприємств,
 дати чи номери справ. Замість цього використовуй узагальнені терміни:
 "особа", "позивач", "відповідач", "суб'єкт владних повноважень", "суд".
 </rule>
-<rule id="legal_references">
-ОБОВ'ЯЗКОВО зберігай посилання на конкретні статті законів (КК, КПК, ЦК, ГК,
-КАС, ЦПК, ГПК тощо). Посилання на статті — це ключова частина правової позиції,
-яка забезпечує її юридичну точність і практичну застосовність.
-Приклад: "відповідно до статті 116 КК України", "за змістом частини 1 статті 463 КПК".
-</rule>
 <rule id="conciseness">
-Текст правової позиції має бути достатньо стислим і лаконічним.
 Кожне слово повинно нести юридичний зміст. Уникай:
 - вступних фраз ("слід зазначити що", "необхідно відмітити");
 - повторення очевидного;
 - зайвих пояснень, які не додають правового змісту.
 </rule>
 <rule id="language">
 Використовуй ВИКЛЮЧНО українську мову. Дотримуйся офіційно-ділового стилю,
 характерного для правових документів Верховного Суду України.
@@ -65,6 +74,7 @@ LEGAL_POSITION_PROMPT = """<task>
 Категорія повинна бути конкретною і по можливості містити посилання на відповідні
 статті кодексів. Категорія описує правову тематику, а не просто тип судочинства.
 </rule>
 </rules>
 <output_format>

 </role>"""
 # Main prompt template
+LEGAL_POSITION_PROMPT = """
+<task>
 На основі наданого тексту судового рішення сформулюй правову позицію,
 яка містить:
 1. **Заголовок** — стисле формулювання суті правової позиції
 <rules>
 <rule id="abstraction">
+Формулюй правову позицію як ПРАВИЛО, придатне для застосування
 до аналогічних справ. Не згадуй конкретних осіб, назви підприємств,
 дати чи номери справ. Замість цього використовуй узагальнені терміни:
 "особа", "позивач", "відповідач", "суб'єкт владних повноважень", "суд".
 </rule>
 <rule id="conciseness">
+Текст правової позиції має бути достатньо стислим і лаконічним (1-2 абзаци).
+Текст правової позиції має бути нормативним та логічно завершеним.
 Кожне слово повинно нести юридичний зміст. Уникай:
 - вступних фраз ("слід зазначити що", "необхідно відмітити");
 - повторення очевидного;
 - зайвих пояснень, які не додають правового змісту.
 </rule>
+<rule id="style_and_legal_technique">
+Уникай надмірної деталізації процесуальних варіантів та повторення тексту закону.
+</rule>
+<rule id="recommended_language_patterns">
+Використовуй типові нормативні конструкції, зокрема:
+- "Суд, вирішуючи питання..., повинен враховувати..."
+- "Сам по собі факт ... не є достатньою підставою для ..."
+- "Оцінка має здійснюватися з урахуванням ..."
+- "Застосування цієї норми передбачає ..."
+- "Відмежування ... від ... має вирішальне значення для правильної правової кваліфікації"
+- "Такий підхід забезпечує дотримання принципу ..."
+</rule>
 <rule id="language">
 Використовуй ВИКЛЮЧНО українську мову. Дотримуйся офіційно-ділового стилю,
 характерного для правових документів Верховного Суду України.
 Категорія повинна бути конкретною і по можливості містити посилання на відповідні
 статті кодексів. Категорія описує правову тематику, а не просто тип судочинства.
 </rule>
 </rules>
 <output_format>

test_anthropic_rest.py ADDED Viewed

	@@ -0,0 +1,51 @@

+#!/usr/bin/env python3
+import os
+import httpx
+import json
+from dotenv import load_dotenv
+load_dotenv()
+def test_rest():
+    api_key = os.getenv("ANTHROPIC_API_KEY")
+    url = "https://api.anthropic.com/v1/messages"
+    headers = {
+        "x-api-key": api_key,
+        "anthropic-version": "2023-06-01",
+        "anthropic-beta": "output-128k-2025-02-19", # test if needed
+        "content-type": "application/json"
+    }
+    payload = {
+        "model": "claude-opus-4-6",
+        "max_tokens": 4000,
+        "messages": [{"role": "user", "content": "Write a short poem about justice in 4 lines."}],
+        "temperature": 1.0,
+        "thinking": {"type": "adaptive"}
+    }
+    # Also test effort
+    payload_effort = {
+        "model": "claude-opus-4-6",
+        "max_tokens": 4000,
+        "messages": [{"role": "user", "content": "Write a short poem about justice in 4 lines."}],
+        "temperature": 1.0,
+        "thinking": {"type": "adaptive", "effort": "low"}
+    }
+    client = httpx.Client(timeout=30.0)
+    print("Testing adaptive without effort...")
+    r = client.post(url, headers=headers, json=payload)
+    print("Status:", r.status_code)
+    if r.status_code != 200:
+        print(r.json())
+    print("\nTesting adaptive with effort parameter...")
+    r = client.post(url, headers=headers, json=payload_effort)
+    print("Status:", r.status_code)
+    if r.status_code != 200:
+        print(r.json())
+if __name__ == "__main__":
+    test_rest()