yomitalk

Sleeping

KyosukeIchikawa commited on May 19, 2025

Commit

3defe25

1 Parent(s): 7d0716d

Update Gemini model and app to support increased maximum token limit

Files changed (3) hide show

tests/unit/test_gemini_model.py CHANGED Viewed

@@ -21,7 +21,7 @@ class TestGeminiModel(unittest.TestCase):
         """Test model initialization."""
         self.assertIsNotNone(self.model)
         self.assertEqual(self.model.model_name, "gemini-2.5-flash-preview-04-17")
-        self.assertEqual(self.model.max_tokens, 8192)
         self.assertDictEqual(self.model.last_token_usage, {})
     def test_set_api_key(self):
@@ -42,7 +42,7 @@ class TestGeminiModel(unittest.TestCase):
         """Test getting available models."""
         models = self.model.get_available_models()
         self.assertIsInstance(models, list)
-        self.assertIn("gemini-2.0-flash", models)
         self.assertIn("gemini-2.5-flash-preview-04-17", models)
         self.assertIn("gemini-2.5-pro-preview-05-06", models)
@@ -79,7 +79,7 @@ class TestGeminiModel(unittest.TestCase):
         self.assertFalse(result)
         self.assertEqual(1000, self.model.max_tokens)  # 変更されない
-        result = self.model.set_max_tokens(40000)
         self.assertFalse(result)
         self.assertEqual(1000, self.model.max_tokens)  # 変更されない

         """Test model initialization."""
         self.assertIsNotNone(self.model)
         self.assertEqual(self.model.model_name, "gemini-2.5-flash-preview-04-17")
+        self.assertEqual(self.model.max_tokens, 65536)
         self.assertDictEqual(self.model.last_token_usage, {})
     def test_set_api_key(self):
         """Test getting available models."""
         models = self.model.get_available_models()
         self.assertIsInstance(models, list)
+        self.assertIn("gemini-2.5-pro-preview-05-06", models)
         self.assertIn("gemini-2.5-flash-preview-04-17", models)
         self.assertIn("gemini-2.5-pro-preview-05-06", models)
         self.assertFalse(result)
         self.assertEqual(1000, self.model.max_tokens)  # 変更されない
+        result = self.model.set_max_tokens(80000)
         self.assertFalse(result)
         self.assertEqual(1000, self.model.max_tokens)  # 変更されない

yomitalk/app.py CHANGED Viewed

@@ -503,7 +503,7 @@ class PaperPodcastApp:
                             with gr.Row():
                                 gemini_max_tokens_slider = gr.Slider(
                                     minimum=100,
-                                    maximum=30720,
                                     value=self.get_gemini_max_tokens(),
                                     step=100,
                                     label="最大トークン数",

                             with gr.Row():
                                 gemini_max_tokens_slider = gr.Slider(
                                     minimum=100,
+                                    maximum=65536,
                                     value=self.get_gemini_max_tokens(),
                                     step=100,
                                     label="最大トークン数",

yomitalk/models/gemini_model.py CHANGED Viewed

@@ -24,13 +24,12 @@ class GeminiModel:
         # 利用可能なモデルのリスト
         self._available_models = [
-            "gemini-2.0-flash",
             "gemini-2.5-flash-preview-04-17",
             "gemini-2.5-pro-preview-05-06",
         ]
         # デフォルトの最大トークン数
-        self.max_tokens: int = 8192
         # トークン使用状況の初期化
         self.last_token_usage: Dict[str, int] = {}
@@ -81,7 +80,7 @@ class GeminiModel:
             max_tokens_int = int(max_tokens)
             if max_tokens_int < 100:
                 return False
-            if max_tokens_int > 30720:  # Geminiの最大値
                 return False
             self.max_tokens = max_tokens_int

         # 利用可能なモデルのリスト
         self._available_models = [
             "gemini-2.5-flash-preview-04-17",
             "gemini-2.5-pro-preview-05-06",
         ]
         # デフォルトの最大トークン数
+        self.max_tokens: int = 65536
         # トークン使用状況の初期化
         self.last_token_usage: Dict[str, int] = {}
             max_tokens_int = int(max_tokens)
             if max_tokens_int < 100:
                 return False
+            if max_tokens_int > 65536:  # Geminiの最大値
                 return False
             self.max_tokens = max_tokens_int