Spaces:

Browen0311
/

WritingScore

Sleeping

App Files Files Community

Browen0311 commited on Nov 20, 2024

Commit

53e2dbe

verified ·

1 Parent(s): e5cd568

Update app.py

Browse files

Files changed (1) hide show

app.py +119 -49

app.py CHANGED Viewed

@@ -13,15 +13,56 @@ except ImportError:
 openai_client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))
 groq_client = Groq(api_key=os.getenv('groq_key'))
-# 模型設定
-OPENAI_MODELS = ["gpt-3.5-turbo", "gpt-4", "gpt-4-turbo"]
 GROQ_MODELS = ["llama3-8b-8192", "gemma2-9b-it"]
 MODEL_CONFIGS = {
     "openai": {
-        "gpt-3.5-turbo": {"max_tokens": 4096, "temperature": 0.7},
-        "gpt-4": {"max_tokens": 8192, "temperature": 0.7},
-        "gpt-4-turbo": {"max_tokens": 4096, "temperature": 0.7}
     },
     "groq": {
         "llama3-8b-8192": {"max_tokens": 4090, "temperature": 0.7},
@@ -30,31 +71,45 @@ MODEL_CONFIGS = {
 }
 def get_llm_response(prompt, provider, model):
-    if provider == "openai":
-        response = openai_client.chat.completions.create(
-            model=model,
-            messages=[
-                {"role": "system", "content": "你是一位資深的國文作文評閱委員，請依據提供的評分規準進行評分。"},
-                {"role": "user", "content": prompt}
-            ],
-            **MODEL_CONFIGS["openai"][model]
-        )
-        return response.choices[0].message.content
-    else:  # groq
-        completion = groq_client.chat.completions.create(
-            model=model,
-            messages=[
-                {"role": "system", "content": "你是一位資深的國文作文評閱委員，請依據提供的評分規準進行評分。"},
-                {"role": "user", "content": prompt}
-            ],
-            **MODEL_CONFIGS["groq"][model],
-            stream=False,
-            top_p=1,
-            stop=None
-        )
-        return completion.choices[0].message.content
 def evaluate_essay(message, additional_prompt, provider, model):
     if not message.strip():
         return [], gr.Markdown("### 請輸入作文內容進行評分")
@@ -88,7 +143,7 @@ def evaluate_essay(message, additional_prompt, provider, model):
 {additional_prompt if additional_prompt else ''}
-請依三等九級制（A+、A、A-、B+、B、B-、C+、C、C-）評分，並提供簡短評語。
 如果是缺考、未作答、完全文不對題或作答內容完全照抄試題，請給予0分。
 請按以下格式回覆：
@@ -118,9 +173,22 @@ def evaluate_essay(message, additional_prompt, provider, model):
             all_feedback[criterion] = feedback
         for criterion in criteria:
             history.append(("", all_feedback[criterion]))
         total_score_display = f"""
 # 總評分結果
 ## 使用模型：{provider} ({model})
@@ -132,10 +200,10 @@ def evaluate_essay(message, additional_prompt, provider, model):
     except Exception as e:
         return [("", f"評分過程發生錯誤：{str(e)}")], gr.Markdown("### ❌ 評分失敗")
-# 模型選擇切換函數
 def update_model_choices(provider):
     if provider == "openai":
-        return gr.Dropdown(choices=OPENAI_MODELS, value="gpt-3.5-turbo")
     else:
         return gr.Dropdown(choices=GROQ_MODELS, value="llama3-8b-8192")
@@ -145,25 +213,26 @@ with gr.Blocks(title="國文作文自動評分系統") as demo:
     # 國文作文自動評分系統
     ## 評分標準說明
     本系統採用以下四個面向進行評分：
-    - 題旨發揮 (40%)
-    - 資料掌握 (20%)
-    - 結構安排 (20%)
-    - 字句運用 (20%)
     評分採用三等九級制（A+、A、A-、B+、B、B-、C+、C、C-）
     """)
     # 輸入區塊
-    msg = gr.Textbox(
-        label="請輸入作文內容",
-        placeholder="在此輸入作文...",
-        lines=6
-    )
-    additional_prompt = gr.Textbox(
-        label="額外評分提示（選填）",
-        placeholder="可輸入額外的評分要求或提示...",
-        lines=2
-    )
     # 模型選擇
     with gr.Row():
@@ -175,7 +244,7 @@ with gr.Blocks(title="國文作文自動評分系統") as demo:
         model = gr.Dropdown(
             choices=OPENAI_MODELS,
             label="選擇模型",
-            value="gpt-3.5-turbo",
             interactive=True
         )
@@ -212,9 +281,10 @@ with gr.Blocks(title="國文作文自動評分系統") as demo:
         outputs=[chatbot, score_display]
     )
     clear.click(
-        lambda: [None, None, "openai", "gpt-3.5-turbo", [], gr.Markdown("### 等待評分...")],
         outputs=[msg, additional_prompt, provider, model, chatbot, score_display]
     )
 # 啟動應用
-demo.launch()

 openai_client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))
 groq_client = Groq(api_key=os.getenv('groq_key'))
+# 更新後的模型設定，包含最新的模型
+OPENAI_MODELS = [
+    # GPT-4o 系列
+    "gpt-4o",                    # 最新的旗艦模型
+    "gpt-4o-2024-08-06",        # 支援結構化輸出的版本
+    "gpt-4o-mini",              # 輕量快速版本
+    "chatgpt-4o-latest",        # ChatGPT使用的持續更新版本
+    # GPT-4 Turbo 系列
+    "gpt-4-turbo",              # 最新的GPT-4 Turbo
+    "gpt-3.5-turbo",            # GPT-3.5 Turbo
+]
 GROQ_MODELS = ["llama3-8b-8192", "gemma2-9b-it"]
 MODEL_CONFIGS = {
     "openai": {
+        # GPT-4o 系列配置
+        "gpt-4o": {
+            "max_tokens": 16384,
+            "temperature": 0.7,
+            "context_window": 128000
+        },
+        "gpt-4o-2024-08-06": {
+            "max_tokens": 16384,
+            "temperature": 0.7,
+            "context_window": 128000
+        },
+        "gpt-4o-mini": {
+            "max_tokens": 16384,
+            "temperature": 0.7,
+            "context_window": 128000
+        },
+        "chatgpt-4o-latest": {
+            "max_tokens": 16384,
+            "temperature": 0.7,
+            "context_window": 128000
+        },
+        # GPT-4 Turbo 系列配置
+        "gpt-4-turbo": {
+            "max_tokens": 4096,
+            "temperature": 0.7,
+            "context_window": 128000
+        },
+        "gpt-3.5-turbo": {
+            "max_tokens": 4096,
+            "temperature": 0.7,
+            "context_window": 16385
+        }
     },
     "groq": {
         "llama3-8b-8192": {"max_tokens": 4090, "temperature": 0.7},
 }
 def get_llm_response(prompt, provider, model):
+    """獲取LLM回應的函數"""
+    try:
+        if provider == "openai":
+            response = openai_client.chat.completions.create(
+                model=model,
+                messages=[
+                    {"role": "system", "content": """你是一位資深的國文作文評閱委員，請依據以下評分規準進行評分：
+                    1. 題旨發揮 (40%): 檢視作文是否切合題目要求、思路清晰、感發得宜、體悟深刻
+                    2. 資料掌握 (20%): 評估材料運用是否恰當、例證是否充實
+                    3. 結構安排 (20%): 審視文章結構是否完整、條理是否分明
+                    4. 字句運用 (20%): 考察遣詞造句是否精確、修辭是否優美
+                    請依三等九級制（A+、A、A-、B+、B、B-、C+、C、C-）評分。
+                    若有缺考、未作答、完全文不對題或作答內容完全照抄試題者，則給予0分。
+                    """},
+                    {"role": "user", "content": prompt}
+                ],
+                temperature=MODEL_CONFIGS["openai"][model]["temperature"],
+                max_tokens=MODEL_CONFIGS["openai"][model]["max_tokens"]
+            )
+            return response.choices[0].message.content
+        else:  # groq
+            completion = groq_client.chat.completions.create(
+                model=model,
+                messages=[
+                    {"role": "system", "content": "你是一位資深的國文作文評閱委員，請依據提供的評分規準進行評分。"},
+                    {"role": "user", "content": prompt}
+                ],
+                **MODEL_CONFIGS["groq"][model],
+                stream=False,
+                top_p=1,
+                stop=None
+            )
+            return completion.choices[0].message.content
+    except Exception as e:
+        return f"評分過程發生錯誤：{str(e)}"
 def evaluate_essay(message, additional_prompt, provider, model):
+    """評估作文的主函數"""
     if not message.strip():
         return [], gr.Markdown("### 請輸入作文內容進行評分")
 {additional_prompt if additional_prompt else ''}
+請依三等九級制（A+、A、A-、B+、B、B-、C+、C、C-）評分，並提供詳細評語。
 如果是缺考、未作答、完全文不對題或作答內容完全照抄試題，請給予0分。
 請按以下格式回覆：
             all_feedback[criterion] = feedback
+        # 添加各項評分到歷史記錄
         for criterion in criteria:
             history.append(("", all_feedback[criterion]))
+        # 生成總評
+        total_evaluation = """
+### 綜合評語
+本作文各項得分如下：
+"""
+        for criterion, details in criteria.items():
+            total_evaluation += f"- {criterion}：{all_feedback[criterion].split('得分**：')[1].split('/')[0]}/{details['max_score']}\n"
+        total_evaluation += f"\n### 總分：{total_score:.1f}/100"
+        history.append(("", total_evaluation))
         total_score_display = f"""
 # 總評分結果
 ## 使用模型：{provider} ({model})
     except Exception as e:
         return [("", f"評分過程發生錯誤：{str(e)}")], gr.Markdown("### ❌ 評分失敗")
 def update_model_choices(provider):
+    """更新模型選擇的函數"""
     if provider == "openai":
+        return gr.Dropdown(choices=OPENAI_MODELS, value="gpt-4o")
     else:
         return gr.Dropdown(choices=GROQ_MODELS, value="llama3-8b-8192")
     # 國文作文自動評分系統
     ## 評分標準說明
     本系統採用以下四個面向進行評分：
+    - 題旨發揮 (40%): 檢視作文是否切合題目要求、思路清晰、感發得宜、體悟深刻
+    - 資料掌握 (20%): 評估材料運用是否恰當、例證是否充實
+    - 結構安排 (20%): 審視文章結構是否完整、條理是否分明
+    - 字句運用 (20%): 考察遣詞造句是否精確、修辭是否優美
     評分採用三等九級制（A+、A、A-、B+、B、B-、C+、C、C-）
     """)
     # 輸入區塊
+    with gr.Column():
+        msg = gr.Textbox(
+            label="請輸入作文內容",
+            placeholder="在此輸入作文...",
+            lines=10
+        )
+        additional_prompt = gr.Textbox(
+            label="額外評分提示（選填）",
+            placeholder="可輸入額外的評分要求或提示...",
+            lines=2
+        )
     # 模型選擇
     with gr.Row():
         model = gr.Dropdown(
             choices=OPENAI_MODELS,
             label="選擇模型",
+            value="gpt-4o",
             interactive=True
         )
         outputs=[chatbot, score_display]
     )
     clear.click(
+        lambda: [None, None, "openai", "gpt-4o", [], gr.Markdown("### 等待評分...")],
         outputs=[msg, additional_prompt, provider, model, chatbot, score_display]
     )
 # 啟動應用
+if __name__ == "__main__":
+    demo.launch()