work1

Sleeping

App Files Files Community

txh17 commited on Jun 28, 2025

Commit

ce873b2

verified ·

1 Parent(s): 39e5ba2

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -21

app.py CHANGED Viewed

@@ -1,5 +1,4 @@
 import gradio as gr
 import pandas as pd
 import plotly.graph_objects as go
 import plotly.express as px
@@ -9,6 +8,7 @@ from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 import torch
 import json
 import re
 # 选择三个小型文本生成模型
 MODEL_CONFIGS = {
@@ -37,6 +37,7 @@ class TextGenerationComparator:
         self.models = {}
         self.tokenizers = {}
         self.load_models()
     def load_models(self):
         """加载所有文本生成模型"""
@@ -58,11 +59,26 @@ class TextGenerationComparator:
                 # 创建一个mock模型用于演示
                 self.models[model_key] = None
     def generate_text(self, model_key, prompt, max_length=50, temperature=0.7, top_p=0.9):
         """使用指定模型生成文本"""
         if self.models[model_key] is None:
             return {
-                "generated_text": f"[模型 {model_key} 未正确加载，这是模拟输出] {prompt} 这是一个模拟的文本续写...",
                 "inference_time": 0.5,
                 "input_length": len(prompt.split()),
                 "output_length": max_length,
@@ -91,16 +107,19 @@ class TextGenerationComparator:
             end_time = time.time()
             # 提取生成的文本（去除原始prompt）
-            generated_text = result[0]['generated_text']
-            if generated_text.startswith(prompt):
-                generated_text = generated_text[len(prompt):].strip()
             return {
-                "generated_text": generated_text,
-                "full_text": result[0]['generated_text'],
                 "inference_time": round(end_time - start_time, 3),
                 "input_length": len(prompt.split()),
-                "output_length": len(generated_text.split()),
                 "parameters": {
                     "temperature": temperature,
                     "top_p": top_p,
@@ -122,7 +141,7 @@ comparator = TextGenerationComparator()
 def run_text_generation_comparison(prompt, max_length, temperature, top_p):
     """运行所有模型的文本生成对比"""
     if not prompt.strip():
-        return "请输入提示文本", "请输入提示文本", "请输入提示文本"
     results = {}
@@ -141,10 +160,11 @@ def run_text_generation_comparison(prompt, max_length, temperature, top_p):
         if "error" in result:
             return json.dumps(result, indent=2, ensure_ascii=False)
         formatted = {
             "生成文本": result["generated_text"],
             "推断时间": f"{result['inference_time']}s",
-            "生成Token数": result["output_length"],
             "生成速度": f"{result['output_length']/max(result['inference_time'], 0.001):.1f} tokens/s"
         }
         return json.dumps(formatted, indent=2, ensure_ascii=False)
@@ -302,13 +322,13 @@ def create_summary_scores_table():
     df = pd.DataFrame(summary_data)
     return df
-# 预设的示例提示
 EXAMPLE_PROMPTS = [
-    "很久很久以前，在一个魔法森林里，",
-    "人工智能的未来是",
-    "在2050年，人们将会",
-    "我学到的最重要的一课是",
-    "科技改变了我们的生活，因为"
 ]
 def create_app():
@@ -320,22 +340,22 @@ def create_app():
             # Arena选项卡
             with gr.TabItem("🏟️ 生成竞技场"):
                 gr.Markdown("## 文本生成竞技场")
-                gr.Markdown("输入一个提示文本，查看不同GPT-2模型如何续写。")
                 with gr.Row():
                     with gr.Column(scale=3):
                         input_prompt = gr.Textbox(
-                            label="输入提示文本",
-                            placeholder="请在这里输入您的文本提示...",
                             lines=3,
-                            value="很久很久以前，在一个数字世界里，"
                         )
                         # 预设示例按钮
                         with gr.Row():
                             example_buttons = []
                             for i, example in enumerate(EXAMPLE_PROMPTS[:3]):
-                                btn = gr.Button(f"示例 {i+1}", size="sm")
                                 example_buttons.append(btn)
                     with gr.Column(scale=1):

 import gradio as gr
 import pandas as pd
 import plotly.graph_objects as go
 import plotly.express as px
 import torch
 import json
 import re
+from googletrans import Translator # 导入翻译库
 # 选择三个小型文本生成模型
 MODEL_CONFIGS = {
         self.models = {}
         self.tokenizers = {}
         self.load_models()
+        self.translator = Translator() # 初始化翻译器
     def load_models(self):
         """加载所有文本生成模型"""
                 # 创建一个mock模型用于演示
                 self.models[model_key] = None
+    def translate_to_chinese(self, text):
+        """将文本翻译成中文"""
+        try:
+            # 尝试翻译，如果原文是中文则不翻译
+            if re.search(r'[\u4e00-\u9fff]', text): # 检查是否包含中文字符
+                return text
+            translation = self.translator.translate(text, dest='zh-cn')
+            return translation.text
+        except Exception as e:
+            print(f"翻译失败: {e}")
+            return text # 翻译失败时返回原文
     def generate_text(self, model_key, prompt, max_length=50, temperature=0.7, top_p=0.9):
         """使用指定模型生成文本"""
         if self.models[model_key] is None:
+            # 模拟输出也翻译成中文
+            mock_output_en = f"[Model {model_key} not loaded correctly, this is a simulated output] {prompt} and this is a sample continuation of the text..."
+            mock_output_zh = self.translate_to_chinese(mock_output_en)
             return {
+                "generated_text": mock_output_zh,
                 "inference_time": 0.5,
                 "input_length": len(prompt.split()),
                 "output_length": max_length,
             end_time = time.time()
             # 提取生成的文本（去除原始prompt）
+            generated_text_en = result[0]['generated_text']
+            if generated_text_en.startswith(prompt):
+                generated_text_en = generated_text_en[len(prompt):].strip()
+            # 将生成的英文文本翻译成中文
+            generated_text_zh = self.translate_to_chinese(generated_text_en)
             return {
+                "generated_text": generated_text_zh, # 返回中文文本
+                "full_text": self.translate_to_chinese(result[0]['generated_text']), # 完整文本也翻译
                 "inference_time": round(end_time - start_time, 3),
                 "input_length": len(prompt.split()),
+                "output_length": len(generated_text_zh.split()), # 基于中文文本长度
                 "parameters": {
                     "temperature": temperature,
                     "top_p": top_p,
 def run_text_generation_comparison(prompt, max_length, temperature, top_p):
     """运行所有模型的文本生成对比"""
     if not prompt.strip():
+        return "Please enter a prompt.", "Please enter a prompt.", "Please enter a prompt." # 提示文本为英文
     results = {}
         if "error" in result:
             return json.dumps(result, indent=2, ensure_ascii=False)
+        # 这里的键名保留中文，值会是中文
         formatted = {
             "生成文本": result["generated_text"],
             "推断时间": f"{result['inference_time']}s",
+            "生成Token数": result["output_length"], # 这里的token数可能因为翻译导致不准确，但保留原逻辑
             "生成速度": f"{result['output_length']/max(result['inference_time'], 0.001):.1f} tokens/s"
         }
         return json.dumps(formatted, indent=2, ensure_ascii=False)
     df = pd.DataFrame(summary_data)
     return df
+# 预设的示例提示（英文）
 EXAMPLE_PROMPTS = [
+    "Once upon a time in a magical forest,",
+    "The future of artificial intelligence is",
+    "In the year 2050, people will",
+    "The most important lesson I learned was",
+    "Technology has changed our lives by"
 ]
 def create_app():
             # Arena选项卡
             with gr.TabItem("🏟️ 生成竞技场"):
                 gr.Markdown("## 文本生成竞技场")
+                gr.Markdown("输入一个**英文**提示文本，查看不同GPT-2模型如何续写，续写结果将翻译成中文显示。")
                 with gr.Row():
                     with gr.Column(scale=3):
                         input_prompt = gr.Textbox(
+                            label="Input Prompt (英文提示文本)", # 标签为英文
+                            placeholder="Please enter your English text prompt here...", # 占位符为英文
                             lines=3,
+                            value="Once upon a time in a digital world," # 初始值为英文
                         )
                         # 预设示例按钮
                         with gr.Row():
                             example_buttons = []
                             for i, example in enumerate(EXAMPLE_PROMPTS[:3]):
+                                btn = gr.Button(f"Example {i+1}", size="sm")
                                 example_buttons.append(btn)
                     with gr.Column(scale=1):