Spaces:

xl2533
/

MakeInstruction

Runtime error

DSXiangLi commited on Apr 9, 2023

Commit

8bfb070

1 Parent(s): 1820e5d

a

Files changed (2) hide show

self/generate.py CHANGED Viewed

@@ -35,7 +35,8 @@ class SELF(object):
     def __init__(self, seed_file, openai_key, n_human, n_machine, n_instruct, prompt):
         self.llm = OpenAI(openai_api_key=openai_key, temperature=1,
                           stop=[f'\n{n_instruct}', '{n_instruct}', '{n_instruct}.'],  # 当已生成足够的指令则停止
-                          logit_bias={'50259': -100}  # 不生成最后的停止符#
                           )  # 默认davinci-003
         self.n_human, self.n_machine, self.n_instruct = n_human, n_machine, n_instruct
         self.n_gen, self.n_keep = 0, 0
@@ -97,6 +98,8 @@ class SELF(object):
     def decode_response(self, response):
         if response is None:
             return []
         raw_instruct = SELF.prefix.format(id=self.first_id) + response['text']
         raw_instruct = raw_instruct.split('###')
         instruction_data = []
@@ -153,7 +156,8 @@ class SELF(object):
         return keep_instruction
     def step(self):
-        new_instruct_data = self.generate()
         keep_instruct_data = self.sim_filter(new_instruct_data)
         self.n_gen += len(new_instruct_data)
         self.n_keep += len(keep_instruct_data)

     def __init__(self, seed_file, openai_key, n_human, n_machine, n_instruct, prompt):
         self.llm = OpenAI(openai_api_key=openai_key, temperature=1,
                           stop=[f'\n{n_instruct}', '{n_instruct}', '{n_instruct}.'],  # 当已生成足够的指令则停止
+                          logit_bias={'50259': -100}, # 不生成最后的停止符#
+                          max_tokens=-1
                           )  # 默认davinci-003
         self.n_human, self.n_machine, self.n_instruct = n_human, n_machine, n_instruct
         self.n_gen, self.n_keep = 0, 0
     def decode_response(self, response):
         if response is None:
             return []
+        if '###' not in response['text']:
+            return []
         raw_instruct = SELF.prefix.format(id=self.first_id) + response['text']
         raw_instruct = raw_instruct.split('###')
         instruction_data = []
         return keep_instruction
     def step(self):
+        response = self.generate()
+        new_instruct_data = self.decode_response(response)
         keep_instruct_data = self.sim_filter(new_instruct_data)
         self.n_gen += len(new_instruct_data)
         self.n_keep += len(keep_instruct_data)

self/prompt.py CHANGED Viewed

@@ -2,7 +2,7 @@
 import re
 #20个简化成5个
-self_prompt = """你需要想出{n_instruct}个不同的任务指令。这些任务指令将输入GPT模型，我们将评估GPT模型完成指令的情况。
 以下是要求：
 1. 尽量不要在每个指令中重复使用动词，以最大化多样性
 2. 指令的表达形式需要多样化。例如你可以把问题和祈使句结合起来

 import re
 #20个简化成5个
+self_prompt = """你需要想出{n_instruct}个医学相关不同的任务指令。这些任务指令将输入GPT模型，我们将评估GPT模型完成指令的情况。
 以下是要求：
 1. 尽量不要在每个指令中重复使用动词，以最大化多样性
 2. 指令的表达形式需要多样化。例如你可以把问题和祈使句结合起来