Spaces:

a0ms1n
/

AI-Code-Detector_for-Competitive-Programming

Running

a0ms1n commited on Jun 5, 2025

Commit

cd68abb

1 Parent(s): e6e78f1

Update model to V.0.5.3

Files changed (8) hide show

{Model-V0.5.1 → Model-V0.5.3}/config.json RENAMED Viewed

@@ -10,14 +10,14 @@
   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "id2label": {
-    "0": "Human",
-    "1": "AI"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
-    "AI": 1,
-    "Human": 0
   },
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,
@@ -29,7 +29,7 @@
   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
-  "transformers_version": "4.52.2",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50265

   "hidden_dropout_prob": 0.1,
   "hidden_size": 768,
   "id2label": {
+    "0": "AI",
+    "1": "Human"
   },
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "label2id": {
+    "AI": 0,
+    "Human": 1
   },
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,
   "position_embedding_type": "absolute",
   "problem_type": "single_label_classification",
   "torch_dtype": "float32",
+  "transformers_version": "4.52.3",
   "type_vocab_size": 1,
   "use_cache": true,
   "vocab_size": 50265

{Model-V0.5.1 → Model-V0.5.3}/merges.txt RENAMED Viewed

File without changes

{Model-V0.5.1 → Model-V0.5.3}/special_tokens_map.json RENAMED Viewed

File without changes

{Model-V0.5.1 → Model-V0.5.3}/tokenizer.json RENAMED Viewed

File without changes

{Model-V0.5.1 → Model-V0.5.3}/tokenizer_config.json RENAMED Viewed

File without changes

Model-V0.5.3/training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5aa5a076c150d5c02aac3d0571d3ace496160b6ab102fbec8f48ae9b4ccc0cf1
+size 5304

{Model-V0.5.1 → Model-V0.5.3}/vocab.json RENAMED Viewed

File without changes

Model_Evaluate.py CHANGED Viewed

@@ -6,7 +6,7 @@ import subprocess
 import shutil
 import torch
-model_path = "Model-V0.5.1"
 tokenizer = AutoTokenizer.from_pretrained(model_path)
 config = AutoConfig.from_pretrained(model_path)
 model = AutoModelForSequenceClassification.from_pretrained(model_path, config=config)
@@ -16,7 +16,8 @@ label2id = model.config.label2id
 import re
 preprocessor_pattern = re.compile(r'^\s*#.*$', re.MULTILINE)
 block_comment_pattern = re.compile(r'/\*.*?\*/', re.DOTALL)
-using_namespace_pattern = re.compile(r'^\s*using\s+namespace\s+[a-zA-Z_][a-zA-Z0-9_:]*\s*;', re.MULTILINE)
 line_comment_pattern = re.compile(r'//.*')
 def remove_comments(code):
@@ -26,7 +27,9 @@ def remove_comments(code):
 def replace_preprocessor(code):
     code = preprocessor_pattern.sub('<PREPROCESSOR>', code)
-    return using_namespace_pattern.sub('<NAMESPACE>', code)
 def strip_lines(text, max_blank_lines=0):
     text += '\n'
@@ -42,12 +45,12 @@ def strip_lines(text, max_blank_lines=0):
             kept.append(line)
     return '\n'.join(kept)
-paren_brace_space_pattern = re.compile(r'\([^\)]*\)\s+\{')
 multiline_function_pattern = re.compile(r'(\([^\)]*\))\s*\n\s*\{')
 def normalize_braces(code):
     code = multiline_function_pattern.sub(r'\1{', code)
-    # code = paren_brace_space_pattern.sub('(){', code)
     return code
 def format_cpp(code: str, style: str = "Google") -> str:

 import shutil
 import torch
+model_path = "Model-V0.5.3"
 tokenizer = AutoTokenizer.from_pretrained(model_path)
 config = AutoConfig.from_pretrained(model_path)
 model = AutoModelForSequenceClassification.from_pretrained(model_path, config=config)
 import re
 preprocessor_pattern = re.compile(r'^\s*#.*$', re.MULTILINE)
 block_comment_pattern = re.compile(r'/\*.*?\*/', re.DOTALL)
+using_pattern = re.compile(r'^\s*using\s+[^\n;]+;', re.MULTILINE)
+typedef_pattern = re.compile(r'^\s*typedef\s+[^\n;]+;', re.MULTILINE)
 line_comment_pattern = re.compile(r'//.*')
 def remove_comments(code):
 def replace_preprocessor(code):
     code = preprocessor_pattern.sub('<PREPROCESSOR>', code)
+    code = using_pattern.sub('<PREPROCESSOR>', code)
+    code = typedef_pattern.sub('<PREPROCESSOR>',code)
+    return code
 def strip_lines(text, max_blank_lines=0):
     text += '\n'
             kept.append(line)
     return '\n'.join(kept)
+space_braces_function_pattern = re.compile(r'(\([^\)]*\))\s*\{')
 multiline_function_pattern = re.compile(r'(\([^\)]*\))\s*\n\s*\{')
 def normalize_braces(code):
     code = multiline_function_pattern.sub(r'\1{', code)
+    code = space_braces_function_pattern.sub(r'\1{',code)
     return code
 def format_cpp(code: str, style: str = "Google") -> str: