prelington
/

Sentinel

Model card Files Files and versions

prelington commited on Oct 2, 2025

Commit

6a5fe57

·

verified ·

1 Parent(s): de4a3df

Update inference.py

Files changed (1) hide show

inference.py +11 -39

inference.py CHANGED Viewed

@@ -1,42 +1,14 @@
-from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
-def load_model(model_name="your-username/sentinel"):
-    """
-    Load Sentinel model and tokenizer.
-    """
-    print(f"Loading {model_name}...")
-    tokenizer = AutoTokenizer.from_pretrained(model_name)
-    model = AutoModelForCausalLM.from_pretrained(
-        model_name,
-        device_map="auto",   # Uses GPU if available
-        trust_remote_code=True
-    )
-    generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
-    return generator
-def code_with_sentinel(prompt, generator, max_new_tokens=200):
-    """
-    Generate code from a natural language prompt.
-    """
-    print(f"\nPrompt: {prompt}\n")
-    output = generator(
-        prompt,
-        max_new_tokens=max_new_tokens,
-        do_sample=True,
-        top_p=0.9,
-        temperature=0.7,
-        eos_token_id=generator.tokenizer.eos_token_id
-    )
-    result = output[0]["generated_text"]
-    # Return only new code, not the full prompt
-    return result[len(prompt):].strip()
 if __name__ == "__main__":
-    # Example usage
-    generator = load_model("your-username/sentinel")
-    prompt = "Write a Python function that checks if a number is prime."
-    code = code_with_sentinel(prompt, generator)
-    print("Generated Code:\n")
-    print(code)

+import argparse
+from model_loader import load_model
+from generator import generate_code
+from utils import pretty_print_code
 if __name__ == "__main__":
+    parser = argparse.ArgumentParser(description="Run Sentinel for code generation")
+    parser.add_argument("prompt", type=str, help="The coding prompt to generate code for")
+    parser.add_argument("--max_new_tokens", type=int, default=200, help="Maximum tokens to generate")
+    args = parser.parse_args()
+    generator = load_model("your-username/sentinel")
+    code = generate_code(args.prompt, generator, max_new_tokens=args.max_new_tokens)
+    pretty_print_code(code)