Spaces:

pradeep4321
/

sample_coder

Sleeping

App Files Files Community

pradeep4321 commited on Apr 15

Commit

b52f1c2

verified ·

1 Parent(s): 967d7c5

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +42 -37

src/streamlit_app.py CHANGED Viewed

@@ -1,20 +1,20 @@
 import streamlit as st
 import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
 # ==============================
 # PAGE CONFIG
 # ==============================
 st.set_page_config(page_title="💻 AI Code Generator", layout="wide")
-st.title("💻 AI Code Generator (Stable Version)")
 # ==============================
-# LOAD MODEL (SAFE)
 # ==============================
 @st.cache_resource
 def load_model():
-    model_name = "deepseek-ai/deepseek-coder-1.3b-instruct"  # ✅ HF Free Safe
     tokenizer = AutoTokenizer.from_pretrained(model_name)
@@ -26,33 +26,42 @@ def load_model():
     model.eval()
     return tokenizer, model
-# Load with spinner (IMPORTANT)
-with st.spinner("🔄 Loading AI model... Please wait"):
     tokenizer, model = load_model()
 st.success("✅ Model Loaded Successfully")
 # ==============================
-# CLEAN OUTPUT
 # ==============================
-def clean_code(code):
-    code = code.strip()
-    # Remove unwanted text
-    remove_words = [
-        "Explanation:",
-        "Here is the code:",
-        "Output:",
-        "Answer:"
-    ]
-    for word in remove_words:
-        code = code.replace(word, "")
     # Remove markdown
-    code = code.replace("```python", "").replace("```", "")
-    return code.strip()
 # ==============================
 # GENERATE CODE
@@ -60,19 +69,19 @@ def clean_code(code):
 def generate_code(prompt, language):
     full_prompt = f"""
 You are an expert {language} programmer.
-Write clean, correct, and complete code.
-Rules:
 - Only return code
-- No explanations
-- Complete solution
-Task:
 {prompt}
-Code:
 """
     inputs = tokenizer(full_prompt, return_tensors="pt", truncation=True)
@@ -81,20 +90,16 @@ Code:
         with torch.no_grad():
             outputs = model.generate(
                 **inputs,
-                max_new_tokens=200,
                 do_sample=True,
-                temperature=0.3,
-                top_p=0.9,
-                repetition_penalty=1.1,
                 pad_token_id=tokenizer.eos_token_id
             )
         result = tokenizer.decode(outputs[0], skip_special_tokens=True)
-        if "Code:" in result:
-            result = result.split("Code:")[-1]
-        return clean_code(result)
     except Exception as e:
         return f"# ERROR: {str(e)}"
@@ -126,7 +131,7 @@ if st.button("Generate Code"):
     if not user_prompt.strip():
         st.warning("⚠️ Please enter a task")
     else:
-        with st.spinner("⚡ Generating code..."):
             code = generate_code(user_prompt, language)
         st.session_state.history.append((user_prompt, code))

 import streamlit as st
 import torch
+import re
 from transformers import AutoTokenizer, AutoModelForCausalLM
 # ==============================
 # PAGE CONFIG
 # ==============================
 st.set_page_config(page_title="💻 AI Code Generator", layout="wide")
+st.title("💻 AI Code Generator (Advanced Clean Version)")
 # ==============================
+# LOAD MODEL (HF SAFE)
 # ==============================
 @st.cache_resource
 def load_model():
+    model_name = "deepseek-ai/deepseek-coder-1.3b-instruct"
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model.eval()
     return tokenizer, model
+# Load model with spinner
+with st.spinner("🔄 Loading AI model..."):
     tokenizer, model = load_model()
 st.success("✅ Model Loaded Successfully")
 # ==============================
+# CLEAN FUNCTION
 # ==============================
+def extract_clean_code(text):
+    if "Code:" in text:
+        text = text.split("Code:")[-1]
+    # Remove non-ascii junk
+    text = re.sub(r"[^\x00-\x7F]+", "", text)
+    # Remove unwanted sections
+    text = re.sub(r"(Explanation:.*)", "", text, flags=re.DOTALL)
     # Remove markdown
+    text = text.replace("```python", "").replace("```", "")
+    # Filter useful lines only
+    lines = text.split("\n")
+    clean_lines = []
+    for line in lines:
+        line = line.strip()
+        if not line:
+            continue
+        if any(word in line.lower() for word in ["instruction", "task", "response"]):
+            continue
+        clean_lines.append(line)
+    return "\n".join(clean_lines).strip()
 # ==============================
 # GENERATE CODE
 def generate_code(prompt, language):
     full_prompt = f"""
+### Instruction:
 You are an expert {language} programmer.
+### Rules:
 - Only return code
+- No explanation
+- Use simple and correct syntax
+- Provide complete solution
+### Task:
 {prompt}
+### Code:
 """
     inputs = tokenizer(full_prompt, return_tensors="pt", truncation=True)
         with torch.no_grad():
             outputs = model.generate(
                 **inputs,
+                max_new_tokens=150,
                 do_sample=True,
+                temperature=0.2,
+                top_p=0.85,
+                repetition_penalty=1.2,
                 pad_token_id=tokenizer.eos_token_id
             )
         result = tokenizer.decode(outputs[0], skip_special_tokens=True)
+        return extract_clean_code(result)
     except Exception as e:
         return f"# ERROR: {str(e)}"
     if not user_prompt.strip():
         st.warning("⚠️ Please enter a task")
     else:
+        with st.spinner("⚡ Generating clean code..."):
             code = generate_code(user_prompt, language)
         st.session_state.history.append((user_prompt, code))