Spaces:

amewebstudio
/

sclm-chat-demo

Runtime error

App Files Files Community

amewebstudio commited on Dec 17, 2025

Commit

4f621fb

verified ·

1 Parent(s): c9d0796

Initial SCLM Chat Demo

Browse files

Files changed (3) hide show

README.md +17 -6
app.py +75 -0
requirements.txt +8 -0

README.md CHANGED Viewed

@@ -1,12 +1,23 @@
 ---
-title: Sclm Chat Demo
-emoji: 🌍
-colorFrom: red
-colorTo: green
 sdk: gradio
-sdk_version: 6.1.0
 app_file: app.py
 pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: SCLM Chat Demo
+emoji: 🧠
+colorFrom: purple
+colorTo: blue
 sdk: gradio
+sdk_version: 4.44.0
 app_file: app.py
 pinned: false
+license: mit
 ---
+# 🧠 SCLM - Stateful Coherent Language Model
+Demo interactive du modèle SCLM avec architecture EARCP.
+## Features
+- État latent persistant
+- Cohérence contextuelle améliorée
+- Architecture MoE (Mixture of Experts)
+## Author
+Mike Amega (Ame Web Studio)

app.py ADDED Viewed

	@@ -0,0 +1,75 @@

+import gradio as gr
+import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
+from huggingface_hub import hf_hub_download
+import json
+# ============================================================
+# SCLM Classes (simplifié pour le Space)
+# ============================================================
+# [Inclure ici les classes SCLMConfigB, EARCPModuleB, SCLMModelOptionB]
+# Pour simplifier, ce Space utilise le modèle de base avec une interface
+print("🔄 Chargement du modèle...")
+# Charger Llama
+quant_config = BitsAndBytesConfig(
+    load_in_4bit=True,
+    bnb_4bit_compute_dtype=torch.float16,
+)
+model = AutoModelForCausalLM.from_pretrained(
+    "meta-llama/Llama-3.2-1B",
+    quantization_config=quant_config,
+    device_map="auto",
+    token=True
+)
+tokenizer = AutoTokenizer.from_pretrained("meta-llama/Llama-3.2-1B", token=True)
+def chat(message, history, temperature, max_tokens):
+    # Build prompt
+    prompt = "You are a helpful AI assistant.
+"
+    for h in history:
+        prompt += f"User: {h[0]}
+Assistant: {h[1]}
+"
+    prompt += f"User: {message}
+Assistant:"
+    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
+    with torch.no_grad():
+        outputs = model.generate(
+            inputs.input_ids,
+            max_new_tokens=int(max_tokens),
+            temperature=temperature,
+            do_sample=True,
+            top_p=0.9,
+            pad_token_id=tokenizer.eos_token_id
+        )
+    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    response = response[len(prompt):].split("User:")[0].strip()
+    return response
+demo = gr.ChatInterface(
+    chat,
+    title="🧠 SCLM Chat Demo",
+    description="Stateful Coherent Language Model - Demo",
+    additional_inputs=[
+        gr.Slider(0.1, 1.5, 0.7, label="Temperature"),
+        gr.Slider(50, 300, 150, label="Max Tokens"),
+    ],
+    examples=[
+        ["Bonjour! Comment vas-tu?"],
+        ["Explique-moi ce qu'est l'intelligence artificielle"],
+        ["Raconte-moi une histoire courte"],
+    ]
+)
+demo.launch()

requirements.txt ADDED Viewed

	@@ -0,0 +1,8 @@

+gradio>=4.0.0
+transformers>=4.35.0
+accelerate
+bitsandbytes
+torch
+huggingface_hub
+sentencepiece
+protobuf==3.20.3