Spaces:

vedaco
/

veda-programming

Sleeping

App Files Files Community

vedaco commited on Jan 10

Commit

54392ea

verified ·

1 Parent(s): ffd2cda

Update model.py

Browse files

Files changed (1) hide show

model.py +21 -42

model.py CHANGED Viewed

@@ -1,21 +1,22 @@
-"""Veda Programming LLM Model - Fixed Version"""
 import tensorflow as tf
 from tensorflow import keras
 from tensorflow.keras import layers
 import numpy as np
 class VedaProgrammingLLM(keras.Model):
-    """Veda Programming Language Model with all generation features"""
     def __init__(
-        self,
-        vocab_size: int,
-        max_length: int = 256,
-        d_model: int = 256,
         num_heads: int = 8,
-        num_layers: int = 4,
-        ff_dim: int = 512,
         **kwargs
     ):
         super().__init__(**kwargs)
@@ -27,12 +28,10 @@ class VedaProgrammingLLM(keras.Model):
         self.num_layers = num_layers
         self.ff_dim = ff_dim
-        # Embeddings
         self.token_embedding = layers.Embedding(vocab_size, d_model)
         self.pos_embedding = layers.Embedding(max_length, d_model)
         self.dropout = layers.Dropout(0.1)
-        # Transformer layers
         self.attn_layers = []
         self.ffn_layers = []
         self.ln1_layers = []
@@ -63,17 +62,14 @@ class VedaProgrammingLLM(keras.Model):
     def call(self, inputs, training=False):
         seq_len = tf.shape(inputs)[1]
-        # Causal mask
         mask = tf.linalg.band_part(tf.ones((seq_len, seq_len)), -1, 0)
-        # Embeddings
         positions = tf.range(seq_len)
         x = self.token_embedding(inputs)
         x = x * tf.math.sqrt(tf.cast(self.d_model, tf.float32))
         x = x + self.pos_embedding(positions)
         x = self.dropout(x, training=training)
-        # Transformer blocks
         for i in range(self.num_layers):
             attn_out = self.attn_layers[i](x, x, attention_mask=mask, training=training)
             x = self.ln1_layers[i](x + attn_out)
@@ -86,79 +82,64 @@ class VedaProgrammingLLM(keras.Model):
     def generate(
         self,
         prompt_tokens: list,
-        max_new_tokens: int = 100,
         temperature: float = 0.7,
         top_k: int = 50,
         top_p: float = 0.9,
-        repetition_penalty: float = 1.2,  # NOW INCLUDED
         stop_tokens: list = None
     ) -> list:
-        """Generate code with all sampling features"""
         generated = list(prompt_tokens)
-        for step in range(max_new_tokens):
-            # Use last max_length tokens
             context = generated[-self.max_length:]
             input_tensor = tf.constant([context], dtype=tf.int32)
-            # Get logits
             logits = self(input_tensor, training=False)
             next_logits = logits[0, -1, :].numpy().astype(np.float64)
-            # Apply repetition penalty
             if repetition_penalty != 1.0:
-                for token_id in set(generated[-50:]):
                     if 0 <= token_id < len(next_logits):
                         if next_logits[token_id] > 0:
                             next_logits[token_id] /= repetition_penalty
                         else:
                             next_logits[token_id] *= repetition_penalty
-            # Apply temperature
             next_logits = next_logits / max(temperature, 0.1)
-            # Apply top-k filtering
             if top_k > 0 and top_k < len(next_logits):
                 indices_to_remove = next_logits < np.partition(next_logits, -top_k)[-top_k]
                 next_logits[indices_to_remove] = -np.inf
-            # Apply top-p (nucleus) filtering
             if top_p < 1.0:
                 sorted_indices = np.argsort(next_logits)[::-1]
                 sorted_logits = next_logits[sorted_indices]
-                # Compute softmax
-                max_logit = np.max(sorted_logits[sorted_logits > -np.inf])
                 exp_logits = np.exp(sorted_logits - max_logit)
                 probs = exp_logits / (np.sum(exp_logits) + 1e-10)
-                cumulative_probs = np.cumsum(probs)
-                # Remove tokens above threshold
-                sorted_indices_to_remove = cumulative_probs > top_p
-                sorted_indices_to_remove[1:] = sorted_indices_to_remove[:-1].copy()
-                sorted_indices_to_remove[0] = False
-                indices_to_remove = sorted_indices[sorted_indices_to_remove]
-                next_logits[indices_to_remove] = -np.inf
-            # Convert to probabilities
             max_logit = np.max(next_logits[next_logits > -np.inf]) if np.any(next_logits > -np.inf) else 0
             exp_logits = np.exp(next_logits - max_logit)
             exp_logits[next_logits == -np.inf] = 0
             probs = exp_logits / (np.sum(exp_logits) + 1e-10)
-            # Ensure valid distribution
             probs = np.clip(probs, 0, 1)
             prob_sum = np.sum(probs)
             if prob_sum > 0:
                 probs = probs / prob_sum
             else:
-                # Fallback to uniform
                 probs = np.ones_like(probs) / len(probs)
-            # Sample
             try:
                 next_token = np.random.choice(len(probs), p=probs)
             except ValueError:
@@ -166,10 +147,8 @@ class VedaProgrammingLLM(keras.Model):
             generated.append(int(next_token))
-            # Stop conditions
-            if next_token == 0:  # PAD
                 break
             if stop_tokens and next_token in stop_tokens:
                 break

+"""Veda Programming Assistant Model"""
 import tensorflow as tf
 from tensorflow import keras
 from tensorflow.keras import layers
 import numpy as np
 class VedaProgrammingLLM(keras.Model):
+    """Conversational Programming Assistant LLM"""
     def __init__(
+        self,
+        vocab_size: int,
+        max_length: int = 512,
+        d_model: int = 256,
         num_heads: int = 8,
+        num_layers: int = 4,
+        ff_dim: int = 512,
         **kwargs
     ):
         super().__init__(**kwargs)
         self.num_layers = num_layers
         self.ff_dim = ff_dim
         self.token_embedding = layers.Embedding(vocab_size, d_model)
         self.pos_embedding = layers.Embedding(max_length, d_model)
         self.dropout = layers.Dropout(0.1)
         self.attn_layers = []
         self.ffn_layers = []
         self.ln1_layers = []
     def call(self, inputs, training=False):
         seq_len = tf.shape(inputs)[1]
         mask = tf.linalg.band_part(tf.ones((seq_len, seq_len)), -1, 0)
         positions = tf.range(seq_len)
         x = self.token_embedding(inputs)
         x = x * tf.math.sqrt(tf.cast(self.d_model, tf.float32))
         x = x + self.pos_embedding(positions)
         x = self.dropout(x, training=training)
         for i in range(self.num_layers):
             attn_out = self.attn_layers[i](x, x, attention_mask=mask, training=training)
             x = self.ln1_layers[i](x + attn_out)
     def generate(
         self,
         prompt_tokens: list,
+        max_new_tokens: int = 200,
         temperature: float = 0.7,
         top_k: int = 50,
         top_p: float = 0.9,
+        repetition_penalty: float = 1.2,
         stop_tokens: list = None
     ) -> list:
+        """Generate response"""
         generated = list(prompt_tokens)
+        for _ in range(max_new_tokens):
             context = generated[-self.max_length:]
             input_tensor = tf.constant([context], dtype=tf.int32)
             logits = self(input_tensor, training=False)
             next_logits = logits[0, -1, :].numpy().astype(np.float64)
             if repetition_penalty != 1.0:
+                for token_id in set(generated[-100:]):
                     if 0 <= token_id < len(next_logits):
                         if next_logits[token_id] > 0:
                             next_logits[token_id] /= repetition_penalty
                         else:
                             next_logits[token_id] *= repetition_penalty
             next_logits = next_logits / max(temperature, 0.1)
             if top_k > 0 and top_k < len(next_logits):
                 indices_to_remove = next_logits < np.partition(next_logits, -top_k)[-top_k]
                 next_logits[indices_to_remove] = -np.inf
             if top_p < 1.0:
                 sorted_indices = np.argsort(next_logits)[::-1]
                 sorted_logits = next_logits[sorted_indices]
+                max_logit = np.max(sorted_logits[sorted_logits > -np.inf]) if np.any(sorted_logits > -np.inf) else 0
                 exp_logits = np.exp(sorted_logits - max_logit)
                 probs = exp_logits / (np.sum(exp_logits) + 1e-10)
+                cumulative = np.cumsum(probs)
+                remove_mask = cumulative > top_p
+                remove_mask[1:] = remove_mask[:-1].copy()
+                remove_mask[0] = False
+                next_logits[sorted_indices[remove_mask]] = -np.inf
             max_logit = np.max(next_logits[next_logits > -np.inf]) if np.any(next_logits > -np.inf) else 0
             exp_logits = np.exp(next_logits - max_logit)
             exp_logits[next_logits == -np.inf] = 0
             probs = exp_logits / (np.sum(exp_logits) + 1e-10)
             probs = np.clip(probs, 0, 1)
             prob_sum = np.sum(probs)
             if prob_sum > 0:
                 probs = probs / prob_sum
             else:
                 probs = np.ones_like(probs) / len(probs)
             try:
                 next_token = np.random.choice(len(probs), p=probs)
             except ValueError:
             generated.append(int(next_token))
+            if next_token == 0 or next_token == 3:
                 break
             if stop_tokens and next_token in stop_tokens:
                 break