OpenLab-NLP
/

model-prototype

Model card Files Files and versions

Yuchan commited on Nov 14, 2025

Commit

e1bb994

·

verified ·

1 Parent(s): 8d881dd

Update Model.py

Files changed (1) hide show

Model.py +3 -3

Model.py CHANGED Viewed

@@ -125,7 +125,7 @@ class Lo(layers.Layer):
         super().__init__()
         # 내부 계산은 float32로 유지
         self.proj = layers.Dense(d_model, use_bias=True, dtype='float32')
-        self.p = layers.Dense(128, use_bias=True, dtype='float32')
         self._out_dtype = 'float32'
     def call(self, x):
@@ -154,8 +154,8 @@ class LoSoU(layers.Layer):
         self.eps = float(eps)
         # projection / gating layers in float32
-        self.Q = layers.Dense(128, dtype='float32')
-        self.K = layers.Dense(128, dtype='float32')
         # V produces d_model so keep it float32 internally
         self.V = Lo(d_model)  # Lo already handles casting to model dtype; we'll cast back to float32
         self.proj = layers.Dense(d_model, use_bias=True, dtype='float32')

         super().__init__()
         # 내부 계산은 float32로 유지
         self.proj = layers.Dense(d_model, use_bias=True, dtype='float32')
+        self.p = layers.Dense(96, use_bias=True, dtype='float32')
         self._out_dtype = 'float32'
     def call(self, x):
         self.eps = float(eps)
         # projection / gating layers in float32
+        self.Q = layers.Dense(96, dtype='float32')
+        self.K = layers.Dense(96, dtype='float32')
         # V produces d_model so keep it float32 internally
         self.V = Lo(d_model)  # Lo already handles casting to model dtype; we'll cast back to float32
         self.proj = layers.Dense(d_model, use_bias=True, dtype='float32')