OpenLab-NLP
/

model-prototype

Model card Files Files and versions

Yuchan commited on Nov 24, 2025

Commit

a6af02f

·

verified ·

1 Parent(s): 8ea3541

Update AlphaS2S.py

Files changed (1) hide show

AlphaS2S.py +2 -2

AlphaS2S.py CHANGED Viewed

@@ -13,7 +13,7 @@ tf.get_logger().setLevel("ERROR")
 SEED = 42
 tf.random.set_seed(SEED)
 np.random.seed(SEED)
-max_len = 256 # 기존 코드에서 200으로 설정됨
 batch_size = 32
 # TPU 초기화 (기존 코드와 동일)
@@ -255,7 +255,7 @@ def create_lr_schedule(initial_lr=5e-5, decay_steps=10000, decay_rate=0.9):
 with strategy.scope():
     # ⚠️ 수정: chat_vocab_size 대신 정의된 vocab_size 사용
-    chat_model = Transformer(num_layers=2, d_model=320, num_heads=5, dff=1024, input_vocab_size=vocab_size, target_vocab_size=vocab_size, max_len=256, dropout=0.1)
     dummy_input = {
         "enc_inputs": tf.zeros((1, max_len), dtype=tf.int32),

 SEED = 42
 tf.random.set_seed(SEED)
 np.random.seed(SEED)
+max_len = 224 # 기존 코드에서 200으로 설정됨
 batch_size = 32
 # TPU 초기화 (기존 코드와 동일)
 with strategy.scope():
     # ⚠️ 수정: chat_vocab_size 대신 정의된 vocab_size 사용
+    chat_model = Transformer(num_layers=2, d_model=320, num_heads=4, dff=960, input_vocab_size=vocab_size, target_vocab_size=vocab_size, max_len=256, dropout=0.1)
     dummy_input = {
         "enc_inputs": tf.zeros((1, max_len), dtype=tf.int32),