loubb
/

aria-medium-base

Model card Files Files and versions

loua19 commited on Jun 5, 2025

Commit

840c6a3

·

1 Parent(s): cea6439

test emb

Files changed (2) hide show

config.json +2 -1
modeling_aria.py +2 -2

config.json CHANGED Viewed

@@ -1,10 +1,11 @@
 {
   "architectures": [
-    "AriaForCausalLM"
   ],
   "bos_token_id": 0,
   "eos_token_id": 1,
   "hidden_size": 1536,
   "intermediate_size": 6144,
   "max_position_embeddings": 8192,
   "model_type": "aria",

 {
   "architectures": [
+    "AriaForSequenceEmbeddings"
   ],
   "bos_token_id": 0,
   "eos_token_id": 1,
   "hidden_size": 1536,
+  "embedding_size": 512,
   "intermediate_size": 6144,
   "max_position_embeddings": 8192,
   "model_type": "aria",

modeling_aria.py CHANGED Viewed

@@ -617,7 +617,7 @@ class AriaForCausalLM(AriaPreTrainedModel, GenerationMixin):
         )
-class AriaForSequenceEmbeddings(AriaPreTrainedModel):
     """Transformer decoder embedding head for contrastive learning.
     Args:
@@ -744,5 +744,5 @@ __all__ = [
     "AriaModel",
     "TransformerBlock",
     "AriaForCausalLM",
-    "AriaForSequenceEmbeddings",
 ]

         )
+class AriaForSequenceEmbedding(AriaPreTrainedModel):
     """Transformer decoder embedding head for contrastive learning.
     Args:
     "AriaModel",
     "TransformerBlock",
     "AriaForCausalLM",
+    "AriaForSequenceEmbedding",
 ]