loubb
/

aria-medium-base

Model card Files Files and versions

loua19 commited on Jun 5, 2025

Commit

99d0567

·

1 Parent(s): 2c49962

emb working

Files changed (3) hide show

config.json +3 -4
config_emb.json +23 -0
modeling_aria.py +1 -3

config.json CHANGED Viewed

@@ -1,13 +1,12 @@
 {
   "architectures": [
-    "AriaForSequenceEmbedding"
   ],
   "bos_token_id": 0,
   "eos_token_id": 1,
   "hidden_size": 1536,
-  "embedding_size": 512,
   "intermediate_size": 6144,
-  "max_seq_len": 2048,
   "model_type": "aria",
   "num_attention_heads": 24,
   "num_hidden_layers": 16,
@@ -18,6 +17,6 @@
   "auto_map": {
     "AutoConfig": "configuration_aria.AriaConfig",
     "AutoModel": "modeling_aria.AriaModel",
-    "AutoModelForCausalLM": "modeling_aria.AriaForSequenceEmbedding"
   }
 }

 {
   "architectures": [
+    "AriaForCausalLM"
   ],
   "bos_token_id": 0,
   "eos_token_id": 1,
   "hidden_size": 1536,
   "intermediate_size": 6144,
+  "max_seq_len": 8192,
   "model_type": "aria",
   "num_attention_heads": 24,
   "num_hidden_layers": 16,
   "auto_map": {
     "AutoConfig": "configuration_aria.AriaConfig",
     "AutoModel": "modeling_aria.AriaModel",
+    "AutoModelForCausalLM": "modeling_aria.AriaForCausalLM"
   }
 }

config_emb.json ADDED Viewed

	@@ -0,0 +1,23 @@

+{
+  "architectures": [
+    "AriaForSequenceEmbedding"
+  ],
+  "bos_token_id": 0,
+  "eos_token_id": 1,
+  "hidden_size": 1536,
+  "embedding_size": 512,
+  "intermediate_size": 6144,
+  "max_seq_len": 2048,
+  "model_type": "aria",
+  "num_attention_heads": 24,
+  "num_hidden_layers": 16,
+  "torch_dtype": "bfloat16",
+  "transformers_version": "4.45.0",
+  "use_cache": true,
+  "vocab_size": 17727,
+  "auto_map": {
+    "AutoConfig": "configuration_aria.AriaConfig",
+    "AutoModel": "modeling_aria.AriaModel",
+    "AutoModelForCausalLM": "modeling_aria.AriaForSequenceEmbedding"
+  }
+}

modeling_aria.py CHANGED Viewed

@@ -659,9 +659,7 @@ class AriaForSequenceEmbedding(AriaPreTrainedModel):
         _batch_size = input_ids.shape[0]
         eos_mask = input_ids == self.config.eos_token_id
         if not eos_mask.any(dim=1).all():
-            raise ValueError(
-                "Each sequence must contain at least one EOS token"
-            )
         eos_pos = eos_mask.int().argmax(dim=1)
         pooled_embedding = embedding[

         _batch_size = input_ids.shape[0]
         eos_mask = input_ids == self.config.eos_token_id
         if not eos_mask.any(dim=1).all():
+            raise ValueError("Each sequence must contain a EOS token")
         eos_pos = eos_mask.int().argmax(dim=1)
         pooled_embedding = embedding[