Shuu12121
/

Owl-ph2-base-len512

@@ -32,7 +32,7 @@ tags:
 既存の事前学習済みモデル（ModernBERT-base など）の重みは使用せず、
 8 言語を含む自前のデータセットである, **Owl コーパス**（約 855 万件の関数ペア）を用いて、
 **ランダム初期化状態から事前学習（scratch training）** を行っています。
-学習時の入力長を512トークンにしたバージョンで，[Owl-ph1-base (512)](https://huggingface.co/Shuu12121/CodeModernBERT-Owl-v3-Pre-len512)から継続事前学習を行った段階2の状態のモデルです
 ## 使用方法
@@ -43,14 +43,14 @@ tags:
 ```python
 from transformers import AutoTokenizer, AutoModelForMaskedLM
 #MLMモデルとして読み込む場合
-tokenizer = AutoTokenizer.from_pretrained("Shuu12121/CodeModernBERT-Owl-v3-len512")
-model = AutoModelForMaskedLM.from_pretrained("Shuu12121/CodeModernBERT-Owl-v3-len512")
 ```
 Sentence-Transformersを用いてファインチューニングを行う場合の読み込み方
 ```python
 from sentence_transformers import SentenceTransformer,models
-word_embedding_model = models.Transformer("Shuu12121/CodeModernBERT-Owl-v3-len512")
 word_embedding_model.max_seq_length = 512
 #CLSトークンを用いる場合pooling_mode_cls_tokenのみTrue
 #平均プーリングを用いる場合 pooling_mode_mean_tokensのみTrue
@@ -66,6 +66,6 @@ model = SentenceTransformer(modules=[word_embedding_model, pooling_model])
 ```
 そのほかのモデル
-- [Owl-ph1-base (512)(https://huggingface.co/Shuu12121/CodeModernBERT-Owl-v3-Pre-len512)
-- [Owl-ph1-base (2048)](https://huggingface.co/Shuu12121/CodeModernBERT-Owl-v3-Pre-len2048)
-- [Owl-ph2-base (2048)](https://huggingface.co/Shuu12121/CodeModernBERT-Owl-v3-len2048)

 既存の事前学習済みモデル（ModernBERT-base など）の重みは使用せず、
 8 言語を含む自前のデータセットである, **Owl コーパス**（約 855 万件の関数ペア）を用いて、
 **ランダム初期化状態から事前学習（scratch training）** を行っています。
+学習時の入力長を512トークンにしたバージョンで，[Owl-ph1-base (512)](https://huggingface.co/Shuu12121/Shuu12121/Owl-ph1-base-len512)から継続事前学習を行った段階2の状態のモデルです
 ## 使用方法
 ```python
 from transformers import AutoTokenizer, AutoModelForMaskedLM
 #MLMモデルとして読み込む場合
+tokenizer = AutoTokenizer.from_pretrained("Shuu12121/Owl-ph2-base-len512")
+model = AutoModelForMaskedLM.from_pretrained("Shuu12121/Owl-ph2-base-len512")
 ```
 Sentence-Transformersを用いてファインチューニングを行う場合の読み込み方
 ```python
 from sentence_transformers import SentenceTransformer,models
+word_embedding_model = models.Transformer("Owl-ph2-base-len512")
 word_embedding_model.max_seq_length = 512
 #CLSトークンを用いる場合pooling_mode_cls_tokenのみTrue
 #平均プーリングを用いる場合 pooling_mode_mean_tokensのみTrue
 ```
 そのほかのモデル
+- [Owl-ph1-base (512)](https://huggingface.co/Shuu12121/Shuu12121/Owl-ph1-base-len512)
+- [Owl-ph1-base (2048)](https://huggingface.co/Shuu12121/Owl-ph1-base-len2048)
+- [Owl-ph2-base (2048)](https://huggingface.co/Shuu12121/Owl-ph2-base-len2048)