Update README.md
Browse files
README.md
CHANGED
|
@@ -38,16 +38,21 @@ language:
|
|
| 38 |
|
| 39 |
|
| 40 |
|
| 41 |
-
#
|
|
|
|
| 42 |
|
| 43 |
-
This model is a [sentence-transformers](https://www.SBERT.net) model fine-tuned from [Shuu12121/CodeModernBERT-Owl](https://huggingface.co/Shuu12121/CodeModernBERT-Owl).
|
| 44 |
-
**It is specifically designed for code search and efficiently calculates semantic similarity between code snippets and documentation.**
|
| 45 |
|
|
|
|
|
|
|
|
|
|
|
|
|
| 46 |
|
| 47 |
---
|
| 48 |
|
| 49 |
-
このモデルは、[Shuu12121/CodeModernBERT-Owl](https://huggingface.co/Shuu12121/CodeModernBERT-Owl) をベースにファインチューニングされた [sentence-transformers](https://www.SBERT.net) モデルです。
|
| 50 |
**特にコードサーチに特化しており、コード片やドキュメントから効果的に意味的類似性を計算できる** ように設計されています。
|
|
|
|
|
|
|
| 51 |
|
| 52 |
|
| 53 |
---
|
|
|
|
| 38 |
|
| 39 |
|
| 40 |
|
| 41 |
+
# SentenceTransformer based on Shuu12121/CodeModernBERT-Owl🦉
|
| 42 |
+
|
| 43 |
|
|
|
|
|
|
|
| 44 |
|
| 45 |
+
This model is a **sentence-transformers** model fine-tuned from **[Shuu12121/CodeModernBERT-Owl](https://huggingface.co/Shuu12121/CodeModernBERT-Owl)**, which is a **ModernBERT model specifically designed for code, pre-trained from scratch by me**.
|
| 46 |
+
**It is specifically designed for code search and efficiently calculates semantic similarity between code snippets and documentation.**
|
| 47 |
+
One of the key features of this model is its **maximum sequence length of 2048 tokens**, which allows it to handle moderately long code snippets and documentation.
|
| 48 |
+
Despite being a relatively small model with about **150 million parameters**, it demonstrates remarkable performance in code search tasks.
|
| 49 |
|
| 50 |
---
|
| 51 |
|
| 52 |
+
このモデルは、**私が一から事前学習を行ったコード特化のModernBERTモデルである [Shuu12121/CodeModernBERT-Owl](https://huggingface.co/Shuu12121/CodeModernBERT-Owl)** をベースにファインチューニングされた **[sentence-transformers](https://www.SBERT.net)** モデルです。
|
| 53 |
**特にコードサーチに特化しており、コード片やドキュメントから効果的に意味的類似性を計算できる** ように設計されています。
|
| 54 |
+
本モデルの特徴として、**最大シーケンス長が2048トークン**に対応しており、**中程度の長さのコード片やドキュメントにも対応可能**です。
|
| 55 |
+
**150M程度と比較的小さいモデル**ながらも、コード検索タスクにおいて高い性能を発揮します。
|
| 56 |
|
| 57 |
|
| 58 |
---
|