IKMLab-team
/

HKELECTRA

Feature Extraction

masked-language-model

replaced-token-detection

Model card Files Files and versions

Metrics Training metrics Community

SolarisCipher commited on Aug 17, 2025

Commit

ae1f30a

·

verified ·

1 Parent(s): dfcbccd

Update README.md

Files changed (1) hide show

README.md +5 -5

README.md CHANGED Viewed

@@ -5,7 +5,7 @@ language:
 language_details: "yue-Hant-HK; zh-Hant-HK"
 license: cc-by-4.0
 datasets:
-- SolarisCipher/hk_content_corpus
 metrics:
 - accuracy
 - exact_match
@@ -50,8 +50,8 @@ This model is also available at Zenodo: https://doi.org/10.5281/zenodo.16889492
 ```python
 from transformers import ElectraTokenizer, ElectraForMaskedLM, pipeline
-tokenizer = ElectraTokenizer.from_pretrained("SolarisCipher/HKELECTRA/generator/small")
-model = ElectraForMaskedLM.from_pretrained("SolarisCipher/HKELECTRA/generator/small")
 unmasker = pipeline("fill-mask", model=model, tokenizer=tokenizer)
 unmasker("從中環[MASK]到尖沙咀。")
@@ -62,8 +62,8 @@ unmasker("從中環[MASK]到尖沙咀。")
 ```python
 from transformers import ElectraTokenizer, ElectraForPreTraining
-tokenizer = ElectraTokenizer.from_pretrained("SolarisCipher/HKELECTRA/discriminator/small")
-model = ElectraForPreTraining.from_pretrained("SolarisCipher/HKELECTRA/discriminator/small")
 inputs = tokenizer("從中環坐車到[MASK]。", return_tensors="pt")
 outputs = model(**inputs)  # logits for replaced token detection

 language_details: "yue-Hant-HK; zh-Hant-HK"
 license: cc-by-4.0
 datasets:
+- IKMLab-team/hk_content_corpus
 metrics:
 - accuracy
 - exact_match
 ```python
 from transformers import ElectraTokenizer, ElectraForMaskedLM, pipeline
+tokenizer = ElectraTokenizer.from_pretrained("IKMLab-team/HKELECTRA/generator/small")
+model = ElectraForMaskedLM.from_pretrained("IKMLab-team/HKELECTRA/generator/small")
 unmasker = pipeline("fill-mask", model=model, tokenizer=tokenizer)
 unmasker("從中環[MASK]到尖沙咀。")
 ```python
 from transformers import ElectraTokenizer, ElectraForPreTraining
+tokenizer = ElectraTokenizer.from_pretrained("IKMLab-team/HKELECTRA/discriminator/small")
+model = ElectraForPreTraining.from_pretrained("IKMLab-team/HKELECTRA/discriminator/small")
 inputs = tokenizer("從中環坐車到[MASK]。", return_tensors="pt")
 outputs = model(**inputs)  # logits for replaced token detection