macedonizer
/

mk-roberta-base

@@ -16,36 +16,36 @@ Note that this model is primarily aimed at being fine-tuned on tasks that use th
 How to use
 You can use this model directly with a pipeline for masked language modeling:
->>> from transformers import pipeline
->>> unmasker = pipeline('fill-mask', model='macedonizer/mk-roberta-base')
->>> unmasker("Скопје е <mask> град на Македонија.")
-[{'sequence': 'Скопје е главен град на Македонија.',
-    'score': 0.5900368094444275,
-    'token': 2782,
-    'token_str': ' главен'},
-  {'sequence': 'Скопје е главниот град на Македонија.',
-   'score': 0.1789761781692505,
-   'token': 3177,
-   'token_str': ' главниот'},
-  {'sequence': 'Скопје е административен град на Македонија.',
-   'score': 0.01679774932563305,
-   'token': 9563,
-   'token_str': ' административен'},
-  {'sequence': 'Скопје е мал град на Македонија.',
-   'score': 0.016263898462057114,
-   'token': 2473,
-   'token_str': ' мал'},
-  {'sequence': 'Скопје е најголемиот град на Македонија.',
-   'score': 0.01312252413481474,
-   'token': 4271,
-   'token_str': ' најголемиот'}]
 Here is how to use this model to get the features of a given text in PyTorch:
-from transformers import RobertaTokenizer, RobertaModel
-tokenizer = RobertaTokenizer.from_pretrained('macedonizer/mk-roberta-base')
-model = RobertaModel.from_pretrained('macedonizer/mk-roberta-base')
-text = "Replace me by any text you'd like."
-encoded_input = tokenizer(text, return_tensors='pt')
-output = model(**encoded_input)

 How to use
 You can use this model directly with a pipeline for masked language modeling:
+>>> from transformers import pipeline \
+>>> unmasker = pipeline('fill-mask', model='macedonizer/mk-roberta-base') \
+>>> unmasker("Скопје е <mask> град на Македонија.") \
+\
+[{'sequence': 'Скопје е главен град на Македонија.', \
+    'score': 0.5900368094444275, \
+    'token': 2782, \
+    'token_str': ' главен'}, \
+  {'sequence': 'Скопје е главниот град на Македонија.', \
+   'score': 0.1789761781692505, \
+   'token': 3177, \
+   'token_str': ' главниот'}, \
+  {'sequence': 'Скопје е административен град на Македонија.', \
+   'score': 0.01679774932563305, \
+   'token': 9563, \
+   'token_str': ' административен'}, \
+  {'sequence': 'Скопје е мал град на Македонија.', \
+   'score': 0.016263898462057114, \
+   'token': 2473, \
+   'token_str': ' мал'}, \
+  {'sequence': 'Скопје е најголемиот град на Македонија.', \
+   'score': 0.01312252413481474, \
+   'token': 4271, \
+   'token_str': ' најголемиот'}] \
+\
 Here is how to use this model to get the features of a given text in PyTorch:
+from transformers import RobertaTokenizer, RobertaModel \
+tokenizer = RobertaTokenizer.from_pretrained('macedonizer/mk-roberta-base') \
+model = RobertaModel.from_pretrained('macedonizer/mk-roberta-base') \
+text = "Replace me by any text you'd like." \
+encoded_input = tokenizer(text, return_tensors='pt') \
+output = model(**encoded_input) \