aehrm
/

dtaec-type-normalizer

text2text-generation

Model card Files Files and versions

aehrm commited on Jun 19, 2024

Commit

155bb31

·

1 Parent(s): 48d9430

Update README

Files changed (1) hide show

README.md +2 -2

README.md CHANGED Viewed

@@ -47,7 +47,7 @@ tokenizer = AutoTokenizer.from_pretrained('aehrm/dtaec-type-normalizer')
 model = AutoModelForSeq2SeqLM.from_pretrained('aehrm/dtaec-type-normalizer')
 # Note: you CANNOT normalize full sentences, only word for word!
-model_in = tokenizer(['Freyheit', 'seyn', 'selbstthätig'], return_tensors='pt', padding=True)
 model_out = model.generate(**model_in)
 print(tokenizer.batch_decode(model_out, skip_special_tokens=True))
@@ -60,7 +60,7 @@ Or, more compact using the huggingface `pipeline`:
 from transformers import pipeline
 pipe = pipeline(model="aehrm/dtaec-type-normalizer")
-out = pipe(['Freyheit', 'seyn', 'selbstthätig'])
 print(out)
 # >>> [{'generated_text': 'Freiheit'}, {'generated_text': 'sein'}, {'generated_text': 'selbsttätig'}]

 model = AutoModelForSeq2SeqLM.from_pretrained('aehrm/dtaec-type-normalizer')
 # Note: you CANNOT normalize full sentences, only word for word!
+model_in = tokenizer(['Freyheit', 'seyn', 'ſelbstthätig'], return_tensors='pt', padding=True)
 model_out = model.generate(**model_in)
 print(tokenizer.batch_decode(model_out, skip_special_tokens=True))
 from transformers import pipeline
 pipe = pipeline(model="aehrm/dtaec-type-normalizer")
+out = pipe(['Freyheit', 'seyn', 'ſelbstthätig'])
 print(out)
 # >>> [{'generated_text': 'Freiheit'}, {'generated_text': 'sein'}, {'generated_text': 'selbsttätig'}]