How do I disable auto-correction of words?

#33
by cloth1975 - opened

Hello,

the Problem I have: I try to scan images of vocabulary tests. If they contain errors it is -intentional- for the errors to remain in the resulting text, since that is a basis for grading that test. However, nanonets-ocr-s seems to auto correct scan results.

E.g. the test literally is like (in the image the word behind the equal sign is handwritten):

Teil A: Englische Wörter auf Deutsch übersetzen (10 Punkte)
Übersetze folgende Wörter ins Deutsche.
table = Tisch
window = Spinne
pencil = Stifft
chair = Stuhl
car = Auto

Teil B: Deutsche Wörter auf Englisch übersetzen (10 Punkte)
Übersetze folgende Wörter ins Englische.
Katze = Kat
Wasser = Water
Lehrer = Teacher
Ball = Ball
Buch = Book

But the resulting text is:

Teil A: Englische Wörter auf Deutsch übersetzen (10 Punkte)
Übersetze folgende Wörter ins Deutsche.
table = Tisch
window = Fenster
pencil = Stift
chair = Stuhl
car = Auto

Teil B: Deutsche Wörter auf Englisch übersetzen (10 Punkte)
Übersetze folgende Wörter ins Englische.
Katze = Cat
Wasser = Water
Lehrer = Teacher
Ball = Ball
Buch = Book

How can I force the model to leave words alone and scan them 'as is'?

Best regards

Sign up or log in to comment