Spaces:

pythainlp
/

api

Paused

wannaphong commited on Apr 26, 2025

Commit

dd4d11e

verified ·

1 Parent(s): 41e295e

Update routers/tokenize.py

Files changed (1) hide show

routers/tokenize.py CHANGED Viewed

@@ -42,16 +42,22 @@ class SentTokenizeEngine(BaseModel):
 @router.post('/word_tokenize', response_model=WordTokenizeResponse)
 def word_tokenize(text: str, engine: WordTokenizeEngine = "newmm"):
     """
-    Word tokenize
     """
     return {"words": py_word_tokenize(text=text, engine=engine)}
 @router.post('/subword_tokenize', response_model=SubwordTokenizeResponse)
 def subword_tokenize(text: str, engine: SubwordTokenizeEngine = "tcc"):
     return {"subwords": py_subword_tokenize(text=text, engine=engine)}
 @router.post('/sent_tokenize', response_model=SentTokenizeEngine)
 def sent_tokenize(text: str, engine: SentTokenizeEngine = "crfcut"):
     return {"sents": py_sent_tokenize(text=text, engine=engine)}

 @router.post('/word_tokenize', response_model=WordTokenizeResponse)
 def word_tokenize(text: str, engine: WordTokenizeEngine = "newmm"):
     """
+    Word tokenize or word segmentation for Thai language
     """
     return {"words": py_word_tokenize(text=text, engine=engine)}
 @router.post('/subword_tokenize', response_model=SubwordTokenizeResponse)
 def subword_tokenize(text: str, engine: SubwordTokenizeEngine = "tcc"):
+    """
+    subword tokenize or subword segmentation for Thai language
+    """
     return {"subwords": py_subword_tokenize(text=text, engine=engine)}
 @router.post('/sent_tokenize', response_model=SentTokenizeEngine)
 def sent_tokenize(text: str, engine: SentTokenizeEngine = "crfcut"):
+    """
+    Thai sentence segmentation
+    """
     return {"sents": py_sent_tokenize(text=text, engine=engine)}