Buckets:
bbkdevops/unicosys-hypergraph-bucket / tinymind-native-8b-remote-handoff /bundle /model /tinymind-12b /tinymind_text_sanitize.py
| from __future__ import annotations | |
| REPLACEMENTS = { | |
| "ยuuk": "ยุค", | |
| "ยùk": "ยุค", | |
| "ยuค": "ยุค", | |
| "ยуค": "ยุค", | |
| "ยуk": "ยุค", | |
| "ยูค": "ยุค", | |
| "ข้อควรกระวังเชิงหรือเทคนิค": "ข้อควรระวังเชิงเทคนิค", | |
| "ข้อควรกระวังเชียชีเทคนิค": "ข้อควรระวังเชิงเทคนิค", | |
| "ข้อควรกระวังเชื่่งเทคนิค": "ข้อควรระวังเชิงเทคนิค", | |
| "ข้อครวรกระวางเชื่่ง เทคนิค": "ข้อควรระวังเชิงเทคนิค", | |
| "ข้อควรกระวัง": "ข้อควรระวัง", | |
| "ข้อควกระวัง": "ข้อควรระวัง", | |
| "ตรวดสอบ": "ตรวจสอบ", | |
| "ตรวญ": "ตรวจ", | |
| "ตรวช": "ตรวจ", | |
| "ข้อมูลปนนิด": "ข้อมูลปนเปื้อน", | |
| "ข้อมูลปนนเปื้อน": "ข้อมูลปนเปื้อน", | |
| "returnFalse": "return False", | |
| } | |
| def sanitize_generated_text(text: str) -> str: | |
| cleaned = text | |
| for bad, good in REPLACEMENTS.items(): | |
| cleaned = cleaned.replace(bad, good) | |
| return cleaned | |
Xet Storage Details
- Size:
- 1.5 kB
- Xet hash:
- c74cf69f48207c76133358ab82e72ff912ec0096bb94a16c6e2f46c22e2e49e9
·
Xet efficiently stores files, intelligently splitting them into unique chunks and accelerating uploads and downloads. More info.