ทดลองใช้งาน
ตัดคำภาษาไทยทำงานในเบราว์เซอร์ผ่าน WebAssembly ไม่ต้องใช้เซิร์ฟเวอร์ พิมพ์ข้อความภาษาไทยและคลิก ตัดคำ หรือเลือกตัวอย่าง
Each sentence ends at a new line,
! ?,
. followed by a space, or Thai markers
ฯ ๚ ๛.
Thai text with no markers will appear as a single sentence.
Samples:
Splits on: newline · ! ? . · Thai markers ฯ ๚ ๛ · Plain Thai prose without punctuation stays as one sentence.
ประเภทของ token
- Thai — ภาษาไทย
- Latin — ภาษาอังกฤษ
- Number — ตัวเลข
- Punctuation — เครื่องหมาย
- Emoji
คอลัมน์ span
Chars — Unicode scalar-value offsets เหมาะสำหรับ Python / JS str.slice()
Bytes — UTF-8 byte offsets ใช้ภายใน Rust / PostgreSQL FTS
เพิ่มเติมใน v0.3
- POS tagging (13 หมวดหมู่)
- Named Entity Recognition
- Romanization (RTGS)
- Phonetic codes (lk82 / udom83)