IsanNLP

Isan NLP

APACHE-2.0 License

Stars
13
Committers
1

IsanNLP

corpus licensed under CC-BY 3.0

The Isan NLP porject want to develop Northeast Thailand local language tool for natural language processing tasks and want to preserve these languages.

Isan NLP เป็นโครงการพัฒนาการประมวลผลภาษาท้องถิ่นของภาคตะวันออกเฉียงเหนือ

ภาษาอีสานไม่มีจริง - อ้างอิง ไม่มีภาษาอีสานในโลกใบนี้ : อีสานใหม่

สาเหตุที่พัฒนา เพื่ออนุรักษ์ภาษาถิ่นในพื้นที่ภาคตะวันออกเฉียงเหนือของประเทศไทย

Support language

  • Korat language (ภาษาโคราช) - List word only
  • Nangrong language (ภาษานางรอง) - List word, Thai words, a few wordnet id, a few example.
  • Phu Thai language (ภาษาผู้ไท) - WIP

Features

  • Word tokenizer with korat words and nangrong words

WIP

Install

pip install IsanNLP