中华新华字典数据库。包括歇后语,成语,词语,汉字。
MIT License
pinyintokenizer, 拼音分词器,将连续的拼音切分为单字拼音列表。
汉字拼音数据
中文公开聊天语料库
成语与成语接龙工具
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、...
Chinese Vocab Extracter and Sorter. Convert a body of Chinese text into a list of Hanzi and vocab...
汉字转拼音(pypinyin)
Chinese version of GPT2 training code, using BERT tokenizer.
Chinese NewsTitle Generation Project by GPT2.带有超级详细注释的中文GPT2新闻标题生成项目。
中文langchain项目|小必应,Q.Talk,强聊,QiangTalk
simple-pinyin 基于隐马尔可夫模型的简易拼音输入法(拼音转汉字)
Python 练习册,每天一个小程序
Free English to Chinese Dictionary Database
中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。
持续维护的新浪微博采集工具🚀🚀🚀