2021搜狐校园文本匹配算法大赛
Statistics for this project are still being loaded, please check back later.
DeepIE: Deep Learning for Information Extraction
GPT2 for Chinese chitchat/用于中文闲聊的GPT2模型(实现了DialoGPT的MMI思想)
text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似...
Chinese version of GPT2 training code, using BERT tokenizer.
ChatYuan: Large Language Model for Dialogue in Chinese and English
一键中文数据增强包 ; NLP数据增强、bert数据增强、EDA:pip install nlpcda
自然语言处理(nlp),小姜机器人(闲聊检索式chatbot),BERT句向量-相似度(Sentence Similarity),XLNET句向量-相似度(text xlnet embeddin...
2020腾讯游戏安全技术竞赛机器学习组优秀奖源码
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、...
Best practice TTS based on BERT and VITS with some Natural Speech Features Of Microsoft; Support ...
中文标点符号模型,可以给文本添加标点符号。
2019-SOTA简繁中文拼写检查工具:FASPell Chinese Spell Checker (Chinese Spell Check / 中文拼写检错 / 中文拼写纠错 / 中文拼写检查)
RoBERTa中文预训练模型: RoBERTa for Chinese
使用Bert,ERNIE,进行中文文本分类
中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。