用于训练中英文对话系统的语料库 Datasets for Training Chatbot System
微信机器人,接入Gemini、ChatGPT、ChatGLM、讯飞星火、Tigerbot;成语接龙、天气预报、新闻摘要、定时任务。
OpenChat: Advancing Open-source Language Models with Imperfect Data
中文公开聊天语料库
自然语言处理(nlp),小姜机器人(闲聊检索式chatbot),BERT句向量-相似度(Sentence Similarity),XLNET句向量-相似度(text xlnet embeddin...
dialogbot, provide search-based dialogue, task-based dialogue and generative dialogue model. 对话机器...
AiLearning:数据分析+机器学习实战+线性代数+PyTorch+NLTK+TF2
中文近义词:聊天机器人,智能问答工具包
GPT2 for Chinese chitchat/用于中文闲聊的GPT2模型(实现了DialoGPT的MMI思想)
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、...
ChatGPT带火了聊天机器人,主流的趋势都调整到了GPT类模式,本项目也与时俱进,会在近期更新GPT类版本。基于本项目和自己的语料可以训练出自己想要的聊天机器人,用于智能客服、在线问答、闲聊等场景。
搜索所有中文NLP数据集,附常用英文NLP数据集
基于自然语言理解与机器学习的聊天机器人,支持多用户并发及自定义多轮对话
中文对话0.2B小模型(ChatLM-Chinese-0.2B),开源所有数据集来源、数据清洗、tokenizer训练、模型预训练、SFT指令微调、RLHF优化等流程的全部代码。支持下游任务sf...
Chinese version of GPT2 training code, using BERT tokenizer.
中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。