基于向量数据库与GPT3.5的通用本地知识库方案(A universal local knowledge base solution based on vector database and GPT3.5)
AGPL-3.0 License
dialogbot, provide search-based dialogue, task-based dialogue and generative dialogue model. 对话机器...
VILA - a multi-image visual language model with training, inference and evaluation recipe, deploy...
An Open-source Neural Hierarchical Multi-label Text Classification Toolkit
中文自然语言处理数据集,平时做做实验的材料。欢迎补充提交合并。
A Comprehensive Toolkit for High-Quality PDF Content Extraction
【大模型】3小时完全从0训练一个仅有26M的小参数GPT,最低仅需2G显卡即可推理训练!
Chinese version of GPT2 training code, using BERT tokenizer.
CodeAssist is an advanced code completion tool that provides high-quality code completions for Py...
AiLearning:数据分析+机器学习实战+线性代数+PyTorch+NLTK+TF2
人工智能学习路线图,整理近200个实战案例与项目,免费提供配套教材,零基础入门,就业实战!包括:Python,数学,机器学习,数据分析,深度学习,计算机视觉,自然语言处理,PyTorch ten...
Chinese NewsTitle Generation Project by GPT2.带有超级详细注释的中文GPT2新闻标题生成项目。
GPT2 for Chinese chitchat/用于中文闲聊的GPT2模型(实现了DialoGPT的MMI思想)
text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似...
中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、...
自然语言处理(nlp),小姜机器人(闲聊检索式chatbot),BERT句向量-相似度(Sentence Similarity),XLNET句向量-相似度(text xlnet embeddin...