Awesome Pretrained Chinese NLP Models,高质量中文预训练模型&大模型&多模态模型&大语言模型集合
MIT License
在自然语言处理领域中,预训练语言模型(Pretrained Language Models)已成为非常重要的基础技术,本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬),并将持续更新......
国内下载HuggingFace仓库模型推荐使用HuggingFace镜像地址: https://hf-mirror.com/
备注
ND: Non-Causal Decoder or Prefix LM
CD: Causal Decoder
ED: Encoder-Decoder
大规模基础模型:表格中只罗列出参数量
大于7B
以上模型。
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 架构 | 文献 | 备注 |
---|---|---|---|---|---|---|---|---|---|---|
XVERSE-MoE | 255B/A36B | 2024-09 | 中英 | 通用 | 🤗HF | XVERSE-MoE-A36B | xverse-ai | MoE | ||
Qwen-2.5 | 0.5/1.5/3/7/14/32/72B | 2024-09 | 中英 | 通用 | 🤗HF | Qwen2.5 | QwenLM | CD | Blog | |
Tele-FLM | 52B/102B/1TB | 2024-07 | 多语 | 通用 | [🤗HF] | / | CofeAI | CD | Tele-FLM Technical Report | |
meta-llama-3.1 | 8/70/405B | 2024-07 | 多语 | 通用 | [🤗HF] | llama3 | meta-llama | CD | ||
internlm2.5-Base | 7B | 2024-07 | 中英 | 通用 | [🤗HF] | InternLM | InternLM | CD | 📜Technical Report | |
MAP-NEO-Base | 2/7B | 2024-06 | 中英 | 通用 | 🤗HF | MAP-NEO | multimodal-art-projection | CD | Paper | |
Nemotron-4-Base | 340B | 2024-06 | 多语 | 通用 | 🤗HF | / | NVIDIA | CD | technical report. | |
Index-Base | 1.9B | 2024-06 | 中英 | 通用 | 🤗HF | Index-1.9B | bilibili | CD | Report | |
Qwen2-Base | 0.5/2/5/7/72B | 2024-06 | 多语 | 通用 | 🤗HF | Qwen2 | QwenLM | CD | Blog | |
GLM-4-Base | 9B | 2024-06 | 多语 | 通用 | 🤗HF | GLM-4 | THUDM | / | ||
Yi-1.5-Base | 6/9/34B | 2024-05 | 中英 | 通用 | 🤗HF | Yi-1.5 | 01-ai | CD | Paper | |
DeepSeek-V2-Base | A21B/236B | 2024-05 | 中英 | 通用 | 🤗HF | DeepSeek-V2 | deepseek-ai | MOE | Paper | |
Llama-3-Base | 8/70B | 2024-04 | 多语 | 通用 | 🤗HF | llama3 | Meta Llama | CD | ||
Zhinao-Base | 7B | 2024-04 | 中英 | 通用 | 🤗HF 🤖 | / | 奇虎科技 | CD | ||
XVERSE-MoE | A4.2B/25.8B | 2024-04 | 中英 | 通用 | 🤗HF | XVERSE-MoE-A4.2B | xverse-ai | MoE | ||
SoftTiger-Base | 13/70B | 2024-04 | 中英 | 通用 | 🤗HF | TigerBot | TigerResearch | CD | ||
HammerLLM | 1.4b | 2024-04 | 中英 | 通用 | 🤗HF | HammerLLM | DataHammer | |||
Mengzi3-Base | 13B | 2024-04 | 中英 | 通用 | 🤗HF | Mengzi3 | Langboat | CD | ||
Breeze-Base | 7B | 2024-02 | 中英 | 通用 | 🤗HF | / | MediaTek Research | |||
TowerBase | 7/13B | 2024-02 | 多语 | 通用 | [🤗HF] | / | Unbabel | CD | ||
Qwen1.5-Base | 0.5/1.8/47/14/32/72/110B | 2024-02 | 中英 | 通用 | [🤗HF] | Qwen1.5 | Qwen | / | Blog | |
LongAlign-Base | 6/7/13B | 2024-02 | 中英 | 通用 | [🤗HF] | LongAlign | THUDM | / | Paper | |
Chinese-Mixtral-Base | 8x7B | 2024-02 | 中英 | 通用 | [Baidu] [🤗HF] | Chinese-Mixtral | Yiming Cui | MOE | ||
iFlytekSpark-Base | 13B | 2024-01 | 中英 | 通用 | mindspore | / | 科大讯飞 | CD | ||
Orion-Base | 14B | 2024-01 | 多语 | 通用 | [🤗HF] | Orion | OrionStarAI | CD | Paper | RAGPlugin |
YaYi2-Base | 30B | 2023-12 | 多语 | 通用 | [🤗HF] | YAYI2 | wenge-research | CD | Paper | |
Aquila2-Base | 7/34/70B | 2023-12 | 中英 | 通用 | [🤗HF] | Aquila2 | FlagAI | CD | ||
Alaya-Base | 7B | 2023-12 | 中英 | 通用 | [🤗HF] | Alaya | DataCanvas | CD | ||
Qwen-Base | 1.8/714/72B | 2023-12 | 中英 | 通用 | [🤗HF] | Qwen | 阿里云 | CD | Paper Report Report2 | |
DeepSeek-Base | 7/67B | 2023-11 | 中英 | 通用 | [🤗HF] | DeepSeek-LLM | deepseek-ai | CD | ||
Yuan-2.0 | 2/51102B | 2023-11 | 中英 | 通用 | baidu [🤗HF] | Yuan-2.0 | IEIT-Yuan | CD | ||
Alaya-Base | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | Alaya | DataCanvasIO | CD | ||
Yi-Base | 6/9/34B | 2023-11 | 中英 | 通用 | [🤗HF] | Yi | 01.AI | CD | ||
XVERSE-Base | 7/1365B | 2023-11 | 多语 | 通用 | [🤗HF] | XVERSE | 元象科技 | CD | ||
Nanbeige-Base | 16B | 2023-11 | 中英 | 通用 | [🤗HF] | Nanbeige | Nanbeige LLM Lab | CD | ||
LingoWhale | 8B | 2023-11 | 中英 | 通用 | [🤗HF] | LingoWhale-8B | DeepLang AI | CD | ||
Skywork-base | 13B | 2023-10 | 中文 | 通用 | [🤗HF] | Skywork | SkyworkAI | CD | Paper | |
BlueLM-Base | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | BlueLM | vivo AI Lab | CD | ||
Chatglm3-base | 6B | 2023-10 | 中英 | 通用 | [🤗HF] | ChatGLM3 | THUDM | ND | ||
Ziya2-Base | 13B | 2023-10 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | ||
OpenBA-LM | 15B | 2023-09 | 中英 | 通用 | [🤗HF] | OpenBA | OpenNLG Group | ED | Paper | |
TigerBot-Base-70B | 80B | 2023-09 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | Paper | |
FLM | 101B | 2023-09 | 中英 | 通用 | [🤗HF] | / | CofeAI | CD | ||
falcon | 7/40180B | 2023-09 | 多语 | 通用 | [🤗HF] | / | Technology Innovation Institute | CD | ||
Baichuan2 | 7/13B | 2023-09 | 中文 | 通用 | [🤗HF] | Baichuan2 | 百川智能 | CD | ||
Chinese-LLaMA-2-16K | 7/13B | 2023-08 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
YuLan-LLaMA-2 | 13B | 2023-08 | 中英 | 通用 | [🤗HF] | YuLan-Chat | 中国人民大学 | CD | ||
Aquila-Base-33B | 33B | 2023-08 | 中英 | 通用 | TODO | Aquila | FlagAI | CD | ||
TigerBot-Base-13B | 13B | 2023-08 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | ||
Linly-Chinese-LLaMA-2 | 7/13B | 2023-07 | 中英 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | ||
Chinese-LLaMA-2 | 7B | 2023-07 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | ||
Jiang-base | 13B | 2023-07 | 中文 | 通用 | [🤗HF] | / | 知未智能 | CD | ||
bwx | 7/13B | 2023-07 | 中文 | 通用 | [🤗HF] | / | 蓝鲸国数 | CD | ||
Llama2 | 7/1370B | 2023-07 | 多语 | 通用 | [🤗HF] | llama | Meta | CD | Paper | |
PolyLM | 13B | 2023-07 | 多语 | 通用 | [🤗HF] | PolyLM | 达摩院 | CD | Paper | |
Baichuan-13B | 13B | 2023-07 | 中文 | 通用 | [🤗HF] | Baichuan-13B | 百川智能 | CD | ||
TigerBot | 7B | 2023-07 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | ||
InternLM-base | 7/20B | 2023-07 | 中文 | 通用 | [🤗HF] | InternLM | 上海人工智能实验室 | CD | report | |
MPT | 7/30B | 2023-06 | 多语 | 通用 | [🤗HF] | llm-foundry | MosaicML | CD | ||
Baichuan | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | baichuan-7B | 百川智能 | CD | ||
Chinese-Falcon | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | Blog | |
AtomGPT | 13B | 2023-06 | 中英 | 通用 | [🤗HF] | / | 原子回声 | CD | ||
Aquila | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | Aquila | FlagAI | CD | ||
Chinese-LLaMA | 33B | 2023-06 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | ||
TigerBot | 7B | 2023-06 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | ||
Panda-OpenLLaMA | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | pandallm | dandelionsllm | CD | ||
Panda | 7/13B | 2023-05 | 中英 | 通用 | [🤗HF] | pandallm | dandelionsllm | CD | ||
OpenLLaMA | 13B | 2023-05 | 中英 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | ||
BiLLa-LLM | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | BiLLa | Zhongli Li | CD | ||
Ziya-LLaMA-Reward | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | ||
YuYan | 11B | 2023-04 | 中文 | 通用 | [🤗HF] | / | 网易伏羲 | CD | Paper | |
Chinese-LLaMA | 7/13/33B | 2023-04 | 中文 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | Blog | |
OpenChineseLLaMA | 7B | 2023-04 | 中英 | 通用 | [🤗HF] | OpenChineseLLaMA | OpenLMLab | CD | ||
MOSS-003 | 16B | 2023-04 | 中英 | 通用 | [🤗HF] | MOSS | 复旦大学 | CD | ||
BBT-2-Text | 13B | 2023-04 | 中文 | 通用 | 申请 | BBT-FinCUGE-Applications | 超对称 | CD | Paper | |
BBT-2-Text | 12B | 2023-04 | 中文 | 通用 | 申请 | BBT-FinCUGE-Applications | 超对称 | CD | Paper | |
Chinese-LLaMA | 13B | 2023-04 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | ||
flan-ul2 | 20B | 2023-03 | 多语 | 通用 | [🤗HF] | ul2 | ED | Paper | ||
CPM-Bee | 10B | 2023-01 | 中英 | 通用 | [🤗HF] | CPM-Bee | OpenBMB | CD | ||
BLOOM | 176B | 2022-11 | 多语 | 通用 | [🤗HF] | Megatron-DeepSpeed | BigScience | CD | Paper | |
BLOOMZ | 176B | 2022-11 | 多语 | 通用 | [🤗HF] | Megatron-DeepSpeed | BigScience | CD | Paper | |
flan-t5-xxl | 11B | 2022-11 | 多语 | 通用 | [🤗HF] | t5x | ED | paper | ||
CPM-Ant+ | 10B | 2022-10 | 中英 | 通用 | BMB | CPM-Live | OpenBMB | CD | blog | |
GLM | 130B | 2022-10 | 中英 | 通用 | 申请 | GLM-130B | 清华大学 | ND | paper | |
CPM-Ant | 10B | 2022-09 | 中文 | 通用 | [🤗HF] | CPM-Live | OpenBMB | CD | blog | |
GLM | 10B | 2022-09 | 中文 | 通用 | [🤗HF] | GLM | 清华大学 | ND | paper | |
源1.0 | 245B | 2021-09 | 中文 | 通用 | API | Yian-1.0 | 浪潮 | CD | paper | |
CPM-2 | 10/11/200B | 2021-06 | 中文 | 通用 | 申请 | CPM | 智源研究院 | ED | paper | |
PanGu-Alpha | 13/200B | 2021-05 | 中文 | 通用 | [🤗HF] | PanGu-Alpha | 鹏城实验室 | CD | paper | |
PLUG | 27B | 2021-04 | 中文 | 通用 | 申请 | AliceMind | 阿里巴巴 | ED | ||
GPT-3 | 13/30B | 2021-04 | 中文 | 通用 | TODO | GPT-3 | 达摩院 | CD |
各个垂直领域开源基础模型
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 架构 | 文献 | 备注 |
---|---|---|---|---|---|---|---|---|---|---|
Qwen-2.5 | 1.5/7B | 2024-09 | 中英 | 代码 | 🤗HF | Qwen2.5 | QwenLM | CD | Blog | |
Qwen-2.5 | 1.5/7/72B | 2024-09 | 中英 | 数学 | 🤗HF | Qwen2.5 | QwenLM | CD | Blog | |
Tongyi-Finance-Base | 14B | 2023-11 | 中文 | 金融 | ModelScope | 通义金融-14B | 通义金融大模型 | CD | ||
ChiMed-GPT | 13B | 2023-10 | 中文 | 医疗 | [🤗HF] | ChiMed-GPT | 中国科学技术大学 | CD | Paper | |
CodeShell-base | 7B | 2023-10 | 中英 | 代码 | [🤗HF] | codeshell | WisdomShell | CD | ||
WiNGPT-base | 7B | 2023-09 | 中文 | 医学 | [🤗HF] | WiNGPT2 | Winning Health AI Research | CD | ||
XuanYuan | 70B | 2023-09 | 中文 | 金融 | [🤗HF] | XuanYuan | 度小满 | CD | Report | |
CodeLLAma | 7/13/34B | 2023-08 | 多语 | 代码 | [🤗HF] | codellama | Meta Research | CD | Paper | |
educhat-base-002 | 7/13B | 2023-06 | 中英 | 教育 | [🤗HF] | EduChat | 华东师范大学 | CD | ||
AquilaCode-NV | 7B | 2023-06 | 中英 | 代码 | [🤗HF] | Aquila | FlagAI | CD | ||
AquilaCode-TS | 7B | 2023-06 | 中英 | 代码 | [🤗HF] | Aquila | FlagAI | CD | ||
LaWGPT | 7B | 2023-05 | 中英 | 法律 | [🤗HF] | LawGPT | Pengxiao Song | CD | ||
CodeGeeX | 13B | 2022-06 | 多语 | 代码 | 申请 | CodeGeeX | 清华大学 | CD | blog |
具备问答和对话等功能的大型语言模型。
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 架构 | 文献 |
---|---|---|---|---|---|---|---|---|---|
TeleChat2 | 115B | 2024-09 | 中英 | 通用 | 🤖 ModelScope | TeleChat2 | Tele-AI | CD | |
Qwen-2.5 | 0.5/1.5/3/7/14/32/72B | 2024-09 | 中英 | 通用 | 🤗HF | Qwen2.5 | QwenLM | CD | Blog |
XVERSE-MoE | 255B/A36B | 2024-09 | 中英 | 通用 | 🤗HF | XVERSE-MoE-A36B | xverse-ai | MoE | |
DeepSeek-V2.5 | 236B/A21B | 2024-09 | 中英 | 通用 | 🤗HF | DeepSeek-V2 | deepseek-ai | MOE | Paper |
MiniCPM3 | 4B | 2024-09 | 中英 | 通用 | 🤗HF | MiniCPM | OpenBMB | CD | MiniCPM Paper |
C4AI Command R+ 08-2024 | 104B | 2024-08 | 多语 | 通用 | 🤗HF | / | CohereForAI | CD | |
JIUTIAN-Chat | 39/A13B | 2024-07 | 中英 | 通用 | 🤖MS | / | 中国移动JiuTian-AI | MOE | |
meta-llama-3.1 | 8/70/405B | 2024-07 | 多语 | 通用 | [🤗HF] | llama3 | meta-llama | CD | |
internlm2.5-chat | 7B | 2024-07 | 中英 | 通用 | [🤗HF] | InternLM | InternLM | CD | 📜Technical Report |
Mistral-large-insruct-2407 | 123B | 2024-07 | 多语 | 通用 | 🤗HF | / | Mistral AI | blog post | |
DeepSeek-V2-Chat-0628 | 236B | 2024-07 | 中英 | 通用 | 🤗HF | DeepSeek-V2 | deepseek-ai | MOE | Paper |
C4ai-command-r-plus | 104B | 2024-07 | 多语 | 通用 | 🤗HF | / | CohereForAI | CD | |
Gemma-2-chat | 9/27B | 2024-06 | 多语 | 通用 | 🤗HF | / | CD | ||
MAP-NEO-Chat | 2/7B | 2024-06 | 中英 | 通用 | 🤗HF | MAP-NEO | multimodal-art-projection | CD | Paper |
GEB-Chat | 1.3B | 2024-06 | 中英 | 通用 | 🤗HF | / | GEB-AGI | CD | Paper |
Nemotron-4-Chat | 340B | 2024-06 | 多语 | 通用 | 🤗HF | / | NVIDIA | CD | technical report. |
Index-Chat | 1.9B | 2024-06 | 中英 | 通用 | 🤗HF | Index-1.9B | bilibili | CD | Report |
Qwen2-MoE | 57B/A14B | 2024-06 | 多语 | 通用 | 🤗HF | Qwen2 | QwenLM | MoE | Blog |
Qwen2-Chat | 0.5/2/5/7/72B | 2024-06 | 多语 | 通用 | 🤗HF | Qwen2 | QwenLM | CD | Blog |
GLM-4-Chat | 9B | 2024-06 | 多语 | 通用 | 🤗HF | GLM-4 | THUDM | / | |
Skywork-MoE | 16/A22B/146B | 2024-06 | 中英 | 通用 | 🤗HF | Skywork-MoE | SkyworkAI | MoE | Tech Report |
Yuan2.0 | 40/A3.7B | 2024-05 | 中英 | 通用 | 🤗HF | Yuan2.0-M32 | IEIT-Yuan | MOE | Paper |
星辰-Chat | 52B | 2024-05 | 中英 | 通用 | 🤗HF | TeleChat-52B | Tele-AI | CD | |
LingLong | 317M | 2024-05 | 中英 | 通用 | 🤗HF | linglong | nkcs-iclab | CD | |
Sailor | 14B | 2024-05 | 7语 | 通用 | 🤗HF | sailor-llm | sail-sg | CD | Paper |
Nanbeige2 | 8/16B | 2024-05 | 中英 | 通用 | 🤗HF | Nanbeige | Nanbeige | CD | |
Yi-1.5-Chat | 6/9/34B | 2024-05 | 中英 | 通用 | 🤗HF | Yi-1.5 | 01-ai | CD | Paper |
DeepSeek-V2-Chat | A21B/236B | 2024-05 | 中英 | 通用 | 🤗HF | DeepSeek-V2 | deepseek-ai | MOE | Paper |
XVERSE-MoE | A4.2B/25.8B | 2024-05 | 中英 | 通用 | 🤗HF | XVERSE-MoE-A4.2B | xverse-ai | MOE | |
Llama3-zh | 8/70B | 2024-04 | 中英 | 通用 | 🤗HF | / | / | CD | llama3中文列表 |
Llama3-Chinese-Chat | 8B | 2024-04 | 中英 | 通用 | 🤗HF | / | Shenzhi Wang | CD | |
Llama-3-Chat | 8/70B | 2024-04 | 多语 | 通用 | 🤗HF | llama3 | Meta Llama | CD | |
Zhinao-Chat | 7B | 2024-04 | 中英 | 通用 | 🤗HF 🤖 | / | 奇虎科技 | CD | |
MiniCPM-MoE | 8x2B | 2024-04 | 中英 | 通用 | 🤗HF | MiniCPM | OpenBMB | MoE | |
Nanbeige2-Chat | 8B | 2024-04 | 中英 | 通用 | 🤗HF | Nanbeige | Nanbeige LLM Lab | CD | |
Sailor | 7B | 2024-04 | 多语 | 通用 | 🤗HF | sailor-llm | Sea AI Lab | CD | Paper |
Mengzi3-Chat | 13B | 2024-04 | 中英 | 通用 | 🤗HF | Mengzi3 | Langboat | CD | |
Qwen-MoE | 2.7B | 2024-03 | 中英 | 通用 | 🤗HF | Qwen1.5 | Qwen | MoE | Blog |
Command-R | 35B | 2024-03 | 多语 | 通用 | 🤗HF | / | CohereForAI | CD | |
Breeze-Instruct | 7B | 2024-02 | 中英 | 通用 | 🤗HF | / | MediaTek Research | ||
aya-101 | 13B | 2024-02 | 多语 | 通用 | 🤗HF | / | Cohere For AI | CD | Paper |
ChemLLM | 7B | 2024-02 | 多语 | 通用 | 🤗HF | / | AI4Chem | CD | Paper |
TowerInstruct | 7/13B | 2024-02 | 多语 | 通用 | [🤗HF] | / | Unbabel | CD | |
Qwen1.5-Chat | 0.5/1.8/4/7/14/32/72/110B | 2024-02 | 中英 | 通用 | [🤗HF] | Qwen1.5 | Qwen | / | Blog |
MiniCPM | 2B | 2024-02 | 中英 | 通用 | [🤗HF] ModelScope | MiniCPM | OpenBMB | / | Report |
LongAlign-Chat | 6/7/13B | 2024-02 | 中英 | 通用 | [🤗HF] | LongAlign | THUDM | / | Paper |
Chinese-Mixtral-Chat | 8x7B | 2024-02 | 中英 | 通用 | [Baidu] [🤗HF] | Chinese-Mixtral | Yiming Cui | MOE | |
iFlytekSpark-Chat | 13B | 2024-01 | 中英 | 通用 | mindspore | / | 科大讯飞 | CD | |
rwkv-5-world | 0.1/1/3/7B | 2023-01 | 多语 | 通用 | [🤗HF] | RWKV-LM | BlinkDL | URL | |
Orion-Chat | 14B | 2024-01 | 多语 | 通用 | [🤗HF] | Orion | OrionStarAI | CD | Paper |
internlm2-chat | 7/20B | 2024-01 | 中英 | 通用 | [🤗HF] | InternLM | InternLM | CD | Report |
Chinese-Mixtral | 8x7B | 2023-01 | 中英 | 通用 | [🤗HF] | / | HIT-SCIR | CD-MOE | |
Telechat | 7/12B | 2024-01 | 中英 | 通用 | [🤗HF] | Telechatx | Tele-AI | CD | Report |
kagentlms | 7/13B | 2024-01 | 中英 | 通用 | [🤗HF] | KwaiAgents | KwaiKEG | ||
YaYi2-Chat | 30B | 2023-12 | 多语 | 通用 | [🤗HF] | YAYI2 | wenge-research | CD | Paper |
SUS-Chat | 34/72B | 2023-12 | 中英 | 通用 | [🤗HF] | SUS-Chat | SUSTech-IDEA | CD | |
Aquila2-Chat | 7/34/70B | 2023-12 | 中英 | 通用 | [🤗HF] | Aquila2 | FlagAI | CD | |
Alaya-Chat | 7B | 2023-12 | 中英 | 通用 | [🤗HF] | Alaya | DataCanvas | CD | |
Qwen-Chat | 1.8/7/14/72B | 2023-12 | 中英 | 通用 | [🤗HF] | Qwen | 阿里云 | CD | Paper Report Report2 |
DeepSeek-Chat | 7/67B | 2023-11 | 中英 | 通用 | [🤗HF] | DeepSeek-LLM | deepseek-ai | CD | |
Yi-Chat | 6/34B | 2023-11 | 中英 | 通用 | [🤗HF] | Yi | 01.AI | CD | |
Alaya-Chat | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | Alaya | DataCanvasIO | CD | |
OrionStar-Yi-Chat | 34B | 2023-11 | 中英 | 通用 | [🤗HF] | OrionStar-Yi-34B-Chat | OrionStarAI | CD | |
Nanbeige-Chat | 16B | 2023-11 | 中英 | 通用 | [🤗HF] | Nanbeige | Nanbeige LLM Lab | CD | |
OpenChat 3.5 | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | openchat | OpenChat | CD | Paper |
XVERSE-Chat | 7/13B | 2023-11 | 多语 | 通用 | [🤗HF] | XVERSE | 元象科技 | CD | |
AndesGPT | 7B | 2023-11 | 中文 | 通用 | [🤗HF] | AndesGPT-7B | OPPO-Mente-Lab | CD | |
SeaLLM-Chat | 13B | 2023-11 | 多语 | 通用 | [🤗HF] | SeaLLMs | SeaLLMs | CD | |
BlueLM | 7B | 2023-11 | 中英 | 通用 | [🤗HF] | BlueLM | vivo AI Lab | CD | |
Skywork-chat | 13B | 2023-10 | 中文 | 通用 | [🤗HF] | Skywork | SkyworkAI | CD | Paper |
Zephyr | 7B | 2023-10 | 多语 | 通用 | [🤗HF] | alignment-handbook | Hugging Face H4 | CD | Paper |
Mistral | 7B | 2023-10 | 多语 | 通用 | [🤗HF] | mistral-src | Mistral AI | CD | Paper |
chatglm3 | 6B | 2023-10 | 中英 | 通用 | [🤗HF] | ChatGLM3 | THUDM | ND | |
Zhiyin-chat | 7B | 2023-10 | 中英 | 通用 | [🤗HF] | Zhiyin | 中科院声学所 | CD | |
Ziya2-Chat | 13B | 2023-10 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | |
Vulture | 40/180B | 2023-10 | 多语 | 通用 | [🤗HF] | / | VILM-AI | TODO | |
Vulture | 3/7/40/180B | 2023-09 | 多语 | 通用 | [🤗HF] | / | VILM | CD | |
Colossal-LLaMA-2 | 7B | 2023-09 | 中英 | 通用 | [🤗HF] | ColossalAI | HPC-AI Tech | CD | Blog |
OpenBA-chat | 15B | 2023-09 | 中英 | 通用 | TODO | OpenBA | OpenNLG Group | ED | Paper |
WeMix-LLaMA2 | 7/70B | 2023-09 | 中英 | 通用 | [🤗HF] | WeMix-LLM | Alpha-VLLM | CD | |
Stable Beluga | 7/13/70B | 2023-09 | 中英 | 通用 | [🤗HF] | / | Stability AI | CD | |
TigerBot-chat | 70B | 2023-09 | 中英 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | Paper |
Openbuddy_llama | 70B | 2023-09 | 多语 | 通用 | [🤗HF] | OpenBuddy | OpenBuddy | CD | |
falcon-180B-chat | 180B | 2023-09 | 多语 | 通用 | [🤗HF] | / | Technology Innovation Institute | CD | |
Baichuan2 | 7/13B | 2023-09 | 中文 | 通用 | [🤗HF] | Baichuan2 | 百川智能 | CD | |
Chinese-Alpaca-2-16K | 7/13B | 2023-09 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | |
InternLM-Chat-8k | 7B | 2023-08 | 中文 | 通用 | [🤗HF] | InternLM | 上海人工智能实验室 | CD | report |
InternLM-Chat-v1.1 | 7B | 2023-08 | 中文 | 通用 | [🤗HF] | InternLM | 上海人工智能实验室 | CD | report |
YuLan-Chat-2 | 13B | 2023-08 | 中英 | 通用 | [🤗HF] | YuLan-Chat | 中国人民大学 | CD | |
falcon | 7/40B | 2023-06 | 多语 | 通用 | [🤗HF] | [🤗HF] | Technology Innovation Institute | CD | |
Toucan | 7B | 2023-08 | 中英 | 通用 | [🤗HF] | Toucan-LLM | Kendryte | CD | |
Zhuzhi | 6B | 2023-08 | 中英 | 通用 | [🤗HF] | Zhuzhi-6B | 竹间智能 | ND | |
Atom | 7B | 2023-08 | 中英 | 通用 | [🤗HF] | Llama2-Chinese | FlagAlpha | CD | |
openbuddy | 3/7/13/40B | 2023-08 | 多语 | 通用 | [🤗HF] | OpenBuddy | OpenBuddy | CD | |
Aquila-Chat-33B | 33B | 2023-08 | 中英 | 通用 | TODO | Aquila | FlagAI | CD | |
vicuna-V1.5-16K | 7/13B | 2023-08 | 多语 | 通用 | [🤗HF] | FastChat | lm-sys | CD | Paper |
vicuna-V1.5 | 7/13B | 2023-08 | 多语 | 通用 | [🤗HF] | FastChat | lm-sys | CD | Paper |
Chinese-Alpaca-2 | 13B | 2023-08 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | |
WizardLM-V1.0 | 70B | 2023-08 | 多语 | 通用 | [🤗HF] | WizardLM | operatorx | CD | |
TigerBot-chat-13B | 13B | 2023-07 | 中英 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | |
huozi | 7B | 2023-08 | 中英 | 通用 | [🤗HF] | huozi | 哈工大 | CD | |
Chinese-Alpaca-2 | 7B | 2023-07 | 中英 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca-2 | Yiming Cui | CD | |
AntX | 7/13B | 2023-07 | 中文 | 通用 | [🤗HF] | / | AntX.ai | CD | |
BatGPT | 15B | 2023-07 | 中英 | 通用 | [🤗HF] | BatGPT | 上海交通大学 | ND | Paper |
WizardLM-V1.2 | 13B | 2023-07 | 多语 | 通用 | [🤗HF] | WizardLM | operatorx | CD | Paper |
llama2-Chinese-chat | 13B | 2023-07 | 中英 | 通用 | [🤗HF] | llama2-Chinese-chat | Ke Bai | CD | |
Jiang-chat | 13B | 2023-07 | 中文 | 通用 | [🤗HF] | / | 知未智能 | CD | |
Llama2-chinese-chat | 7/13B | 2023-07 | 中英 | 通用 | [🤗HF] | Llama2-Chinese | FlagAlpha | CD | |
LL7M | 7B | 2023-07 | 多语 | 通用 | [🤗HF] | / | Joseph Cheung | CD | |
Chinese-Llama-2 | 7B | 2023-07 | 中英 | 通用 | [🤗HF] | Chinese-Llama-2-7b | LinkSoul-AI | CD | |
Llama2-chat | 7/13/70B | 2023-07 | 多语 | 通用 | [🤗HF] | llama | Meta | CD | Paper |
PolyLM-chat | 13B | 2023-07 | 多语 | 通用 | [🤗HF] | PolyLM | 达摩院 | CD | Paper |
Baichuan-13B-chat | 13B | 2023-07 | 中文 | 通用 | [🤗HF] | Baichuan-13B | 百川智能 | CD | |
vicuna-V1.3 | 7/13/33B | 2023-07 | 多语 | 通用 | [🤗HF] | FastChat | lm-sys | CD | Paper |
WizardLM-V1.0 | 7/13/30B | 2023-07 | 多语 | 通用 | [🤗HF] | WizardLM | operatorx | CD | Paper |
TigerBot-v2-sft | 7B | 2023-07 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | |
InternLM-chat | 7/20B | 2023-07 | 中文 | 通用 | [🤗HF] | InternLM | 上海人工智能实验室 | CD | report |
vicuna汉化版 | 33B | 2023-07 | 中文 | 通用 | baidu-hiks | chinese-StableVicuna | ziwang-com | CD | |
CuteGPT | 13B | 2023-07 | 中英 | 通用 | [🤗HF] | CuteGPT | 复旦大学知识工场 | CD | |
MPT-chat | 7/30B | 2023-06 | 多语 | 通用 | [🤗HF] | llm-foundry | MosaicML | CD | |
ChatGLM2 | 6B | 2023-06 | 中英 | 通用 | [🤗HF] | ChatGLM2-6B | 清华大学 | ND | |
BayLing | 7/13B | 2023-06 | 中英 | 通用 | [🤗HF] | BayLing | 中国科学院 | CD | |
ZhiXi-Diff | 13B | 2023-06 | 中英 | 通用 | [🤗HF] | KnowLLM | 浙江大学 | CD | |
Anima | 33B | 2023-06 | 中文 | 通用 | [🤗HF] | Anima | Gavin Li | CD | |
OpenLLaMA-Chinese | 3/7/13B | 2023-06 | 中文 | 通用 | [🤗HF] | OpenLLaMA-Chinese | FittenTech | CD | |
openbuddy-falcon-7b-v1.5 | 7B | 2023-06 | 多语 | 通用 | [🤗HF] | OpenBuddy | OpenBuddy | CD | |
AtomGPT_chat | 13B | 2023-06 | 中英 | 通用 | [🤗HF] | AtomGPT | 原子回声 | CD | |
AquilaChat | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | Aquila | FlagAI | CD | |
YuLan-Chat | 13/65B | 2023-06 | 中英 | 通用 | [🤗HF] | YuLan-Chat | 中国人民大学 | CD | |
Chinese-Alpaca | 33B | 2023-06 | 中文 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | |
TigerBot-sft | 7/180B | 2023-06 | 多语 | 通用 | [🤗HF] | TigerBot | 虎博科技 | CD | |
ChatYuan | 7B | 2023-06 | 中英 | 通用 | [🤗HF] | ChatYuan-7B | ClueAI | CD | |
Panda-Instruct | 13B | 2023-05 | 中英 | 通用 | [🤗HF] | pandallm | dandelionsllm | CD | |
Panda-Instruct | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | pandallm | dandelionsllm | CD | |
BiLLa-SFT | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | BiLLa | Zhongli Li | CD | |
Ziya-LLaMA-v1 | 13B | 2023-05 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | Blog |
BLOOMChat V1.0 | 176B | 2023-05 | 多语 | 通用 | [🤗HF] | bloomchat | SambaNova Systems | CD | Blog |
BiLLa | 7B | 2023-05 | 中英 | 通用 | [🤗HF] | BiLLa | Zhongli Li | CD | |
Bactrian-X | 7/13B | 2023-05 | 多语 | 通用 | [🤗HF] | bactrian-x | MBZUAI | CD | |
Bactrian-ZH | 7B | 2023-05 | 中文 | 通用 | [🤗HF] | bactrian-x | MBZUAI | CD | |
ChatFlow | 7/13B | 2023-05 | 中英 | 通用 | [🤗HF] | Linly | 深圳大学计算机视觉研究所 | CD | |
OpenBuddy | 7/13B | 2023-05 | 多语 | 通用 | [🤗HF] | OpenBuddy | OpenBuddy | CD | |
YuYan-dialogue | 11B | 2023-04 | 中文 | 通用 | [🤗HF] | / | 网易伏羲 | CD | paper |
Moss-moon-003-sft-plugin | 16B | 2023-04 | 中英 | 通用 | [🤗HF] | MOSS | 复旦大学 | CD | |
moss-moon-003-sft | 16B | 2023-04 | 中英 | 通用 | [🤗HF] | MOSS | 复旦大学 | CD | |
RWKV-4-Raven | 3/7/14B | 2023-04 | 中英 | 通用 | [🤗HF] | ChatRWKV | BlinkDL | RNN | Blog |
Phoenix-inst-chat | 7B | 2023-04 | 中文 | 通用 | [🤗HF] | LLMZoo | 香港中文大学 | CD | |
Phoenix-chat | 7B | 2023-04 | 中文 | 通用 | [🤗HF] | LLMZoo | 香港中文大学 | CD | |
ChatPLUG | 3.7B | 2023-04 | 中文 | 通用 | [🤗HF] | ChatPLUG | 阿里巴巴 | ED | Paper |
Chinese-Alpaca | 13B | 2023-04 | 中文 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | |
BELLE-LLAMA | 13B | 2023-04 | 中文 | 通用 | [🤗HF] | BELLE | 贝壳 | CD | |
LLaMA-tuned | 7/13/33/65B | 2023-04 | 中文 | 通用 | [🤗HF] | LMFlow | 香港科技大学 | CD | |
Chinese-Vicuna | 7/13B | 2023-03 | 中文 | 通用 | [🤗HF] | Chinese-Vicuna | Facico | CD | |
ChatYuan-V2 | 0.7B | 2023-03 | 中英 | 通用 | [🤗HF] | ChatYuan | 元语智能 | ED | |
Chinese-Alpaca | 7B | 2023-03 | 中文 | 通用 | [🤗HF] | Chinese-LLaMA-Alpaca | Yiming Cui | CD | |
Luotuo | 7B | 2023-03 | 中文 | 通用 | [🤗HF] | Chinese-alpaca-lora | 华中师范大学 | CD | |
BELLE-LLAMA | 7B | 2023-03 | 中英 | 通用 | [🤗HF] | BELLE | 贝壳 | CD | |
ChatGLM | 6B | 2023-03 | 中英 | 通用 | [🤗HF] | ChatGLM-6B | 清华大学 | ND |
开源的垂直领域对话大模型
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 架构 | 文献 |
---|---|---|---|---|---|---|---|---|---|
珠算 | 2.7B | 2024-09 | 中英 | 代码 | 🤗HF | Abacus | HIT-SCIR | CD | |
Qwen-2.5 | 1.5/7B | 2024-09 | 中英 | 代码 | 🤗HF | Qwen2.5 | QwenLM | CD | Blog |
Qwen-2.5 | 1.5/7/72B | 2024-09 | 中英 | 数学 | 🤗HF | Qwen2.5 | QwenLM | CD | Blog |
Yi-Coder | 1.5/9B | 2024-09 | 中英 | 代码 | 🤗 Hugging Face • 🤖 ModelScope • 🟣 wisemodel | Yi-Coder | 01-ai | CD | Paper Blog |
CodeGeeX4 | 9B | 2024-07 | 多语 | 代码 | 🤗HF | CodeGeeX4 | THUDM | ||
DeepSeek-Coder-V2 | A16B/236B | 2024-06 | 中英 | 代码 | 🤗HF | DeepSeek-V2 | deepseek-ai | MoE | Paper |
AutoCoder | 6.7/33B | 2024-06 | / | 代码 | 🤗HF | AutoCoder | Bin Lei | CD | Paper |
Codestral | 22B | 2024-05 | / | 代码 | 🤗HF | / | mistralai | / | Blog |
CodeQwen1.5-Chat | 7B | 2024-04 | 中英 | 代码 | 🤗HF | Qwen1.5 | Qwen | CD | Blog |
codegemma | 2/7B | 2024-04 | 多语 | 代码 | 🤗HF | / | |||
WaveCoder | 6.7B | 2024-04 | 多语 | 代码 | 🤗HF | WaveCoder | microsoft | Paper | |
ChemDFM | 13B | 2024-03 | 中英 | 化学 | 🤗HF | / | OpenDFM | CD | Paper |
starcoder2 | 3/7/15B | 2024-02 | 中英 | 代码 | 🤗HF | starcoder2 | bigcode-project | CD | Paper |
TuringMM-Chat | 34B | 2024-02 | 中英 | 教育 | 🤗HuggingFace 🤖ModelScope | / | 光年无限 | CD | |
deepseek-moe | 16B | 2024-01 | 中英 | 代码 | [🤗HF] | DeepSeekMoE | DeepSeek | CD-MOE | |
Code Millenials | 1/3/13/34B | 2023-01 | 多语 | 代码 | [🤗HF] | code-millenials | BudEcosystem | CD | |
WizardCoder | 15/33B | 2024-01 | 多语 | 代码 | [🤗HF] | WizardLM | operatorx | CD | Paper |
DeepSeek-Coder | 1/7/33B | 2023-11 | 中英 | 代码 | [🤗HF] | DeepSeek-Coder | deepseek-ai | Blog | |
Phind | 34B | 2023-10 | 多语 | 代码 | [🤗HF] | / | Phind | CD | Blog zh |
Tongyi-Finance-Chat | 14B | 2023-11 | 中文 | 金融 | ModelScope | 通义金融-14B-Chat | 通义金融大模型 | CD | |
Skywork-math | 13B | 2023-10 | 中文 | 数学 | [🤗HF] | Skywork | SkyworkAI | CD | Paper |
XuanYuan-Chat | 70B | 2023-10 | 中英 | 金融 | [🤗HF] | XuanYuan | Duxiaoman度小满 | CD | |
zhilu | 13B | 2023-10 | 中英 | 金融 | [🤗HF] | / | SYSU-MUCFC-FinTech-Research-Center | CD | |
TestGPT | 7B | 2023-10 | 中文 | 测试 | [🤗HF] | Test-Agent | codefuse-ai | CD | |
cross | 7/13B | 2023-10 | 多语 | 数学 | [🤗HF] | / | Mathoctopus | CD | |
CodeFuse | 13/14/15/34B | 2023-10 | 中文 | 代码 | [🤗HF] | MFTCoder | codefuse-ai | CD | |
Taiyi | 7B | 2023-10 | 中英 | 医学 | [🤗HF] | Taiyi-LLM | DUTIR-BioNLP | CD | |
CodeShell-chat | 7B | 2023-10 | 中英 | 代码 | [🤗HF] | codeshell | WisdomShell | CD | |
DISC-LawLLM | 13B | 2023-09 | 中文 | 法律 | [🤗HF] | / | ShengbinYue | CD | Report |
WiNGPT-chat | 7B | 2023-09 | 中文 | 医学 | [🤗HF] | WiNGPT2 | Winning Health AI Research | CD | |
ziya-coding | 15/34B | 2023-09 | 中英 | 代码 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | |
AgriGPT | 6/13b | 2023-09 | 中文 | 农业 | [🤗HF] | AgriGPTs | AgriGPTs | ||
XuanYuan-chat | 70B | 2023-09 | 中文 | 金融 | TODO | XuanYuan | 度小满 | CD | Report |
夫子•明察 | 6B | 2023-09 | 中文 | 司法 | [🤗HF] | fuzi.mingcha | 山东大学 | ND | |
仲景 | 13B | 2023-09 | 中文 | 医学 | [🤗HF] | Zhongjing | Songhua Yang | CD | Paper |
CodeFuse | 13/34B | 2023-09 | 中英 | 代码 | [🤗HF] | MFTCoder | codefuse-ai | CD | |
EcomGPT | 7B | 2023-09 | 中英 | 电商 | TODO | EcomGPT | Alibaba | ||
DISC-MedLLM | 13B | 2023-08 | 中文 | 医疗 | [🤗HF] | DISC-MedLLM | FudanDISC | CD | Paper |
K2 | 7B | 2023-08 | 中英 | 科学 | [🤗HF] | k2 | daven | CD | |
CodeLLAma | 7/13/34B | 2023-08 | 多语 | 代码 | [🤗HF] | codellama | Meta Research | CD | Paper |
sqlcoder | 15B | 2023-08 | 中英 | 代码 | [🤗HF] | sqlcoder | Defog.ai | CD | |
智海-录问 | 7B | 2023-08 | 中文 | 法律 | [🤗HF] | wisdomInterrogatory | zhihaiLLM | CD | |
WizardMath-V1.0 | 7/13/70B | 2023-08 | 多语 | 数学 | [🤗HF] | WizardLM | operatorx | CD | |
QiaoBan | 7B | 2023-08 | 中文 | 情感 | [🤗HF] | QiaoBen | 哈尔滨工业大学 | ||
HuangDi | 13B | 2023-08 | 中文 | 中医 | [🤗HF] | HuangDI | Zlasejd | CD | |
ZhongJing | 2023-08 | 中文 | 中医 | TODO | CMLM-ZhongJing | 复旦大学 | |||
TCMLLM | 6B | 2023-08 | 中文 | 中医 | [🤗HF] | TCMLLM | 2020MEAI | ND | |
AutoAudit | 7B | 2023-07 | 中文 | 安全 | [🤗HF] | AutoAudit | Jiaying Li | CD | |
Lychee | 10B | 2023-07 | 中文 | 法律 | [🤗HF] | lychee_law | davidpig | ND | |
IvyGPT | 6B | 2023-07 | 中文 | 医学 | [🤗HF] | IvyGPT | WangRongsheng | ||
MING | 7B | 2023-07 | 中文 | 医学 | [🤗HF] | MING | 上海交通大学 | CD | |
Mozi | 7B | 2023-07 | 中英 | 科技 | [🤗HF] | science-llm | GMFTBY | CD | |
StarGLM | 6B | 2023-07 | 中文 | 天文 | [🤗HF] | StarGLM | LI YUYANG | ND | |
TransGPT | 7B | 2023-07 | 中英 | 交通 | [🤗HF] | TransGPT | 北京交通大学 | CD | |
CodeGeeX2 | 6B | 2023-07 | 中英 | 代码 | [🤗HF] | CodeGeeX2 | 清华大学 | ND | |
Yayi-llama2 | 7/13B | 2023-07 | 中英 | 舆情 | [🤗HF] | Yayi | 中科闻歌 | CD | |
Ziya-Writing | 13B | 2023-07 | 中英 | 写作 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | CD | |
MindChat | 13B | 2023-07 | 中文 | 心理 | [🤗HF] | MindChat | 华东理工大学 | CD | |
ShenNong-TCM-LLM | 7B | 2023-07 | 中英 | 医学 | [🤗HF] | ShenNong-TCM-LLM | michael-wzhu | CD | |
ailawyer | 13B | 2023-07 | 中英 | 法律 | [🤗HF] | JurisLMs | openkg | CD | |
educhat | 7B/13B | 2023-06 | 中英 | 教育 | [🤗HF] | EduChat | 华东师范大学 | CD | |
Sunsimiao | 7B | 2023-06 | 中英 | 医学 | [🤗HF] | Sunsimiao | 华东理工大学 | CD | |
Media LLaMA | 7B | 2023-06 | 中文 | 媒体 | baidu | Media-LLaMA | 智媒开源研究院 | CD | |
PULSE | 7/14B | 2023-06 | 中文 | 医学 | [🤗HF] | PULSE | OpenMEDLab | CD | |
ChatLaw | 13/33B | 2023-06 | 中文 | 法律 | [🤗HF] | ChatLaw | 北京大学 | CD | |
BaoLuo | 6B | 2023-06 | 中文 | 法律 | [🤗HF] | BaoLuo-LawAssisant | LeiZi | ND | |
CoLLaMA | 7B | 2023-06 | 中英 | 代码 | [🤗HF] | CoLLaMA | Denilah | CD | |
TechGPT | 7B | 2023-06 | 中英 | 教育 | [🤗HF] | TechGPT | 东北大学 | CD | |
Yayi | 7B | 2023-06 | 中英 | 舆情 | [🤗HF] | Yayi | 中科闻歌 | CD | |
MeChat | 6B | 2023-06 | 中文 | 医学 | [🤗HF] | smile | qiuhuachuan | ND | |
ziya-medical | 13b | 2023-06 | 中英 | 医学 | [🤗HF] | MedicalGPT | Ming Xu | CD | |
Taoli | 7B | 2023-06 | 中英 | 教育 | 待开源 | taoli | 北京语言大学 | CD | |
Lawyer-llama | 13B | 2023-06 | 中英 | 法律 | [🤗HF] | lawyer-llama | Quzhe Huang | CD | |
QiZhen-CaMA | 13B | 2023-06 | 中英 | 医学 | [🤗HF] | QiZhenGPT | 浙江大学 | CD | |
扁鹊-2.0 | 6B | 2023-06 | 中文 | 医学 | [🤗HF] | BianQue | 华南理工大学 | ND | |
SoulChat | 6B | 2023-06 | 中文 | 心理 | [🤗HF] | SoulChat | 华南理工大学 | ND | |
HanFei | 7B | 2023-05 | 中文 | 法律 | baidu-d6t5 | HanFei | 中国科学院深圳先进院 | CD | |
QiZhen | 6B | 2023-05 | 中英 | 医学 | [baidu] | QiZhenGPT | 浙江大学 | CD | |
ChatMed-Consult | 7B | 2023-05 | 中英 | 医学 | [🤗HF] | ChatMed | michael-wzhu | CD | |
LaWGPT-beta1.1 | 7B | 2023-05 | 中英 | 法律 | [🤗HF] | LawGPT | Pengxiao Song | CD | |
Cornucopia | 7B | 2023-05 | 中英 | 金融 | [🤗HF] | Cornucopia-LLaMA-Fin-Chinese | yuyangmu | CD | |
HuatuoGPT | 7B | 2023-05 | 中文 | 医学 | [🤗HF] | HuatuoGPT | 香港中文大学 | CD | Paper |
LexiLaw | 6B | 2023-05 | 中文 | 法律 | [🤗HF] | LexiLaw | Haitao Li | ND | Paper |
XuanYuan | 176B | 2023-05 | 中文 | 金融 | 申请 | XuanYuan | 度小满 | CD | Paper |
LawGPT | 6B | 2023-05 | 中文 | 法律 | [🤗HF] | LAW-GPT | hongchengliu | N | |
扁鹊-1.0 | 0.7B | 2023-04 | 中文 | 医学 | [🤗HF] | BianQue | scutcyr | ED | |
ChatGLM-Med | 6B | 2023-04 | 中文 | 医学 | [🤗HF] | Med-ChatGLM | 哈尔滨工业大学 | ED | |
BenTsao | 7B | 2023-04 | 中文 | 医学 | [🤗HF] | Huatuo-Llama-Med-Chinese | 哈尔滨工业大学 | CD | |
DoctorGLM | 6B | 2023-04 | 中文 | 医学 | TODO | DoctorGLM | xionghonglin | ND | |
Firefly | 1/2/7B | 2023-04 | 中文 | 文化 | [🤗HF] | Firefly | Yang JianXin | CD | |
ChatRWKV | 7B | 2023-01 | 中英 | 小说 | [🤗HF] | ChatRWKV | BlinkDL | RNN | Blog |
收集包含中文的多模态大模型,具备对话等功能。
模型 | 大小 | 时间 | 语言模型 | 非语言模型 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 文献 |
---|---|---|---|---|---|---|---|---|---|---|
GOT-OCR-2.0 | / | 2024-09 | Qwen | / | 中英 | 图文 | 🤗HF | GOT-OCR2.0 | StepFun-AI | Paper |
Ovis-1.6 | 9B | 2024-09 | Gemma2-9B-It | Siglip-400M | 中英 | 图文 | 🤗 | Ovis | AIDC-AI | Paper |
Qwen2-VL | 2/7/72B | 2024-08 | / | / | 多语 | 图文视 | 🤗 🤖 | Qwen2-VL | QwenLM | |
CogVideoX | 2/5B | 2024-08 | / | / | 中英 | 文视 | 🤗 link | CogVideo | THUDM | |
MiniCPM-V 2.6 | 8B | 2024-08 | Qwen2-7B | SigLip-400M | 中英 | 文图视 | 🤗 link | MiniCPM-V | OpenBMB | |
InternVL2 | 1/2/4/8/26/40/76B | 2024-07 | Qwen2/internlm2/llama3 | InternViT | 中英 | 文图 | 🤗 link 🤖 link | InternVL | OpenGVLab | report |
Qwen2-Audio | 8.2B | 2024-07 | Qwen2 | Whisper-large-V3 | 中英 | 文音 | 🤗HF | Qwen2-Audio | QwenLM | report |
Kolors | / | 2024-07 | ChatGLM3-Base | / | 中英 | 文图 | 🤗HF | Kolors | Kwai-Kolors | Paper |
ChatTTS | / | 2024-06 | / | / | 中英 | 文音 | 🤗HF | ChatTTS | 2noise | / |
GLM-4V | 9B | 2024-06 | GLM-4 | / | 多语 | 文图 | 🤗HF | GLM-4 | THUDM | / |
HunyuanDiT | 1.5B | 2024-05 | multilingual T5 encoder | CLIP | 中英 | 文图 | 🤗 | HunyuanDiT | Tencent | Paper |
CogVLM2 | 2024-05 | Meta-Llama-3-8B-Instruct | / | 中英 | 文图 | 🤗 | CogVLM | Skip to content | ||
360VL | 8/70B | 2024-05 | LLama3 | CLIP-ViT | 中英 | 文图 | 🤗 | 360VL | 360CVGroup | |
XVERSE-V | 13B | 2024-05 | XVERSE-13B-Chat | clip-vit-large-patch14-224 | 中英 | 文图 | 🤖 | XVERSE-V-13B | xverse-ai | |
MiniCPM-V 2.0 | 2.8B | 2024-04 | MiniCPM-2.4B | SigLip-400M | 中英 | 文图 | 🤗 🤖 | MiniCPM-V | OpenBMB | Blog |
Qwen-Audio | 7B | 2024-03 | Qwen-7B | Whisper-large-v2 | 中英 | 文音 | 🤗HF | Qwen-Audio | Qwen | Paper |
DeepSeek-VL | 1.3/7B | 2024-03 | DeepSeek | SigLip/SAM | 中英 | 图文 | 🤗HF | DeepSeek-VL | deepseek-ai | Paper |
OmniLMM | 3/12B | 2024-02 | MiniCPM | SigLip | 中英 | 图文 | 🤗HF | OmniLMM | [OpenBMB](https://github.com/01-ai) | |
MiniCPM-V | 3B | 2024-02 | MiniCPM-2.4B | SigLip-400M | 中英 | 图文 | 🤗HF | OmniLMM | [OpenBMB](https://github.com/01-ai) | |
Yi-VL | 6/34B | 2024-01 | Yi | CLIP-VIT | 中英 | 图文 | [🤗HF] | Yi | 01-ai | |
Lyrics | 14B | 2023-12 | / | / | 中英 | 图文 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | |
Qwen-Audio | 7B | 2023-12 | Qwen-7B | Whisper-large-v2 | 中英 | 文音 | [🤗HF] | Qwen-Audio | Qwen | Paper |
SPHINX | 13B | 2023-10 | / | / | 中英 | 图文 | [🤗HF] | LLaMA2-Accessory | Alpha-VLLM | |
Skywork-MM | 13B | 2023-10 | / | / | 中英 | 图文 | [🤗HF] | Skywork | SkyworkAI | Paper |
CogVLM | 7/14B | 2023-10 | Qwen | ViT | 中英 | 图文 | [🤗HF] | / | CausalLM | |
fuyu | 8B | 2023-10 | / | / | 中英 | 图文 | [🤗HF] | / | Adept AI Labs | Blog |
Ziya-Visual | 14B | 2023-10 | LLaMA | InstructBLIP | 中英 | 图文 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | Paper |
CogVLM | 17B | 2023-10 | EVA2-CLIP-E | Vicuna-v1.5 | 中英 | 图文 | TODO | CogVLM | THUDM | Paper |
idefics | 9/80B | 2023-10 | LLaMA | CLIP-ViT | 中英 | 图文 | [🤗HF] | / | HuggingFaceM4 | log |
InternLM-XComposer | 7B | 2023-10 | InternLM | EVA-CLIP | 中英 | 图文 | [🤗HF] | InternLM-XComposer | InternLM | Report |
WeMix-LLM | 13B | 2023-09 | LLama2 | / | 中英 | 图文 | [🤗HF] | WeMix-LLM | Alpha-VLLM | |
Vally | 7/13B | 2023-08 | BelleGroup/BELLE-LLaMA-EXT | OFA-Sys/chinese-clip-vit-large-patch14 | 中英 | 图文 | [🤗HF] [🤗HF] | Valley | 罗瑞璞 | Paper |
SALMONN | / | 2023-08 | / | / | 中英 | 语音 | TODO | SALMONN | Bytedance | |
IDEFICS | 9/80B | 2023-08 | llama | CLIP-ViT | 中英 | 图文-通用 | [🤗HF] | m4-logs | HuggingFaceM4 | Paper |
Qwen-VL | 7B | 2023-08 | Qwen-7B | Openclip ViT-bigG | 中英 | 通用 | [🤗HF] | Qwen-VL | 阿里云 | |
Qwen-VL-chat | 7B | 2023-08 | Qwen-7B | Openclip ViT-bigG | 中英 | 通用 | [🤗HF] | Qwen-VL | 阿里云 | |
LLasM | 7B | 2023-07 | Chinese-Llama2 | whisper-large-v2 | 中英 | 语音 | [🤗HF] | LLaSM | 北京灵琐 | |
Chinese-LLaVA | 7B | 2023-07 | Chinese-Llama2 | Clip-vit | 中英 | 视觉 | [🤗HF] | Chinese-LLaVA | 北京灵琐 | |
RemoteGLM | 6B | 2023-07 | VisualGLM-6B | VisualGLM-6B | 中文 | 遥感 | TODO | RemoteGLM | lzw-lzw | |
VisualCLA | 7B | 2023-07 | Chinese-Alpaca-Plus | CLIP-ViT-L/14 | 中文 | 视觉 | [🤗HF] | Visual-Chinese-LLaMA-Alpaca | Ziqing Yang | |
yuren | 7B | 2023-07 | baichuan-7B | CLIP | 中英 | 视觉 | [🤗HF] | yuren-baichuan-7b | Pleisto | |
VisCPM-Chat | 10B | 2023-06 | CPM-Bee | Q-Former | 中英 | 视觉 | [🤗HF] | VisCPM | OpenBMB | |
VisCPM-Paint | 10B | 2023-06 | CPM-Bee | Stable Diffusion 2.1 | 中英 | 视觉 | [🤗HF] | VisCPM | OpenBMB | |
XrayPULSE | 7B | 2023-06 | PULSE | MedCLIP | 中文 | 医学 | [🤗HF] | XrayPULSE | OpenMEDLab | |
SEEChat | 6B | 2023-06 | ChatGLM | CLIP-ViT | 中文 | / | [🤗HF] | SEEChat | 360 | |
Ziya-BLIP2-14B-Visual-v1 | 14B | 2023-06 | LLaMA-13B | BLIP2 | 中英 | 通用 | [🤗HF] | Fengshenbang-LM | IDEA研究院 | |
Video-LLaMA-BiLLA | 7B | 2023-05 | BiLLa-7B | MiniGPT-4 | 中英 | 通用 | [🤗HF] | Video-LLaMA | 达摩院多语言NLP | Paper |
Video-LLaMA-Ziya | 13B | 2023-05 | Ziya-13B | MiniGPT-4 | 中英 | 通用 | [🤗HF] | Video-LLaMA | 达摩院多语言NLP | Paper |
XrayGLM | 6B | 2023-05 | ChatGLM-6B | BLIP2-Qformer | 中英 | 医学 | [🤗HF] | XrayGLM | 澳门理工大学 | |
X-LLM | 2023-05 | ChatGLM | ViT-g | 中文 | / | TODO | X-LLM | 中科院自动化所 | Paper | |
VisualGLM | 6B | 2023-05 | ChatGLM-6B | BLIP2-Qformer | 中英 | 视觉 | [🤗HF] | VisualGLM-6B | 清华大学 |
收集包含中文的指令数据集,用于微调语言模型。
名称 | 大小 | 时间 | 语言 | 下载 | 项目地址 | 作者 | 备注 |
---|---|---|---|---|---|---|---|
FinCorpus | 50G | 2023-09 | 中文 | dataset | XuanYuan | 度小满 | 金融领域 |
TransGPT-sft | 346k | 2023-07 | 中文 | dataset | TransGPT | 北京交通大学 | |
TransGPT-pt | 58k | 2023-07 | 中文 | dataset | TransGPT | 北京交通大学 | |
ShareGPT-Chinese-English | 90K | 2023-07 | 中英 | dataset | llama2-Chinese-chat | Ke Bai | |
educhat-sft-002-data-osm | 400w | 2023-06 | 中英 | dataset | EduChat | 华东师范大学 | 教育 |
chatgpt-corpus | 3M | 2023-06 | 中文 | dataset | chatgpt-corpus | plex | |
Simle | 350k | 2023-06 | 中文 | dataset | smile | qiuhuachuan | 心理健康 |
QiZhen | 20k | 2023-06 | 中文 | dataset | QiZhenGPT | 浙江大学 | 医学 |
BayLing-80 | 80 | 2023-06 | 中英 | dataset | BayLing | 中国科学院 | 多轮指令 |
Tigerbot-dataset | 120k | 2023-06 | 中英 | dataset | TigerBot | 虎博科技 | |
lawyer-llama | / | 2023-05 | 中文 | dataset | lawyer-llama | Quzhe Huang | 法律 |
Bactrian-X | 67K | 2023-05 | 多语 | dataset | bactrian-x | MBZUAI | |
CrimeKgAssitant | 52k | 2023-05 | 中文 | dataset | LAW-GPT | hongchengliu | 法律 |
moss-002-sft-data | 1.1M | 2023-04 | 中英 | dataset | MOSS | 复旦大学 | |
moss-003-sft-data | 1.1M | 2023-04 | 中英 | dataset | MOSS | 复旦大学 | |
moss-003-sft-plugin-data | 300K | 2023-04 | 中英 | dataset | MOSS | 复旦大学 | |
Safety-Prompts | 100K | 2023-04 | 中文 | dataset | Safety-Prompts | 清华大学 | 评测平台 |
OASST1 | / | 2023-04 | 多语 | dataset | Open-Assistant | OpenAssistant | |
ShareChat | 90K | 2023-04 | 中英 | dataset | ShareChat | czhko | |
GPT-4-LLM | 52K | 2023-04 | 中文 | dataset | GPT-4-LLM | Instruction-Tuning-with-GPT-4 | paper |
COIG | 200K | 2023-04 | 中文 | dataset | FlagInstruct | BAAI | paper |
RedGPT | 50k | 2023-04 | 中文 | dataset | RedGPT | MiniGPT | |
shareGPT_cn | 20k | 2023-04 | 中文 | dataset | shareGPT_cn | shareAI | |
generated_chat_0.4M | 0.4M | 2023-04 | 中文 | dataset | BELLE | Ke Technologies | 角色对话 |
multiturn_chat_0.8M | 0.8M | 2023-04 | 中文 | dataset | BELLE | Ke Technologies | 多轮任务 |
school_math_0.25M | 0.25M | 2023-04 | 中文 | dataset | BELLE | Ke Technologies | 数学题 |
Zhihu-KOL | / | 2023-03 | 中文 | dataset | Zhihu-KOL | Rui Wang | |
InstructionWild | 104k | 2023-03 | 中英 | dataset | InstructionWild | Xue Fuzhao | |
Alpaca-CoT | /. | 2023-03 | 中英 | dataset | Alpaca-CoT | Qingyi Si | |
GuanacoDataset | / | 2023-03 | 多语 | dataset | guanaco-model | Guanaco | |
Traditional-Chinese-alpaca | 52K | 2023-03 | 中文 | dataset | Traditional-Chinese Alpaca | NTU NLP Lab | gpt翻译 |
alpaca_chinese_dataset | / | 2023-03 | 中文 | dataset | alpaca_chinese_dataset | akou | 人工校验 |
alpaca-chinese-dataset | / | 2023-03 | 中文 | dataset | alpaca-chinese-dataset | carbonz | 机器翻译 |
train_2M_CN | 2M | 2023-03 | 中文 | dataset | BELLE | Ke Technologies | |
train_1M_CN | 1M | 2023-03 | 中文 | dataset | BELLE | Ke Technologies | |
train_0.5M_CN | 0.5M | 2023-03 | 中文 | dataset | BELLE | Ke Technologies | |
HC3 人类-ChatGPT 问答 | / | 2023-03 | 中文 | dataset | chatgpt-comparison-detection | SimpleAI | |
firefly-train-1.1M | 1.1M | 2023-03 | 中文 | dataset | Firefly | Jianxin Yang |
模型 | 大小 | 时间 | 语言 | 领域 | 下载 | 项目地址 | 机构/个人 | 文 |
---|---|---|---|---|---|---|---|---|
JinaColBERT V2 | large | 2024-08 | 多语 | 通用 | [🤗HF] | / | Jina AI | Paper |
Conan-embedding-v1 | large | 2024-08 | 中文 | 通用 | [🤗HF] | / | TencentABC | Paper |
xiaobu-v2 | large | 2024-07 | 中文 | 通用 | [🤗HF] | / | lier007 | |
zpoint_large | Large | 2024-06 | 中文 | 通用 | [🤗HF] | / | yang | |
BCE | 279M | 2024-01 | 多语 | 通用 | [🤗HF] | BCEmbedding | netease-youdao | |
Cohere | Base | 2023-09 | 多语 | 通用 | [🤗HF] | / | Cohere | Blog |
jina | Base | 2023-10 | 中英 | 通用 | [🤗HF] | / | Jina AI | |
Dmeta | 400MB | 2024-02 | 中文 | 通用 | [🤗HF] | / | DMetaSoul | |
bge-m3 | 2024-02 | 中文 | 通用 | [🤗HF] | / | BAAI | Paper | |
tao-8k | 2023-11 | 中文 | 通用 | [🤗HF] | amu | |||
bge | s/b/l | 2023-10 | 中文 | 通用 | [🤗HF] | / | BAAI | |
gte-zh | s/b/l | 2023-08 | 中文 | 通用 | [🤗HF] | / | Alibaba DAMO | Paper |
m3e | s/b/l | 2023-06 | 中文 | 通用 | [🤗HF] | / | Moka-AI | |
LaBSE | 多语 | 通用 | [🤗HF] | / | Sentence Transformers |
C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题,涵盖了52个不同的学科和四个难度级别,查看论文了解更多细节。
FlagEval是一个面向AI基础模型的评测工具包。我们的目标是探索和集合科学、公正、开放的基础模型评测基准、方法及工具,对多领域(如语言、语音、视觉及多模态)的基础模型进行多维度(如准确性、效率、鲁棒性等)的评测。我们希望通过对基础模型的评测,加深对基础模型的理解,促进相关的技术创新及产业应用。
SuperCLUE琅琊榜,这是一个中文通用大模型对战评价基准,它以众包的方式提供匿名、随机的对战。在本文中,我们发布了初步的结果和基于Elo评级系统的排行榜,Elo评级是国际象棋和其他竞技游戏中广泛使用的评级系统。我们邀请整个社区加入这项工作,贡献新的模型,并通过提问和投票选出你最喜欢的答案来评估它们。
该基准包括来自13个不同学科的516个学科的220,000个多项选择题,以及15,000个来自单一学科和多个学科的问题。我们对47个最新的大型语言模型在Xiezhi上进行了评估,结果表明在科学、工程、农学、医学和艺术等领域,大型语言模型的表现超过了人类的平均水平,但在经济学、法学、教育学、文学、历史和管理学等领域,人类的表现仍然远远超过了大型语言模型。
由HuggingFace组织的一个LLM评测榜单,目前已评估了较多主流的开源LLM模型,以英文为主。主要目标是跟踪、排名和评估最新的大语言模型和聊天机器人,让所有人方便的观察到开源社区的进展和评估这些模型。这个排行榜有一个关键优势,社区中的任何成员都可以提交模型,并在 Hugging Face 的 GPU 集群上自动评估。
[官方网站]
大模型安全测评依托于一套系统的安全评测框架,涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别,包括细粒度划分的40余个二级安全类别。
OpenCompass 是一款开源、高效、全面的评测大模型体系及开放平台。我们提供完整开源可复现的评测框架,支持大语言模型、多模态模型各类模型的一站式评测。利用分布式技术,即使面对千亿参数模型也能在数小时内完成评测。基于多个不同维度的高认可度数据集开放多样化的评测方式,包括零样本评测、小样本评测和思维链评测,全方位量化模型各个维度能力。
注:需要申请或者注册方可体验,更多见Github
OpenAI所提出的GPT相关模型,也是目前最火的大语言模型,发布版本已经到了4.0.
[官方网站]
NewBing是微软在2023年3月推出的一款全新的搜索引擎,它基于OpenAI的大型语言模型(LLM),并结合了ChatGPT和DALL·E的技术,为用户提供了一个AI驱动的网络助手。
[官方网站]
百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。
[官方网站]
阿里大模型统一品牌,覆盖语言、听觉、多模态等领域致力于实现接近人类智慧的通用智能,让AI从“单一感官”到“五官全开”
[官方网站]
科大讯飞推出的新一代认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化,实现从提出、规划到解决问题的全流程闭环。
[官方网站]
Claude,是人工智能初创公司Anthropic 发布的一款类似ChatGPT的产品。
[官方网站]
基于千亿基座模型 GLM-130B,注入代码预训练,通过有监督微调等技术实现人类意图对齐,具备问答、多轮对话、代码生成功能的中英双语大模型。
[官方网站]
天工作为一款大型语言模型,拥有强大的自然语言处理和智能交互能力,能够实现智能问答、聊天互动、文本生成等多种应用场景,并且具有丰富的知识储备,涵盖科学、技术、文化、艺术、历史等领域。
[官方网站]
序列猴子大模型是一个具有长序列、多模态、单模型、大数据等特点的超大规模语言模型,基于其通用的表示能力与推理能力,能够进行多轮交互,打造更便捷流畅的用户体验,极大地提高了生产效率和数据处理能力,被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。
[官方网站]
MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型
[官方网站]
360智脑的生成与创作、多轮对话、代码能力、阅读理解、逻辑与推理、多模态等十大核心能力可覆盖大模型全部应用场景。
[官方网站]
达观数据积极探索大语言模型LLM的实践,研发国产版GPT“曹植”系统,作为垂直、专用、自主可控的国产版ChatGPT模型,不仅实现专业领域的AIGC智能化应用,且可内置在客户各类业务系统中提供专用服务
[官方网站]
商汤“日日新SenseNova”大模型体系,正式问世
不仅展示了大模型体系下的语言大模型,还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用,还揭开了依托商汤AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。
[官方网站]
天燕大模型是APUS公司自研的多模态大模型(LMM),具备对文本、图像、视频、音频的理解和生成能力(视频和音频的能力即将推出)。
[官方网站]
图文机器人
[官方网站]
[官方网站]
AI多模态搜索引擎
[官方网站]
只需一次对话即可获取信息、知识和灵感,解决需求。是每个人身边的助理、朋友和专家。
[官方网站]
MiniMax 最新一代的中文大语言模型帮助人类高效写作、激发创意、获取知识、做出决策现已对企业开放API体验
[官方网站]
本项目旨在收集关于ChatGPT 的资源、工具、应用和用法等。
本项目旨在收集关于ChatGPT 模型使用的Prompts示例集。
本项目旨在收集有关大型语言模型相关资料,尤其是 ChatGPT 的论文的精选列表。它还包含 LLM 训练框架、部署 LLM 的工具、有关 LLM 的课程和教程以及所有公开可用的 LLM 模型和 API。
本项目旨在收集与LangChain有关应用列表。LangChain是一个惊人的框架,可以在短时间内完成相关LLM应用开发。
本项目旨在收集关于GPT开源精选项目的合集(170+全网最全),其中包括了一些GPT镜像、GPT增强、GPT插件、GPT工具、GPT平替的聊天机器人、开源大语言模型等等。
本项目是关于多模态大语言模型(MLLM)的精选列表,包括数据集、多模态模型、多模态语境学习、多模态思维链、llm 辅助视觉推理、基础模型等。此列表将实时更新。✨
此 repo 包含 Vision Transformer & Attention 的综合论文列表,包括论文、代码和相关网站。
This repository contains a hand-curated resources for Prompt Engineering with a focus on Generative Pre-trained Transformer (GPT), ChatGPT, PaLM etc
这个仓库整理AI相关的实用工具。
本项目旨在收集和梳理中文LLM相关的开源模型、应用、数据集及教程等资料,目前收录的资源已达100+个!
Awesome-LLM4Tool is a curated list of the papers, repositories, tutorials, and anythings related to the large language models for tools.
A curation of awesome tools, documents and projects about LLM Security.
Welcome to our list of AI agents. We structured the list into two parts: Open source projects and Closed-source projects and companies
LLM-Large-Language-Models-Notes
A curated list for Efficient Large Language Models。
A quick guide (especially) for trending instruction finetuning datasets。
A collection of papers and resources about aligning large language models (LLMs) with human.
This is a collection of research papers for Reinforcement Learning with Human Feedback (RLHF). And the repository will be continuously updated to track the frontier of RLHF.
An Open-Source Engineering Guide for Prompt-in-context-learning from EgoAlpha Lab.
An awesome reading list of Instruction Tuning (or, put it more comprehensively, Instruction Learning), including papers and datasets.
A foundation model is a large-scale pretrained model (e.g., BERT, DALL-E, GPT-3) that can be adapted to a wide range of downstream applications. This term was first popularized by the Stanford Institute for Human-Centered Artificial Intelligence. This repository maintains a curated list of foundation models for vision and language tasks. Research papers without code are not included.
This is a curated list of AI-powered developer tools. These tools leverage AI to assist developers in tasks such as code completion, refactoring, debugging, documentation, and more.
A curated list of awesome projects and resources related to autonomous AI agents.
This is a collection of recent papers focusing on autonomous agent.
a comprehensive review of LLM researches for code.
Awesome LLM compression research papers and tools to accelerate LLM training and inference.
Autonomous Agents (LLMs). Updated daily.
Awesome Large Multimodal Agents.
This repo aims to record advanced papers of LLM prompt tuning and automatic optimization (after 2022).
代表性LLM文本数据集大列表,包括预训练语料库、微调指令数据集、偏好数据集、评估数据集和传统NLP数据集.
This repo is constructed for collecting and categorizing papers about RAG according to our survey paper: Retrieval-Augmented Generation for AI-Generated Content: A Survey. Considering the rapid growth of this field, we will continue to update both paper and this repo.
Language models (LMs) are powerful yet mostly for text-generation tasks. Tools have substantially enhanced their performance for tasks that require complex skills.
Recently, tool learning with large language models~(LLMs) has emerged as a promising paradigm for augmenting the capabilities of LLMs to tackle highly complex problems.
This is the collection of papers related to tool learning with LLMs. These papers are organized according to our survey paper "Tool Learning with Large Language Models: A Survey".
Awesome Foundation Model Leaderboard is a curated list of awesome foundation model leaderboards (for an explanation of what a leaderboard is, please refer to this post), along with various development tools and evaluation organizations according to our survey:.
Awesome-LLM-KV-Cache: A curated list of 📙Awesome LLM KV Cache Papers with Codes. This repository is for personal use of learning and classifying the burning KV Cache related papers!
This is a collection of research papers & blogs for OpenAI Strawberry(o1) and Reasoning.
And the repository will be continuously updated to track the frontier of LLM Reasoning.
🧑🚀 全世界最好的LLM资料总结 | Summary of the world's best LLM resources.
The related works and background techniques about OpenAI o1, including LLM reasoning, self-play reinforcement learning, complex logic reasoning, scaling law, etc.
Curated collection of papers and resources on how to unlock the reasoning ability of LLMs and MLLMs.
PDF
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
BERT-Base | base | Google Drive | Google Research | github | 通用 | |
BERT-wwm | base | Google Drive讯飞云-07Xj | Google Drive | Yiming Cui | github | 通用 |
BERT-wwm-ext | base | Google Drive讯飞云-4cMG | Google Drive | Yiming Cui | github | 通用 |
bert-base-民事 | base | 阿里云 | THUNLP | github | 司法 | |
bert-base-刑事 | base | 阿里云 | THUNLP | github | 司法 | |
BAAI-JDAI-BERT | base | 京东云 | JDAI | github | 电商客服对话 | |
FinBERT | base | Google Drive百度网盘-1cmp | Google Drive百度网盘-986f | Value Simplex | github | 金融科技领域 |
EduBERT | base | 好未来AI | 好未来AI | tal-tech | github | 教育领域 |
guwenbert-base | base | 百度网盘-4jng[🤗HF] | Ethan | github | 古文领域 | |
guwenbert-large | large | 百度网盘-m5sz[🤗HF] | Ethan | github | 古文领域 | |
BERT-CCPoem | small | thunlp | THUNLP-AIPoet | github | 古典诗歌 |
备注:
wwm全称为**Whole Word Masking **,一个完整的词的部分WordPiece子词被mask,则同属该词的其他部分也会被mask
ext表示在更多数据集下训练
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
ChineseBERT | base | [🤗HF] | ShannonAI | github | 通用 | |
ChineseBERT | large | [🤗HF] | ShannonAI | github | 通用 |
PDF
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Albert_tiny | tiny | Google Drive | Google Drive | brightmart | github | 通用 |
Albert_base_zh | base | Google Drive | Google Drive | brightmart | github | 通用 |
Albert_large_zh | large | Google Drive | Google Drive | brightmart | github | 通用 |
Albert_xlarge_zh | xlarge | Google Drive | Google Drive | brightmart | github | 通用 |
Albert_base | base | Google Drive | Google Research | github | 通用 | |
Albert_large | large | Google Drive | Google Research | github | 通用 | |
Albert_xlarge | xlarge | Google Drive | Google Research | github | 通用 | |
Albert_xxlarge | xxlarge | Google Drive | Google Research | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
NEZHA-base | base | Google Drive百度网盘-ntn3 | lonePatient | HUAWEI | github | 通用 |
NEZHA-base-wwm | base | Google Drive百度网盘-f68o | lonePatient | HUAWEI | github | 通用 |
NEZHA-large | large | Google Drive百度网盘-7thu | lonePatient | HUAWEI | github | 通用 |
NEZHA-large-wwm | large | Google Drive百度网盘-ni4o | lonePatient | HUAWEI | github | 通用 |
WoNEZHA(word-base) | base | 百度网盘-qgkq | ZhuiyiTechnology | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
MacBERT-base | base | Google Drive讯飞云-E2cP | Yiming Cui | github | 通用 | |
MacBERT-large | large | Google Drive讯飞云-3Yg3 | Yiming Cui | github | 通用 |
Blog post
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
WoBERT | base | 百度网盘-kim2 | ZhuiyiTechnology | github | 通用 | |
WoBERT-plus | base | 百度网盘-aedw | ZhuiyiTechnology | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
XLNet-base | base | Google Drive讯飞云-uCpe | Google Drive | Yiming Cui | github | 通用 |
XLNet-mid | middle | Google Drive讯飞云-68En | Google Drive | Yiming Cui | github | 通用 |
XLNet_zh_Large | large | 百度网盘 | brightmart | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
ELECTRA-180g-large | large | Google Drive讯飞云-Yfcy | Yiming Cui | github | 通用 | |
ELECTRA-180g-small-ex | small | Google Drive讯飞云-GUdp | Yiming Cui | github | 通用 | |
ELECTRA-180g-base | base | Google Drive讯飞云-Xcvm | Yiming Cui | github | 通用 | |
ELECTRA-180g-small | small | Google Drive讯飞云-qsHj | Yiming Cui | github | 通用 | |
legal-ELECTRA-large | large | Google Drive讯飞云-7f7b | Yiming Cui | github | 司法领域 | |
legal-ELECTRA-base | base | Google Drive讯飞云-7f7b | Yiming Cui | github | 司法领域 | |
legal-ELECTRA-small | small | Google Drive讯飞云-7f7b | Yiming Cui | github | 司法领域 | |
ELECTRA-tiny | tiny | Google Drive百度网盘-rs99 | CLUE | github | 通用 |
PDF
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
ZEN-Base | base | Google Drive百度网盘 | Sinovation Ventures AI Institute | github | 通用 | |
Erlangshen-ZEN2 | large | [🤗HF] | IDEA-CCNL | github | 通用 |
2019 | ERNIE: Enhanced Representation through Knowledge Integration | Yu Sun, et al. | arXiv | PDF
2020 | SKEP: Sentiment Knowledge Enhanced Pre-training for Sentiment Analysis | Hao Tian, et al. | arXiv | PDF
2020 | ERNIE-Gram: Pre-Training with Explicitly N-Gram Masked Language Modeling for Natural Language Understanding | Dongling Xiao, et al. | arXiv | PDF
模型 | 版本 | PaddlePaddle | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
ernie-1.0-base | base | link | PaddlePaddle | github | 通用 | |
ernie_1.0_skep_large | large | link | Baidu | github | 情感分析 | |
ernie-gram | base | link | Baidu | github | 通用 |
备注:
PaddlePaddle转TensorFlow可参考: tensorflow_ernie
PaddlePaddle转PyTorch可参考: ERNIE-Pytorch
2021 | ERNIE 3.0: Large-scale Knowledge Enhanced Pre-training for Language Understanding and Generation | Yu Sun, et al. | arXiv | PDF
2021 | ERNIE 3.0 Titan: Exploring Larger-scale Knowledge Enhanced Pre-training for Language Understanding and Generation | Shuohuan Wang, et al. | arXiv | PDF
模型 | 版本 | PaddlePaddle | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
ernie-3.0-base | 12-layer, 768-hidden, 12-heads | link | [🤗HF] | PaddlePaddle | github | 通用 |
ernie-3.0-medium | 6-layer, 768-hidden, 12-heads | link | [🤗HF] | PaddlePaddle | github | 通用 |
ernie-3.0-mini | 6-layer, 384-hidden, 12-heads | link | [🤗HF] | PaddlePaddle | github | 通用 |
ernie-3.0-micro | 4-layer, 384-hidden, 12-heads | link | [🤗HF] | PaddlePaddle | github | 通用 |
ernie-3.0-nano | 4-layer, 312-hidden, 12-heads | link | [🤗HF] | PaddlePaddle | github | 通用 |
PaddlePaddle转PyTorch可参考: ERNIE-Pytorch
2021 | RoFormer: Enhanced Transformer with Rotary Position Embedding | Jianlin Su, et al. | arXiv | PDF
2021 | Transformer升级之路:2、博采众长的旋转式位置编码 | 苏剑林. | spaces | Blog post
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
roformer | base(L12) | 百度网盘-xy9x | ZhuiyiTechnology | github | 通用 | |
roformer | small(L6) | 百度网盘-gy97 | ZhuiyiTechnology | github | 通用 | |
roformer-char | base(L12) | 百度网盘-bt94 | ZhuiyiTechnology | github | 通用 | |
roformerV2 | small(L6) | 百度网盘-ttn4追一 | ZhuiyiTechnology | github | 通用 | |
roformerV2 | base(L12) | 百度网盘-pfoh追一 | ZhuiyiTechnology | github | 通用 | |
roformerV2 | large(L24) | 百度网盘-npfv追一 | ZhuiyiTechnology | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
StructBERT | large(L24) | 阿里云 | Alibaba | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
LatticeBERT | tiny(L4) | 阿里云 | Alibaba | github | 通用 | |
LatticeBERT | small(L6) | 阿里云 | Alibaba | github | 通用 | |
LatticeBERT | base(L12) | 阿里云 | Alibaba | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Mengzi-BERT | base(L12) | [🤗HF] | Langboat | github | 通用 | |
Mengzi-BERT-fin | base(L12) | [🤗HF] | Langboat | github | 金融财经 |
BLOG
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
bloom-6b4-zh | 6B(L30) | [🤗HF] | Langboat | github | 通用 |
注:作者另有bloom-389m-zh到bloom-2b5-zh等多个中文模型
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
TaCL | base(L12) | [🤗HF] | yxuansu | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
MC-BERT | base(L12) | link | alibaba-research | github | 生物医疗 |
模型 | 版本 | 类型 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|---|
Erlangshen | large(L24) | bert | [🤗HF] | IDEA-CCNL | github | 中文通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
PERT-base | base(12L) | 百度网盘-rcsw | [🤗HF] | Yiming Cui | github | 通用 |
PERT-large | large(24L) | 百度网盘-e9hs | [🤗HF] | Yiming Cui | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Chinese-MobileBERT-base-f2 | base | 百度网盘-56bj | Yiming Cui | github | 通用 | |
Chinese-MobileBERT-base-f4 | base | 百度网盘-v2v7 | Yiming Cui | github | 通用 | |
Chinese-MobileBERT-large-f2 | large | 百度网盘-6m5a | Yiming Cui | github | 通用 | |
Chinese-MobileBERT-large-f4 | large | 百度网盘-3h9b | Yiming Cui | github | 通用 |
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
chinese_GAU-alpha-char_L-24_H-768 | base | 下载 | ZhuiyiTechnology | github | 通用 |
PDF
|模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
DeBERTa-v2-Large | large | [🤗HF] | IDEA-CCNL | github | 通用 | |
DeBERTa-v2-xLarge | xlarge | [🤗HF] | IDEA-CCNL | github | 通用 | |
DeBERTa-v2 | base | [🤗HF] | IDEA-CCNL | github | 通用 |
PDF
|模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
GlyphCRM-base | base | [🤗HF] | HITsz-TMG | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
pai-ckbert-base-zh | base | [🤗HF] | Alibaba | github | 通用 | |
pai-ckbert-large-zh | large | [🤗HF] | Alibaba | github | 通用 | |
pai-ckbert-huge-zh | huge | [🤗HF] | Alibaba | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Chinese-LERT-small | 15m | 百度网盘-4vuy | [🤗HF] | Yiming Cui | github | 通用 |
Chinese-LERT-base | 400m | 百度网盘-9jgi | [🤗HF] | Yiming Cui | github | 通用 |
Chinese-LERT-large | 1.2G | 百度网盘-s82t | [🤗HF] | Yiming Cui | github | 通用 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
rocbert | base | [🤗HF] | Weiwe Shi | github | 通用 |
模型 | 版本 | PyTorch | 作者 | 源地址 | 备注 |
---|---|---|---|---|---|
m3e-base | base | m3e-base | Moka-AI | uniem | 文本嵌入模型 |
M3e-small | Small | m3e-small | Moka-AI | uniem | 文本嵌入模型 |
PDF
模型 | 版本 | PyTorch | 作者 | 源地址 | 备注 |
---|---|---|---|---|---|
LEALLA-base | base | LEALLA-base | Google Research | / | 文本嵌入模型 |
LEALLA-large | large | LEALLA-large | Google Research | / | 文本嵌入模型 |
2019 | Improving Language Understandingby Generative Pre-Training | Alec Radford, et al. | arXiv | PDF
2019 | Language Models are Unsupervised Multitask Learners | Alec Radford, et al. | arXiv | PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
GPT2 | 30亿语料 | Google Drive百度网盘-ffz6 | Caspar ZHANG | gpt2-ml | 通用 | |
GPT2 | 15亿语料 | Google Drive百度网盘-q9vr | Caspar ZHANG | gpt2-ml | 通用 | |
CDial-GPTLCCC-base | base | [🤗HF] | thu-coai | CDial-GPT | 中文对话 | |
CDial-GPT2LCCC-base | base | [🤗HF] | thu-coai | CDial-GPT | 中文对话 | |
CDial-GPTLCCC-large | large | [🤗HF] | thu-coai | CDial-GPT | 中文对话 | |
GPT2-dialogue | base | Google Drive百度网盘-osi6 | yangjianxin1 | GPT2-chitchat | 闲聊对话 | |
GPT2-mmi | base | Google Drive百度网盘-1j88 | yangjianxin1 | GPT2-chitchat | 闲聊对话 | |
GPT2-散文模型 | base | Google Drive百度网盘-fpyu | Zeyao Du | GPT2-Chinese | 散文 | |
GPT2-诗词模型 | base | Google Drive百度网盘-7fev | Zeyao Du | GPT2-Chinese | 诗词 | |
GPT2-对联模型 | base | Google Drive百度网盘-i5n0 | Zeyao Du | GPT2-Chinese | 对联 | |
roformer-gpt | base(L12) | 百度网盘-2nnn | ZhuiyiTechnology | github | 通用 |
2019 | Transformer-XL: Attentive Language Models Beyond a Fixed-Length Context | Zihang Dai, et al. | arXiv | PDF
2020 | Language Models are Few-Shot Learners | Tom B. Brown, et al. | arXiv | PDF
模型 | 版本 | 介绍 | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Chinese-Transformer-XL | 29亿参数(GPT-3) | 项目首页 | 模型下载 | THUDM | github | 通用 |
2019 | NEZHA: Neural Contextualized Representation for Chinese Language Understanding | Junqiu Wei, et al. | arXiv | PDF
2019 | Improving Language Understandingby Generative Pre-Training | Alec Radford, et al. | arXiv | PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
NEZHA-Gen | base | Google Drive百度网盘-rb5m | HUAWEI | github | 通用 | |
NEZHA-Gen | base | Google Drive百度网盘-ytim | HUAWEI | github | 诗歌 |
PDF
模型 | 版本 | 资源 | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
CPM | 26亿参数 | 项目首页 | 模型下载 | Tsinghua AI | github | 通用 |
备注:
PyTorch转TensorFlow可参考: CPM-LM-TF2
PyTorch转PaddlePaddle可参考: CPM-Generate-Paddle
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
T5 | small | [🤗HF] | [🤗HF] | DBIIR @ RUC | UER | 通用 |
2019 | Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer | Colin Raffel, et al. | arXiv | PDF
2019 | PEGASUS: Pre-training with Extracted Gap-sentences for Abstractive Summarization | Jingqing Zhang, et al. | arXiv | PDF
2021 | T5 PEGASUS:开源一个中文生成式预训练模型 | 苏剑林. | spaces | Blog post
模型 | 版本 | Keras | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
T5 PEGASUS | base | 百度网盘-3sfn | ZhuiyiTechnology | github | 通用 | |
T5 PEGASUS | small | 百度网盘-qguk | ZhuiyiTechnology | github | 通用 |
Keras转PyTorch可参考: t5-pegasus-pytorch
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Mengzi-T5 | base(L12) | [🤗HF] | Langboat | github | 通用 |
PDF
模型 | 版本 | 资源 | 下载地址 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
盘古α-2.6B | 2.6G | 项目首页 | 模型下载 | PCL-Platform.Intelligence | github | 通用 |
盘古α-13B | 12G | 项目首页 | 模型下载 | PCL-Platform.Intelligence | github | 通用 |
盘古α-2.6B pytorch版本 | 2.6G | 项目首页 | 模型下载 | PCL-Platform.Intelligence | github | 通用 |
盘古α-13B pytorch版本 | 12G | 项目首页 | 模型下载 | PCL-Platform.Intelligence | github | 通用 |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 | 备注 |
---|---|---|---|---|---|---|---|
EVA | 28亿参数 | 项目首页 | 模型下载 | thu-coai | github | 中文开放域对话 | 需要登陆才能下载 |
EVA2.0-xLarge | xlarge | 项目首页 | [🤗HF] | thu-coai | github | 中文开放域对话 | |
EVA2.0-large | large | 项目首页 | [🤗HF] | thu-coai | github | 中文开放域对话 | |
EVA2.0-base | base | 项目首页 | [🤗HF] | thu-coai | github | 中文开放域对话 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
BART-base | base | [🤗HF] | fastNLP | github | 中文通用 | |
BART-large | large | [🤗HF] | fastNLP | github | 中文通用 |
模型 | 版本 | 类型 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|---|
Wenzhong | large(L24) | GPT2 | [🤗HF] | IDEA-CCNL | github | 中文通用 |
模型 | 版本 | 类型 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|---|
Yuyuan | large(L24) | GPT2 | [🤗HF] | IDEA-CCNL | github | 医学领域 |
PDF
模型 | 版本 | 类型 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|---|
RWKV | base(L12) | github | PENG Bo | github | 小说 | ||
RWKV | 7B | [🤗HF] | PENG Bo | github | 小说 | ||
RWKV | 14B | [🤗HF] | PENG Bo | github | 小说 |
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
PromptCLUE | base(L12) | [🤗HF] | ClueAI | github | 通用 | |
PromptCLUE-v1-5 | base(L12) | [🤗HF] | ClueAI | github | 通用 | |
PromptCLUE-large | large | API在线调用 | ClueAI | github | 通用 |
模型 | 版本 | 类型 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|---|
ChatYuan | large | T5 | [🤗HF] | ClueAI | github | 功能型对话 | |
ChatYuan-large-v2 | large | T5 | [🤗HF] | ClueAI | github | 功能型对话 |
模型 | 版本 | 类型 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|---|
SkyText | large | GPT3 | [🤗HF] | SkyWorkAIGC | github | 通用 |
PDF
PDF
模型 | 版本 | 类型 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|---|
ProphetNet-Zh | link | microsoft | github | 通用 | |||
ProphetNet-Dialog-Zh | link | microsoft | github | 对话 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Unilm | base | 百度网盘-tblr | 百度网盘-etwf | YunwenTechnology | github | 通用 |
Blog post
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
SimBERT Tiny | tiny | 百度网盘-1tp7 | ZhuiyiTechnology | github | 通用 | |
SimBERT Small | small | 百度网盘-nu67 | ZhuiyiTechnology | github | 通用 | |
SimBERT Base | base | 百度网盘-6xhq | ZhuiyiTechnology | github | 通用 |
Blog post
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
roformer-sim | base(L12) | 百度网盘-2cgz | ZhuiyiTechnology | github | 通用 | |
roformer-sim | small(L6) | 百度网盘-h68q | ZhuiyiTechnology | github | 通用 | |
roformer-sim-v2 | base(L12) | 百度网盘-w15n | ZhuiyiTechnology | github | 通用 |
模型 | 版本 | 类型 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|---|
Zhouwenwang | base(L12) | roformer | [🤗HF] | IDEA-CCNL | github | 中文通用 | |
Zhouwenwang | large(L24) | roformer | [🤗HF] | IDEA-CCNL | github | 中文通用 |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 | 备注 |
---|---|---|---|---|---|---|---|
CPM-2 | 110亿参数 | 项目首页 | 模型下载 | BAAI-WuDao | github | 通用 | 需要申请才能下载 |
CPM-2 | 100亿参数 | 项目首页 | 模型下载 | BAAI-WuDao | github | 中英 | 需要申请才能下载 |
CPM-2 | 1980亿参数 | 项目首页 | 模型下载 | BAAI-WuDao | github | 中英 | 需要申请才能下载 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
CPT-base | base(L12) | [🤗HF] | fastNLP | github | 通用 | |
CPT-large | large(L24) | [🤗HF] | fastNLP | github | 通用 |
PDF
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
GLM | large | [🤗HF] | THUDM | github | 通用 | |
GLM | xxlarge | [🤗HF] | THUDM | github | 通用 | |
GLM-130B | 130B | 申请地址1申请地址2 | THUDM | github | 通用 |
PDF
PDF
模型 | 版本 | 模型下载 | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|
PLUG | 27B | AliceMind-需要申请 | Alibaba | github | 通用 |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 | 备注 |
---|---|---|---|---|---|---|---|
OPD | 6.3B | 项目首页 | 模型下载 | thu-coai | github | 中文开放域对话 | 需要申请才能下载 |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 | 备注 |
---|---|---|---|---|---|---|---|
BriVL(WenLan) | 10亿参数 | 项目首页 | 模型下载 | BAAI-WuDao | github | 中文通用图文 | 需要登陆才能下载 |
PDF
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 | 备注 |
---|---|---|---|---|---|---|---|
CogView | 40亿参数 | 项目首页 | 模型下载 | THUDM | github | 中文多模态生成模型 | 需要登陆才能下载 |
模型 | 版本 | 介绍 | 模型下载 | 作者 | 源地址 | 应用领域 | 备注 |
---|---|---|---|---|---|---|---|
紫东太初- light_vision_text | 项目首页 | 模型下载 | 中科院自动化所 | github | 中文图像-文本领域 | 紫东太初多模态大模型中的图像-文本预训练模型 | |
紫东太初-text[GPT] | 32亿参数 | 项目首页 | 百度网盘-nos5 | 中科院自动化所 | github | 中文通用 | 紫东太初多模态大模型中的文本预训练模型 |
紫东太初-vision | 项目首页 | 模型下载 | 中科院自动化所 | github | 视觉领域 | 紫东太初多模态大模型中的视觉预训练模型 | |
紫东太初-speech | 项目首页 | 模型下载 | 中科院自动化所 | github | 语音领域 | 紫东太初多模态大模型中的语音检测与识别多任务模型 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Mengzi-oscar | base(L12) | [🤗HF] | Langboat | github | 中文多模态-图文 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 首页 | 应用领域 |
---|---|---|---|---|---|---|---|
R2D2ViT-L | large | yuxie11 | github | zero | 中文多模态-图文 | ||
PRD2ViT-L | large | yuxie11 | github | zero | 中文多模态-图文 |
PDF
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
CN-CLIPRN50 | 77M | aliyuncs | OFA-Sys | github | 中文多模态-图文 | |
CN-CLIPViT-B/16 | 188M | aliyuncs | OFA-Sys | github | 中文多模态-图文 | |
CN-CLIPViT-L/14 | 406M | aliyuncs | OFA-Sys | github | 中文多模态-图文 | |
CN-CLIPViT-L/14@336px | 407M | aliyuncs | OFA-Sys | github | 中文多模态-图文 | |
CN-CLIPViT-H/14 | 958M | aliyuncs | OFA-Sys | github | 中文多模态-图文 |
PDF
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Taiyi-CLIP-Roberta-large-326M-Chinese | base | [🤗HF] | IDEA-CCNL | github | 中文多模态-图文 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
AltCLIP | 3.22G | [🤗HF] | FlagAI | github | 中文多模态-图文 |
PDF
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
AltDiffusion | 8.0G | [🤗HF] | FlagAI | github | 中文多模态-图文 |
PDF
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
Taiyi-Stable-Diffusion | 1B | [🤗HF] | IDEA-CCNL | github | 中文多模态-图文 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
CLIP | url | HUAWEI | github | 中文多模态-图文 | ||
FILIP | url | HUAWEI | github | 中文多模态-图文 | ||
wukong | url | HUAWEI | github | 中文多模态-图文 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
OFA | link | OFA-Sys | github | 中文多模态-图文 | ||
OFA-Chinese | [🤗HF] | Yang JianXin | github | 中文多模态-图文 |
模型 | 版本 | 视觉架构 | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
QA-CLIPRN50 | 77M | ResNet50 | [🤗HF] | 腾讯 | QA-CLIP | 中文多模态-图文 |
QA-CLIPViT-B/16 | 188M | ViT-B/16 | [🤗HF] | 腾讯 | QA-CLIP | 中文多模态-图文 |
QA-CLIPViT-L/14 | 406M | ViT-L/14 | [🤗HF] | 腾讯 | QA-CLIP | 中文多模态-图文 |
PDF
模型 | 版本 | TensorFlow | PyTorch | 作者 | 源地址 | 应用领域 |
---|---|---|---|---|---|---|
sdcup | base | 阿里云 | Alibaba | github | 中文表格 | |
sdcup | large | 阿里云 | Alibaba | github | 中文表格 |
Flan-ul2
和Flan-t5-xxl
大规模
& 高性能