Awesome AI
收集分享 AI 大型语言模型 (LLM)、AI 辅助编程、AI 绘画等领域的常用资料,探索生成式人工智能的应用与开发。
目录
🔍 提醒:善用搜索,按 Ctrl+F 或 ⌘F 定位到你想找的关键词。
💡 持续更新中,建议添加到浏览器收藏夹,平常一定会用到。
大型语言模型
OpenAI GPT / ChatGPT
Claude
Google Gemini
百度文心大模型 / 文心一言
智谱 GLM / ChatGLM(智谱清言)
Moonshot AI / Kimi
更多
AI 辅助编程
GitHub Copilot
- 简介:AI 辅助编程领域的标杆。由 GitHub 和 OpenAI 共同开发,作为编辑器插件集成到开发环境中,支持 VS Code 和 JetBrains IDE 等主流开发工具。通过提供代码建议和自动补全功能,Copilot 能够提高编程效率。此外,它还集成了生成单测、生成注释、转译代码、回答问题等功能。
- 官网:https://github.com/features/copilot
- 定价:个人版:$10 / 月(第一个月免费试用)
Cursor
- 简介:AI 辅助编程领域的后起之秀。Cursor 是一款编辑器,基于 VS Code 内核,集成了 AI 辅助编程和基于当前代码仓库的 AI 问答功能。除了基础的代码补全功能以外,Cursor 还提供了批量补全、预测下一步操作、通过对话修改代码、修改多个文件、生成整个工程等高级功能。
- 官网:https://cursor.sh/
- 定价:https://cursor.sh/pricing
- 免费版(两周的专业版试用期 + 2000 次补全 + 有限次模型请求):免费
- 专业版(无限次补全 + 每月 500 次快速高级模型请求 + 无限次慢速模型请求):$20 / 月
- ...
其他
-
Claude Dev:VS Code 插件,融合了 Agent 思维,通过对话生成或修改项目代码。已开源。
-
CodeGeeX:智谱旗下的智能编程助手。支持 20 多种编程语言,适配 VS Code 和 JetBrains IDE 等主流开发工具。个人用户免费。企业用户可选择私有化部署服务。
-
通义灵码:编辑器插件,支持 VS Code 和 JetBrains IDE 等。个人用户免费。
-
Codeium:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
-
Tabnine:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
-
Amazon CodeWhisperer:编辑器插件,支持 VS Code 和 JetBrains IDE 等。
- 定价:个人版(代码建议 + 参考跟踪 + 安全扫描):免费
-
JetBrains AI Assistant:全球知名 IDE 厂商推出的第一方 AI 编程助手。提供代码补全建议、重构建议、AI 问答、生成文档、生成提交信息等功能。
-
Devin:Cognition Labs 推出的 AI 编程机器人,有很强的自主学习和工作能力。内测申请排队中,还未正式开放。
-
Gru.ai:一款在线的编程助手 AI Agent,根据用户的任务生成代码,支持 Python 和 TS 语言。
- 网页设计与生成工具:
-
Bolt.new:StackBlitz 出品的 AI 编程工具,可在线生成、编辑、运行、部署全栈网站,一站式解决网站开发需求。支持多种基于 JS 的前后端技术栈。
-
v0:Vercel 出品的 AI 网页设计开发工具。通过对话生成网页,可一键发布。主力支持 shadcn/ui (React) + Tailwind 技术栈,后续会支持更多前端技术栈。有免费配额。
-
Wegic:AI 驱动的网页 UI 设计和开发工具。通过自然对话快速生成网站,可通过对话持续修改,可一键发布。
-
OpenUI:开源项目,AI 自动生成前端代码。可根据描述生成 UI 界面,且可以持续输入描述进行修改,可输出 HTML、React、Vue 组件等格式。支持输入中文描述。在线演示。
- 书籍推荐:
AI 绘画 / 音频视频创作
Midjourney
- 简介:Midjourney 是一款热门的 AI 绘画工具,依托 Discord 平台提供服务。它易于入门,作品风格华丽,适合初学者探索 AI 艺术创作,创造独特的视觉作品。
- 官网:https://www.midjourney.com/home
- 定价:
- 基础版套餐(3.3h Fast Time):$10 / 月
- 标准版套餐(15h Fast Time + Unlimited Relax Time):$30 / 月
- 专业版套餐(30h Fast Time + Unlimited Relax Time):$60 / 月
- 至尊版套餐(60h Fast Time + Unlimited Relax Time):$120 / 月
OpenAI DALL·E
Stable Diffusion
FLUX.1
Google Imagen 2
Runway Gen-2
Pika
- 简介:视频生成领域的热门产品。典型功能为图生视频。
- 官网:https://pika.art/
- 定价:
- 免费版(30 积分):免费
- 标准版(700 积分 / 月):$10 / 月
- ...
PixVerse
Stable Video Diffusion
OpenAI Sora
可灵大模型
Vidu
- 简介:Vidu 是由清华大学朱军教授团队研发的 AI 视频生成器。支持生成高逼真度的 4 秒或 8 秒 1080p 高清视频。亮点包括生成速度快、角色一致性、支持写实和动漫风格、生成效果连续流畅等,可应用于游戏、影视、教育等领域。
- 官网:https://www.vidu.studio/
Luma Dream Machine
剪映专业版 / CapCut
3D 建模
-
Zero-1-to-3 (zero123): Zero-shot 单张图片生成 3D 物体。哥伦比亚大学的开源项目。
-
One-2-3-45:“Any Single Image to 3D Mesh in 45 Seconds without Per-Shape Optimization”。开源项目。
-
Wonder3D:“Wonder3D produces consistent multi-view normal maps and corresponding color images, and thus reconstructs high-fidelity textured mesh from a single image in only 2~3 minutes”。开源项目。
-
Stable Zero123:单张图片生成高质量 3D 物体。Stability AI 开源模型,可整合到 ComfyUI 工作流。
-
DreamGaussian:Generative Gaussian Splatting for Efficient 3D Content Creation。开源项目。
-
Tripo AI:通过文本或图片生成高质量 3D 模型,可下载。有免费配额。
-
Genie:Luma AI 出品的一款通过文本生成 3D 模型的 AI 工具。目前依托 Discord 提供服务。
-
Luma AI:通过视频来重建 3D 场景。你只需要有一台手持拍摄设备,按要求对物体进行 360°旋转拍摄。有网页版和 iOS App。
数字人 / 语音驱动视频 / TTS
TTS:Text to Speech,文本生成语音。
-
万兴播爆:输入文案,一键生成数字人播报视频。
- 剪映:可生成数字人播报视频。
-
HeyGen:生成数字人播报视频,视频翻译,语音克隆。
-
Eleven Labs:文本转语音(TTS),通过文字描述生成音效,语音克隆,视频翻译配音。有 API。
-
EMO:阿里发布的(图片 + 音频 → 视频)大模型,生成的人物嘴形和表情相当自然。
-
ChatTTS:开源的文本转语音(TTS)模型,支持中文和英文。可以控制停顿和笑声等人性化特征,生成结果自然流畅。
-
Seed-TTS:字节跳动发布的高质量、多功能语音生成模型,未开源,似乎也没有发布可用的产品。支持音色微调、带情绪的 TTS、音色转换、情绪转换、基于原语音生成新语音、语音内容编辑、调速等能力。可应用于有声读物、翻译视频等场景。
- 剪映:已上线 AI 克隆音色的功能,只能克隆自己的音色。
-
微软 Azure AI 语音:微软的云服务,支持语音转文本、文本转语音、语音翻译和说话人辨识等功能。
-
LivePortrait:快手开源的人物肖像控制模型,可通过五官视频驱动图片生成视频,或修改其他视频。在线体验。
-
ReSyncer:一个研究项目,通过语音和视频模板素材,生成更自然的唇形视频。可应用于数字人场景。目前只有研究论文,还没有公开可用的产品。
在线 SD 绘画
-
Leonardo.Ai:易用且强大的 AI 绘图平台,底层基于 SD,深度集成 SD 各种插件,提供训练好的模型,可训练模型。有免费配额。
-
eSheep 电子羊:体验在线的 WebUI 和 ComfyUI。新用户获得 100 积分。每 100 积分相当于 ¥1。
-
网易 AI 设计工坊:在线 WebUI,可训练模型。有免费配额,每天 10 次。
-
LibLib AI:在线 WebUI,可训练模型。有免费配额,每天 300 积分。
-
Cephalon Cloud 端脑云:云端一键部署自己的 WebUI 和 ComfyUI。新用户获得 2000 积分。每 1000 积分相当于 ¥1。
-
即梦 AI:字节跳动出品的在线绘画平台,主打易用和免费。原名 “Dreamina”。
音乐创作
-
Suno:AI 根据你的要求生成歌曲(作词、作曲、演唱)。
其他创作工具
(持续更新中……)
常用 AI 网站 / 工具
综合平台
-
POE:各种知名模型的聚合平台。用户可根据自己的需求通过 Prompt 定制对话机器人,相当于 GPTs 平替。付费用户可无限量使用 GPT-4、Claude 2 等高端模型。
-
FlowGPT:一个 Prompt 分享平台。提供了角色聊天、游戏、创意、生产力等各种类型的对话机器人,是一个学习提示词的好地方。也可以把它当作 GPTs 平替。
-
Character.AI:与各种类型的 AI 虚拟角色对话,包括世界名人、动漫人物、游戏角色等。
- Coze:字节跳动推出的 AI 聊天机器人及 AI 应用开发平台。无论是否具备编程基础,用户都可以快速构建特定功能的聊天机器人,并发布到各大社交平台。
-
GPTsCopilot:第三方 GPTs 商店,提供 GPTs 中转访问服务。在 GPTs 的网址中,把
openai.com
改成 openai-now.com
就可以切换到 GPTsCopilot 提供的中转访问服务,无需成为 ChatGPT Plus 会员即可使用 GPTs。
-
Toolify.ai:AI 工具分类导航目录。
-
There's An AI For That (TAAFT):提问我的需求可以用哪些 AI 工具来实现。
-
通往 AGI 之路 / WayToAGI:AI 工具(包含网站和 GPTs)分类导航目录,也可搜索。
-
ChandlerAi:国内可用的 AI 助手,可调用 GPT-4、Claude 3 Opus、Gemini、DALL·E 等先进模型。需要付费。
图像处理 / 图形设计 / UI 设计
写作 / PPT 幻灯片
-
Notion AI:Notion 中的 AI 写作助手。增值服务,每月 $10。
-
蛙蛙写作:国产写作模型,写长篇小说、视频脚本、论文等。免费试用 3000 字。
-
讯飞智文:Word、PPT 一键生成、AI 撰写助手、多语种互译、AI 自动配图、PPT 转演讲稿等。
-
腾讯文档:AI 助手提供生成 PPT、生成文档、生成表格、生成思维导图、生成收集表等功能。
-
Gamma:AI 设计助手,生成 PPT、文档和网页,优化现有 PPT 和文档。
-
AiPPT.cn:AI 一键生成 PPT。支持自动生成 PPT 大纲文案,文档秒变 PPT,支持多种模板,兼容 pptx 格式。
内容分析、识别、提炼
-
通义听悟:语音文件识别为文本,拆分章节,提炼关键信息,识别多人发言,适合处理录音采访、播客、会议记录等内容。
-
MinerU:一站式、开源、高质量的数据提取工具,包含 PDF 文档、网页与电子书的内容提取并转换等 Markdown 等功能。在线体验
-
Elicit:以超人速度分析论文。自动化耗时的研究任务,如总结论文、提取数据和汇总结论。
-
Monica:多功能 AI 工具箱,有浏览器插件、桌面应用和移动 App。最为人熟知的功能是基于网页内容的总结和问答。
- 剪映:可识别语音生成字幕。
定制知识库 / RAG
RAG:Retrieval-Augmented Generation,检索增强生成。是目前基于 LLM 实现 “外挂知识库” 的主流技术方案。
-
SiteGPT:基于你的官网内容和上传文档创建客服机器人,解答客户的咨询。
-
Dify:LLM 应用开发平台,支持各种大模型,提供 Prompt 编排、RAG、Agent 框架、工作流编排等功能。
-
RAGFlow:一款基于深度文档理解构建的开源 RAG 引擎。
-
MaxKB:基于 LLM 大语言模型的知识库问答系统。开箱即用,支持快速嵌入到第三方业务系统。
广告 / 营销
其他工具 / 开源项目
-
Perplexity:AI 搜索。
-
秘塔 AI 搜索:更友好的搜索引擎,帮你整理信息后更有条理地呈现。有 “全网” 和 “学术” 两种搜索模式,搜索深度可选简洁、深入、研究。
-
天工 AI:AI 搜索、对话助手等。
-
PromptPerfect:帮你优化提示词(Prompt)。比如把你的笼统需求拆解为多步骤的任务,以提高模型输出的准确性;又比如根据给定的文章主题生成大纲并撰写长文。
-
AppAgent:腾讯研究团队的开源项目,基于大语言模型的手机端多模态智能代理,帮用户自动执行复杂任务。适用于 Android 手机和模拟器。可粗略类比为手机端的按键精灵。
-
ProctorAI:AI 监工,号称 “拖延症终结者”。开源项目,本地应用程序,通过定时截图来检查你是否在摸鱼,并发出警告,支持语音提醒。可以设置详细的监督规则。底层调用了 GPT-4o 等多模态模型。
-
llm_aided_ocr:LLM 辅助 OCR,通过大模型来提升 OCR 的准确性。
教程
法规 / 公告
(持续更新中……)
常见问题
有什么简便的方式可以使用 GPT-4 和 GPTs?
建议先通过 ChatGPT Plus 拼车账号开始体验,即买即用。解锁 GPT-4 + DALL·E 绘图 + GPTs 等高端功能。需自备海外线路。
这里推荐一个老牌的拼车平台,稳定可靠。点此开始拼车(还可用九五折优惠码 ai2024
)。
AI 生成内容的版权(著作权)属于谁?
简单说一下结论:
- 如果 AI 服务商的用户协议中主张了 AI 生成内容的著作权,则属于 AI 服务商。
- 否则属于使用 AI 服务生成内容的用户。
详细解释:你用 AI 生成的作品,版权归你吗?
微信群
加入群,快人一步获取 AI 资讯、与数百名同好交流:
License
- Text and graphics: © Creative Commons BY-NC-ND 4.0
- Code: GPLv3