多模态 MM +Chat 合集
多模态 MM +Chat 合集
具体见 BERT
具体见 GPT
具体见 CLIP
具体见 BLIP 和 BLIP2 解读
具体见 llama
具体见 DetGPT
Visual Segmentation 指的是通用图像分割,包括开放集。
指的是在 CV 任务中特别是检测任务中常用的多数据集联合训练论文
具体见 Multi Dataset
大语言模型相关论文
具体见 LLM
视觉多模态大语言模型相关论文
具体见 MLLM
具体见 mmpretrain
存放和 LLM tool 相关的内容,例如 visual chatgpt 等
具体见 Tools
本部分用于 CVer 们快速上手 HuggingFace Transformers
官方地址: https://github.com/hwchase17/langchain 文档: https://python.langchain.com/en/latest/
具体见 langchain
Parameter-Efficient Fine-Tuning
官方地址: https://github.com/huggingface/peft
具体见 PEFT
具体见 Diffusers
内容已经发布到知乎,具体见: https://zhuanlan.zhihu.com/p/632210111
具体见 SAM
具体见 DETR
详情见 technology