无需标注海量数据,目标检测新范式OVD让多模态AGI又前进一步
目标检测是计算机视觉中一个非常重要的基础任务,与常见的的图像分类 / 识别任务不同,目标检测需要模型在给出目标的类别之上,进一步给出目标的位置和大小信息,在 CV 三大任务(识别、检测、分割)中处于承上启下的关键地位。
转自《360AI研究院》
OVD基本流程示意
论文1:Open-Vocabulary Object Detection Using Captions
- 论文地址:https://arxiv.org/pdf/2011.10678.pdf
- 代码地址:https://github.com/alirezazareian/ovr-cnn
- 论文地址:https://arxiv.org/abs/2112.09106
- 代码地址:https://github.com/microsoft/RegionCLIP
论文3:CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching
- 论文地址:https://arxiv.org/abs/2303.13076
- 代码地址:https://github.com/tgxs002/CORA
*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。