微信扫码
添加专属顾问
我要投稿
Paper:YOLO-World: Real-Time Open-Vocabulary Object Detection
Abs:https://arxiv.org/abs/2401.17270
Code:https://github.com/AILab-CVC/YOLO-World在自然图像与视频目标检测与识别领域,传统方法通常在预定义类别的数据集上训练,无法识别数据集中未出现的目标类别,缺乏零样本检测能力,识别能力有限。
来自Tencent AI Lab、ARC Lab、Tencent PCG 以及华中科技大学的研究者们在 CVPR 2024 上提出了基于视觉语言建模的开放词汇YOLO-World模型,并探索针对YOLO检测器的大规模数据预训练方法,赋予 YOLO 模型零样本检测能力与语言理解能力,在推理速度和零样本检测精度上均领先先前工作。
YOLO-World模型目前已经在腾讯内部多项业务中落地,并与海外多家公司达成商业合作。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-05-14
小企业专属Claude来了!一键接入全套业务流,不用写代码AI自动算账催款
2026-05-14
开源 ElevenLabs 平替来了!OmniVoice Studio 本地免费实现电影级配音
2026-05-14
重构大模型通信架构:火山引擎 RocketMQ For AI 解决方案
2026-05-14
别再一步步确认了:/goal让AI编程真正自己干活
2026-05-14
MiniMax 推出了 Mavis,活脱脱的 Agent「三省六部」
2026-05-13
BP Claw 破解 AI 编码输入难题 ——FlinkSpec 需求智能化实践|得物技术
2026-05-13
AI-Generated UI 技术深度解析:模型流式输出与 UI 渲染实践
2026-05-12
AI 交互的范式转变:从"回合制"到"实时协作"
2026-04-15
2026-02-14
2026-03-31
2026-03-13
2026-04-07
2026-03-17
2026-03-17
2026-04-07
2026-03-21
2026-02-20
2026-05-09
2026-05-09
2026-05-09
2026-05-08
2026-05-07
2026-04-26
2026-04-22
2026-04-18