开源推荐
morning
GitHub 热门项目:OmDet
2026-05-27
1 阅读
GitHub Trending
GitHub 项目:OmDet
仓库地址:https://github.com/om-ai-lab/OmDet
星级:1376 | 作者:om-ai-lab
项目描述:实时准确的开放词汇端到端目标检测
===================================================
自述文件内容:
# OmDet-Turbo
[论文?] [HuggingFace模型?️] [ModelScope模型?️]
快速准确的开放词汇端到端对象检测
*** ## ?️ 更新 * 03/12/2026:我们很高兴地宣布,我们的模型现已在[ModelScope](https://modelscope.cn/models/Om_AI_Lab/omdet-turbo-swin-tiny-hf)上可用! * 09/26/2024:OmDet-Turbo 已集成到变形金刚版本 4.45.0 中。代码可在[此处](https://github.com/huggingface/transformers/tree/main/src/transformers/models/omdet_turbo)获取,Hugging Face模型可在[此处](https://huggingface.co/omlab/omdet-turbo-swin-tiny-hf)获取。 * 07/05/2024:我们的新开源项目 [OmAget:用于解决复杂任务的多模式代理框架](https://github.com/om-ai-lab/OmAgent) 可用!此外,OmDet 已作为 OVD 工具无缝集成在其中。请随意深入研究我们创新的多模式代理框架。 * 2024 年 6 月 24 日:[将 OmDet-Turbo 转换为 ONNX] 指南(https://github.com/om-ai-lab/OmDet#:~:text=How%20To%20Export%20ONNX%20Model) * 2024 年 3 月 25 日:发布推理代码和预训练的 OmDet-Turbo-Tiny 模型。 * 2024 年 3 月 12 日:Github 开源项目创建 *** ## ? 相关作品 如果您对我们的研究感兴趣,我们欢迎您探索我们其他精彩的项目。 ?【如何评价检测的泛化能力?全面开放词汇检测的基准](https://arxiv.org/abs/2308.13177)(AAAI24) ?[Github 存储库](https://github.com/om-ai-lab/OVDEval/tree/main) ? [OmDet:采用多模态检测网络的大规模视觉语言多数据集预训练](https://ietresearch.onlinelibrary.wiley.com/doi/full/10.1049/cvi2.12268)(IET 计算机视觉) *** ## ? 简介 该存储库是 **OmDet-Turbo** 的官方 PyTorch 实现,OmDet-Turbo 是一种基于快速转换器的开放词汇对象检测模型。 **⭐️亮点** 1. **OmDet-Turbo** 是一个基于 Transformer 的实时开放词汇表 结合了强大的 OVD 功能和快速推理速度的检测器。 该模型解决了开放词汇中有效检测的挑战 场景,同时保持高检测性能。 2. 我们推出**Efficient Fusion Head**,一种快速多模态融合模块 旨在减轻编码器的计算负担并减少 头部的时间消耗与 ROI。 3. OmDet-Turbo-Base模型,在ODinW和OVDEval数据集上实现了最先进的零样本性能,并具有AP分数 分别为 **30.1** 和 **26.86**。 4. OmDetTurbo-Base 在 COCO val2017 数据集上的推理速度在 A100 GPU 上达到 **100.2** FPS。 欲了解更多详细信息,请查看我们的论文**[Re