Open Vocabulary benchmark

Репозиторий содержит в себе код для тестирования существующих моделей (LSeg, OWL-Vit, GroundingDino) поиска объектов по открытому запросу на изображениях по собственных данных в рамках летней школы AIRI 2023.

Dataset

Данные могут быть получены по запросу к [email protected].

Repo structure

annotations (содержит GT разметку в формате COCO)
methods (содержит код для получения результатов нахождения объектов по открытым запросам)
results (содержит файлы с пердсказаниями для каждого эксперимента)
metrics.py - код для получения метрик поиска объектов

mAP evaluation

В качестве метрик использовались map для боксов и map для масок. Для моделей, которые предсказывают только боксы (OWL-Vit, GroundingDino), использовался SAM с промптом бокса для получения маски, для OWL-Vit бокс находился как описывающий прямоугольник предсказанной маски.

Описание экспериментов:

Tag2Text - описания объектов (с human evaluation, чтобы убедиться в отсутствии мусора), сгенерированные предобученной моделью Tag2Text по кропам боксов из GT разметки, подаются на вход моделям для поиска. Количество фотографий меньше, чем в Indoor.
Label* - текстовый запрос формата "a picture of {gt class name}". Количество фотографий тоже, что и в Indoor.
Indoor - полный набор размеченных данных, текстовый запрос для поиска - это имя класса.

Модель\Данные	Bbox mAP Tag2Text	Bbox mAP Label*	Bbox mAP Indoor
OWL-ViT + SAM	0.183	0.314	0.151
GroundingDINO + SAM	0.484	0.619	0.360
LSeg	0.002	0.002	0.000

Модель\Данные	Seg mAP Tag2Text	Seg mAP Label*	Seg mAP Indoor
OWL-ViT + SAM	0.287	0.439	0.193
GroundingDINO + SAM	0.568	0.669	0.337
LSeg	0.001	0.001	0.000

Research

Дополнительные ислледования по модификации открытых запросов проводились в отдельном репозитории https://github.com/ZoyaV/cunning_manipulator.git.

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
annotations		annotations
methods		methods
results		results
.gitignore		.gitignore
README.md		README.md
metrics.py		metrics.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Open Vocabulary benchmark

Dataset

Repo structure

mAP evaluation

Research

About

Releases

Packages

Contributors 4

Languages

Areson251/open_vocabulary_benchmark

Folders and files

Latest commit

History

Repository files navigation

Open Vocabulary benchmark

Dataset

Repo structure

mAP evaluation

Research

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 4

Languages

Packages