Raziskovalne novice

Nova metoda in evalvacijska metodologija za vizualno sledenje objektov

Datum objave: 23.12.2022

Kategorija: Najodličnejši raziskovalni dosežki, Interdisciplinarne raziskave

Cilji trajnostnega razvoja: 3 Zdravje in dobro počutje, 9 Industrija, inovacije in infrastruktura, 11 Trajnostna mesta in skupnosti (kazalniki)

Vizualno sledenje objektov je eden od osrednjih problemov računalniškega vida z velikim aplikativnim potencialom v zagotavljanju varnosti avtonomnih robotov in vozil, urejevalnikih videa, zabavni industriji, 3D rekonstrukciji in obogateni resničnosti. Obravnava situacijo, kjer objekt izberemo zgolj v prvi sliki, sledilni algoritem pa mora oceniti njegov položaj v vseh naslednjih slikah, se prilagajati spremembam njegovega izgleda in zakrivanju z drugimi objekti. Klasične metode so sposobne podajanja lokacije zgolj kot pravokotne regije, kar je sicer zahtevno, ni pa dovolj natančno za mnogo aplikacij.

Predlagali smo novi sledilnik D3S, ki je sposoben izračunavanja izredno natančnega modela objekta ter ga segmentirati iz ozadja v vsaki sliki. Gre za novo paradigmo sledilnikov, temelječih na globokem učenju. D3S smo objavili v IEEE TPAMI, ki je z IF>24 najprestižnejša revija umetne inteligence (A’’), preliminarno verzijo pa na konferenci CVPR (skupaj sta prejeli več kot 150 citatov). O odmevnosti D3S priča tudi dejstvo, da so številni najboljši sledilniki mednarodnega izziva VOT2021 temeljili ravno na idejah, predstavljenih v D3S. Poleg sledilnika smo objavili tudi novo metodologijo in trenutno najzahtevnejšo podatkovno zbirko, ki je postala del standardne evalvacije dolgoročnih sledilnikov na področju računalniškega vida (VOT). Metodologija je objavljena v reviji IEEE TCyb, ki je s faktorjem vpliva 19,118 prva hkrati na dveh strokovnih področjih.

Arhitektura D3S (levo) in primeri lokalizacije objektov (desno).

Slika 1: Arhitektura D3S (levo) in primeri lokalizacije objektov (desno).

Avtorji dosežka:

asist. dr. Alan Lukežič, doc. dr. Luka Čehovin Zajc, prof. dr. Matej Kristan

 Viri:

LUKEŽIČ, Alan, MATAS, Jiří, KRISTAN, Matej. A discriminative single-shot segmentation network for visual object tracking. IEEE transactions on pattern analysis and machine intelligence, Dec. 2021, doi: 10.1109/TPAMI.2021.3137933, IF(2021)=24,314, (2/145 Computer science, Artificial intelligence), A'', h-5 indeks: 165 [COBISS.SI-ID 94955523]

LUKEŽIČ, Alan, ČEHOVIN ZAJC, Luka, VOJÍŘ, Tomáš, MATAS, Jiří, KRISTAN, Matej. Performance evaluation methodology for long-term single-object tracking. IEEE transactions on cybernetics, Dec. 2021, 51(12): 6305-6318, doi: 10.1109/TCYB.2020.2980618, IF(2021)=19,118, (3/145 Computer science, Artificial intelligence), A'', h-5 indeks: 142 [COBISS.SI-ID 1538564803]

 

nazaj na seznam