Irányított objektumok detekciója légi felvételeken
Directional object detection in aerial images
Kulcsszavak:
orientált befoglaló négyszögek, iránybecslés, légi képfeldolgozásAbsztrakt
Távoli, zsúfolt képeken gyakran használt módszer az Orientált Befoglaló Négyszögek (OBB). Ezek az elforgatott négyszögek pontosan behatárolják az objektumok helyzetét, viszont az orientációjuk nem feltétlenül azonosul az objektum irányával, azaz egy adott jármű elejével. A leírt módszer, Irányított Objektum Detektor (DOD), egy hozzáadott paraméter segítségével képes meghatározni az objektumok irányát. A módszer továbbá képek kanonikus nézetbe való transzformálásához is használhatjuk.
A módszerben a YOLOv8-OBB módszer van továbbfejlesztve azáltal, hogy az architektúra Detektor ágban egy fáziseltolással kódolt szög becslése jelenik meg (phase shifting coder). Veszteségfüggvényként a kapott szöget és a referencia szöget felhasználva, 1-1 normalizált ellipszist képezünk, amik között probabilisztikus átfedést számolunk.
A bemutatott módszert az OHD-SJTU-L adatszetten összehasonlítottuk két élvonalbeli módszerrel, amiket túlteljesít, különösképpen az objektumok irányának pontosságában. Ez az adatszett távoli képfeldolgozásban mutatja be a módszer hatékonyságát, elsősorban különböző járművek elejének a meghatározásában. A módszer viszont más területeken is felhasználható. Például, ha adott egy szőlőlevél és ennek a körvonala, egy kovariancia mátrixot számolhatunk, ami egy levélbe írt ellipszist definiál. A DOD módszer képes megtanulni ráhelyezni ezeket az ellipsziseket a levelekre, az irányt pedig a levelek szára fele megbecsülni. Ezekből az információkból az adott levelet kanonikus nézetbe transzformálhatjuk, azaz frontális nézetbe, akkor is, ha a levél el van fordulva.
Hivatkozások
-