Rakenteen ymmärtäminen liikkeestä (SFM) Computer Visionissa
SFM tulee sanoista "Structure from Motion". Se on tietokonenäkötekniikka, jota käytetään 3D-kohtausten rekonstruoimiseen 2D-kuvasarjoista. SFM:n perusideana on käyttää kohtauksen esineiden liikettä näkymän 3D-rakenteen arvioimiseen.
SFM:ssä samasta kohtauksesta otetaan useita kuvia eri näkökulmista. Analysoimalla näitä kuvia algoritmi voi määrittää kohteiden 3D-paikat näkymässä ja luoda 3D-pistepilviesityksen näkymästä. Tätä voidaan käyttää monenlaisissa sovelluksissa, kuten robotiikassa, lisätyssä todellisuudessa ja virtuaalitodellisuudessa.
SFM-putken päävaiheet sisältävät tyypillisesti:
1. Kuvakokoelma: Useiden kuvien ottaminen kohtauksesta eri näkökulmista.
2. Ominaisuuksien poimiminen: Ominaisuuksien (kuten kulmien tai reunojen) tunnistaminen ja poimiminen jokaisesta kuvasta.
3. Vastaaminen: Kuvien välisten ominaisuuksien yhteensovittaminen kunkin kuvan suhteellisen asennon (asento ja suunta) määrittämiseksi.
4. Rekonstruktio: Yhteensopivien ominaisuuksien käyttäminen näkymän 3D-pisteiden kolmiomittamiseen ja 3D-pistepilviesityksen luomiseen.
5. Jalostaminen: Rekonstruoinnin tarkentaminen toistuvasti parantamalla asentoarvioita ja säätämällä 3D-pistepilveä.
SFM:n suorittamiseen on saatavilla monia ohjelmistokirjastoja ja työkaluja, mukaan lukien OpenCV, COLMAP ja MeshLab. Nämä kirjastot tarjoavat valmiiksi rakennettuja toimintoja ja luokkia, joiden avulla on helppo suorittaa SFM omilla kuvillasi.