Bilgisayarla Görmede Yapıyı Hareketten (SFM) Anlamak
SFM, "Hareketten Yapı" anlamına gelir. 2 boyutlu görüntü dizilerinden 3 boyutlu sahneleri yeniden oluşturmak için kullanılan bir bilgisayarlı görme tekniğidir. SFM'nin arkasındaki temel fikir, sahnenin 3 boyutlu yapısını tahmin etmek için sahnedeki nesnelerin hareketini kullanmaktır.
SFM'de, aynı sahnenin birden fazla görüntüsü farklı bakış açılarından alınır. Algoritma, bu görüntüleri analiz ederek sahnedeki nesnelerin 3 boyutlu konumlarını belirleyebilir ve sahnenin 3 boyutlu nokta bulutu temsilini oluşturabilir. Bu, robotik, artırılmış gerçeklik ve sanal gerçeklik gibi çok çeşitli uygulamalar için kullanılabilir.
Bir SFM hattının ana adımları tipik olarak şunları içerir:
1. Görüntü toplama: Sahnenin farklı bakış açılarından birden fazla görüntüsünün yakalanması.
2. Özellik çıkarma: Her görüntüden özelliklerin (köşeler veya kenarlar gibi) tanımlanması ve çıkarılması.
3. Eşleştirme: Her görüntünün göreceli pozunu (konumunu ve yönünü) belirlemek için görüntüler arasındaki özelliklerin eşleştirilmesi.
4. Yeniden Yapılanma: Sahnedeki 3B noktaları üçgenlemek ve 3B nokta bulutu temsili oluşturmak için eşleşen özelliklerin kullanılması.
5. İyileştirme: Poz tahminlerini yinelemeli olarak iyileştirerek ve 3B nokta bulutunu ayarlayarak yeniden yapılanmanın iyileştirilmesi.
OpenCV, COLMAP ve MeshLab dahil olmak üzere SFM gerçekleştirmek için birçok yazılım kitaplığı ve araç mevcuttur. Bu kitaplıklar, kendi görüntülerinizde SFM gerçekleştirmeyi kolaylaştıran önceden oluşturulmuş işlevler ve sınıflar sağlar.