ทำความเข้าใจโครงสร้างจากการเคลื่อนไหว (SFM) ในคอมพิวเตอร์วิทัศน์
SFM ย่อมาจาก "Structure from Motion" เป็นเทคนิคการมองเห็นด้วยคอมพิวเตอร์ที่ใช้ในการสร้างฉาก 3 มิติขึ้นมาใหม่จากลำดับภาพ 2 มิติ แนวคิดพื้นฐานเบื้องหลัง SFM คือการใช้การเคลื่อนไหวของวัตถุในฉากเพื่อประมาณโครงสร้าง 3 มิติของฉาก
ใน SFM ภาพหลายภาพในฉากเดียวกันจะถูกถ่ายจากมุมมองที่ต่างกัน ด้วยการวิเคราะห์ภาพเหล่านี้ อัลกอริธึมสามารถกำหนดตำแหน่ง 3 มิติของวัตถุในฉาก และสร้างการแสดงภาพเมฆจุด 3 มิติของฉากได้ ซึ่งสามารถนำไปใช้งานได้หลากหลาย เช่น หุ่นยนต์ ความเป็นจริงเสริม และความเป็นจริงเสมือน ขั้นตอนหลักของไปป์ไลน์ SFM โดยทั่วไปจะประกอบด้วย:
1 การรวบรวมภาพ: การถ่ายภาพฉากหลายภาพจากมุมมองที่แตกต่างกัน
2. การแยกคุณลักษณะ: การระบุและการแยกคุณลักษณะ (เช่น มุมหรือขอบ) จากแต่ละภาพ
3 การจับคู่: การจับคู่คุณสมบัติระหว่างภาพเพื่อกำหนดท่าทางที่สัมพันธ์กัน (ตำแหน่งและการวางแนว) ของแต่ละภาพ
4 การสร้างใหม่: การใช้คุณสมบัติที่ตรงกันเพื่อกำหนดจุด 3D ในฉากเป็นรูปสามเหลี่ยม และสร้างการแสดงภาพ 3D point cloud
5 การปรับปรุง: ปรับปรุงการสร้างใหม่โดยปรับปรุงการประมาณท่าทางซ้ำๆ และปรับ 3D point cloud มีไลบรารีซอฟต์แวร์และเครื่องมือมากมายสำหรับดำเนินการ SFM รวมถึง OpenCV, COLMAP และ MeshLab ไลบรารีเหล่านี้มีฟังก์ชันและคลาสที่สร้างไว้ล่วงหน้าซึ่งทำให้ง่ายต่อการใช้งาน SFM กับอิมเมจของคุณเอง