İçindekiler:
2025 Yazar: John Day | [email protected]. Son düzenleme: 2025-01-13 06:58
3D rekonstrüksiyon görevi genellikle binoküler görme ile ilişkilidir. Alternatif olarak, nesnenin etrafında tek bir kamerayı hareket ettirebilirsiniz. Bu arada cismin şekli biliniyorsa, görev tek bir fotoğraftan çözülebilir. Yani sadece bir kameranız var ve hareket etmiyor. Adım adım nasıl yapılacağına bakalım. Rubik Küpü kullanacağız çünkü iyi standartlaştırılmış ve zengin özelliklere sahip. Çok basit bir nesne ve aynı zamanda karmaşık bir yapı olarak kabul edilebilir. Bu nedenle, makine görüşü, görevi tamamlamak için önemli engelleri aşmalıdır.
Adım 1: Görevin Karmaşıklığını Değerlendirin
İlk bakışta, görev basittir. Küpün 3 kenarının birleştiği merkezi düğümü bulun ve bu kenarları çizin. Koordinatlarından kameraya olan mesafeyi ve dönüş açılarını hesaplamak mümkündür. Sorun şu ki bu çizgiler yok. Soldaki görüntüden her bir kenarın 2 paralel çizgi ile temsil edildiğini görüyorsunuz. Ayrıca sağ üstteki resimde her birinin 3 parçaya bölündüğü görülmektedir. Ayrıca, popüler Hough dönüşümünün çizgi parçalarını tespit edebilen bir varyantını uygularsak, görevi merkezi düğümün tespitini imkansız kılan bazı hatalarla gerçekleştirir. Uçlar birbirine ulaşmıyorsa tek bir nokta yoktur. Algılama ucu aşarsa, kalan 2 resimde gördüğünüz gibi kenarın ortasındaki düğüm gibi görünecektir.
2. Adım: Uygun Yaklaşımı Bulun
Çok fazla detay deterministik algoritmaları çalışmaz hale getirdiğinde, olasılıksal yaklaşımı düşünmenin zamanı gelmiştir. Görüntünün ortalama parametrelerini hesaplarsak, hataları önemli ölçüde azalacak ve paradoksal olarak yöntem daha güvenilir hale gelecektir. Standart Hough dönüşümü, çizgi segmentleri çıkarmaz. Yalnızca eğim tetası ve koordinat orijinden rho uzaklığı. Bir kısmı yukarıda gösterilen Hough uzayını oluştururlar. Burada teta yatay eksene karşılık gelir. Parlak noktalar, görüntüdeki olası çizgileri işaretler. Bu tür birkaç noktanın üst üste yerleştirildiğini unutmayın. Merak etme, resmimizde birçok paralel çizgi var. Aynı tetaya ve farklı rho'ya sahiptirler.
Adım 3: Teta Histogramını Hesaplayın
Bu tür kümeleri tespit edelim. Bu amaçla, aynı teta ile Hough uzayındaki tüm noktalar için okumaları özetleyeceğiz. Resimde karşılık gelen histogramı görüyorsunuz. Ölçümler hakkında birkaç not. Görüntülerle piksel koordinatlarında çalışırken, X ekseni her zamanki gibi gider, ancak Y aşağıyı gösterir, bu nedenle koordinat orijini sol üst köşedir ve teta, X ekseninden saat yönünde ölçülmelidir. Resimdeki tüm teta taramasının 180 derece olduğunu göz önünde bulundurarak, görüntüde 3 ana tepe noktasının 3 baskın eğimi temsil ettiğini yaklaşık olarak kontrol edebilirsiniz.
Adım 4: Rho Histogramını Hesaplayın
Artık 3 ana paralel doğru kümesini bildiğimize göre, her birinin içindeki doğruları ayıralım. Aynı yaklaşımı tekrarlayabiliriz. Teta histogramında bir tepe noktasına karşılık gelen Hough uzayından bir sütun alalım. Daha sonra, X ekseninin rho değerini ve Y - bu rho için özetlenmiş okumaları temsil ettiği başka bir histogramı hesaplayacağız. Açıkçası, toplam daha az olacak, bu yüzden bu grafik o kadar düzgün değil. Bununla birlikte, tepe noktaları açıkça görülebilir ve bunların sayısı (7), kaynak görüntüdeki paralel çizgilerin sayısına tam olarak karşılık gelir. Ne yazık ki, tüm çizelgeler o kadar mükemmel değil, ancak prensip açık.
Adım 5: Merkez Düğümü Bulun
Her teta için rho histogramında merkezi tepe noktasını alırsak, resimde kırmızı olan 3 çizgi elde ederiz. Kavşakları gerekli noktayı işaretler.
Adım 6: 2 Alternatiften Seçim Yapın
Her çizginin merkez noktadan her iki yönde de gittiğini görüyorsunuz. Doğru yarı nasıl belirlenir? Teta3'ü alalım. Bu çizginin alt kısmını aldığımızı varsayalım. Resmin sadece 2 yeşil çizgiden resmin sağ üst köşesine kadar olan kısmı için bir Hough uzayı daha hesaplayalım. Ardından bunun için teta histogramı oluşturun. Görüyorsunuz, üçüncü zirve tamamen ortadan kalktı, bu yüzden doğru seçimi yaptık.
Adım 7: Dış Köşeleri Belirleyin
Şimdi kırmızı kenarları kesen ve kalan köşeleri işaretleyen mavi çizgiler çizmek için rho histogramlarda ilk ve son tepe noktalarını kullanabiliriz. Görev çözüldü.
Adım 8: Pratikte Deneyin
Bu Eğitilebilir Tablonun resimleri Perception 1.0 kullanılarak oluşturulmuştur. Bu, bilgisayarla görü için güçlü bir kitaplık olan OpenCV'yi kullanan ücretsiz bir yazılımdır. Ayrıca, başka bir Instructable'ımda kullanılan WinNB ile bağlantılı olabilir, böylece robotik için görüş yeteneği sağlar. Her iki programı da nbsite'den indirebilirsiniz. Kurulum için indirilen exe dosyasını çalıştırmanız yeterlidir. Daha sonra, Windows'un standart aracını kullanarak kaldırabilirsiniz. Site ayrıca bilgisayarla görü ve ilgili konular hakkında kaynaklar içerir. Algıda, açıklanan 3B yeniden yapılandırma yöntemini ve diğer birçok yöntemi bulacaksınız. Bu programın avantajı, ara verilerle birlikte nihai sonucu vermesidir. Bir programcı olmadan bilgisayar görüşünün nasıl çalıştığını araştırabilirsiniz. Girdi olarak, her yöntemin özel olarak seçilmiş tipik örnekleri vardır. Tabii ki, kendiniz de kullanabilirsiniz. Bir dosyadan veya bilgisayarın kamerasından görüntü girmek mümkündür. Herhangi bir soru veya öneriniz için benimle iletişime geçmekten çekinmeyin.