Dreidimensionale Multi-View-Rekonstruktion: Fortgeschrittene Techniken zur räumlichen Wahrnehmung in der Computer Vision
Von Fouad Sabry
()
Über dieses E-Book
Was ist dreidimensionale Multi-View-Rekonstruktion
3D-Rekonstruktion aus mehreren Bildern ist die Erstellung dreidimensionaler Modelle aus einer Reihe von Bildern. Es handelt sich um den umgekehrten Prozess zur Gewinnung von 2D-Bildern aus 3D-Szenen.
Wie Sie davon profitieren
(I) Einblicke und Validierungen zu den folgenden Themen:
Kapitel 1: 3D-Rekonstruktion aus mehreren Bildern
Kapitel 2: Grundlegende Matrix (Computer Vision)
Kapitel 3: Triangulation (Computer Vision)
Kapitel 4: Perspektive-n-Punkt
Kapitel 5: Bildzusammenfügung
Kapitel 6: Aktives Konturmodell
Kapitel 7: Bündelanpassung
Kapitel 8: Skalierungsinvariante Feature-Transformation
Kapitel 9: 3D-Objekterkennung
Kapitel 10: Automatische Kamerakalibrierung
(II) Beantwortung der häufigsten öffentlichen Fragen zur dreidimensionalen Multi-View-Rekonstruktion.
(III) Beispiele aus der Praxis für die Verwendung der dreidimensionalen Multi-View-Rekonstruktion in vielen Bereichen.
Wer das? Das Buch richtet sich an
Profis, Studenten und Doktoranden, Enthusiasten, Bastler und diejenigen, die über das Grundwissen oder die Informationen für jede Art von dreidimensionaler Multi-View-Rekonstruktion hinausgehen möchten.
Mehr von Fouad Sabry lesen
Ähnlich wie Dreidimensionale Multi-View-Rekonstruktion
Titel in dieser Serie (100)
Gemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard Bewertung: 0 von 5 Sternen0 BewertungenUnterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen Bewertung: 0 von 5 Sternen0 BewertungenFarberscheinungsmodell: Wahrnehmung und Darstellung in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenComputer Vision: Erkundung der Tiefen des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenHough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenHadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden Bewertung: 0 von 5 Sternen0 BewertungenBildkompression: Effiziente Techniken zur visuellen Datenoptimierung Bewertung: 0 von 5 Sternen0 BewertungenTonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAnisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion Bewertung: 0 von 5 Sternen0 BewertungenLärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung Bewertung: 0 von 5 Sternen0 BewertungenAdaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung Bewertung: 0 von 5 Sternen0 BewertungenRadon-Transformation: Aufdecken verborgener Muster in visuellen Daten Bewertung: 0 von 5 Sternen0 BewertungenOrientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung Bewertung: 0 von 5 Sternen0 BewertungenHomographie: Homographie: Transformationen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenComputer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenKantenerkennung: Grenzen in der Computer Vision erkunden Bewertung: 0 von 5 Sternen0 BewertungenFarbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenHistogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenHarris Eckendetektor: Enthüllung der Magie der Bildmerkmalserkennung Bewertung: 0 von 5 Sternen0 BewertungenAktive Kontur: Weiterentwicklung der Computer Vision mit aktiven Konturtechniken Bewertung: 0 von 5 Sternen0 BewertungenRetinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex Bewertung: 0 von 5 Sternen0 BewertungenFarbmanagementsystem: Optimierung der visuellen Wahrnehmung in digitalen Umgebungen Bewertung: 0 von 5 Sternen0 BewertungenInpainting: Überbrückung von Lücken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAffine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik Bewertung: 0 von 5 Sternen0 BewertungenModell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen Bewertung: 0 von 5 Sternen0 BewertungenFarbmodell: Das Spektrum des Computer Vision verstehen: Farbmodelle erkunden Bewertung: 0 von 5 Sternen0 BewertungenLevel-Set-Methode: Weiterentwicklung der Computer Vision, Erforschung der Level-Set-Methode Bewertung: 0 von 5 Sternen0 BewertungenFilterbank: Einblicke in die Filterbanktechniken von Computer Vision Bewertung: 0 von 5 Sternen0 Bewertungen
Ähnliche E-Books
Computer-Vision-Grafikschnitte: Erforschung von Graphschnitten in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenKontextuelle Bildklassifizierung: Visuelle Daten für eine effektive Klassifizierung verstehen Bewertung: 0 von 5 Sternen0 BewertungenBündelanpassung: Optimieren visueller Daten für eine präzise Rekonstruktion Bewertung: 0 von 5 Sternen0 BewertungenComputer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildsegmentierung: Erkenntnisse durch Pixelpräzision erschließen Bewertung: 0 von 5 Sternen0 BewertungenModell einer Lochkamera: Perspektive durch Computeroptik verstehen Bewertung: 0 von 5 Sternen0 BewertungenVolumen Rendern: Erforschung des Visuellen Realismus in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenRaytracing-Grafiken: Erforschung des fotorealistischen Renderings in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBewegungsschätzung: Fortschritte und Anwendungen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenVerfahrensoberfläche: Erforschung der Texturgenerierung und -analyse in Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildbasierte Modellierung und Rendering: Erforschung des visuellen Realismus: Techniken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenPolygon-Computergrafik: Erkundung der Schnittstelle zwischen Polygon-Computergrafik und Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenPyramiden Bildverarbeitung: Erkundung der Tiefen der visuellen Analyse Bewertung: 0 von 5 Sternen0 BewertungenComputergeometrie: Erforschung geometrischer Erkenntnisse für Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenVertex-Computergrafik: Erkundung der Schnittstelle zwischen Vertex Computer Graphics und Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenLernen geometrischer Merkmale: Visuelle Einblicke durch das Lernen geometrischer Merkmale erschließen Bewertung: 0 von 5 Sternen0 BewertungenEigenface: Erkunden Sie die Tiefen der visuellen Erkennung mit Eigenface Bewertung: 0 von 5 Sternen0 BewertungenAktives Erscheinungsmodell: Erschließung der Leistungsfähigkeit aktiver Darstellungsmodelle in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenSynthese anzeigen: Erkundung von Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenRastergrafik-Editor: Visuelle Realitäten transformieren: Rastergrafik-Editoren in Computer Vision beherrschen Bewertung: 0 von 5 Sternen0 BewertungenBump-Mapping: Bump Mapping: Erforschung der Tiefe der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenPartitionierung des binären Raums: Erkundung der binären Raumpartitionierung: Grundlagen und Anwendungen in der Bildverarbeitung Bewertung: 0 von 5 Sternen0 BewertungenDistanznebel: Erkundung der visuellen Grenze: Einblicke in den Distanznebel der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenRadiosity Computergrafik: Fortschrittliche Visualisierung durch Radiosität in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBestimmung verdeckter Oberflächen: Enthüllung der Geheimnisse des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenTextur Zuordnung: Erforschung der Dimensionalität im Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenVisuelles Sensornetzwerk: Erkundung der Leistungsfähigkeit visueller Sensornetzwerke in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenSchätzung der artikulierten Körperhaltung: Erschließung menschlicher Bewegung in Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenKantenerkennung: Grenzen in der Computer Vision erkunden Bewertung: 0 von 5 Sternen0 Bewertungen
Künstliche Intelligenz (KI) & Semantik für Sie
Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German Bewertung: 0 von 5 Sternen0 BewertungenChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler Bewertung: 0 von 5 Sternen0 BewertungenAufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen Bewertung: 0 von 5 Sternen0 BewertungenMenschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt Bewertung: 0 von 5 Sternen0 BewertungenEinstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5 Bewertung: 0 von 5 Sternen0 BewertungenDie Zukunft der Arbeit: Digitalisierung, Automatisierung, KI Bewertung: 0 von 5 Sternen0 BewertungenKI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch Bewertung: 0 von 5 Sternen0 BewertungenChatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken Bewertung: 0 von 5 Sternen0 BewertungenDie KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen Bewertung: 1 von 5 Sternen1/5Künstliche Intelligenz: Die vierte industrielle Revolution Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen Bewertung: 0 von 5 Sternen0 BewertungenRoboter im Alltag: Maschinen (beinahe) wie Menschen Bewertung: 0 von 5 Sternen0 BewertungenDigitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit? Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz in Sozialen Medien Bewertung: 0 von 5 Sternen0 BewertungenChatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit Bewertung: 0 von 5 Sternen0 BewertungenWissen statt Glauben!: Das Weltbild des neuen Humanismus Bewertung: 0 von 5 Sternen0 Bewertungen
Rezensionen für Dreidimensionale Multi-View-Rekonstruktion
0 Bewertungen0 Rezensionen
Buchvorschau
Dreidimensionale Multi-View-Rekonstruktion - Fouad Sabry
Kapitel 1: 3D-Rekonstruktion aus mehreren Bildern
Der Prozess der Erstellung eines 3D-Modells aus einer Sammlung von 2D-Fotos wird als 3D-Rekonstruktion bezeichnet. Es ist die Technik, mit der 3D-Szenen in 2D-Bilder umgewandelt werden.
Bilder sind im Wesentlichen Projektionen von dreidimensionalen Szenen auf eine zweidimensionale Ebene, in der die Tiefeninformationen verloren gehen. Für einen bestimmten Bildpunkt muss der passende 3D-Punkt entlang der Sichtlinie des Betrachters liegen. Welcher Punkt auf dieser Linie dem Bildpunkt entspricht, kann man nicht allein anhand eines einzelnen Bildes erkennen. Wenn wir Zugriff auf zwei Fotos haben, können wir die 3D-Koordinaten eines Punktes bestimmen, indem wir die Stelle finden, an der sich die beiden Projektionsstrahlen verbinden. Die Triangulation beschreibt diese Methode. Beziehungen zwischen verschiedenen Ansichten sind entscheidend, da sie das Wissen vermitteln, dass Punktpaare miteinander korrelieren, weil es eine zugrunde liegende Struktur zwischen ihnen geben muss, und dass diese Struktur wiederum mit den Posen und der Kamerakalibrierung zusammenhängt.
In den letzten Jahrzehnten hat sich der Fokus weg von 2D-Grafiken und hin zu 3D-Inhalten für Computergrafik, virtuelle Realität und Kommunikation verlagert. Viele der aktuellen Methoden zur Erstellung von 3D-Modellen basieren auf teurer, spezialisierter Hardware (z. B. Stereo-Rigs), die für die meisten vorhandenen Anwendungen nicht erforderlich ist. Die Notwendigkeit, diese Lücke zu füllen, treibt die Einführung digitaler Bildgebungstechnologien (wie einer Kamera) voran. Tomasi und Kanade schlugen eine Technik vor, die damals verwendet wurde. Um 3D-Daten aus Videosequenzen zu gewinnen, verwendeten sie eine affine Faktorisierungsmethode. Ein großer Fehler in diesem Ansatz besteht jedoch darin, dass er auf orthographischer Projektion beruht.
Es gibt eine bestimmte Abfolge von Operationen, die ausgeführt werden müssen, um eine Sammlung von 2D-Fotos in ein 3D-Modell umzuwandeln:
Bei der Kamerakalibrierung sind sowohl interne als auch externe Parameter beteiligt, ohne die keine algorithmische Konfiguration genaue Ergebnisse liefern kann. Kalibrierung und Tiefenbestimmung sind durch eine durchgezogene Linie getrennt, da die Kalibrierung für die meisten Tiefenbestimmungen erforderlich ist.
Der schwierigste Teil dieser Methode ist die Schätzung der Tiefe, der dritten Dimension, die in einem bestimmten Bild immer fehlt. Die größte Herausforderung ist das Korrespondenzproblem, bei dem übereinstimmende Merkmale in zwei Bildern so lokalisiert werden müssen, dass ihre 3D-Koordinaten trianguliert werden können.
Sobald Sie viele Tiefenkarten haben, können Sie sie mithilfe der Registrierung zusammenführen, um mithilfe von Tiefenberechnungen und Kameraprojektionen ein endgültiges Netz zu erhalten. Um mehrere Perspektiven zu bieten, wird die Kamerakalibrierung verwendet, um zu bestimmen, welche der zahlreichen von Tiefenkarten erzeugten Netze zu einem größeren kombiniert werden können.
Obwohl ein fertiges 3D-Netz in der Phase der Materialanwendung möglich ist, ist es üblicher, an dieser Stelle die Farbe aus den Quellfotos hinzuzufügen. Die Segmentierung des Modells nach Material, wie z. B. spiegelnde und diffuse Qualitäten, ist eine weitere Option. Dies kann auf verschiedene Arten erreicht werden, von der zufälligen Projektion der Bilder auf das Mesh bis hin zum Mischen der Texturen für eine Superauflösung.
Bei einer Gruppe von 3D-Punkten, die von N Kameras mit Matrizen betrachtet werden \{P^{i}\}_{{i=1\ldots N}} , definieren Sie m_{j}^{i}\simeq P^{i}w_{j} die homogenen Koordinaten der Projektion des Punktes j^{th} auf die i^{th} Kamera.
Das Rekonstruktionsproblem kann wie folgt geändert werden: Ermitteln Sie anhand der Gruppe von Pixelkoordinaten \{m_{j}^{i}\} den entsprechenden Satz von Kameramatrizen \{P^{i}\} und die Szenenstruktur \{w_{j}\} so, dass
m_{j}^{i}\simeq P^{i}w_{j} (1)
Im Allgemeinen, ohne weitere Grenzen, ist eine projektive Rekonstruktion das, was wir am Ende haben werden.
Wenn \{P^{i}\} und \{w_{j}\} (1) erfüllen \{P^{i}T\} und \{T^{{-1}}w_{j}\} (1) mit einer beliebigen 4 × 4 nichtsingulären Matrix T erfüllen.
Ohne Vorkenntnisse kann eine projektive Rekonstruktion allein durch die Entsprechung von Punkten berechnet werden.
Der erste Schritt bei der automatischen Kalibrierung, auch als Selbstkalibrierung bezeichnet, ist die Wiederherstellung von Kamerabewegungen und -parametern über die Steifigkeit. Dann werden die statischen Berechnungen einfach. Hier sind zwei Ansätze, um diesen Plan in die Tat umzusetzen:
Die internen Eigenschaften der Kamera können mit mindestens drei Verschiebungen unter Verwendung eines von Kruppa entwickelten Satzes von Polynomgleichungen berechnet werden. Die Matrix K=AA^{{\top }} ist in den Kruppa-Gleichungen, Matrix der Kruppa-Koeffizienten, unbekannt.
Es ist einfach, die intrinsischen Parameter mit K und der Cholesky-Faktorisierungstechnik zu berechnen:
K={\begin{bmatrix}k_{1}&k_{2}&k_{3}\\k_{2}&k_{4}&k_{5}\\k_{3}&k_{5}&1\\\end{bmatrix}}Eine neue, einfachere Version wurde kürzlich von Hartley vorgestellt.
Es sei F geschrieben als F=DUV^{\top } , wobei
Anschließend werden die Kruppa-Gleichungen neu formuliert (die Herleitung finden Sie in )
Der Schlüssel zu dieser Strategie ist die strikte Einhaltung von Einschränkungen.
Erstellen Sie ein Preismodell, Es berücksichtigt grundlegende Matrizen als Argumente und systeminterne Parameter als Eingabe.
{\displaystyle {F}_{ij}} ist als fundamentale Matrix {A}_{i} und {A}_{j} als intrinsische Parametermatrizen definiert.
In letzter Zeit wurden neue Ansätze vorgeschlagen, die auf der Idee der Schichtung basieren. Aktualisieren Sie diese projektive Rekonstruktion auf eine euklidische Rekonstruktion, indem Sie alle verfügbaren Randbedingungen verwenden, ausgehend von einer projektiven Struktur, die nur mit Korrespondenzen berechnet werden kann. Dadurch kann das Problem in überschaubare Blöcke zerlegt werden, von denen jeder je nach Anzahl der verfügbaren Einschränkungen auf einer anderen Ebene (projektiv, affin oder euklidisch) untersucht werden kann.
Typischerweise stellen wir uns die Welt als einen dreidimensionalen euklidischen Raum vor. Die gesamte euklidische Struktur des 3D-Raums kann nicht in allen Situationen verwendet werden. Die projektive Geometrie ist die einfachste, gefolgt von der affinen Geometrie (einer Zwischenschicht) und der euklidischen Geometrie (der komplexesten). Eine Reihe von projektiven Transformationen (eine Homographie) findet sich in der projektiven Schicht, eine affine Reihe von Transformationen findet sich in der affinen Schicht und eine euklidische Reihe von Transformationen findet sich in