Pyramiden Bildverarbeitung: Erkundung der Tiefen der visuellen Analyse

eBook139 Seiten1 Stunde

Pyramiden Bildverarbeitung: Erkundung der Tiefen der visuellen Analyse

Name: Pyramiden Bildverarbeitung: Erkundung der Tiefen der visuellen Analyse
Author: Fouad Sabry

Von Fouad Sabry

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist Pyramiden Bildverarbeitung?

Pyramide oder Pyramidendarstellung ist eine Art mehrskalige Signaldarstellung, die von den Bereichen Computer Vision, Bildverarbeitung und Signalverarbeitung entwickelt wurde und bei der ein Signal oder ein Bild einer wiederholten Glättung und Unterabtastung unterzogen wird. Die Pyramidendarstellung ist ein Vorläufer der Maßstabsraumdarstellung und der Analyse mit mehreren Auflösungen.

Wie Sie davon profitieren

(I) Erkenntnisse und Validierungen zu den folgenden Themen:

Kapitel 1: Pyramide (Bildverarbeitung)

Kapitel 2: Skalierungsinvariante Feature-Transformation

Kapitel 3: Gabor-Filter

Kapitel 4: Raum skalieren

Kapitel 5: Gaußsche Unschärfe

Kapitel 6: Funktion (Computer Vision)

Kapitel 7: Unterschied der Gauß-Funktionen

Kapitel 8: Eckenerkennung

Kapitel 9: Strukturtensor

Kapitel 10: Mittlere Verschiebung

(II) Beantwortung der häufigsten öffentlichen Fragen zur Pyramidenbildverarbeitung.

(III) Beispiele aus der Praxis für den Einsatz der Pyramidenbildverarbeitung in vielen Bereichen.

Für wen dieses Buch ist

Fachleute, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über grundlegende Kenntnisse oder Informationen für jede Art von Pyramidenbildverarbeitung hinausgehen möchten.

Karussell überspringen

SpracheDeutsch

HerausgeberEine Milliarde Sachkundig [German]

Erscheinungsdatum11. Mai 2024

Autor

Fouad Sabry

Mehr von Fouad Sabry lesen

Karussell überspringen

Neue Technologien Im Weltraum [German]
eBook-Reihen
Neue Technologien Im Weltraum [German]
vonFouad Sabry
Neue Technologien Im Militär [German]
eBook-Reihen
Neue Technologien Im Militär [German]
vonFouad Sabry
Neue Technologien in den Neurowissenschaften [German]
eBook-Reihen
Neue Technologien in den Neurowissenschaften [German]
vonFouad Sabry
Neue Technologien Im Transportwesen [German]
eBook-Reihen
Neue Technologien Im Transportwesen [German]
vonFouad Sabry

Ähnlich wie Pyramiden Bildverarbeitung

Titel in dieser Serie (100)

Karussell überspringen

Gemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard
eBook
Gemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Unterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen
eBook
Unterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farberscheinungsmodell: Wahrnehmung und Darstellung in Computer Vision verstehen
eBook
Farberscheinungsmodell: Wahrnehmung und Darstellung in Computer Vision verstehen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Computer Vision: Erkundung der Tiefen des Computer Vision
eBook
Computer Vision: Erkundung der Tiefen des Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Hough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision
eBook
Hough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Hadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision
eBook
Hadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Bildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden
eBook
Bildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Bildkompression: Effiziente Techniken zur visuellen Datenoptimierung
eBook
Bildkompression: Effiziente Techniken zur visuellen Datenoptimierung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Tonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision
eBook
Tonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Anisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion
eBook
Anisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Lärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung
eBook
Lärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Adaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung
eBook
Adaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Radon-Transformation: Aufdecken verborgener Muster in visuellen Daten
eBook
Radon-Transformation: Aufdecken verborgener Muster in visuellen Daten
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Orientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung
eBook
Orientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Homographie: Homographie: Transformationen in der Computer Vision
eBook
Homographie: Homographie: Transformationen in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Computer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision
eBook
Computer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Kantenerkennung: Grenzen in der Computer Vision erkunden
eBook
Kantenerkennung: Grenzen in der Computer Vision erkunden
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen
eBook
Farbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Histogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung
eBook
Histogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Harris Eckendetektor: Enthüllung der Magie der Bildmerkmalserkennung
eBook
Harris Eckendetektor: Enthüllung der Magie der Bildmerkmalserkennung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Aktive Kontur: Weiterentwicklung der Computer Vision mit aktiven Konturtechniken
eBook
Aktive Kontur: Weiterentwicklung der Computer Vision mit aktiven Konturtechniken
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Retinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex
eBook
Retinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farbmanagementsystem: Optimierung der visuellen Wahrnehmung in digitalen Umgebungen
eBook
Farbmanagementsystem: Optimierung der visuellen Wahrnehmung in digitalen Umgebungen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Inpainting: Überbrückung von Lücken in der Computer Vision
eBook
Inpainting: Überbrückung von Lücken in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Affine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision
eBook
Affine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Gamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik
eBook
Gamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Modell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen
eBook
Modell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farbmodell: Das Spektrum des Computer Vision verstehen: Farbmodelle erkunden
eBook
Farbmodell: Das Spektrum des Computer Vision verstehen: Farbmodelle erkunden
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Level-Set-Methode: Weiterentwicklung der Computer Vision, Erforschung der Level-Set-Methode
eBook
Level-Set-Methode: Weiterentwicklung der Computer Vision, Erforschung der Level-Set-Methode
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Filterbank: Einblicke in die Filterbanktechniken von Computer Vision
eBook
Filterbank: Einblicke in die Filterbanktechniken von Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen

Künstliche Intelligenz (KI) & Semantik für Sie

Karussell überspringen

Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German
eBook
Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German
vonVasyl Kolomiiets
Bewertung: 0 von 5 Sternen
0 Bewertungen
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
eBook
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
vonChrista Stuber
Bewertung: 0 von 5 Sternen
0 Bewertungen
Aufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen
eBook
Aufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen
vonMartin Ford
Bewertung: 0 von 5 Sternen
0 Bewertungen
Menschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt
eBook
Menschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt
vonEdwin Hübner
Bewertung: 0 von 5 Sternen
0 Bewertungen
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
eBook
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
vonShahin Amiriparian
Bewertung: 0 von 5 Sternen
0 Bewertungen
ChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5
eBook
ChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5
vonRolf Jeger
Bewertung: 0 von 5 Sternen
0 Bewertungen
Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI
eBook
Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI
vonFrankfurter Allgemeine Archiv
Bewertung: 0 von 5 Sternen
0 Bewertungen
KI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch
eBook
KI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch
vonJhon Dujardin
Bewertung: 0 von 5 Sternen
0 Bewertungen
Chatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken
eBook
Chatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken
vonSvetlana Badak
Bewertung: 0 von 5 Sternen
0 Bewertungen
Die KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen
eBook
Die KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen
vonJhon Dujardin
Bewertung: 1 von 5 Sternen
1/5
Künstliche Intelligenz: Die vierte industrielle Revolution
eBook
Künstliche Intelligenz: Die vierte industrielle Revolution
vonVasil Teigens
Bewertung: 0 von 5 Sternen
0 Bewertungen
ChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen
eBook
ChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen
vonHema
Bewertung: 0 von 5 Sternen
0 Bewertungen
Roboter im Alltag: Maschinen (beinahe) wie Menschen
eBook
Roboter im Alltag: Maschinen (beinahe) wie Menschen
vonAndreas Dripke
Bewertung: 0 von 5 Sternen
0 Bewertungen
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
eBook
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
vonSascha Berger
Bewertung: 0 von 5 Sternen
0 Bewertungen
Künstliche Intelligenz in Sozialen Medien
eBook
Künstliche Intelligenz in Sozialen Medien
vonIntroBooks Team
Bewertung: 0 von 5 Sternen
0 Bewertungen
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit
eBook
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit
vonSvetlana Badak
Bewertung: 0 von 5 Sternen
0 Bewertungen
Die destruktive Wirkung der Informationstechnologie auf die intellektuelle Entwicklung des Menschen: Eine technophilosophische Betrachtung
eBook
Die destruktive Wirkung der Informationstechnologie auf die intellektuelle Entwicklung des Menschen: Eine technophilosophische Betrachtung
vonTom Landon
Bewertung: 1 von 5 Sternen
1/5
GPT-4: Ein umfassender Leitfaden mit Unterschieden zu GPT-3 und Anwendungsbeispielen: ChatGPT4, GPT-3 - eine kleine Zeitreise in die Vergangenheit und Zukunft
eBook
GPT-4: Ein umfassender Leitfaden mit Unterschieden zu GPT-3 und Anwendungsbeispielen: ChatGPT4, GPT-3 - eine kleine Zeitreise in die Vergangenheit und Zukunft
vonHenrik Roth
Bewertung: 0 von 5 Sternen
0 Bewertungen
Wissen statt Glauben!: Das Weltbild des neuen Humanismus
eBook
Wissen statt Glauben!: Das Weltbild des neuen Humanismus
vonBernd Vowinkel
Bewertung: 0 von 5 Sternen
0 Bewertungen

Buchvorschau

Pyramiden Bildverarbeitung - Fouad Sabry

Kapitel 1: Pyramide (Bildverarbeitung)

Die Pyramidendarstellung, kurz Pyramide, ist eine Art Multiskalen-Signaldarstellung, die von Forschern in den Bereichen Computer Vision, Bildverarbeitung und Signalverarbeitung entwickelt wurde. Vor der Skalenraumdarstellung und der Multiresolution-Analyse gab es die Pyramidendarstellung.

Pyramiden können in zwei große Kategorien unterteilt werden: Tiefpass und Bandpass.

Nach dem Anwenden des erforderlichen Glättungsfilters auf das Bild wird eine Tiefpasspyramide erstellt, indem das Ergebnis sowohl in horizontaler als auch in vertikaler Richtung um den Faktor 2 abgetastet wird. Das resultierende Bild wird auf die gleiche Weise noch einmal verarbeitet, und dieser Zyklus wird mehrmals wiederholt. Nach mehreren Iterationen nimmt die Bildgröße ab, die Glätte verbessert sich, aber die räumliche Abtastdichte nimmt ab (d. h. die Bildauflösung nimmt ab). Visuell ähnelt die gesamte Darstellung in mehreren Maßstäben einer Pyramide, wobei das Originalbild an der Basis steht und die kleineren Bilder, die durch aufeinanderfolgende Zyklen erzeugt werden, darüber geschichtet sind.

Um die Berechnung pixelweiser Unterschiede zu ermöglichen, wird eine Bandpasspyramide konstruiert, indem die Differenz zwischen Bildern auf aufeinanderfolgenden Ebenen in der Pyramide erzeugt und eine Bildinterpolation zwischen benachbarten Auflösungsstufen durchgeführt wird.

Für die Pyramidengenerierung wurden viele Glättungskörner vorgeschlagen. Die heute leistungsfähigeren Prozessoren ermöglichen es, größere unterstützte Gaußsche Filter als Glättungskerne in den Pyramidenerstellungsprozessen zu verwenden.

Nachfolgende Fotos in einer Gaußschen Pyramide werden verkleinert und mit einem Gaußschen Durchschnitt (Gaußsche Unschärfe) gewichtet. Jedes Nachbarschaftspixel in den unteren Ebenen der Pyramide wird durch ein Pixel mit einem lokalen Durchschnitt dargestellt. Diese Methode ist im Bereich der Textursynthese weit verbreitet.

Ähnlich wie eine Gaußsche Pyramide speichert auch eine Laplace-Pyramide das Differenzbild zwischen den einzelnen Unschärfegraden. Um das hochauflösende Bild aus den Differenzfotos auf höheren Ebenen zu rekonstruieren, ist nur die niedrigste Ebene kein Differenzbild. Bilder können mit dieser Methode komprimiert werden.

Simoncelli und andere erfanden die steuerbare Pyramide, eine Bandpassfilterbank mit mehreren Skalen und mehreren Ausrichtungen, die zur Bildkomprimierung, Texturerzeugung und Objekterkennung verwendet wird. Es ähnelt einer Laplace-Pyramide, aber anstatt auf jeder Ebene einen einzelnen Laplace- oder Gauß-Filter zu verwenden, wird eine Bank steuerbarer Filter verwendet.

Pyramiden waren die primäre Multiskalendarstellung, die in der frühen Computer Vision zur Generierung von Multiskalen-Bildattributen aus Rohbilddaten verwendet wurde. Einige Forscher bevorzugen die Darstellung im Skalenraum aufgrund ihrer theoretischen Grundlage, der Möglichkeit, die Subsampling-Phase von der Multiskalendarstellung zu entkoppeln, robusterer Werkzeuge für die theoretische Analyse und der Fähigkeit, eine Darstellung in jedem gewünschten Maßstab zu berechnen, wodurch die algorithmischen Probleme der Beziehung von Bilddarstellungen bei unterschiedlichen Auflösungen vermieden werden. Pyramiden sind nicht mehr so beliebt wie früher, aber sie werden dennoch häufig eingesetzt, um recheneffiziente Annäherungen an die Darstellung des Maßstabsraums zu vermitteln.

Laplace-Pyramiden ermöglichen die Verstärkung oder Reduzierung von Details in verschiedenen Maßstäben durch Hinzufügen oder Entfernen von Ebenen aus dem Quellbild. Es ist jedoch bekannt, dass diese Art der Detailmanipulation häufig zu Halo-Fehlern führt, was zur Erstellung von Alternativen wie dem bilateralen Filter führt.

Der Adam7-Algorithmus wird zusammen mit anderen Interlacing-Techniken in bestimmten Bildkomprimierungsdateiformaten verwendet. Diese können als Pyramidenform für Visuals angesehen werden. Eine Datei kann viele Viewer-Auflösungen unterstützen, anstatt für jede Auflösung eine andere Datei speichern oder generieren zu müssen, da diese Dateiformate die großflächigen Features zuerst und die feinkörnigen Details später in der Datei speichern. Auf diese Weise kann ein bestimmter Viewer, der ein kleines Thumbnail oder auf einem kleinen Bildschirm anzeigt, schnell gerade genug vom Bild herunterladen, um es in den verfügbaren Pixeln anzuzeigen.

{Ende Kapitel 1}

Kapitel 2: Skalierungsinvariante Feature-Transformation

David Lowe entwickelte 1999 die skaleninvariante Merkmalstransformation (SIFT) als Computer-Vision-Algorithmus zum Auffinden, Charakterisieren und Abgleichen lokaler Merkmale in Bildern. Objekterkennung, robotische Kartierung und Navigation, Bildzusammenfügung, dreidimensionale Modellierung, Gestenerkennung, Videoverfolgung, individuelle Wildtieridentifikation und Matchmaking sind nur einige der vielen Einsatzmöglichkeiten dieser Technologie.

Objekt-SIFT-Schlüsselpunkte werden zunächst aus einem Trainingssatz von Bildern extrahiert.

Es ist möglich, eine Merkmalsbeschreibung eines beliebigen Objekts in einem Bild zu erstellen, indem wichtige Punkte zu diesem Objekt isoliert werden. Wenn Sie versuchen, ein Objekt in einem Testbild mit vielen anderen Objekten zu finden, kann diese Beschreibung verwendet werden, da es aus einem Trainingsbild extrahiert wurde. Die aus dem Trainingsbild extrahierten Merkmale müssen trotz Variationen in Bildmaßstab, Rauschen und Beleuchtung erkennbar sein, wenn eine zuverlässige Erkennung erreicht werden soll. Diese Flecken befinden sich normalerweise an Bildrändern oder anderen Bereichen mit hohem Kontrast.

Darüber hinaus sollten diese Features von einem Bild zum nächsten die gleichen relativen Positionen beibehalten wie in der Originalszene. Wenn nur die vier Ecken einer Tür als Merkmale verwendet würden, würde die Erkennung gelingen, unabhängig davon, ob die Tür offen oder geschlossen ist. Wenn jedoch auch Punkte im Rahmen verwendet würden, würde die Erkennung in beiden Fällen fehlschlagen. Wenn sich die interne Geometrie eines artikulierten oder flexiblen Objekts zwischen zwei Bildern in der zu verarbeitenden Menge ändert, funktionieren die in diesem Objekt befindlichen Features wahrscheinlich nicht mehr. Während diese lokalen Variationen einen erheblichen Einfluss auf den durchschnittlichen Fehler aller Feature-Matching-Fehler haben können, erkennt und verwendet SIFT in der Praxis eine viel größere Anzahl von Features aus den Bildern, was ihre Auswirkungen abmildert.

Dieser Abschnitt bietet einen kurzen Überblick über den ursprünglichen SIFT-Algorithmus und erläutert kurz einige alternative Methoden zur Objekterkennung in Umgebungen mit vielen Hintergrundgeräuschen oder verdeckten Ansichten.

Der SIFT-Deskriptor verwendet rezeptive Feldmessungen zur Analyse von Bildern.

Lokale Bildmerkmale können bei der Objekterkennung helfen, wenn sie erkannt und beschrieben werden können. Die SIFT-Features werden durch Ändern der Größe oder Drehen des Bildes nicht beeinflusst, da sie auf der Darstellung des Objekts an diskreten Interessenpunkten basieren. Sie können geringfügigen Verschiebungen des Blickwinkels sowie Schwankungen der Beleuchtung und des Rauschens standhalten. Sie ermöglichen auch eine genaue Objektidentifikation mit einer geringen Wahrscheinlichkeit einer Nichtübereinstimmung, und sie sind sehr einzigartig und leicht zu extrahieren. Die hohe Dimensionalität kann jedoch ein Problem darstellen, daher werden in der Regel probabilistische Algorithmen wie k-d-Bäume mit der besten bin-first-Suche verwendet. Sie lassen sich einfach mit einer (großen) Datenbank mit lokalen Features abgleichen. Es werden nur drei SIFT-Merkmale eines Objekts benötigt, um seine Position und Pose zu berechnen, wodurch Objektbeschreibungen, die auf Sätzen von SIFT-Merkmalen basieren, robust gegenüber teilweiser Okklusion sind. Bei relativ kleinen Datenbanken und mit der heutigen Rechenleistung kann die Erkennung fast sofort erfolgen.

Mit Lowes Ansatz wird ein Bild in eine große Menge von Merkmalsvektoren umgewandelt, die robust gegenüber lokaler geometrischer Verzerrung sind, während sie immer noch unveränderlich gegenüber Bildtranslation, Skalierung und Rotation und in geringerem Maße Änderungen der Beleuchtung sind. Die Neuronen im primären visuellen Kortex, die grundlegende Form, Farbe und Bewegung für die Objekterkennung im Primatensehen kodieren, haben ähnliche Eigenschaften wie diese Merkmale. Maxima und Minimums der Differenz der Gaußschen Funktion, die im Skalierungsraum auf eine Reihe von geglätteten und neu abgetasteten Bildern angewendet

Gefällt Ihnen die Vorschau?

Seite 1 von 1

Pyramiden Bildverarbeitung: Erkundung der Tiefen der visuellen Analyse

Über dieses E-Book

Fouad Sabry

Mehr von Fouad Sabry lesen

Ähnliche Autoren

Ähnlich wie Pyramiden Bildverarbeitung

Titel in dieser Serie (100)

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Ähnliche Podcast-Episoden

Ähnliche Artikel

Verwandte Kategorien

Rezensionen für Pyramiden Bildverarbeitung

Wie hat es Ihnen gefallen?

Buchvorschau

Pyramiden Bildverarbeitung - Fouad Sabry

Kapitel 1: Pyramide (Bildverarbeitung)

Kapitel 2: Skalierungsinvariante Feature-Transformation