Skalierungsinvariante Feature-Transformation: Enthüllung der Leistungsfähigkeit der skaleninvarianten Merkmalstransformation in der Computer Vision

eBook131 Seiten1 Stunde

Skalierungsinvariante Feature-Transformation: Enthüllung der Leistungsfähigkeit der skaleninvarianten Merkmalstransformation in der Computer Vision

Name: Skalierungsinvariante Feature-Transformation: Enthüllung der Leistungsfähigkeit der skaleninvarianten Merkmalstransformation in der Computer Vision
Author: Fouad Sabry

Von Fouad Sabry

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist Scale Invariant Feature Transform

SIFT, was für Scale-invariant Feature Transform steht, ist eine Methode für Computer Vision, die 1999 von David Lowe entwickelt wurde Der Zweck besteht darin, lokale Merkmale in Bildern zu identifizieren, zu beschreiben und mit ihnen in Einklang zu bringen. Zu den Anwendungen, die genutzt werden können, gehören Objekterkennung, Roboterkartierung und -navigation, Bildzusammenfügung, dreidimensionale Modellierung, Gestenerkennung, Videoverfolgung, individuelle Identifizierung von Wildtieren und Match-Movement.

Wie Sie davon profitieren

(I) Einblicke und Validierungen zu den folgenden Themen:

Kapitel 1: Skalierungsinvariante Feature-Transformation

Kapitel 2: Kantenerkennung

Kapitel 3: Skalierungsraum

Kapitel 4: Gaußsche Unschärfe

Kapitel 5: Funktion (Computer Vision)

Kapitel 6: Eckenerkennung

Kapitel 7: Affine Formanpassung

Kapitel 8: Hessischer affiner Regionendetektor

Kapitel 9: Hauptkrümmungsbasierter Regionendetektor

Kapitel 10: SCHNELL orientiert und KURZ gedreht

(II) Beantwortung der häufigsten öffentlichen Fragen zur skaleninvarianten Merkmalstransformation.

(III) Beispiele aus der Praxis für die Verwendung von skaleninvarianter Merkmalstransformation in vielen Bereichen.

Für wen dieses Buch gedacht ist

Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die es wollen um über das Grundwissen oder die Informationen für jede Art von skaleninvarianter Merkmalstransformation hinauszugehen.

Karussell überspringen

SpracheDeutsch

HerausgeberEine Milliarde Sachkundig [German]

Erscheinungsdatum30. Apr. 2024

Autor

Fouad Sabry

Mehr von Fouad Sabry lesen

Karussell überspringen

Neue Technologien in der Landwirtschaft [German]
eBook-Reihen
Neue Technologien in der Landwirtschaft [German]
vonFouad Sabry
Neue Technologien In Der Optoelektronik [German]
eBook-Reihen
Neue Technologien In Der Optoelektronik [German]
vonFouad Sabry
Neue Technologien In Der Medizin [German]
eBook-Reihen
Neue Technologien In Der Medizin [German]
vonFouad Sabry
Neue Technologien in den Neurowissenschaften [German]
eBook-Reihen
Neue Technologien in den Neurowissenschaften [German]
vonFouad Sabry
Neue Technologien Im Transportwesen [German]
eBook-Reihen
Neue Technologien Im Transportwesen [German]
vonFouad Sabry
Wirtschaftswissenschaft [German]
eBook-Reihen
Wirtschaftswissenschaft [German]
vonFouad Sabry

Ähnlich wie Skalierungsinvariante Feature-Transformation

Titel in dieser Serie (100)

Karussell überspringen

Inpainting: Überbrückung von Lücken in der Computer Vision
eBook
Inpainting: Überbrückung von Lücken in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Bildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden
eBook
Bildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Computer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision
eBook
Computer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Lärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung
eBook
Lärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Tonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision
eBook
Tonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Affine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision
eBook
Affine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Radon-Transformation: Aufdecken verborgener Muster in visuellen Daten
eBook
Radon-Transformation: Aufdecken verborgener Muster in visuellen Daten
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Unterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen
eBook
Unterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Modell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen
eBook
Modell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farbprofil: Erforschung der visuellen Wahrnehmung und Analyse in der Computer Vision
eBook
Farbprofil: Erforschung der visuellen Wahrnehmung und Analyse in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Aktive Kontur: Weiterentwicklung der Computer Vision mit aktiven Konturtechniken
eBook
Aktive Kontur: Weiterentwicklung der Computer Vision mit aktiven Konturtechniken
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Histogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung
eBook
Histogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Anisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion
eBook
Anisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Hadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision
eBook
Hadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Retinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex
eBook
Retinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Adaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung
eBook
Adaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Hough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision
eBook
Hough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farbzuordnung: Erforschung der visuellen Wahrnehmung und Analyse in der Computer Vision
eBook
Farbzuordnung: Erforschung der visuellen Wahrnehmung und Analyse in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Computer Vision: Erkundung der Tiefen des Computer Vision
eBook
Computer Vision: Erkundung der Tiefen des Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Bildkompression: Effiziente Techniken zur visuellen Datenoptimierung
eBook
Bildkompression: Effiziente Techniken zur visuellen Datenoptimierung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Aktives Erscheinungsmodell: Erschließung der Leistungsfähigkeit aktiver Darstellungsmodelle in der Computer Vision
eBook
Aktives Erscheinungsmodell: Erschließung der Leistungsfähigkeit aktiver Darstellungsmodelle in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Canny Edge Detector: Enthüllung der Kunst der visuellen Wahrnehmung
eBook
Canny Edge Detector: Enthüllung der Kunst der visuellen Wahrnehmung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Direkte lineare Transformation: Praktische Anwendungen und Techniken in der Computer Vision
eBook
Direkte lineare Transformation: Praktische Anwendungen und Techniken in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Gamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik
eBook
Gamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Filterbank: Einblicke in die Filterbanktechniken von Computer Vision
eBook
Filterbank: Einblicke in die Filterbanktechniken von Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Homographie: Homographie: Transformationen in der Computer Vision
eBook
Homographie: Homographie: Transformationen in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farberscheinungsmodell: Wahrnehmung und Darstellung in Computer Vision verstehen
eBook
Farberscheinungsmodell: Wahrnehmung und Darstellung in Computer Vision verstehen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Gemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard
eBook
Gemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Visuelle Wahrnehmung: Einblicke in die computergestützte visuelle Verarbeitung
eBook
Visuelle Wahrnehmung: Einblicke in die computergestützte visuelle Verarbeitung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Bündelanpassung: Optimieren visueller Daten für eine präzise Rekonstruktion
eBook
Bündelanpassung: Optimieren visueller Daten für eine präzise Rekonstruktion
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen

Künstliche Intelligenz (KI) & Semantik für Sie

Karussell überspringen

Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI
eBook
Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI
vonFrankfurter Allgemeine Archiv
Bewertung: 0 von 5 Sternen
0 Bewertungen
ChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5
eBook
ChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5
vonRolf Jeger
Bewertung: 0 von 5 Sternen
0 Bewertungen
Aufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen
eBook
Aufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen
vonMartin Ford
Bewertung: 0 von 5 Sternen
0 Bewertungen
Menschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt
eBook
Menschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt
vonEdwin Hübner
Bewertung: 0 von 5 Sternen
0 Bewertungen
Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German
eBook
Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German
vonVasyl Kolomiiets
Bewertung: 0 von 5 Sternen
0 Bewertungen
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
eBook
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
vonChrista Stuber
Bewertung: 0 von 5 Sternen
0 Bewertungen
Künstliche Intelligenz: Die vierte industrielle Revolution
eBook
Künstliche Intelligenz: Die vierte industrielle Revolution
vonVasil Teigens
Bewertung: 0 von 5 Sternen
0 Bewertungen
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit
eBook
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit
vonSvetlana Badak
Bewertung: 0 von 5 Sternen
0 Bewertungen
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
eBook
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
vonShahin Amiriparian
Bewertung: 0 von 5 Sternen
0 Bewertungen
GPT-4: Ein umfassender Leitfaden mit Unterschieden zu GPT-3 und Anwendungsbeispielen: ChatGPT4, GPT-3 - eine kleine Zeitreise in die Vergangenheit und Zukunft
eBook
GPT-4: Ein umfassender Leitfaden mit Unterschieden zu GPT-3 und Anwendungsbeispielen: ChatGPT4, GPT-3 - eine kleine Zeitreise in die Vergangenheit und Zukunft
vonHenrik Roth
Bewertung: 0 von 5 Sternen
0 Bewertungen
Künstliche Intelligenz in Sozialen Medien
eBook
Künstliche Intelligenz in Sozialen Medien
vonIntroBooks Team
Bewertung: 0 von 5 Sternen
0 Bewertungen
Die KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen
eBook
Die KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen
vonJhon Dujardin
Bewertung: 1 von 5 Sternen
1/5
Chatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken
eBook
Chatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken
vonSvetlana Badak
Bewertung: 0 von 5 Sternen
0 Bewertungen
Wissen statt Glauben!: Das Weltbild des neuen Humanismus
eBook
Wissen statt Glauben!: Das Weltbild des neuen Humanismus
vonBernd Vowinkel
Bewertung: 0 von 5 Sternen
0 Bewertungen
ChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen
eBook
ChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen
vonHema
Bewertung: 0 von 5 Sternen
0 Bewertungen
KI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch
eBook
KI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch
vonJhon Dujardin
Bewertung: 0 von 5 Sternen
0 Bewertungen
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
eBook
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
vonSascha Berger
Bewertung: 0 von 5 Sternen
0 Bewertungen
Roboter im Alltag: Maschinen (beinahe) wie Menschen
eBook
Roboter im Alltag: Maschinen (beinahe) wie Menschen
vonAndreas Dripke
Bewertung: 0 von 5 Sternen
0 Bewertungen
Die destruktive Wirkung der Informationstechnologie auf die intellektuelle Entwicklung des Menschen: Eine technophilosophische Betrachtung
eBook
Die destruktive Wirkung der Informationstechnologie auf die intellektuelle Entwicklung des Menschen: Eine technophilosophische Betrachtung
vonTom Landon
Bewertung: 1 von 5 Sternen
1/5

Buchvorschau

Skalierungsinvariante Feature-Transformation - Fouad Sabry

Kapitel 1: Skaleninvariante Feature-Transformation

David Lowe entwickelte 1999 die skaleninvariante Merkmalstransformation (SIFT) als Computer-Vision-Algorithmus zum Auffinden, Charakterisieren und Abgleichen lokaler Merkmale in Bildern. Objekterkennung, robotergestützte Kartierung und Navigation, Bildzusammenfügen, dreidimensionale Modellierung, Gestenerkennung, Videoverfolgung, individuelle Wildtierbestimmung und Matchmaking sind nur einige der vielen Einsatzmöglichkeiten für diese Technologie.

Objekt-SIFT-Schlüsselpunkte werden zunächst aus einem Trainingssatz von Bildern extrahiert.

Es ist möglich, eine Merkmalsbeschreibung eines beliebigen Objekts in einem Bild zu erstellen, indem Schlüsselpunkte über dieses Objekt isoliert werden. Wenn Sie versuchen, ein Objekt in einem Testbild mit vielen anderen Objekten zu finden, kann diese Beschreibung verwendet werden, da sie aus einem Trainingsbild extrahiert wurde. Die aus dem Trainingsbild extrahierten Merkmale müssen trotz unterschiedlicher Bildskala, Rauschen und Beleuchtung erkennbar sein, wenn eine zuverlässige Erkennung erreicht werden soll. Diese Flecken befinden sich in der Regel an Bildrändern oder anderen Bereichen mit hohem Kontrast.

Darüber hinaus sollten diese Features von einem Bild zum nächsten die gleichen relativen Positionen beibehalten wie in der Originalszene. Wenn nur die vier Ecken einer Tür als Merkmale verwendet würden, würde die Erkennung gelingen, unabhängig davon, ob die Tür offen oder geschlossen ist. Wenn jedoch auch Punkte im Rahmen verwendet würden, würde die Erkennung in beiden Fällen fehlschlagen. Wenn sich die interne Geometrie eines artikulierten oder flexiblen Objekts zwischen zwei Bildern in dem zu verarbeitenden Satz ändert, funktionieren die in diesem Objekt befindlichen Features wahrscheinlich nicht mehr. Während diese lokalen Variationen einen erheblichen Einfluss auf den durchschnittlichen Fehler aller Merkmalsübereinstimmungsfehler haben können, erkennt und verwendet SIFT in der Praxis eine viel größere Anzahl von Merkmalen aus den Bildern, wodurch ihre Auswirkungen abgeschwächt werden.

Dieser Abschnitt bietet einen kurzen Überblick über den ursprünglichen SIFT-Algorithmus und erläutert kurz einige alternative Methoden zur Objekterkennung in Umgebungen mit vielen Hintergrundgeräuschen oder verdeckten Ansichten.

Der SIFT-Deskriptor verwendet rezeptive Feldmessungen, um Bilder zu analysieren.

Lokale Bildmerkmale können bei der Objekterkennung helfen, wenn sie erkannt und beschrieben werden können. Die SIFT-Features werden durch das Ändern der Größe oder Drehen des Bildes nicht beeinflusst, da sie auf dem Erscheinungsbild des Objekts an diskreten Interessenpunkten basieren. Sie halten geringfügigen Verschiebungen des Blickwinkels sowie Schwankungen in Beleuchtung und Rauschen stand. Sie ermöglichen auch eine genaue Objektidentifikation mit einer geringen Wahrscheinlichkeit einer Fehlanpassung, und sie sind hochgradig einzigartig und einfach zu extrahieren. Die hohe Dimensionalität kann jedoch ein Problem darstellen, so dass in der Regel probabilistische Algorithmen wie k-d-Bäume mit Best-Bin-First-Suche verwendet werden. Sie lassen sich leicht mit einer (großen) Datenbank lokaler Features abgleichen. Es werden nur drei SIFT-Merkmale von einem Objekt benötigt, um seine Position und Pose zu berechnen, wodurch Objektbeschreibungen, die auf Sätzen von SIFT-Merkmalen basieren, robust gegenüber teilweiser Okklusion sind. Bei relativ kleinen Datenbanken und mit der heutigen Rechenleistung kann die Erkennung fast sofort erfolgen.

Mit dem Lowe-Ansatz wird ein Bild in eine große Menge von Merkmalsvektoren umgewandelt, die robust gegenüber lokaler geometrischer Verzerrung sind, während sie immer noch invariant gegenüber Bildübersetzung, Skalierung und Drehung und, in geringerem Maße, Änderungen der Beleuchtung sind. Die Neuronen im primären visuellen Kortex, die die grundlegende Form, Farbe und Bewegung für die Objekterkennung beim Primatensehen kodieren, haben ähnliche Eigenschaften wie diese Merkmale. Maxima und Minimums der Differenz der Gauß-Funktion, die im Maßstabsraum auf eine Reihe von geglätteten und neu berechneten Bildern angewendet wird, werden verwendet, um Schlüsselpositionen zu definieren. Kandidaten- und Kantenreaktionspunkte mit geringem Kontrast entlang einer Kante werden eliminiert. Orientierungen erhalten ihre dominanten Orientierungen an bestimmten Knoten. Wenn Sie diese Verfahren befolgen, wird der Abgleich und die Erkennung genauer. Durch die Berücksichtigung von Pixeln innerhalb eines Radius um die Schlüsselposition, Unschärfe und Resampling lokaler Bildausrichtungsebenen können wir SIFT-Deskriptoren erhalten, die robust gegenüber lokaler affiner Verzerrung sind.

Bei der Indizierung speichern Sie SIFT-Schlüssel und verwenden das neue Image, um übereinstimmende Schlüssel zu finden. Um zu bestimmen, ob ein Kandidat behalten oder rausgeworfen werden sollte, verwendete Lowe eine Variante des k-d-Baum-Algorithmus, die als Best-Bin-First-Suchmethode bezeichnet wird. Bei dieser Methode wird der Abstand zwischen dem Merkmalsvektor des Kandidaten und dem Merkmalsvektor des nächstgelegenen Schlüsselpunkts verglichen, der nicht zur gleichen Objektklasse wie der vorliegende Kandidat gehört (Kandidatenmerkmalsvektor / nächstgelegener Merkmalsvektor anderer Klasse). Wenn das Verhältnis größer als 0,8 ist, wird es automatisch disqualifiziert. Durch den Einsatz dieser Technik konnten wir 90 % der Fehlalarme beseitigen und gleichzeitig 5 % der tatsächlichen Treffer verwerfen. Der Best-Bin-First-Suchalgorithmus wurde optimiert, indem er nach dem Testen der 200 nächsten Nachbarn gestoppt wurde. Diese Methode ist etwa zwei Größenordnungen schneller als die Suche nach dem exakten nächsten Nachbarn für eine Datenbank mit 100.000 Schlüsselpunkten, mit einem Verlust von weniger als 5 % bei der Anzahl der richtigen Übereinstimmungen.

Um Schlüssel zu finden, die einer bestimmten Modellpose entsprechen, wird die Hough-Transformation verwendet, um glaubwürdige Hypothesen über das Modell zu gruppieren. Dadurch, dass jedes Merkmal eine Stimme für alle Objektposen abgibt, die mit dem Merkmal konsistent sind, ist die Hough-Transformation in der Lage, Cluster von Merkmalen mit einer konsistenten Interpretation zu identifizieren. Es besteht eine viel höhere Wahrscheinlichkeit, dass die Interpretation korrekt ist, wenn mehrere Merkmale gefunden werden, die für die gleiche Pose eines Objekts stimmen. Basierend auf der Übereinstimmungshypothese wird ein Hashtabelleneintrag generiert, der die Position, Ausrichtung und Größe des Modells vorhersagt. Alle Cluster mit mindestens drei Einträgen in einem Abschnitt werden in der Hashtabelle nachgeschlagen, und die Abschnitte werden dann vom größten zum kleinsten sortiert.

Jeder SIFT-Schlüsselpunkt enthält Informationen über seine 2D-Position, -Größe und -Ausrichtung, und die Datenbank verfolgt diese Parameter für jeden Schlüsselpunkt, der eine übereinstimmende Instanz im Trainingssatz hat. Ein 3D-Objekt hat 6 Freiheitsgrade in seinem Posenraum, und die Ähnlichkeitstransformation, die durch diese 4 Parameter impliziert wird, berücksichtigt nur starre Transformationen. Dementsprechend wurden 30-Grad-Abschnitte für die Orientierung, 2x für die Skalierung und 0,25x für die Position (maximale projizierte Trainingsbilddimension unter Verwendung des vorhergesagten Maßstabs) verwendet. Den SIFT-Schlüsselproben, die im größeren Maßstab erzeugt werden, wird doppelt so viel Aufmerksamkeit geschenkt wie im kleineren Maßstab. Dies impliziert, dass die größere Skala die wahrscheinlichsten Nachbarn für weitere Untersuchungen auf der kleineren Skala auswählen kann. Dies ist hilfreich für die Erkennung, da es der Waage mit dem geringsten Rauschen mehr Gewicht verleiht. Jede Schlüsselpunktübereinstimmung grenzt die 16 möglichen Hypothesen auf die beiden nächstgelegenen Abschnitte in jeder Dimension ein, wodurch die Auswirkungen von Randeffekten bei der Abschnittszuweisung reduziert werden.

Die identifizierten Cluster werden einem Verifikationsprozess unterzogen, bei dem eine lineare Lösung der kleinsten Quadrate für die affinen Transformationsparameter berechnet wird, die das Modell mit dem

Gefällt Ihnen die Vorschau?

Seite 1 von 1

Skalierungsinvariante Feature-Transformation: Enthüllung der Leistungsfähigkeit der skaleninvarianten Merkmalstransformation in der Computer Vision

Über dieses E-Book

Fouad Sabry

Mehr von Fouad Sabry lesen

Ähnliche Autoren

Ähnlich wie Skalierungsinvariante Feature-Transformation

Titel in dieser Serie (100)

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Ähnliche Podcast-Episoden

Ähnliche Artikel

Verwandte Kategorien

Rezensionen für Skalierungsinvariante Feature-Transformation

Wie hat es Ihnen gefallen?

Buchvorschau

Skalierungsinvariante Feature-Transformation - Fouad Sabry

Kapitel 1: Skaleninvariante Feature-Transformation