Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Orientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung
Orientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung
Orientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung
eBook118 Seiten1 Stunde

Orientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist ein Histogramm orientierter Gradienten?


In den Bereichen Computer Vision und Bildverarbeitung ist das Histogramm orientierter Gradienten (HOG) ein Merkmalsdeskriptor, der für diesen Zweck verwendet wird der Objekterkennung. Diese Technik wird verwendet, um die Anzahl der Instanzen der Gradientenausrichtung zu zählen, die in bestimmten Bereichen eines Bildes auftreten. Diese Technik ist vergleichbar mit Kantenorientierungs-Histogrammen, skaleninvarianten Merkmalstransformationsdeskriptoren und Formkontexten; Sie unterscheidet sich jedoch von diesen Methoden dadurch, dass sie auf einem dichten Gitter aus gleichmäßig verteilten Zellen berechnet wird und eine überlappende lokale Kontrastnormalisierung verwendet, um ein höheres Maß an Genauigkeit zu erreichen.


Wie Sie wollen Nutzen


(I) Erkenntnisse und Validierungen zu den folgenden Themen:


Kapitel 1: Histogramm orientierter Verläufe


Kapitel 2: Kantenerkennung


Kapitel 3: Skaleninvariante Feature-Transformation


Kapitel 4: Beschleunigte robuste Features


Kapitel 5: GLOH


Kapitel 6: Lokale binäre Muster


Kapitel 7: SCHNELL ausgerichtet und KURZ gedreht


Kapitel 8: Boosting (maschinelles Lernen)


Kapitel 9: Bildsegmentierung


Kapitel 10: Objekterkennung


(II) Beantwortung der häufigsten öffentlichen Fragen zum Histogramm mit orientierten Farbverläufen.


(III) Beispiele aus der Praxis für die Verwendung des Histogramms mit orientierten Farbverläufen in vielen Bereichen .


Für wen sich dieses Buch eignet


Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über das Grundwissen oder die Informationen hinausgehen möchten jede Art von Histogramm mit orientierten Farbverläufen.


 


 

SpracheDeutsch
Erscheinungsdatum30. Apr. 2024
Orientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung

Mehr von Fouad Sabry lesen

Ähnlich wie Orientiertes Gradienten-Histogramm

Titel in dieser Serie (100)

Mehr anzeigen

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Orientiertes Gradienten-Histogramm

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Orientiertes Gradienten-Histogramm - Fouad Sabry

    Kapitel 1: Histogramm der orientierten Gradienten

    In der maschinellen Bildverarbeitung und Bildverarbeitung ist das Histogramm orientierter Gradienten (HOG) ein Merkmalsdeskriptor, der für die Objekterkennung verwendet wird. Diese Methode verwendet die Richtung von Farbverläufen in diskreten Bereichen eines Bildes, um deren Vorkommen zu zählen. Im Vergleich zu Kantenorientierungshistogrammen, skaleninvarianten Merkmalstransformationsdeskriptoren und Formkontexten ist dieses Verfahren genauer, da es auf einem dichten Gitter mit gleichmäßig verteilten Zellen berechnet wird und eine überlappende lokale Kontrastnormalisierung verwendet.

    Die Ideen von HOG wurden erstmals 1986 von Robert K. McConnell von Wayland Research Inc. ohne den Spitznamen HOG skizziert. Es dauerte jedoch bis 2005, als die Forscher Navneet Dalal und Bill Triggs vom französischen Nationalen Institut für Forschung in Informatik und Automatisierung (INRIA) ihre zusätzlichen Arbeiten zu HOG-Deskriptoren auf der Conference on Computer Vision and Pattern Recognition vorstellten, dass diese weithin angenommen wurden (CVPR). Sie konzentrierten sich zunächst auf die Fußgängererkennung in Standbildern, haben ihre Tests aber später auf die Personenerkennung in Videos sowie auf die Erkennung einer Vielzahl von gewöhnlichen Tieren und Fahrzeugen in Standbildern ausgeweitet.

    Das Histogramm der gerichteten Farbverläufe basiert auf der Idee, dass das Aussehen und die Form von Objekten auf lokaler Ebene innerhalb eines Bildes durch die Verteilung von Intensitätsgradienten oder Kantenrichtungen dargestellt werden können. Für jedes Pixel im Bild wird ein Histogramm mit Verlaufsrichtungen erstellt, indem es in kleine zusammenhängende Abschnitte unterteilt wird, die als Zellen bezeichnet werden. Die Kombination dieser Histogramme zu einer einzigen Metrik dient als Beschreibung. Die lokalen Histogramme können kontrastnormalisiert werden, um die Genauigkeit zu erhöhen, indem zuerst ein Intensitätsmaß für einen größeren Teil des Bildes (einen Block) berechnet und dann dieser Wert verwendet wird, um alle Zellen innerhalb des Blocks zu normalisieren. Das Ergebnis dieser Standardisierung ist eine erhöhte Beständigkeit gegen helle und dunkle Flecken.

    Mehrere wesentliche Vorteile heben die HOG-Beschreibung von ihren Mitbewerbern ab. Da es sich nur auf Zellen in der Nähe auswirkt, bleibt es bei Änderungen des Maßstabs oder der Beleuchtung unverändert, mit Ausnahme der Drehung. Nur in größeren geografischen Gebieten würden wir diese Art von Verschiebungen sehen. Darüber hinaus fanden Dalal und Triggs heraus, dass, solange Fußgänger ihren Körper in einer annähernd aufrechten Position halten, ihre Bewegung dank grober räumlicher Abtastung, feiner Orientierungsabtastung und starker lokaler photometrischer Normalisierung ignoriert werden kann. Aus diesem Grund zeichnet sich der HOG-Deskriptor dadurch aus, dass er Personen in Bildern findet.

    Bei vielen Merkmalsdetektoren ist die Normalisierung von Farb- und Gammawerten der erste Schritt der Berechnung in der Bildvorverarbeitung. Bei der Berechnung von HOG-Deskriptoren argumentieren Dalal und Triggs jedoch, dass dieser Schritt unnötig ist, da die anschließende Deskriptornormalisierung das gleiche Ziel erreicht. Daher hat die Vorverarbeitung von Bildern einen vernachlässigbaren Einfluss auf die Leistung. Stattdessen steht die Berechnung der Gradientenwerte an erster Stelle. Das Anwenden der 1-dimensional zentrierten, punktdiskreten Ableitungsmaske in horizontaler oder vertikaler Richtung ist die typischste Methode. Damit diese Technik funktioniert, müssen die Farb- oder Intensitätsdaten des Bildes mit den folgenden Kernels gefiltert werden:

    {\displaystyle [-1,0,1]{\text{ and }}[-1,0,1]^{\top }.\,}

    Während Dalal und Triggs ausgeklügeltere Masken wie die 3x3-Sobel-Maske und diagonale Masken verwendeten, stellten sie fest, dass sie bei der Identifizierung von Personen auf Fotos weniger effektiv waren. Sie versuchten auch, vor dem Auftragen der abgeleiteten Maske einen Gaußschen Glätter zu verwenden, stellten aber fest, dass überhaupt keine Glättung tatsächlich zu besseren Ergebnissen führte.

    Die Zellhistogramme werden als zweite Stufe des Prozesses generiert.

    Jedes Pixel in der Zelle verwendet die Farbverlaufswerte, um eine gewichtete Stimme für einen Abschnitt im Histogramm abzugeben, der auf der Ausrichtung basiert.

    Die Zellen selbst können eine quadratische oder kreisförmige Konfiguration annehmen, und die Kanäle des Histogramms erstrecken sich über einen einheitlichen Zeitraum von 0 bis 180 oder 0 bis 360 Grad, je nachdem, ob der Farbverlauf vorzeichenlos oder vorzeichenbehaftet ist.

    Die besten Ergebnisse in Human-Detection-Versuchen von Dalal und Triggs wurden erzielt, wenn vorzeichenlose Gradienten mit 9 Histogrammkanälen kombiniert wurden, wobei darauf hingewiesen wurde, dass vorzeichenbehaftete Gradienten die Objekterkennung für andere Kategorien auf die gleiche Weise wie für Autos und Motorräder erheblich verbessern.

    In Bezug auf die Wichtigkeit jeder Abstimmung können Pixel entweder die Größe des Farbverlaufs oder eine Skala oder Funktion der Größe beitragen.

    In Tests werden die besten Ergebnisse in der Regel erzielt, wenn man sich nur auf die Gradientengröße konzentriert.

    Die Quadratwurzel oder das Quadrat der Größe des Farbverlaufs sind zwei weitere mögliche Maße für das Stimmengewicht oder ein abgeschnittenes Maß desselben.

    Die Gradientenstärken müssen lokal normalisiert werden, um Variationen in Beleuchtung und Kontrast zu berücksichtigen, was eine Clusterung der Zellen in größere, geografisch verbundene Blöcke erfordert. Schließlich ist der HOG-Deskriptor die Vektorsumme der Komponenten der normalisierten Zellhistogramme für jeden Block. Jede Zelle trägt aufgrund der Überlappung dieser Blöcke oft auf mehr als eine Weise zur endgültigen Beschreibung bei. Die gebräuchlichsten Formen für Blöcke sind quadratisch oder rechteckig für R-HOG-Blöcke und kreisförmig für C-HOG-Blöcke. R-HOG-Blöcke sind in der Regel quadratische Raster, bei denen die Zellenanzahl, die Pixelanzahl und die Anzahl der Histogrammkanäle die definierenden Merkmale sind. Vier 8x8 Pixelzellen pro Block (16x16 Pixel Block) mit 9 Histogrammkanälen erwiesen sich in dem von Dalal und Triggs durchgeführten Experiment mit menschlicher Detektion als am besten. Darüber hinaus entdeckten sie, dass die Leistung leicht verbessert werden kann, wenn ein Gaußscher räumlicher Rahmen innerhalb jedes Blocks verwendet wird, bevor Histogramm-Stimmen gezählt werden, um den Pixeln in der Nähe der Blockkanten weniger Gewicht zu verleihen. Obwohl die R-HOG-Blöcke und die SIFT-Deskriptoren (Scale-Invariant Feature Transform) auf den ersten Blick ähnlich aussehen mögen, sind sie unterschiedlich geformt. SIFT-Deskriptoren werden in der Regel an spärlichen, skaleninvarianten Schlüsselbildpunkten berechnet und gedreht, um die Ausrichtung auszurichten, während R-HOG-Blöcke in dichten Rastern auf einer einzigen Skala ohne Orientierungsausrichtung berechnet werden. Darüber hinaus werden die R-HOG-Blöcke im Gegensatz zu SIFT-Deskriptoren, die allein verwendet werden, zusammen verwendet, um räumliche Forminformationen darzustellen.

    Es gibt zwei verschiedene Arten von kreisförmigen HOG-Blöcken (C-HOG): solche mit einer einzigen zentralen Zelle und solche mit eckig geteilten Zellen. Die vier Faktoren, die diese C-HOG-Blöcke charakterisieren, sind die Anzahl der eckigen und radialen Behälter, der Radius des mittleren

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1