Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Fußgängererkennung: Bitte schlagen Sie einen Untertitel für ein Buch mit dem Titel „Fußgängererkennung“ im Bereich „Computer Vision“ vor. Der vorgeschlagene Untertitel sollte kein „:“ enthalten.
Fußgängererkennung: Bitte schlagen Sie einen Untertitel für ein Buch mit dem Titel „Fußgängererkennung“ im Bereich „Computer Vision“ vor. Der vorgeschlagene Untertitel sollte kein „:“ enthalten.
Fußgängererkennung: Bitte schlagen Sie einen Untertitel für ein Buch mit dem Titel „Fußgängererkennung“ im Bereich „Computer Vision“ vor. Der vorgeschlagene Untertitel sollte kein „:“ enthalten.
eBook127 Seiten1 Stunde

Fußgängererkennung: Bitte schlagen Sie einen Untertitel für ein Buch mit dem Titel „Fußgängererkennung“ im Bereich „Computer Vision“ vor. Der vorgeschlagene Untertitel sollte kein „:“ enthalten.

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist Fußgängererkennung?


In jedem intelligenten Videoüberwachungssystem ist die Identifizierung von Fußgängern eine ebenso entscheidende wie bedeutsame Aufgabe. Denn es liefert die grundlegenden Informationen, die für das semantische Verständnis der verfügbaren Videodaten notwendig sind. Angesichts der Tatsache, dass es Sicherheitssysteme verbessern kann, ist es offensichtlich, dass es in der Automobilindustrie Anwendung findet. Im Jahr 2017 bieten zahlreiche Automobilhersteller dies als Alternative zu ADAS an.


Wie Sie davon profitieren


(I) Einblicke und Validierungen darüber Folgende Themen:


Kapitel 1: Fußgängererkennung


Kapitel 2: Boosting (maschinelles Lernen)


Kapitel 3: Cleverer Kantendetektor


Kapitel 4: Bildsegmentierung


Kapitel 5: Skaleninvariante Feature-Transformation


Kapitel 6: Feature (Computer Vision)


Kapitel 7: Personenzähler


Kapitel 8: Struktur aus Bewegung


Kapitel 9: Takeo Kanade


Kapitel 10: Schätzung der artikulierten Körperhaltung


(II) Beantwortung der öffentlichen Frage Fragen zur Fußgängererkennung.


(III) Beispiele aus der Praxis für den Einsatz der Fußgängererkennung in vielen Bereichen.


Für wen dieses Buch gedacht ist


Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über grundlegende Kenntnisse oder Informationen für jede Art von Fußgängererkennung hinausgehen möchten.


 


 

SpracheDeutsch
Erscheinungsdatum4. Mai 2024
Fußgängererkennung: Bitte schlagen Sie einen Untertitel für ein Buch mit dem Titel „Fußgängererkennung“ im Bereich „Computer Vision“ vor. Der vorgeschlagene Untertitel sollte kein „:“ enthalten.

Mehr von Fouad Sabry lesen

Ähnlich wie Fußgängererkennung

Titel in dieser Serie (100)

Mehr anzeigen

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Fußgängererkennung

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Fußgängererkennung - Fouad Sabry

    Kapitel 1: Fußgängererkennung

    Die Erkennung von Fußgängern ist eine wichtige und kritische Aufgabe für jedes intelligente Videoüberwachungssystem, da sie die wesentlichen Daten für die semantische Interpretation des Videomaterials liefert. Aufgrund des Potenzials zur Verbesserung von Sicherheitssystemen hat es einen offensichtlichen Einsatz im Automobilsektor. Im Jahr 2017 bieten viele Autohersteller (darunter Volvo, Ford, GM und Nissan) diese ADAS-Option an.

    Vielfältige Kleidungsstile im Erscheinungsbild

    Unterschiedliche Artikulationsmöglichkeiten

    Das Vorhandensein von hinderlichem Zubehör.

    Häufige Kollisionen zwischen Fußgängern

    Trotz der Schwierigkeiten ist die Fußgängererkennung in den letzten Jahren ein herausragendes Feld der Computer-Vision-Forschung geblieben. Es wurden mehrere Strategien angeboten.

    Die Detektoren sind so programmiert, dass sie das gesamte Videobild auf der Suche nach Fußgängern abtasten.

    Der Melder würde feuern, wenn die Bildmerkmale innerhalb des lokalen Suchfensters bestimmte Kriterien erfüllen.

    Einige Lösungen verwenden globale Merkmale wie die Edge-Vorlage und Deskriptoren.

    Der Nachteil dieser Strategie besteht darin, dass Hintergrundunordnung und Okklusionen die Leistung leicht beeinträchtigen können.

    Fußgänger werden als Assemblagen von Bauteilen modelliert. Anfängliche Teilhypothesen werden durch das Erlernen lokaler Merkmale, wie z. B. Kanten, erstellt.

    Im Jahr 2005 stellten Leibe et al. das Implicit Shape Model vor, eine Methode, die Detektion und Segmentierung (ISM) kombiniert. Während des Trainings wird ein Codebuch des regionalen Auftretens erlernt. Bei der Erkennung werden extrahierte lokale Merkmale mit den Codebucheinträgen verglichen, und jede Übereinstimmung zählt als eine Stimme für die Fußgängerhypothesen. Durch die weitere Verfeinerung dieser Ideen kann man schlüssige Nachweisergebnisse erzielen. Diese Methode hat den Vorteil, dass nur eine begrenzte Anzahl von Trainingsfotos erforderlich ist.

    Wenn die Bedingungen es zulassen (feste Kamera, konstante Beleuchtung usw.), kann die Hintergrundentfernung bei der Erkennung von Fußgängern helfen. Bei der Hintergrundsubtraktion werden die Pixel von Videostreams als Hintergrund oder Vordergrund klassifiziert, je nachdem, ob eine Bewegung erkannt wird. Diese Technik betont die Silhouetten (die verbundenen Vordergrundelemente) aller sich bewegenden Elemente im Bild, einschließlich der Personen. Ein Protokoll wurde erstellt, Fleuret et al. schlugen eine Technik zur Integration zahlreicher kalibrierter Kameras zur Erkennung mehrerer Fußgänger vor. Bei dieser Methode wird die Grundebene in gleichmäßige, nicht überlappende Gitterzellen unterteilt, die in der Regel 25 x 25 Pixel (cm) groß sind. Der Detektor generiert eine Probability Occupancy Map (POM), die die Wahrscheinlichkeit schätzt, dass jede Rasterzelle von einem Menschen besetzt ist. Bei zwei bis vier synchronisierten Videoströmen, die auf Augenhöhe und aus verschiedenen Blickwinkeln aufgenommen werden, kann diese Methode effizient ein generatives Modell mit dynamischer Programmierung kombinieren, um bis zu sechs Personen über Tausende von Bildern hinweg trotz erheblicher Okklusionen und Beleuchtungsschwankungen korrekt zu verfolgen. Darüber hinaus kann es für jeden von ihnen metrisch präzise Trajektorien generieren.

    Histogramm der Gradientenorientierung

    Integrierte Kanalfunktion

    {Ende Kapitel 1}

    Kapitel 2: Boosting (maschinelles Lernen)

    Boosting ist ein Meta-Algorithmus, der in den Ensembles des maschinellen Lernens verwendet wird, um Verzerrungen und Variationen zu reduzieren. Er fragte: Kann eine Gruppe schlechter Lernender ein hervorragendes hervorbringen? Ein schwacher Lerner ist ein Klassifikator mit einem geringen Grad an Übereinstimmung mit der richtigen Bezeichnung (er kann Beispiele besser kennzeichnen als zufälliges Raten). Ein starker Lerner hingegen ist ein Klassifikator, der eine Korrelation mit der Wahrheit hat, die willkürlich hoch ist.

    In einer Veröffentlichung aus dem Jahr 1990 bejahte Robert Schapire diese Frage.

    Obwohl es keine algorithmischen Einschränkungen für das Boosting gibt, beinhalten die meisten Boosting-Techniken die inkrementelle Stärkung eines schwachen Klassifikators, indem mehr schwache Klassifikatoren für eine bestimmte Verteilung gelernt werden. Die Addition erfolgt mit einer Gewichtung, die die Leistung der leistungsschwachen Schülerinnen und Schüler berücksichtigt. Der Prozess der Neugewichtung von Daten erfolgt, wenn ein neuer schwacher Lerner zu einem Datensatz hinzugefügt wird. Eingabedaten, die falsch klassifiziert sind, werden stärker gewichtet, während korrekt klassifizierte Instanzen weniger gewichtet werden. Das bedeutet, dass schwache Schüler in Zukunft stärker auf die Proben achten werden, die ihre Vorgänger falsch beschriftet haben.

    Es existieren zahlreiche Algorithmen zur Augmentation.

    Die ersten Versionen, die von Robert Schapire vorgeschlagen wurden (eine rekursive Mehrheitsgattungsformel), waren nicht adaptiv und nutzten das Potenzial der schwachen Studierenden nicht aus.

    AdaBoost wurde von Schapire und Freund entwickelt, ein adaptiver Boosting-Algorithmus, der mit dem renommierten Gödel-Preis ausgezeichnet wurde.

    Der Begriff Boosting-Algorithmus sollte nur verwendet werden, um sich auf diejenigen Algorithmen zu beziehen, die sich in der wahrscheinlich annähernd korrekten Lernformulierung als Boosting-Algorithmen erweisen können. Der Begriff Hebelalgorithmus wird gelegentlich verwendet, um sich auf Algorithmen zu beziehen, die konzeptionell Boosting-Algorithmen ähneln. Der Begriff Boosting-Algorithmus wird jedoch auch falsch verwendet. Dies zeigt, dass beim Boosten eine konvexe Kostenfunktion verwendet wird, um den Gradientenabstieg in einem Funktionsraum durchzuführen.

    Ein Klassifikator kann mit Fotos von realen Objekten trainiert werden, um neue Fotos automatisch zu identifizieren und zu beschriften. Eine schlechte Kategorisierungsleistung tritt in der Regel bei einfachen Klassifikatoren auf, die aus einem einzelnen Objektbild-Feature entwickelt wurden. Um die Kategorisierungsfähigkeit insgesamt zu verbessern, können Boosting-Methoden verwendet werden, um die schwachen Klassifikatoren auf eine bestimmte Weise zu vereinen.

    Die Objektkategorisierung ist ein häufiges Problem des maschinellen Sehens, bei dem überprüft werden muss, ob ein Bild eine bestimmte Klasse von Objekten enthält. Das Konzept bezieht sich auf das Erkennen von etwas oder jemandem oder das Erkennen von etwas. Das Extrahieren von Merkmalen, das Erlernen eines Klassifikators und das Anwenden des Klassifikators auf neue Instanzen sind gängige Schritte bei der darstellungsbasierten Elementkategorisierung. Formanalysen, Bag-of-Words-Modelle und lokale Deskriptoren wie SIFT sind nur einige Beispiele dafür, wie eine Klasse von Objekten dargestellt werden kann. Naive Bayes-Klassifikatoren, Support Vector Machines, Gaußsche Mischungsmodelle und neuronale Netze sind alle Arten von überwachten Klassifikatoren. Unüberwachte Methoden haben sich auch als effektiv erwiesen, wenn es darum geht, Objektkategorien und ihre Positionen auf Fotos zu entdecken.

    Wenn die Anzahl der zu erkennenden Elementtypen riesig ist, wird die Bildkategorisierung zu einer schwierigen Herausforderung im Bereich Computer Vision. Dies liegt daran, dass eine Verallgemeinerung über Variationen von Elementen innerhalb derselben Kategorie hinweg erforderlich ist und dass die Variabilität innerhalb der Klasse erheblich ist. Zusammengefasste Objekte können in ihrem Aussehen sehr unterschiedlich sein. Das Gleiche kann je nach Perspektive, Maßstab und Beleuchtung sehr unterschiedlich aussehen. Erkennungsprobleme (die bereits durch Faktoren wie Hintergrundunordnung und partielle Okklusion verschärft werden) wurden gelöst. Das Bewerben und Teilen von Funktionen ist eine Methode.

    Als Anwendung der binären Kategorisierung kann AdaBoost für die Gesichtserkennung verwendet werden. Es gibt zwei verschiedene Typen: solche mit Gesichtern und solche ohne. Das übergeordnete Vorgehen sieht folgendermaßen aus:

    Erstellen Sie eine Fülle von einfachen Elementen

    Festlegen der Gewichte für das anfängliche Trainingsbild

    Für T-Runden

    Normalisieren der Gewichtungen

    Trainieren Sie einen Klassifikator mit einem einzelnen Feature aus dem Satz, und bewerten Sie dann den Trainingsfehler.

    Wählen Sie

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1