Fußgängererkennung: Bitte schlagen Sie einen Untertitel für ein Buch mit dem Titel „Fußgängererkennung“ im Bereich „Computer Vision“ vor. Der vorgeschlagene Untertitel sollte kein „:“ enthalten.
Von Fouad Sabry
()
Über dieses E-Book
Was ist Fußgängererkennung?
In jedem intelligenten Videoüberwachungssystem ist die Identifizierung von Fußgängern eine ebenso entscheidende wie bedeutsame Aufgabe. Denn es liefert die grundlegenden Informationen, die für das semantische Verständnis der verfügbaren Videodaten notwendig sind. Angesichts der Tatsache, dass es Sicherheitssysteme verbessern kann, ist es offensichtlich, dass es in der Automobilindustrie Anwendung findet. Im Jahr 2017 bieten zahlreiche Automobilhersteller dies als Alternative zu ADAS an.
Wie Sie davon profitieren
(I) Einblicke und Validierungen darüber Folgende Themen:
Kapitel 1: Fußgängererkennung
Kapitel 2: Boosting (maschinelles Lernen)
Kapitel 3: Cleverer Kantendetektor
Kapitel 4: Bildsegmentierung
Kapitel 5: Skaleninvariante Feature-Transformation
Kapitel 6: Feature (Computer Vision)
Kapitel 7: Personenzähler
Kapitel 8: Struktur aus Bewegung
Kapitel 9: Takeo Kanade
Kapitel 10: Schätzung der artikulierten Körperhaltung
(II) Beantwortung der öffentlichen Frage Fragen zur Fußgängererkennung.
(III) Beispiele aus der Praxis für den Einsatz der Fußgängererkennung in vielen Bereichen.
Für wen dieses Buch gedacht ist
Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über grundlegende Kenntnisse oder Informationen für jede Art von Fußgängererkennung hinausgehen möchten.
Mehr von Fouad Sabry lesen
Neue Technologien In Der Energie [German]
Ähnlich wie Fußgängererkennung
Titel in dieser Serie (100)
Bildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden Bewertung: 0 von 5 Sternen0 BewertungenLärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung Bewertung: 0 von 5 Sternen0 BewertungenGamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik Bewertung: 0 von 5 Sternen0 BewertungenUnterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen Bewertung: 0 von 5 Sternen0 BewertungenModell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen Bewertung: 0 von 5 Sternen0 BewertungenFarbraum: Erkundung des Spektrums von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenRetinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex Bewertung: 0 von 5 Sternen0 BewertungenHomographie: Homographie: Transformationen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenInpainting: Überbrückung von Lücken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAnisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion Bewertung: 0 von 5 Sternen0 BewertungenComputer Vision: Erkundung der Tiefen des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAktive Kontur: Weiterentwicklung der Computer Vision mit aktiven Konturtechniken Bewertung: 0 von 5 Sternen0 BewertungenTonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenKonturerkennung: Enthüllung der Kunst der visuellen Wahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenVisuelle Wahrnehmung: Einblicke in die computergestützte visuelle Verarbeitung Bewertung: 0 von 5 Sternen0 BewertungenAdaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung Bewertung: 0 von 5 Sternen0 BewertungenGemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard Bewertung: 0 von 5 Sternen0 BewertungenHistogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenRadon-Transformation: Aufdecken verborgener Muster in visuellen Daten Bewertung: 0 von 5 Sternen0 BewertungenAffine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenCanny Edge Detector: Enthüllung der Kunst der visuellen Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenComputer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFilterbank: Einblicke in die Filterbanktechniken von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarberscheinungsmodell: Wahrnehmung und Darstellung in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenHough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenHadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarbmodell: Das Spektrum des Computer Vision verstehen: Farbmodelle erkunden Bewertung: 0 von 5 Sternen0 BewertungenZufallsstichprobenkonsens: Robuste Schätzung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGeometrisches Hashing: Effiziente Algorithmen zur Bilderkennung und -anpassung Bewertung: 0 von 5 Sternen0 Bewertungen
Ähnliche E-Books
Objekterkennung: Fortschritte, Anwendungen und Algorithmen Bewertung: 0 von 5 Sternen0 BewertungenKontextuelle Bildklassifizierung: Visuelle Daten für eine effektive Klassifizierung verstehen Bewertung: 0 von 5 Sternen0 BewertungenInhaltsbasierter Bildabruf: Visuelle Datenbanken freischalten Bewertung: 0 von 5 Sternen0 BewertungenTüte mit Wörtern Modell: Erschließen Sie visuelle Intelligenz mit tüte mit wörtern Bewertung: 0 von 5 Sternen0 BewertungenSkalierungsinvariante Feature-Transformation: Enthüllung der Leistungsfähigkeit der skaleninvarianten Merkmalstransformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenSynthese anzeigen: Erkundung von Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAutomatische Zielerkennung: Fortschritte in Computer-Vision-Techniken zur Zielerkennung Bewertung: 0 von 5 Sternen0 BewertungenComputer Vision: Erkundung der Tiefen des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenApache Mahout: Empfehlen, clustern, klassifizieren Bewertung: 0 von 5 Sternen0 BewertungenLernen geometrischer Merkmale: Visuelle Einblicke durch das Lernen geometrischer Merkmale erschließen Bewertung: 0 von 5 Sternen0 BewertungenOptische Braille-Erkennung: Ermöglichung der Barrierefreiheit durch visuelle Intelligenz Bewertung: 0 von 5 Sternen0 BewertungenAutomatische Bildanmerkung: Verbesserung des visuellen Verständnisses durch automatisiertes Tagging Bewertung: 0 von 5 Sternen0 BewertungenAktives Erscheinungsmodell: Erschließung der Leistungsfähigkeit aktiver Darstellungsmodelle in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAphelion-Software: Vision freischalten: Erkundung der Tiefen der Aphelion-Software Bewertung: 0 von 5 Sternen0 BewertungenPyramiden Bildverarbeitung: Erkundung der Tiefen der visuellen Analyse Bewertung: 0 von 5 Sternen0 BewertungenEinführung in Machine Learning mit Python: Praxiswissen Data Science Bewertung: 0 von 5 Sternen0 BewertungenVisuelles Sensornetzwerk: Erkundung der Leistungsfähigkeit visueller Sensornetzwerke in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenMerkmalskonstruktion für Machine Learning: Prinzipien und Techniken der Datenaufbereitung Bewertung: 0 von 5 Sternen0 BewertungenMLOps – Kernkonzepte im Überblick: Machine-Learning-Prozesse im Unternehmen nachhaltig automatisieren und skalieren Bewertung: 0 von 5 Sternen0 BewertungenGesichtserkennungssystem: Erschließen Sie die Kraft der visuellen Intelligenz Bewertung: 0 von 5 Sternen0 BewertungenDreidimensionale Computergrafik: Erkundung der Schnittstelle zwischen Vision und virtuellen Welten Bewertung: 0 von 5 Sternen0 BewertungenBewegungsschätzung: Fortschritte und Anwendungen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenMaschinelles Sehen: Einblicke in die Welt des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenDreidimensionale Multi-View-Rekonstruktion: Fortgeschrittene Techniken zur räumlichen Wahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildabruf: Erschließen Sie die Kraft visueller Daten Bewertung: 0 von 5 Sternen0 BewertungenjQuery Mobile: Unit Testing Bewertung: 0 von 5 Sternen0 BewertungenGANs mit PyTorch selbst programmieren: Ein verständlicher Einstieg in Generative Adversarial Networks Bewertung: 0 von 5 Sternen0 BewertungenUmgekehrte Bildsuche: Entdecken Sie die Geheimnisse der visuellen Erkennung Bewertung: 0 von 5 Sternen0 BewertungenErweiterte Realität: Erkundung der Grenzen von Computer Vision in Augmented Reality Bewertung: 0 von 5 Sternen0 Bewertungen
Künstliche Intelligenz (KI) & Semantik für Sie
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5 Bewertung: 0 von 5 Sternen0 BewertungenChatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken Bewertung: 0 von 5 Sternen0 BewertungenPsychologie des Sozialismus Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen Bewertung: 0 von 5 Sternen0 BewertungenKI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch Bewertung: 0 von 5 Sternen0 BewertungenDie KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen Bewertung: 1 von 5 Sternen1/5Roboter im Alltag: Maschinen (beinahe) wie Menschen Bewertung: 0 von 5 Sternen0 BewertungenChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler Bewertung: 0 von 5 Sternen0 BewertungenMeistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German Bewertung: 0 von 5 Sternen0 BewertungenDie Zukunft der Arbeit: Digitalisierung, Automatisierung, KI Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz: Die vierte industrielle Revolution Bewertung: 0 von 5 Sternen0 BewertungenMenschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt Bewertung: 0 von 5 Sternen0 BewertungenWissen statt Glauben!: Das Weltbild des neuen Humanismus Bewertung: 0 von 5 Sternen0 BewertungenEinstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte Bewertung: 0 von 5 Sternen0 BewertungenAufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen Bewertung: 0 von 5 Sternen0 BewertungenDigitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit? Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz in Sozialen Medien Bewertung: 0 von 5 Sternen0 Bewertungen
Rezensionen für Fußgängererkennung
0 Bewertungen0 Rezensionen
Buchvorschau
Fußgängererkennung - Fouad Sabry
Kapitel 1: Fußgängererkennung
Die Erkennung von Fußgängern ist eine wichtige und kritische Aufgabe für jedes intelligente Videoüberwachungssystem, da sie die wesentlichen Daten für die semantische Interpretation des Videomaterials liefert. Aufgrund des Potenzials zur Verbesserung von Sicherheitssystemen hat es einen offensichtlichen Einsatz im Automobilsektor. Im Jahr 2017 bieten viele Autohersteller (darunter Volvo, Ford, GM und Nissan) diese ADAS-Option an.
Vielfältige Kleidungsstile im Erscheinungsbild
Unterschiedliche Artikulationsmöglichkeiten
Das Vorhandensein von hinderlichem Zubehör.
Häufige Kollisionen zwischen Fußgängern
Trotz der Schwierigkeiten ist die Fußgängererkennung in den letzten Jahren ein herausragendes Feld der Computer-Vision-Forschung geblieben. Es wurden mehrere Strategien angeboten.
Die Detektoren sind so programmiert, dass sie das gesamte Videobild auf der Suche nach Fußgängern abtasten.
Der Melder würde feuern
, wenn die Bildmerkmale innerhalb des lokalen Suchfensters bestimmte Kriterien erfüllen.
Einige Lösungen verwenden globale Merkmale wie die Edge-Vorlage und Deskriptoren.
Der Nachteil dieser Strategie besteht darin, dass Hintergrundunordnung und Okklusionen die Leistung leicht beeinträchtigen können.
Fußgänger werden als Assemblagen von Bauteilen modelliert. Anfängliche Teilhypothesen werden durch das Erlernen lokaler Merkmale, wie z. B. Kanten, erstellt.
Im Jahr 2005 stellten Leibe et al. das Implicit Shape Model vor, eine Methode, die Detektion und Segmentierung (ISM) kombiniert. Während des Trainings wird ein Codebuch des regionalen Auftretens erlernt. Bei der Erkennung werden extrahierte lokale Merkmale mit den Codebucheinträgen verglichen, und jede Übereinstimmung zählt als eine Stimme für die Fußgängerhypothesen. Durch die weitere Verfeinerung dieser Ideen kann man schlüssige Nachweisergebnisse erzielen. Diese Methode hat den Vorteil, dass nur eine begrenzte Anzahl von Trainingsfotos erforderlich ist.
Wenn die Bedingungen es zulassen (feste Kamera, konstante Beleuchtung usw.), kann die Hintergrundentfernung bei der Erkennung von Fußgängern helfen. Bei der Hintergrundsubtraktion werden die Pixel von Videostreams als Hintergrund oder Vordergrund klassifiziert, je nachdem, ob eine Bewegung erkannt wird. Diese Technik betont die Silhouetten (die verbundenen Vordergrundelemente) aller sich bewegenden Elemente im Bild, einschließlich der Personen. Ein Protokoll wurde erstellt, Fleuret et al. schlugen eine Technik zur Integration zahlreicher kalibrierter Kameras zur Erkennung mehrerer Fußgänger vor. Bei dieser Methode wird die Grundebene in gleichmäßige, nicht überlappende Gitterzellen unterteilt, die in der Regel 25 x 25 Pixel (cm) groß sind. Der Detektor generiert eine Probability Occupancy Map (POM), die die Wahrscheinlichkeit schätzt, dass jede Rasterzelle von einem Menschen besetzt ist. Bei zwei bis vier synchronisierten Videoströmen, die auf Augenhöhe und aus verschiedenen Blickwinkeln aufgenommen werden, kann diese Methode effizient ein generatives Modell mit dynamischer Programmierung kombinieren, um bis zu sechs Personen über Tausende von Bildern hinweg trotz erheblicher Okklusionen und Beleuchtungsschwankungen korrekt zu verfolgen. Darüber hinaus kann es für jeden von ihnen metrisch präzise Trajektorien generieren.
Histogramm der Gradientenorientierung
Integrierte Kanalfunktion
{Ende Kapitel 1}
Kapitel 2: Boosting (maschinelles Lernen)
Boosting ist ein Meta-Algorithmus, der in den Ensembles des maschinellen Lernens verwendet wird, um Verzerrungen und Variationen zu reduzieren. Er fragte: Kann eine Gruppe schlechter Lernender ein hervorragendes hervorbringen?
Ein schwacher Lerner ist ein Klassifikator mit einem geringen Grad an Übereinstimmung mit der richtigen Bezeichnung (er kann Beispiele besser kennzeichnen als zufälliges Raten). Ein starker Lerner hingegen ist ein Klassifikator, der eine Korrelation mit der Wahrheit hat, die willkürlich hoch ist.
In einer Veröffentlichung aus dem Jahr 1990 bejahte Robert Schapire diese Frage.
Obwohl es keine algorithmischen Einschränkungen für das Boosting gibt, beinhalten die meisten Boosting-Techniken die inkrementelle Stärkung eines schwachen Klassifikators, indem mehr schwache Klassifikatoren für eine bestimmte Verteilung gelernt werden. Die Addition erfolgt mit einer Gewichtung, die die Leistung der leistungsschwachen Schülerinnen und Schüler berücksichtigt. Der Prozess der Neugewichtung von Daten erfolgt, wenn ein neuer schwacher Lerner zu einem Datensatz hinzugefügt wird. Eingabedaten, die falsch klassifiziert sind, werden stärker gewichtet, während korrekt klassifizierte Instanzen weniger gewichtet werden. Das bedeutet, dass schwache Schüler in Zukunft stärker auf die Proben achten werden, die ihre Vorgänger falsch beschriftet haben.
Es existieren zahlreiche Algorithmen zur Augmentation.
Die ersten Versionen, die von Robert Schapire vorgeschlagen wurden (eine rekursive Mehrheitsgattungsformel), waren nicht adaptiv und nutzten das Potenzial der schwachen Studierenden nicht aus.
AdaBoost wurde von Schapire und Freund entwickelt, ein adaptiver Boosting-Algorithmus, der mit dem renommierten Gödel-Preis ausgezeichnet wurde.
Der Begriff Boosting-Algorithmus
sollte nur verwendet werden, um sich auf diejenigen Algorithmen zu beziehen, die sich in der wahrscheinlich annähernd korrekten Lernformulierung als Boosting-Algorithmen erweisen können. Der Begriff Hebelalgorithmus
wird gelegentlich verwendet, um sich auf Algorithmen zu beziehen, die konzeptionell Boosting-Algorithmen ähneln. Der Begriff Boosting-Algorithmus
wird jedoch auch falsch verwendet. Dies zeigt, dass beim Boosten eine konvexe Kostenfunktion verwendet wird, um den Gradientenabstieg in einem Funktionsraum durchzuführen.
Ein Klassifikator kann mit Fotos von realen Objekten trainiert werden, um neue Fotos automatisch zu identifizieren und zu beschriften. Eine schlechte Kategorisierungsleistung tritt in der Regel bei einfachen Klassifikatoren auf, die aus einem einzelnen Objektbild-Feature entwickelt wurden. Um die Kategorisierungsfähigkeit insgesamt zu verbessern, können Boosting-Methoden verwendet werden, um die schwachen Klassifikatoren auf eine bestimmte Weise zu vereinen.
Die Objektkategorisierung ist ein häufiges Problem des maschinellen Sehens, bei dem überprüft werden muss, ob ein Bild eine bestimmte Klasse von Objekten enthält. Das Konzept bezieht sich auf das Erkennen von etwas oder jemandem oder das Erkennen von etwas. Das Extrahieren von Merkmalen, das Erlernen eines Klassifikators und das Anwenden des Klassifikators auf neue Instanzen sind gängige Schritte bei der darstellungsbasierten Elementkategorisierung. Formanalysen, Bag-of-Words-Modelle und lokale Deskriptoren wie SIFT sind nur einige Beispiele dafür, wie eine Klasse von Objekten dargestellt werden kann. Naive Bayes-Klassifikatoren, Support Vector Machines, Gaußsche Mischungsmodelle und neuronale Netze sind alle Arten von überwachten Klassifikatoren. Unüberwachte Methoden haben sich auch als effektiv erwiesen, wenn es darum geht, Objektkategorien und ihre Positionen auf Fotos zu entdecken.
Wenn die Anzahl der zu erkennenden Elementtypen riesig ist, wird die Bildkategorisierung zu einer schwierigen Herausforderung im Bereich Computer Vision. Dies liegt daran, dass eine Verallgemeinerung über Variationen von Elementen innerhalb derselben Kategorie hinweg erforderlich ist und dass die Variabilität innerhalb der Klasse erheblich ist. Zusammengefasste Objekte können in ihrem Aussehen sehr unterschiedlich sein. Das Gleiche kann je nach Perspektive, Maßstab und Beleuchtung sehr unterschiedlich aussehen. Erkennungsprobleme (die bereits durch Faktoren wie Hintergrundunordnung und partielle Okklusion verschärft werden) wurden gelöst. Das Bewerben und Teilen von Funktionen ist eine Methode.
Als Anwendung der binären Kategorisierung kann AdaBoost für die Gesichtserkennung verwendet werden. Es gibt zwei verschiedene Typen: solche mit Gesichtern und solche ohne. Das übergeordnete Vorgehen sieht folgendermaßen aus:
Erstellen Sie eine Fülle von einfachen Elementen
Festlegen der Gewichte für das anfängliche Trainingsbild
Für T-Runden
Normalisieren der Gewichtungen
Trainieren Sie einen Klassifikator mit einem einzelnen Feature aus dem Satz, und bewerten Sie dann den Trainingsfehler.
Wählen Sie