Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Objekterkennung: Fortschritte, Anwendungen und Algorithmen
Objekterkennung: Fortschritte, Anwendungen und Algorithmen
Objekterkennung: Fortschritte, Anwendungen und Algorithmen
eBook149 Seiten1 Stunde

Objekterkennung: Fortschritte, Anwendungen und Algorithmen

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist Objekterkennung


Der als Objekterkennung bekannte Bereich der Computertechnologie ist eng mit Computer Vision und Bildverarbeitung verbunden. Sein Hauptziel besteht darin, Instanzen semantischer Objekte zu identifizieren, die zu einer bestimmten Klasse in digitalen Bildern und Videos gehören. Im Bereich der Objekterkennung sind Gesichtserkennung und Fußgängererkennung zwei Bereiche, denen große Aufmerksamkeit gewidmet wurde. Die Objekterkennung ist in einer Vielzahl von Computer-Vision-Anwendungen nützlich, darunter unter anderem Bildabruf und Videoüberwachung.


Wie Sie profitieren


(I ) Erkenntnisse und Validierungen zu den folgenden Themen:


Kapitel 1: Objekterkennung


Kapitel 2: Computer Vision


Kapitel 3: Bildsegmentierung


Kapitel 4: Vorlagenabgleich


Kapitel 5: Optische Blindenschrifterkennung


Kapitel 6: Deep Learning


Kapitel 7: Faltungs-Neuronales Netzwerk


Kapitel 8: DeepDream


Kapitel 9: Salienzkarte


Kapitel 10: Erkennung kleiner Objekte


(II) Beantwortung der häufigsten öffentlichen Fragen zur Objekterkennung .


(III) Beispiele aus der Praxis für den Einsatz der Objekterkennung in vielen Bereichen.


Für wen dieses Buch gedacht ist


Fachleute, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über grundlegende Kenntnisse oder Informationen für jede Art von Objekterkennung hinausgehen möchten.


 


 

SpracheDeutsch
Erscheinungsdatum4. Mai 2024
Objekterkennung: Fortschritte, Anwendungen und Algorithmen

Mehr von Fouad Sabry lesen

Ähnlich wie Objekterkennung

Titel in dieser Serie (100)

Mehr anzeigen

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Objekterkennung

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Objekterkennung - Fouad Sabry

    Kapitel 1: Objekterkennung

    Die Objekterkennung ist ein Teilgebiet des maschinellen Sehens und der Bildverarbeitung, das darauf abzielt, erkennbare Subjekte in digitalen Bildern und Videos anhand ihrer Eigenschaften zu identifizieren. Gesichtserkennung und Personenzählung sind zwei Beispiele für gut untersuchte Teilbereiche der Objekterkennung. Die Anwendungen der Objekterkennung in der maschinellen Bildverarbeitung reichen von der Bildgewinnung bis hin zur Überwachung.

    Zu den gängigen Anwendungen im Bereich des maschinellen Sehens gehören die Kommentierung von Bildern, die Erkennung von Gesichtern, die Erkennung von Gesichtern und die Kosegmentierung von Objekten in Videos. Es wird auch verwendet, um Dinge wie den Ball in einem Fußballspiel, den Cricketschläger in einem Cricketspiel oder eine Person in einem Videospiel zu verfolgen.

    Die Aufgabe der Objekterkennung wird in der Regel dadurch erschwert, dass die Testbilder aus einer anderen Datenverteilung entnommen werden. Da die Beschriftungen kein menschliches Eingreifen erfordern, wird die domänenübergreifende Objekterkennung in vielen verschiedenen Kontexten eingesetzt, einschließlich des autonomen Fahrens.

    Klassen von Objekten können durch gemeinsame Merkmale voneinander unterschieden werden. Zum Beispiel haben alle Kreise die Eigenschaft, kugelförmig zu sein. Eindeutige Merkmale werden verwendet, um die Klasse eines Objekts zu bestimmen. Bei Kreisen suchen wir zum Beispiel nach Objekten, die einen bestimmten Radius von einem bestimmten Punkt entfernt sind. Die gleiche Logik gilt für die Suche nach Quadraten, die Objekte mit senkrechten Ecken und gleich langen Seiten erfordert. Gesichtsmerkmale wie Augen, Nase und Lippen sowie nicht-anatomische Merkmale wie Hautfarbe und Augenabstand werden in ähnlicher Weise zur Gesichtserkennung verwendet.

    Objekterkennungsmethoden können entweder als neuronale Netze oder nicht-neuronal klassifiziert werden. Um Daten zu klassifizieren, ohne auf neuronale Netze zurückzugreifen, ist es notwendig, zunächst Merkmale mit einem der folgenden Ansätze zu definieren. Neuronale Techniken, die in der Regel auf Convolutional Neural Networks basieren, können jedoch eine End-to-End-Objekterkennung durchführen, ohne dass die Definition von Merkmalen (CNN) erforderlich ist.

    Der Einsatz nicht-neuronaler Methoden:

    Objekterkennung unter Verwendung des Viola-Jones-Frameworks mit Haar-Funktionen

    Transformieren für skalierungsinvariante Features (SIFT)

    Eigenschaften des Orientalierten Gradientenhistogramms (HOG)

    Methoden auf Basis neuronaler Netze:

    Vorschläge nach Regionen (R-CNN,)

    Ein individueller Multi-Box-Detektor (SSD)

    Wenn du es siehst, weißt du es (YOLO)

    Ein neuronales Netz mit einmaliger Feinabstimmung zur Identifizierung von Objekten (RefineDet)

    Retina-Netz

    Deformierbare Faltungsnetzwerke

    {Ende Kapitel 1}

    Kapitel 2: Maschinelles Sehen

    Die Untersuchung, wie Computer aus digitalen Bildern oder Videos Wissen auf hohem Niveau ableiten können, steht im Mittelpunkt des multidisziplinären Wissenschaftsbereichs Computer Vision. Aus technologischer Sicht untersucht und versucht es, Aktivitäten zu automatisieren, die im Rahmen der Möglichkeiten des menschlichen visuellen Systems liegen.

    Zu den Aufgaben im Zusammenhang mit Computer Vision gehören Techniken zum Erhalten, Verarbeiten, Analysieren und Verstehen digitaler Bilder sowie die Extraktion hochdimensionaler Daten aus der physischen Umgebung, um numerische oder symbolische Informationen, wie z. B. Urteile, zu erstellen.

    Computer Vision ist ein Teilgebiet der Informatik, das die theoretischen Grundlagen künstlicher Systeme untersucht, die Informationen aus Bildern ableiten sollen. Die visuellen Daten können in einer Vielzahl von Formaten dargestellt werden, einschließlich Videosequenzen, Bildern, die von mehreren Kameras erhalten wurden, mehrdimensionalen Daten, die von einem 3D-Scanner oder medizinischen Scangeräten erhalten wurden, und so weiter. Das Ziel des technischen Bereichs Computer Vision ist es, die Ideen und Modelle, die es im Prozess des Aufbaus von Computer-Vision-Systemen entwickelt hat, umzusetzen.

    Die Bereiche Szenenrekonstruktion, Objekterkennung, Ereigniserkennung, Videoverfolgung, Objekterkennung, 3D-Posenschätzung, Lernen, Indizierung, Bewegungsschätzung, visuelle Servoisierung, 3D-Szenenmodellierung und Bildwiederherstellung sind allesamt Teilbereiche des maschinellen Sehens. Zu den weiteren Teilbereichen des maschinellen Sehens gehört die 3D-Szenenmodellierung.

    Computer Vision ist eine multidisziplinäre Studie, die untersucht, wie Computer programmiert werden können, um aus digitalen Bildern oder Filmen Wissen auf hohem Niveau zu extrahieren. In diesem Bereich geht es darum, wie Computern beigebracht werden kann, das zu verstehen, was ihnen gezeigt wird. Aus Sicht des Ingenieurwesens besteht das Ziel darin, Wege zu finden, um Vorgänge zu automatisieren, die bereits vom menschlichen visuellen System ausgeführt werden können. Computer Vision ist ein Studiengebiet im Bereich der Informationstechnologie, das sich auf die Anwendung bestehender Theorien und Modelle auf den Prozess des Aufbaus von Computer-Vision-Systemen konzentriert.

    In den späten 1960er Jahren waren Colleges, die auf dem neuesten Stand der künstlichen Intelligenz waren, die ersten, die mit Computer Vision experimentierten. Sein Zweck war es, ähnlich wie das menschliche Sehsystem zu funktionieren, mit dem Ziel, Robotern intelligentes Verhalten zu verleihen. In den 1990er Jahren wurden einige der zuvor untersuchten Untersuchungsgebiete aktiver als die anderen. Das Studium projektiver dreidimensionaler Rekonstruktionen führte zu einem tieferen Verständnis der Kalibrierung einer Kamera. Mit der Einführung von Optimierungstechniken für die Kamerakalibrierung wurde deutlich, dass eine signifikante Anzahl der Konzepte zuvor von der Disziplin der Photogrammetrie mit der Bündelanpassungstheorie untersucht worden war. Dies kam als Folge dieser Entwicklung ans Licht. Dies führte zur Entwicklung von Techniken zur spärlichen dreidimensionalen Rekonstruktion von Szenen mit mehreren Fotografien. Sowohl das Problem der dichten Stereokorrespondenz als auch die Entwicklung weiterer Multi-View-Stereo-Ansätze zeigten ein gewisses Maß an Vorwärtsbewegung. Gleichzeitig wurden viele Varianten des Graphenschnitts verwendet, um das Problem der Bildsegmentierung zu lösen. Dieses Jahrzehnt war von besonderer Bedeutung, da es das erste Mal war, dass statistische Lernmethoden in der Praxis eingesetzt wurden, um Gesichter in Fotografien zu erkennen (siehe Eigenface). Die Bereiche Computergrafik und Computer Vision sind in den letzten Jahren enger miteinander verflochten, was zu einem starken Anstieg der Zusammenarbeit zwischen den beiden geführt hat. Dabei handelte es sich um frühe Formen des Lichtfeld-Renderings, des Zusammenfügens von Panoramabildern, des Bildmorphings, der Ansichtsinterpolation und des bildbasierten Renderings. Der Bereich Computer Vision hat durch die Entwicklung von Algorithmen, die auf Deep Learning basieren, neues Leben erhalten. Die Genauigkeit von Deep-Learning-Algorithmen auf zahlreichen Benchmark-Computer-Vision-Datensätzen für Aufgaben, die von der Klassifizierung bis zum optischen Fluss reichen, hat die früherer Ansätze übertroffen. Zu diesen Aufgaben gehören die Segmentierung von Bildern und der optische Fluss.

    Solid-State Computer Vision ist eng mit einer Reihe anderer Disziplinen verbunden, darunter auch mit der Physik. Die überwiegende Mehrheit der Computer-Vision-Systeme basiert auf Bildsensoren, also Geräten, die in der Lage sind, elektromagnetische Strahlung zu erkennen. Diese Strahlung manifestiert sich in der Regel entweder als sichtbares oder infrarotes Licht. Bei der Entwicklung der Sensoren kam die Quantenphysik zum Einsatz. Die wissenschaftliche Disziplin der Physik liefert eine Erklärung für die Methode, mit der Licht mit Oberflächen wechselwirkt. Das Verhalten der Optik, die ein grundlegender Bestandteil der meisten bildgebenden Systeme ist, kann durch die Physik erklärt werden. Um ein umfassendes Wissen über den Entstehungsprozess eines Bildes bieten zu können, benötigen hochentwickelte Bildsensoren den Einsatz der Quantenmechanik. Computer Vision kann auch verwendet werden, um eine Vielzahl von Messproblemen zu lösen, die in der Physik auftreten, z. B. solche, die die Bewegung von Flüssigkeiten betreffen.

    Die wissenschaftliche Disziplin der Neurobiologie, insbesondere die Erforschung des biologischen visuellen Systems. Die Augen, die Neuronen und die Gehirnregionen, die für die Verarbeitung visueller Reize sowohl beim Menschen als auch bei verschiedenen Tieren zuständig sind, waren im Laufe des letzten Jahrhunderts Gegenstand einer umfangreichen Forschung. Als Konsequenz daraus ist eine einfache, aber komplizierte Beschreibung der Funktionsweise tatsächlicher Bildverarbeitungssysteme entstanden, um verschiedene bildverarbeitungsbezogene Aufgaben zu erfüllen. Als Konsequenz aus diesen Erkenntnissen hat sich ein Teilgebiet des maschinellen Sehens herausgebildet, in dem künstliche Systeme die Verarbeitung und das Verhalten biologischer Systeme mit unterschiedlicher biologischer Ähnlichkeit imitieren sollen. Viele der lernbasierten Ansätze, die im Bereich des maschinellen Sehens entwickelt wurden, haben ihre Wurzeln in der Biologie. Einige Beispiele für diese lernbasierten Methoden sind neuronale Netze und Deep-Learning-basierte Bild- und Merkmalsanalyse und -kategorisierung.

    Einige Zweige der Computer-Vision-Forschung sind dem Studium des biologischen Sehens sehr ähnlich. Viele Zweige der KI-Forschung sind auch der Erforschung des menschlichen Bewusstseins und der Anwendung von zuvor erworbenem Wissen zur Interpretation, Integration und Nutzung von visuellem Input sehr ähnlich. Die Untersuchung und Modellierung der physiologischen Mechanismen, die der visuellen Wahrnehmung bei Menschen und anderen Tieren zugrunde liegen, ist das Fachgebiet der akademischen Disziplin des biologischen Sehens. Auf der anderen Seite ist Computer Vision die Untersuchung und Beschreibung der Prozesse, die in Software und Hardware implementiert sind, die künstlichen Bildverarbeitungssystemen zugrunde liegen. Die interdisziplinäre Zusammenarbeit zwischen den Wissenschaften des biologischen Sehens und des maschinellen Sehens hat sich für beide Bereiche als vorteilhaft erwiesen.

    Signalverarbeitung ist ein weiteres Forschungsgebiet, das mit Computer Vision verbunden ist. In der Computer Vision kann die Verarbeitung von Signalen mit zwei Variablen oder Signalen mit mehreren Variablen auf natürliche Weise von der Verarbeitung von Signalen mit einer Variablen, oft zeitlichen Signalen, erweitert werden. Dies ermöglicht ein höheres Maß an Flexibilität bei der Signalanalyse. Aufgrund der einzigartigen Eigenschaften von Bildern hat das Feld des

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1