Automatische Zielerkennung: Fortschritte in Computer-Vision-Techniken zur Zielerkennung
Von Fouad Sabry
()
Über dieses E-Book
Was ist automatische Zielerkennung?
Die Fähigkeit eines Algorithmus oder Geräts, Ziele oder andere Objekte auf der Grundlage der von Sensoren erfassten Daten zu erkennen, wird als automatische Zielerkennung bezeichnet Abkürzung für diese Fähigkeiten.
Wie Sie profitieren
(I) Einblicke und Validierungen zu den folgenden Themen:
Kapitel 1: Automatische Zielerkennung
Kapitel 2: Computer Vision
Kapitel 3: Radar
Kapitel 4: Doppler-Radar
Kapitel 5: Radar mit synthetischer Apertur
Kapitel 6: Bildgebendes Radar
Kapitel 7: Strahlformung
Kapitel 8: Pulse-Doppler-Radar
Kapitel 9 : Passives Radar
Kapitel 10: Inverses Radar mit synthetischer Apertur
(II) Beantwortung der häufigsten öffentlichen Fragen zur automatischen Zielerkennung.
(III) Reale Welt Beispiele für den Einsatz der automatischen Zielerkennung in vielen Bereichen.
Für wen sich dieses Buch eignet
Profis, Studenten und Doktoranden, Enthusiasten, Bastler und diejenigen, die über grundlegende Kenntnisse oder Informationen für jede Art von automatischer Zielerkennung hinausgehen möchten.
Mehr von Fouad Sabry lesen
Neue Technologien In Der Energie [German]
Ähnlich wie Automatische Zielerkennung
Titel in dieser Serie (100)
Multispektrale Bildgebung: Das Spektrum erschließen: Fortschritte in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden Bewertung: 0 von 5 Sternen0 BewertungenComputer Vision: Erkundung der Tiefen des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAffine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenComputer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildkompression: Effiziente Techniken zur visuellen Datenoptimierung Bewertung: 0 von 5 Sternen0 BewertungenLärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung Bewertung: 0 von 5 Sternen0 BewertungenTonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenInpainting: Überbrückung von Lücken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenUnterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen Bewertung: 0 von 5 Sternen0 BewertungenFarbraum: Erkundung des Spektrums von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenRetinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex Bewertung: 0 von 5 Sternen0 BewertungenHough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFilterbank: Einblicke in die Filterbanktechniken von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard Bewertung: 0 von 5 Sternen0 BewertungenHadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik Bewertung: 0 von 5 Sternen0 BewertungenRadon-Transformation: Aufdecken verborgener Muster in visuellen Daten Bewertung: 0 von 5 Sternen0 BewertungenHomographie: Homographie: Transformationen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAnisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion Bewertung: 0 von 5 Sternen0 BewertungenFarbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenHistogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenModell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen Bewertung: 0 von 5 Sternen0 BewertungenEpipolare Geometrie: Erschließung der Tiefenwahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarbmanagementsystem: Optimierung der visuellen Wahrnehmung in digitalen Umgebungen Bewertung: 0 von 5 Sternen0 BewertungenAdaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung Bewertung: 0 von 5 Sternen0 BewertungenDirekte lineare Transformation: Praktische Anwendungen und Techniken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGeometrisches Hashing: Effiziente Algorithmen zur Bilderkennung und -anpassung Bewertung: 0 von 5 Sternen0 BewertungenCanny Edge Detector: Enthüllung der Kunst der visuellen Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenKonturerkennung: Enthüllung der Kunst der visuellen Wahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 Bewertungen
Ähnliche E-Books
Synthese anzeigen: Erkundung von Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenVisuelles Sensornetzwerk: Erkundung der Leistungsfähigkeit visueller Sensornetzwerke in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAktives Erscheinungsmodell: Erschließung der Leistungsfähigkeit aktiver Darstellungsmodelle in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAutomatische Bildanmerkung: Verbesserung des visuellen Verständnisses durch automatisiertes Tagging Bewertung: 0 von 5 Sternen0 BewertungenObjekterkennung: Fortschritte, Anwendungen und Algorithmen Bewertung: 0 von 5 Sternen0 BewertungenComputer Vision: Erkundung der Tiefen des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenOptische Braille-Erkennung: Ermöglichung der Barrierefreiheit durch visuelle Intelligenz Bewertung: 0 von 5 Sternen0 BewertungenIntelligente Kamera: Revolutionierung der visuellen Wahrnehmung mit Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenMaschinelles Sehen: Einblicke in die Welt des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenPersonenzähler: Erschließung von Erkenntnissen durch visuelle Analysen Bewertung: 0 von 5 Sternen0 BewertungenBildabruf: Erschließen Sie die Kraft visueller Daten Bewertung: 0 von 5 Sternen0 BewertungenModell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen Bewertung: 0 von 5 Sternen0 BewertungenDigitale Rastergrafik: Enthüllung der Leistungsfähigkeit digitaler Rastergrafiken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGestenerkennung: Die Sprache der Bewegung erschließen Bewertung: 0 von 5 Sternen0 BewertungenRaytracing-Grafiken: Erforschung des fotorealistischen Renderings in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGesichtserkennungssystem: Erschließen Sie die Kraft der visuellen Intelligenz Bewertung: 0 von 5 Sternen0 BewertungenIntelligente Zeichenerkennung: Förderung der maschinellen Wahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenMultispektrale Bildgebung: Das Spektrum erschließen: Fortschritte in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenPhysikalisches Rechnen: Erforschung von Computer Vision im Physical Computing Bewertung: 0 von 5 Sternen0 BewertungenBildbasierte Sensoren: Kompendium Messtechnik und Sensorik, Teil 11 Bewertung: 5 von 5 Sternen5/5Rastergrafiken: Die Grundlagen der Rastergrafik in der Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenSoftware Defined Radio-Systeme für die Telemetrie: Aufbau und Funktionsweise von der Antenne bis zum Bit-Ausgang Bewertung: 0 von 5 Sternen0 BewertungenZufallsstichprobenkonsens: Robuste Schätzung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAphelion-Software: Vision freischalten: Erkundung der Tiefen der Aphelion-Software Bewertung: 0 von 5 Sternen0 BewertungenIris Erkennung: Erhellende Perspektiven zur Iriserkennung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBewegungsschätzung: Fortschritte und Anwendungen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenVektorgrafik-Editor: Ermöglichen Sie die visuelle Erstellung mit fortschrittlichen Algorithmen Bewertung: 0 von 5 Sternen0 BewertungenRastergrafik-Editor: Visuelle Realitäten transformieren: Rastergrafik-Editoren in Computer Vision beherrschen Bewertung: 0 von 5 Sternen0 BewertungenDatenkompression: Erhöhen Sie die Effizienz von Computer Vision durch Datenkomprimierung Bewertung: 0 von 5 Sternen0 Bewertungen
Künstliche Intelligenz (KI) & Semantik für Sie
Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German Bewertung: 0 von 5 Sternen0 BewertungenChatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken Bewertung: 0 von 5 Sternen0 BewertungenChatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit Bewertung: 0 von 5 Sternen0 BewertungenChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler Bewertung: 0 von 5 Sternen0 BewertungenRoboter im Alltag: Maschinen (beinahe) wie Menschen Bewertung: 0 von 5 Sternen0 BewertungenKI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch Bewertung: 0 von 5 Sternen0 BewertungenDie KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen Bewertung: 1 von 5 Sternen1/5Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5 Bewertung: 0 von 5 Sternen0 BewertungenWissen statt Glauben!: Das Weltbild des neuen Humanismus Bewertung: 0 von 5 Sternen0 BewertungenMenschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen Bewertung: 0 von 5 Sternen0 BewertungenPsychologie des Sozialismus Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz: Die vierte industrielle Revolution Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz in Sozialen Medien Bewertung: 0 von 5 Sternen0 BewertungenEinstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte Bewertung: 0 von 5 Sternen0 BewertungenDigitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit? Bewertung: 0 von 5 Sternen0 BewertungenAufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen Bewertung: 0 von 5 Sternen0 Bewertungen
Rezensionen für Automatische Zielerkennung
0 Bewertungen0 Rezensionen
Buchvorschau
Automatische Zielerkennung - Fouad Sabry
Kapitel 1: Automatische Zielerkennung
Der Begriff automatische Zielerkennung
(ATR) bezieht sich auf die Fähigkeit eines Algorithmus oder Geräts, ein Ziel oder ein anderes Objekt anhand von Sensordaten zu identifizieren.
In den Anfängen des Radars mussten sich die Bediener Audiodarstellungen der empfangenen Signale anhören und ihre Ausbildung nutzen, um festzustellen, welche Art von Ziel beleuchtet wurde. Trotz der Errungenschaften dieser menschlichen Experten wurden und werden automatisierte Methoden entwickelt, um die Genauigkeit und Geschwindigkeit der Klassifizierung zu verbessern. Tiere, Menschen und unübersichtliche Vegetation sind nur einige der biologischen Ziele, die mit der ATR-Technologie identifiziert werden können. Die Anwendungsbereiche reichen von der Objekterkennung im Feld bis hin zur Reduzierung von Vogelgeräuschen auf dem Doppler-Wetterradar.
Zu den möglichen militärischen Anwendungen gehören ein einfach zu implementierender Identifikator wie ein IFF-Transponder sowie komplexere Systeme wie UAVs und Marschflugkörper. Die Einsatzmöglichkeiten von ATR im heimischen Bereich rücken immer mehr in den Fokus. Eine Vielzahl von Anwendungen, von automatisierten Fahrzeugen über Sicherheitssysteme, die Objekte oder Personen auf einem U-Bahn-Gleis erkennen können, bis hin zur Grenzsicherung, haben von ATR-Studien profitiert.
Fast so lange, wie es Radar gibt, wurden Ziele erkannt. Radarbediener nutzten die akustische Darstellung des reflektierten Signals, um feindliche Bomber und Jäger zu identifizieren (siehe Radar im Zweiten Weltkrieg).
Lange Zeit hörten die Betreiber auf das Basisbandsignal, um Ziele zu identifizieren. Geschulte Radarbediener können dieses Signal verwenden, um die Art des Fahrzeugs zu bestimmen, mit dem das Ziel beleuchtet wird, die Größe des Ziels und möglicherweise sogar das Vorhandensein biologischer Ziele. Es gibt jedoch viele Einschränkungen für diese Methode. Es besteht eine hohe Fehlerwahrscheinlichkeit aufgrund der menschlichen Entscheidungskomponente, der Notwendigkeit, dass der Bediener darauf trainiert werden muss, wie jedes Ziel klingen wird, und der Möglichkeit, dass das Ziel nicht mehr hörbar ist, wenn es sich mit hoher Geschwindigkeit bewegt. Dieses Konzept der akustischen Repräsentation des Signals legte jedoch den Grundstein für die automatisierte Zielklassifizierung. Merkmale des Basisbandsignals, die in anderen Audioanwendungen verwendet wurden, wie z. B. die Spracherkennung, wurden in eine Reihe von Klassifizierungsschemata integriert, die entwickelt wurden.
Die Reichweite eines Objekts kann mit Hilfe von Radar berechnet werden, indem gemessen wird, wie lange es dauert, bis das Signal von dem Ziel zurückkehrt, das das Signal beleuchtet. Der Doppler-Effekt beschreibt die Veränderung der Frequenz, die durch die Bewegung eines solchen Objekts verursacht wird. Eine Frequenzverschiebung kann zusätzlich zur translatorischen Bewegung des gesamten Objekts durch Vibration oder Drehung eines Objekts verursacht werden. Das Doppler-verschobene Signal wird in diesem Fall moduliert. Der Mikro-Doppler-Effekt bezieht sich auf den zusätzlichen Doppler-Effekt, der für die Signalmodulation verantwortlich ist. Um Algorithmen für ATR zu erstellen, kann diese Modulation eine erkennbare Signatur haben. Wenn sich das Ziel bewegt, verursacht der Mikro-Doppler-Effekt ein zeit- und frequenzveränderliches Signal.
Da die Fourier-Transformation die Zeit nicht berücksichtigt, ist die Analyse dieses Signals mit einer Fourier-Transformation nicht ausreichend. Die Kurzzeit-Fourier-Transformation ist der einfachste Ansatz, um eine Frequenz-Zeit-Funktion (STFT) zu erhalten. Die Frequenz- und Zeitbereiche können gleichzeitig mit robusteren Methoden wie der Gabor-Transformation oder der Wigner-Verteilungsfunktion (WVD) dargestellt werden. Die Frequenzauflösung und die Zeitauflösung werden bei diesen Ansätzen jedoch immer beeinträchtigt.
Nachdem diese Spektraldaten extrahiert wurden, können sie mit einer Datenbank verglichen werden, die Informationen über die vom System identifizierten Ziele enthält, um zu bestimmen, was das beleuchtete Ziel tatsächlich ist. Um zu bestimmen, welches Ziel in der Bibliothek am besten zu dem Modell passt, das mit dem empfangenen Signal erstellt wurde, wird eine statistische Schätzmethode wie Maximum Likelihood (ML), Majority Voting (MV) oder Maximum a posteriori (MAP) verwendet.
Automatisierte Zielerkennungssysteme, die Audiofunktionen aus der Spracherkennung nutzen, um die Identität einer Zielperson zu bestimmen, sind Gegenstand der Forschung. Einige Beispiele für diese Koeffizienten sind:
LPC-Koeffizienten oder lineare prädiktive Codes
Koeffizienten der linearen Vorhersage und Kodierung im Cepstralspektrum
Kopfkoeffizienten basierend auf Mel-Frequenzen (MFCC).
Diese Koeffizienten werden aus einem verarbeiteten Basisbandsignal abgeleitet, und dann wird ein statistisches Verfahren verwendet, um zu bestimmen, welches Ziel in der Datenbank den abgeleiteten Koeffizienten am ähnlichsten ist. Das System und der Anwendungsfall müssen bei der Entscheidung, welche Funktionen und welches Entscheidungsschema implementiert werden sollen, berücksichtigt werden.
Zielklassifizierungsmerkmale sind nicht auf Koeffizienten beschränkt, die durch menschliche Sprache motiviert sind. ATR kann mit zahlreichen Feature-Sets und verschiedenen Detektionsmethoden erreicht werden.
Die Entwicklung einer Trainingsdatenbank ist notwendig, um die Zielerkennung zu automatisieren. In der Regel wird der ATR-Algorithmus mit experimentellen Daten gefüttert, die nach der Bestimmung des Ziels gesammelt wurden.
Das Flussdiagramm stellt eine Art von Erkennungsalgorithmus dar. Bei dieser Technik werden M Datenblöcke mit einem Gaußschen Mischungsmodell modelliert und dann die extrahierten Merkmale (z. B. LPC-Koeffizienten oder MFCC) verwendet, um Schlussfolgerungen zu ziehen (GMM). Nach dem Anpassen der Daten an ein Modell werden bedingte Wahrscheinlichkeiten für jedes Ziel im Trainingssatz berechnet. Hier haben wir M-Datenblöcke zu untersuchen. Dadurch werden M individuelle Wahrscheinlichkeiten generiert, eine für jedes Datenbankziel. Anhand dieser Wahrscheinlichkeiten wird eine Maximum-Likelihood-Bestimmung getroffen, was das Ziel tatsächlich ist. Es hat sich gezeigt, dass diese Technik die Anwesenheit von bis zu drei Personen zuverlässig bestimmen und zwischen Fahrzeugtypen (z. B. Rad- vs. Kettenfahrzeuge) unterscheiden kann.
Ein CNN-basierter Ansatz zur Zielerkennung
Die Zielerkennung mit einem Convolutional Neural Network (CNN) kann traditionellere Ansätze übertreffen. Nach dem Training mit synthetischen Bildern hat es sich als nützlich erwiesen, um Ziele (z. B. Kampfpanzer) in Infrarotbildern realer Szenen zu erkennen. Wie realistisch die synthetischen Bilder sind, ist aufgrund der Einschränkungen des Trainingssatzes von großer Bedeutung, wenn Sie versuchen, echte Szenen aus dem Testsatz zu erkennen.
Sieben Faltungsschichten, drei Max-Pooling-Schichten und eine Softmax-Schicht dienen als Rückgrat der gesamten CNN-Netzwerkarchitektur. Auf die zweite, vierte und fünfte Faltungsschicht folgen die maximalen Pooling-Schichten. Vor dem Endergebnis wird ein globaler Pooling-Durchschnitt angewendet. Leaky ReLU wird als nichtlineare Aktivierungsfunktion in allen Faltungsschichten verwendet.
{Ende Kapitel 1}
Kapitel 2: Maschinelles Sehen
Die Untersuchung, wie Computer aus digitalen Bildern oder Videos Wissen auf hohem Niveau ableiten können, steht im Mittelpunkt des multidisziplinären Wissenschaftsbereichs Computer Vision. Aus technologischer Sicht untersucht und versucht es, Aktivitäten zu automatisieren, die im Rahmen der Möglichkeiten des menschlichen visuellen Systems liegen.
Zu den Aufgaben im Zusammenhang mit Computer Vision gehören Techniken zum Erhalten, Verarbeiten, Analysieren und Verstehen digitaler Bilder sowie die Extraktion hochdimensionaler Daten aus der physischen Umgebung, um numerische oder symbolische Informationen, wie z. B. Urteile, zu erstellen.
Computer Vision ist ein Teilgebiet der Informatik, das die theoretischen Grundlagen künstlicher Systeme untersucht, die Informationen aus Bildern ableiten sollen. Die visuellen Daten können in einer Vielzahl von Formaten dargestellt werden, einschließlich Videosequenzen, Bildern, die von mehreren Kameras erhalten wurden, mehrdimensionalen Daten, die von einem 3D-Scanner oder medizinischen Scangeräten erhalten wurden, und so weiter. Das Ziel des technischen Bereichs Computer Vision ist es, die Ideen und Modelle, die es im Prozess des Aufbaus von Computer-Vision-Systemen entwickelt hat, umzusetzen.
Die Bereiche Szenenrekonstruktion, Objekterkennung, Ereigniserkennung, Videoverfolgung, Objekterkennung, 3D-Posenschätzung, Lernen, Indizierung, Bewegungsschätzung, visuelle Servoisierung, 3D-Szenenmodellierung und Bildwiederherstellung sind allesamt Teilbereiche des maschinellen Sehens. Zu den weiteren Teilbereichen des maschinellen Sehens gehört die 3D-Szenenmodellierung.
Computer Vision ist eine multidisziplinäre Studie, die untersucht, wie Computer programmiert werden können, um aus digitalen Bildern oder Filmen Wissen auf hohem Niveau zu extrahieren. In diesem Bereich geht es darum, wie Computern beigebracht werden kann, das zu verstehen, was ihnen gezeigt wird. Aus Sicht des Ingenieurwesens besteht das Ziel darin, Wege zu finden, um Vorgänge zu automatisieren, die bereits vom menschlichen visuellen System ausgeführt werden können. Computer Vision ist ein Studiengebiet im Bereich der Informationstechnologie, das sich auf die Anwendung bestehender Theorien und Modelle auf den Prozess des Aufbaus von Computer-Vision-Systemen konzentriert.
In den späten 1960er Jahren waren Colleges, die auf dem neuesten Stand der künstlichen Intelligenz waren, die ersten, die mit Computer Vision experimentierten. Sein Zweck war es, ähnlich wie das menschliche Sehsystem zu funktionieren, mit dem Ziel, Robotern intelligentes Verhalten zu verleihen. In den 1990er Jahren wurden einige der zuvor untersuchten Untersuchungsgebiete aktiver als die anderen. Das Studium projektiver dreidimensionaler Rekonstruktionen führte zu einem tieferen Verständnis der Kalibrierung einer Kamera. Mit der Einführung von Optimierungstechniken für die Kamerakalibrierung wurde deutlich, dass eine signifikante Anzahl der Konzepte zuvor von der Disziplin der Photogrammetrie mit der Bündelanpassungstheorie untersucht worden war. Dies kam als Folge dieser Entwicklung ans Licht. Dies führte zur Entwicklung von Techniken zur spärlichen dreidimensionalen Rekonstruktion von Szenen mit mehreren Fotografien. Sowohl das Problem der dichten Stereokorrespondenz als auch die Entwicklung weiterer Multi-View-Stereo-Ansätze zeigten ein gewisses Maß an Vorwärtsbewegung. Gleichzeitig wurden viele Varianten des Graphenschnitts verwendet, um das Problem der Bildsegmentierung zu lösen. Dieses Jahrzehnt war von besonderer Bedeutung, da es das erste Mal war, dass statistische Lernmethoden in der Praxis eingesetzt wurden, um Gesichter in Fotografien zu erkennen (siehe Eigenface). Die Bereiche Computergrafik und Computer Vision sind in den letzten Jahren enger miteinander verflochten, was zu einem starken Anstieg der Zusammenarbeit zwischen den beiden geführt hat. Dabei handelte es sich um frühe Formen des Lichtfeld-Renderings, des Zusammenfügens von Panoramabildern, des Bildmorphings, der Ansichtsinterpolation und des bildbasierten Renderings. Der Bereich Computer Vision hat durch die Entwicklung von Algorithmen, die auf Deep Learning basieren, neues Leben erhalten. Die Genauigkeit von Deep-Learning-Algorithmen auf zahlreichen Benchmark-Computer-Vision-Datensätzen für Aufgaben, die von der Klassifizierung bis zum optischen Fluss reichen, hat die früherer Ansätze übertroffen. Zu diesen Aufgaben gehören die Segmentierung von Bildern und der optische Fluss.
Solid-State Computer Vision ist eng mit einer Reihe anderer Disziplinen verbunden, darunter auch mit der Physik. Die überwiegende Mehrheit der Computer-Vision-Systeme basiert auf Bildsensoren, also Geräten, die in der Lage sind, elektromagnetische Strahlung zu erkennen. Diese Strahlung manifestiert sich in der Regel entweder als sichtbares oder infrarotes Licht. Bei der Entwicklung der Sensoren kam die Quantenphysik zum Einsatz. Die wissenschaftliche Disziplin der Physik liefert eine Erklärung für die Methode, mit der Licht mit Oberflächen wechselwirkt. Das Verhalten der Optik, die ein grundlegender Bestandteil der meisten bildgebenden Systeme ist, kann durch die Physik erklärt werden. Um ein umfassendes Wissen über den Entstehungsprozess eines Bildes bieten zu können, benötigen hochentwickelte Bildsensoren den Einsatz der Quantenmechanik. Computer Vision kann auch verwendet werden, um eine Vielzahl von Messproblemen zu lösen, die in der Physik auftreten, z. B. solche, die die Bewegung von Flüssigkeiten betreffen.
Die wissenschaftliche Disziplin der Neurobiologie, insbesondere die Erforschung des biologischen visuellen Systems. Die Augen, die Neuronen und die Gehirnregionen, die für die Verarbeitung visueller Reize sowohl beim Menschen als auch bei verschiedenen Tieren zuständig sind, waren im Laufe des letzten Jahrhunderts Gegenstand einer umfangreichen Forschung. Als Konsequenz daraus ist eine einfache, aber komplizierte Beschreibung der Funktionsweise tatsächlicher
Bildverarbeitungssysteme entstanden, um verschiedene bildverarbeitungsbezogene Aufgaben zu erfüllen. Als Konsequenz aus diesen Erkenntnissen hat sich ein Teilgebiet des maschinellen Sehens herausgebildet, in dem künstliche Systeme die Verarbeitung und das Verhalten biologischer Systeme mit unterschiedlicher biologischer Ähnlichkeit imitieren sollen. Viele der lernbasierten Ansätze, die im Bereich des maschinellen Sehens entwickelt wurden, haben ihre Wurzeln in der Biologie. Einige Beispiele für diese lernbasierten Methoden