Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Automatische Zielerkennung: Fortschritte in Computer-Vision-Techniken zur Zielerkennung
Automatische Zielerkennung: Fortschritte in Computer-Vision-Techniken zur Zielerkennung
Automatische Zielerkennung: Fortschritte in Computer-Vision-Techniken zur Zielerkennung
eBook192 Seiten2 Stunden

Automatische Zielerkennung: Fortschritte in Computer-Vision-Techniken zur Zielerkennung

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist automatische Zielerkennung?


Die Fähigkeit eines Algorithmus oder Geräts, Ziele oder andere Objekte auf der Grundlage der von Sensoren erfassten Daten zu erkennen, wird als automatische Zielerkennung bezeichnet Abkürzung für diese Fähigkeiten.


Wie Sie profitieren


(I) Einblicke und Validierungen zu den folgenden Themen:


Kapitel 1: Automatische Zielerkennung


Kapitel 2: Computer Vision


Kapitel 3: Radar


Kapitel 4: Doppler-Radar


Kapitel 5: Radar mit synthetischer Apertur


Kapitel 6: Bildgebendes Radar


Kapitel 7: Strahlformung


Kapitel 8: Pulse-Doppler-Radar


Kapitel 9 : Passives Radar


Kapitel 10: Inverses Radar mit synthetischer Apertur


(II) Beantwortung der häufigsten öffentlichen Fragen zur automatischen Zielerkennung.


(III) Reale Welt Beispiele für den Einsatz der automatischen Zielerkennung in vielen Bereichen.


Für wen sich dieses Buch eignet


Profis, Studenten und Doktoranden, Enthusiasten, Bastler und diejenigen, die über grundlegende Kenntnisse oder Informationen für jede Art von automatischer Zielerkennung hinausgehen möchten.


 


 

SpracheDeutsch
Erscheinungsdatum4. Mai 2024
Automatische Zielerkennung: Fortschritte in Computer-Vision-Techniken zur Zielerkennung

Mehr von Fouad Sabry lesen

Ähnlich wie Automatische Zielerkennung

Titel in dieser Serie (100)

Mehr anzeigen

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Automatische Zielerkennung

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Automatische Zielerkennung - Fouad Sabry

    Kapitel 1: Automatische Zielerkennung

    Der Begriff automatische Zielerkennung (ATR) bezieht sich auf die Fähigkeit eines Algorithmus oder Geräts, ein Ziel oder ein anderes Objekt anhand von Sensordaten zu identifizieren.

    In den Anfängen des Radars mussten sich die Bediener Audiodarstellungen der empfangenen Signale anhören und ihre Ausbildung nutzen, um festzustellen, welche Art von Ziel beleuchtet wurde. Trotz der Errungenschaften dieser menschlichen Experten wurden und werden automatisierte Methoden entwickelt, um die Genauigkeit und Geschwindigkeit der Klassifizierung zu verbessern. Tiere, Menschen und unübersichtliche Vegetation sind nur einige der biologischen Ziele, die mit der ATR-Technologie identifiziert werden können. Die Anwendungsbereiche reichen von der Objekterkennung im Feld bis hin zur Reduzierung von Vogelgeräuschen auf dem Doppler-Wetterradar.

    Zu den möglichen militärischen Anwendungen gehören ein einfach zu implementierender Identifikator wie ein IFF-Transponder sowie komplexere Systeme wie UAVs und Marschflugkörper. Die Einsatzmöglichkeiten von ATR im heimischen Bereich rücken immer mehr in den Fokus. Eine Vielzahl von Anwendungen, von automatisierten Fahrzeugen über Sicherheitssysteme, die Objekte oder Personen auf einem U-Bahn-Gleis erkennen können, bis hin zur Grenzsicherung, haben von ATR-Studien profitiert.

    Fast so lange, wie es Radar gibt, wurden Ziele erkannt. Radarbediener nutzten die akustische Darstellung des reflektierten Signals, um feindliche Bomber und Jäger zu identifizieren (siehe Radar im Zweiten Weltkrieg).

    Lange Zeit hörten die Betreiber auf das Basisbandsignal, um Ziele zu identifizieren. Geschulte Radarbediener können dieses Signal verwenden, um die Art des Fahrzeugs zu bestimmen, mit dem das Ziel beleuchtet wird, die Größe des Ziels und möglicherweise sogar das Vorhandensein biologischer Ziele. Es gibt jedoch viele Einschränkungen für diese Methode. Es besteht eine hohe Fehlerwahrscheinlichkeit aufgrund der menschlichen Entscheidungskomponente, der Notwendigkeit, dass der Bediener darauf trainiert werden muss, wie jedes Ziel klingen wird, und der Möglichkeit, dass das Ziel nicht mehr hörbar ist, wenn es sich mit hoher Geschwindigkeit bewegt. Dieses Konzept der akustischen Repräsentation des Signals legte jedoch den Grundstein für die automatisierte Zielklassifizierung. Merkmale des Basisbandsignals, die in anderen Audioanwendungen verwendet wurden, wie z. B. die Spracherkennung, wurden in eine Reihe von Klassifizierungsschemata integriert, die entwickelt wurden.

    Die Reichweite eines Objekts kann mit Hilfe von Radar berechnet werden, indem gemessen wird, wie lange es dauert, bis das Signal von dem Ziel zurückkehrt, das das Signal beleuchtet. Der Doppler-Effekt beschreibt die Veränderung der Frequenz, die durch die Bewegung eines solchen Objekts verursacht wird. Eine Frequenzverschiebung kann zusätzlich zur translatorischen Bewegung des gesamten Objekts durch Vibration oder Drehung eines Objekts verursacht werden. Das Doppler-verschobene Signal wird in diesem Fall moduliert. Der Mikro-Doppler-Effekt bezieht sich auf den zusätzlichen Doppler-Effekt, der für die Signalmodulation verantwortlich ist. Um Algorithmen für ATR zu erstellen, kann diese Modulation eine erkennbare Signatur haben. Wenn sich das Ziel bewegt, verursacht der Mikro-Doppler-Effekt ein zeit- und frequenzveränderliches Signal.

    Da die Fourier-Transformation die Zeit nicht berücksichtigt, ist die Analyse dieses Signals mit einer Fourier-Transformation nicht ausreichend. Die Kurzzeit-Fourier-Transformation ist der einfachste Ansatz, um eine Frequenz-Zeit-Funktion (STFT) zu erhalten. Die Frequenz- und Zeitbereiche können gleichzeitig mit robusteren Methoden wie der Gabor-Transformation oder der Wigner-Verteilungsfunktion (WVD) dargestellt werden. Die Frequenzauflösung und die Zeitauflösung werden bei diesen Ansätzen jedoch immer beeinträchtigt.

    Nachdem diese Spektraldaten extrahiert wurden, können sie mit einer Datenbank verglichen werden, die Informationen über die vom System identifizierten Ziele enthält, um zu bestimmen, was das beleuchtete Ziel tatsächlich ist. Um zu bestimmen, welches Ziel in der Bibliothek am besten zu dem Modell passt, das mit dem empfangenen Signal erstellt wurde, wird eine statistische Schätzmethode wie Maximum Likelihood (ML), Majority Voting (MV) oder Maximum a posteriori (MAP) verwendet.

    Automatisierte Zielerkennungssysteme, die Audiofunktionen aus der Spracherkennung nutzen, um die Identität einer Zielperson zu bestimmen, sind Gegenstand der Forschung. Einige Beispiele für diese Koeffizienten sind:

    LPC-Koeffizienten oder lineare prädiktive Codes

    Koeffizienten der linearen Vorhersage und Kodierung im Cepstralspektrum

    Kopfkoeffizienten basierend auf Mel-Frequenzen (MFCC).

    Diese Koeffizienten werden aus einem verarbeiteten Basisbandsignal abgeleitet, und dann wird ein statistisches Verfahren verwendet, um zu bestimmen, welches Ziel in der Datenbank den abgeleiteten Koeffizienten am ähnlichsten ist. Das System und der Anwendungsfall müssen bei der Entscheidung, welche Funktionen und welches Entscheidungsschema implementiert werden sollen, berücksichtigt werden.

    Zielklassifizierungsmerkmale sind nicht auf Koeffizienten beschränkt, die durch menschliche Sprache motiviert sind. ATR kann mit zahlreichen Feature-Sets und verschiedenen Detektionsmethoden erreicht werden.

    Die Entwicklung einer Trainingsdatenbank ist notwendig, um die Zielerkennung zu automatisieren. In der Regel wird der ATR-Algorithmus mit experimentellen Daten gefüttert, die nach der Bestimmung des Ziels gesammelt wurden.

    Das Flussdiagramm stellt eine Art von Erkennungsalgorithmus dar. Bei dieser Technik werden M Datenblöcke mit einem Gaußschen Mischungsmodell modelliert und dann die extrahierten Merkmale (z. B. LPC-Koeffizienten oder MFCC) verwendet, um Schlussfolgerungen zu ziehen (GMM). Nach dem Anpassen der Daten an ein Modell werden bedingte Wahrscheinlichkeiten für jedes Ziel im Trainingssatz berechnet. Hier haben wir M-Datenblöcke zu untersuchen. Dadurch werden M individuelle Wahrscheinlichkeiten generiert, eine für jedes Datenbankziel. Anhand dieser Wahrscheinlichkeiten wird eine Maximum-Likelihood-Bestimmung getroffen, was das Ziel tatsächlich ist. Es hat sich gezeigt, dass diese Technik die Anwesenheit von bis zu drei Personen zuverlässig bestimmen und zwischen Fahrzeugtypen (z. B. Rad- vs. Kettenfahrzeuge) unterscheiden kann.

    Ein CNN-basierter Ansatz zur Zielerkennung

    Die Zielerkennung mit einem Convolutional Neural Network (CNN) kann traditionellere Ansätze übertreffen. Nach dem Training mit synthetischen Bildern hat es sich als nützlich erwiesen, um Ziele (z. B. Kampfpanzer) in Infrarotbildern realer Szenen zu erkennen. Wie realistisch die synthetischen Bilder sind, ist aufgrund der Einschränkungen des Trainingssatzes von großer Bedeutung, wenn Sie versuchen, echte Szenen aus dem Testsatz zu erkennen.

    Sieben Faltungsschichten, drei Max-Pooling-Schichten und eine Softmax-Schicht dienen als Rückgrat der gesamten CNN-Netzwerkarchitektur. Auf die zweite, vierte und fünfte Faltungsschicht folgen die maximalen Pooling-Schichten. Vor dem Endergebnis wird ein globaler Pooling-Durchschnitt angewendet. Leaky ReLU wird als nichtlineare Aktivierungsfunktion in allen Faltungsschichten verwendet.

    {Ende Kapitel 1}

    Kapitel 2: Maschinelles Sehen

    Die Untersuchung, wie Computer aus digitalen Bildern oder Videos Wissen auf hohem Niveau ableiten können, steht im Mittelpunkt des multidisziplinären Wissenschaftsbereichs Computer Vision. Aus technologischer Sicht untersucht und versucht es, Aktivitäten zu automatisieren, die im Rahmen der Möglichkeiten des menschlichen visuellen Systems liegen.

    Zu den Aufgaben im Zusammenhang mit Computer Vision gehören Techniken zum Erhalten, Verarbeiten, Analysieren und Verstehen digitaler Bilder sowie die Extraktion hochdimensionaler Daten aus der physischen Umgebung, um numerische oder symbolische Informationen, wie z. B. Urteile, zu erstellen.

    Computer Vision ist ein Teilgebiet der Informatik, das die theoretischen Grundlagen künstlicher Systeme untersucht, die Informationen aus Bildern ableiten sollen. Die visuellen Daten können in einer Vielzahl von Formaten dargestellt werden, einschließlich Videosequenzen, Bildern, die von mehreren Kameras erhalten wurden, mehrdimensionalen Daten, die von einem 3D-Scanner oder medizinischen Scangeräten erhalten wurden, und so weiter. Das Ziel des technischen Bereichs Computer Vision ist es, die Ideen und Modelle, die es im Prozess des Aufbaus von Computer-Vision-Systemen entwickelt hat, umzusetzen.

    Die Bereiche Szenenrekonstruktion, Objekterkennung, Ereigniserkennung, Videoverfolgung, Objekterkennung, 3D-Posenschätzung, Lernen, Indizierung, Bewegungsschätzung, visuelle Servoisierung, 3D-Szenenmodellierung und Bildwiederherstellung sind allesamt Teilbereiche des maschinellen Sehens. Zu den weiteren Teilbereichen des maschinellen Sehens gehört die 3D-Szenenmodellierung.

    Computer Vision ist eine multidisziplinäre Studie, die untersucht, wie Computer programmiert werden können, um aus digitalen Bildern oder Filmen Wissen auf hohem Niveau zu extrahieren. In diesem Bereich geht es darum, wie Computern beigebracht werden kann, das zu verstehen, was ihnen gezeigt wird. Aus Sicht des Ingenieurwesens besteht das Ziel darin, Wege zu finden, um Vorgänge zu automatisieren, die bereits vom menschlichen visuellen System ausgeführt werden können. Computer Vision ist ein Studiengebiet im Bereich der Informationstechnologie, das sich auf die Anwendung bestehender Theorien und Modelle auf den Prozess des Aufbaus von Computer-Vision-Systemen konzentriert.

    In den späten 1960er Jahren waren Colleges, die auf dem neuesten Stand der künstlichen Intelligenz waren, die ersten, die mit Computer Vision experimentierten. Sein Zweck war es, ähnlich wie das menschliche Sehsystem zu funktionieren, mit dem Ziel, Robotern intelligentes Verhalten zu verleihen. In den 1990er Jahren wurden einige der zuvor untersuchten Untersuchungsgebiete aktiver als die anderen. Das Studium projektiver dreidimensionaler Rekonstruktionen führte zu einem tieferen Verständnis der Kalibrierung einer Kamera. Mit der Einführung von Optimierungstechniken für die Kamerakalibrierung wurde deutlich, dass eine signifikante Anzahl der Konzepte zuvor von der Disziplin der Photogrammetrie mit der Bündelanpassungstheorie untersucht worden war. Dies kam als Folge dieser Entwicklung ans Licht. Dies führte zur Entwicklung von Techniken zur spärlichen dreidimensionalen Rekonstruktion von Szenen mit mehreren Fotografien. Sowohl das Problem der dichten Stereokorrespondenz als auch die Entwicklung weiterer Multi-View-Stereo-Ansätze zeigten ein gewisses Maß an Vorwärtsbewegung. Gleichzeitig wurden viele Varianten des Graphenschnitts verwendet, um das Problem der Bildsegmentierung zu lösen. Dieses Jahrzehnt war von besonderer Bedeutung, da es das erste Mal war, dass statistische Lernmethoden in der Praxis eingesetzt wurden, um Gesichter in Fotografien zu erkennen (siehe Eigenface). Die Bereiche Computergrafik und Computer Vision sind in den letzten Jahren enger miteinander verflochten, was zu einem starken Anstieg der Zusammenarbeit zwischen den beiden geführt hat. Dabei handelte es sich um frühe Formen des Lichtfeld-Renderings, des Zusammenfügens von Panoramabildern, des Bildmorphings, der Ansichtsinterpolation und des bildbasierten Renderings. Der Bereich Computer Vision hat durch die Entwicklung von Algorithmen, die auf Deep Learning basieren, neues Leben erhalten. Die Genauigkeit von Deep-Learning-Algorithmen auf zahlreichen Benchmark-Computer-Vision-Datensätzen für Aufgaben, die von der Klassifizierung bis zum optischen Fluss reichen, hat die früherer Ansätze übertroffen. Zu diesen Aufgaben gehören die Segmentierung von Bildern und der optische Fluss.

    Solid-State Computer Vision ist eng mit einer Reihe anderer Disziplinen verbunden, darunter auch mit der Physik. Die überwiegende Mehrheit der Computer-Vision-Systeme basiert auf Bildsensoren, also Geräten, die in der Lage sind, elektromagnetische Strahlung zu erkennen. Diese Strahlung manifestiert sich in der Regel entweder als sichtbares oder infrarotes Licht. Bei der Entwicklung der Sensoren kam die Quantenphysik zum Einsatz. Die wissenschaftliche Disziplin der Physik liefert eine Erklärung für die Methode, mit der Licht mit Oberflächen wechselwirkt. Das Verhalten der Optik, die ein grundlegender Bestandteil der meisten bildgebenden Systeme ist, kann durch die Physik erklärt werden. Um ein umfassendes Wissen über den Entstehungsprozess eines Bildes bieten zu können, benötigen hochentwickelte Bildsensoren den Einsatz der Quantenmechanik. Computer Vision kann auch verwendet werden, um eine Vielzahl von Messproblemen zu lösen, die in der Physik auftreten, z. B. solche, die die Bewegung von Flüssigkeiten betreffen.

    Die wissenschaftliche Disziplin der Neurobiologie, insbesondere die Erforschung des biologischen visuellen Systems. Die Augen, die Neuronen und die Gehirnregionen, die für die Verarbeitung visueller Reize sowohl beim Menschen als auch bei verschiedenen Tieren zuständig sind, waren im Laufe des letzten Jahrhunderts Gegenstand einer umfangreichen Forschung. Als Konsequenz daraus ist eine einfache, aber komplizierte Beschreibung der Funktionsweise tatsächlicher Bildverarbeitungssysteme entstanden, um verschiedene bildverarbeitungsbezogene Aufgaben zu erfüllen. Als Konsequenz aus diesen Erkenntnissen hat sich ein Teilgebiet des maschinellen Sehens herausgebildet, in dem künstliche Systeme die Verarbeitung und das Verhalten biologischer Systeme mit unterschiedlicher biologischer Ähnlichkeit imitieren sollen. Viele der lernbasierten Ansätze, die im Bereich des maschinellen Sehens entwickelt wurden, haben ihre Wurzeln in der Biologie. Einige Beispiele für diese lernbasierten Methoden

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1