Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Skalieren Sie den Raum: Erforschung von Dimensionen in der Computer Vision
Skalieren Sie den Raum: Erforschung von Dimensionen in der Computer Vision
Skalieren Sie den Raum: Erforschung von Dimensionen in der Computer Vision
eBook121 Seiten1 Stunde

Skalieren Sie den Raum: Erforschung von Dimensionen in der Computer Vision

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist Skalieren Sie den Raum


Die Skalenraumtheorie ist ein Rahmenwerk für die mehrskalige Signaldarstellung, das von Computer-Vision-, Bildverarbeitungs- und Signalverarbeitungsgemeinschaften mit komplementären Motivationen entwickelt wurde Physik und biologisches Sehen. Dabei handelt es sich um eine formale Theorie zur Handhabung von Bildstrukturen in unterschiedlichen Maßstäben, indem ein Bild als Ein-Parameter-Familie geglätteter Bilder dargestellt wird, die Skalenraumdarstellung, parametrisiert durch die Größe des Glättungskerns, der zur Unterdrückung feinskaliger Strukturen verwendet wird. Der Parameter  wird in dieser Familie als Skalierungsparameter bezeichnet, mit der Interpretation, dass Bildstrukturen mit einer räumlichen Größe kleiner als etwa  wurden auf Skalenraumebene im Maßstab weitgehend geglättet.


Wie Sie davon profitieren


(I) Einblicke und Validierungen zu den folgenden Themen :


Kapitel 1: Skalierungsraum


Kapitel 2: Kantenerkennung


Kapitel 3: Gaußsche Unschärfe


Kapitel 4: Differenz von Gaußschen


Kapitel 5: Skaleninvariante Feature-Transformation


Kapitel 6: Mehrskalige Ansätze


Kapitel 7: Strukturtensor


Kapitel 8 : Pyramide (Bildverarbeitung)


Kapitel 9: Anisotrope Diffusion


Kapitel 10: Gabor-Filter


(II) Beantwortung der häufigsten öffentlichen Fragen zum Skalenraum.


(III) Beispiele aus der Praxis für die Nutzung des Skalenraums in vielen Bereichen.


Für wen dieses Buch gedacht ist


Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über das Grundwissen oder die Informationen für jede Art von Scale Space hinausgehen möchten.

SpracheDeutsch
Erscheinungsdatum14. Mai 2024
Skalieren Sie den Raum: Erforschung von Dimensionen in der Computer Vision

Mehr von Fouad Sabry lesen

Ähnlich wie Skalieren Sie den Raum

Titel in dieser Serie (100)

Mehr anzeigen

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Skalieren Sie den Raum

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Skalieren Sie den Raum - Fouad Sabry

    Kapitel 1: Raum skalieren

    Die Computer-Vision-Community entwickelte eine Theorie namens Skalenraum, um einen Rahmen für die Darstellung von Signalen auf mehreren Skalen zu schaffen, Motivationen aus der Physik und dem biologischen Sehen, die Bildverarbeitungs- und Signalverarbeitungsgemeinschaften haben komplementäre Motivationen.

    Es ist eine formale Theorie für den Umgang mit den unterschiedlichen Strukturgrößen von Bildern, indem sie als eine Gruppe von geglätteten Bildern kodiert wird, die sich nur um einen Parameter unterscheiden, eine Darstellung im Maßstabsraum, die durch Anpassen der Größe des Glättungskerns gesteuert werden kann, der zum Ausblenden subtiler Details verwendet wird.

    Der Parameter t in dieser Familie wird als Skalierungsparameter bezeichnet, mit der Interpretation, dass Bildstrukturen mit räumlicher Größe, die kleiner als ungefähr sind, {\sqrt {t}} in der Maßstabs-Raum-Ebene weitgehend geglättet wurden t .

    Der lineare (Gaußsche) Skalenraum ist aufgrund seiner Vielseitigkeit und der Leichtigkeit, mit der er aus einer begrenzten Anzahl von Axiomen abgeleitet werden kann, der gebräuchlichste und am weitesten verbreitete Skalenraumtyp. Mit der Theorie der Gaußschen Ableitungsoperatoren, die durch das entsprechende Skalenraum-Framework bereitgestellt wird, kann eine Vielzahl visueller Operationen in computergestützten visuellen Verarbeitungssystemen ausgedrückt werden. Da reale Objekte eine beliebige Anzahl von Größen haben können und der Abstand zwischen dem Objekt und der Kamera unbekannt sein oder sich je nach den Umständen ändern kann, ermöglicht dieses Framework auch, visuelle Operationen maßstabsinvariant zu gestalten.

    Signale mit beliebig vielen Variablen können vom Konzept des Skalenraums profitieren.

    Zweidimensionale Bilder sind die Norm in der wissenschaftlichen Literatur, nämlich in dem hier präsentierten Material.

    Für ein gegebenes Bild f(x,y) ist seine lineare (Gaußsche) Skalenraumdarstellung eine Familie abgeleiteter Signale L(x,y;t) , die durch die Faltung von f(x,y) mit dem zweidimensionalen Gaußschen Kern definiert sind

    {\displaystyle g(x,y;t)={\frac {1}{2\pi t}}e^{-(x^{2}+y^{2})/2t}\,}

    so dass

    L(\cdot ,\cdot ;t)\ =g(\cdot ,\cdot ;t)*f(\cdot ,\cdot ),

    wobei das Semikolon im Argument von L impliziert, dass die Faltung nur über die Variablen ausgeführt wird x,y , während der Parameter scale t nach dem Semikolon nur angibt, welche Skalierungsstufe definiert wird.

    Diese Definition von L Werken für ein Kontinuum von Skalen t\geq 0 würde jedoch nur eine kleine Teilmenge der möglichen Skalenstufen in der Praxis berücksichtigt.

    Der Skalierungsparameter t=\sigma ^{2} ist die Varianz des Gaußschen Filters und wird als Grenzwert für t=0 den Filter g zu einer Impulsfunktion, d. L(x,y;0)=f(x,y), h. die Skalierungsraumdarstellung auf Skalenebene t=0 ist das Bild f selbst.

    Mit t zunehmender Geschwindigkeit L ist das Ergebnis der Glättung f mit einem immer größeren Filter, wodurch die feineren Details des Bildes allmählich verloren gehen.

    Da die Standardabweichung des Filters ist \sigma ={\sqrt {t}} , werden Details, die deutlich kleiner als dieser Wert sind, beim Maßstabsparameter weitgehend aus dem Bild entfernt t , für visuelle Hilfsmittel siehe die folgende Abbildung und.

    Maßstabsgetreue Darstellung des Maßstabsbereichs L(x,y;t) t=0 , die dem Originalbild entspricht f

    Maßstabsbereichsdarstellung L(x,y;t) in großem Maßstab t=1

    Maßstabsbereichsdarstellung L(x,y;t) in großem Maßstab t=4

    Maßstabsbereichsdarstellung L(x,y;t) in großem Maßstab t=16

    Maßstabsbereichsdarstellung L(x,y;t) in großem Maßstab t=64

    Maßstabsbereichsdarstellung L(x,y;t) in großem Maßstab t=256

    Auf die Frage, ob ein Tiefpassfilter g mit einer Breite, die durch einen Parameter t bestimmt wird, verwendet werden könnte, um einen Skalenraum für eine Darstellung mit mehreren Skalen zu erzeugen, lautet die Antwort ja. Da es entscheidend ist, dass der Glättungsfilter keine neuen Störstrukturen auf groben Skalen einführt, die nicht den Vereinfachungen entsprechender Strukturen auf feineren Skalen entsprechen, lautet die Antwort nein. Mehrere präzise mathematische Formulierungen dieses Kriteriums wurden in der Skalenraumliteratur ausgedrückt.

    Basierend auf der grundlegenden Anforderung, dass keine neuen Strukturen geschaffen werden dürfen, wenn man von einer feinen Skala zu einer gröberen Skala übergeht, wurde durch verschiedene axiomatische Ableitungen gezeigt, dass der Gaußsche Skalenraum die kanonische Methode zur Erzeugung eines linearen Skalenraums darstellt. Bedingungen, die als Skalenraumaxiome bekannt sind, wie Linearität, Verschiebungsinvarianz, Halbgruppenstruktur, Nichtverstärkung lokaler Extrema, Skaleninvarianz und Rotationsinvarianz wurden verwendet, um die Einzigartigkeit des Gaußschen Kerns abzuleiten. Die Lösung der Diffusionsgleichung bietet eine alternative Definition der Skalenraumfamilie (z. B. in Bezug auf die Wärmegleichung), \partial _{t}L={\frac {1}{2}}\nabla ^{2}L,

    mit Ausgangszustand L(x,y;0)=f(x,y) .

    Diese Formulierung der Maßstabsraumdarstellung L bedeutet, dass es möglich ist, die Intensitätswerte des Bildes f als Temperaturverteilung in der Bildebene zu interpretieren und dass der Prozess, der die Maßstabsraumdarstellung als Funktion von t erzeugt, der Wärmediffusion in der Bildebene über die Zeit t  entspricht (unter der Annahme, dass die Wärmeleitfähigkeit des Materials gleich der willkürlich gewählten Konstante 1/2 ist).

    Für einen Leser, der mit Differentialgleichungen nicht vertraut ist, mag diese Verbindung bestenfalls dürftig erscheinen. Wie sich herausstellt, wird die primäre Formulierung des Skalenraums in Bezug auf die Nicht-Verstärkung lokaler Extrema als Vorzeichenbedingung für partielle Ableitungen in dem 2+1-dimensionalen Volumen geschrieben, das durch den Skalenraum erzeugt wird, als Ergebnis innerhalb der Grenzen partieller Differentialgleichungen.

    Darüber hinaus überbrückt die Diffusionsgleichung die Lücke zwischen kontinuierlichen und diskreten Skalenräumen, wie eine sorgfältige Untersuchung des diskreten Falls zeigt, der sich beispielsweise auf Skalenräume jenseits der linearen Dimension erstreckt, indem eine Technik namens anisotrope Diffusion verwendet wird.

    Daher könnte argumentiert werden, dass die Diffusionsgleichung die gebräuchlichste Methode zur Erzeugung eines Skalenraums ist, der aufgrund einer bestimmten partiellen Differentialgleichung den Gaußschen Kern als Green-Funktion hat.

    Reale Objekte bestehen aus verschiedenen Strukturen in verschiedenen Maßstäben, und daher kommt der Anstoß zur Erstellung einer Maßstabsraumdarstellung eines bestimmten Datensatzes. Dies deutet darauf hin, dass im Gegensatz zu idealisierten mathematischen Entitäten wie Punkten oder Linien das Aussehen von Objekten in der realen Welt mit dem Maßstab variieren kann, in dem sie beobachtet werden. Konzepte wie Blätter und Moleküle eignen sich eher für kleinere Maßstäbe, während das Konzept eines Baumes für die Meterskala geeignet ist. Es gibt keine Möglichkeit für ein Computer-Vision-System, a priori zu wissen, welche Maßstäbe geeignet sind, um die interessanten Strukturen in den Bilddaten bei der Analyse einer unbekannten Szene zu beschreiben. Daher besteht die beste Strategie darin, Beschreibungen in verschiedenen Maßstäben zu berücksichtigen, um mögliche Abweichungen im Maßstab zu berücksichtigen. Eine

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1