Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Bewegungsfeld: Erkundung der Dynamik von Computer Vision: Bewegungsfeld enthüllt
Bewegungsfeld: Erkundung der Dynamik von Computer Vision: Bewegungsfeld enthüllt
Bewegungsfeld: Erkundung der Dynamik von Computer Vision: Bewegungsfeld enthüllt
eBook146 Seiten1 Stunde

Bewegungsfeld: Erkundung der Dynamik von Computer Vision: Bewegungsfeld enthüllt

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist ein Bewegungsfeld


In der Computer Vision ist das Bewegungsfeld eine ideale Darstellung der Bewegung im dreidimensionalen Raum (3D), wie sie auf ein Kamerabild projiziert wird . Bei einem vereinfachten Kameramodell ist jeder Punkt  Im Bild handelt es sich um die Projektion eines Punkts in der 3D-Szene, aber die Position der Projektion eines festen Punkts im Raum kann sich mit der Zeit ändern. Das Bewegungsfeld kann formal als die zeitliche Ableitung der Bildposition aller Bildpunkte definiert werden, sofern diese festen 3D-Punkten entsprechen. Das bedeutet, dass das Bewegungsfeld als Funktion dargestellt werden kann, die Bildkoordinaten auf einen zweidimensionalen Vektor abbildet. Das Bewegungsfeld ist eine ideale Beschreibung der projizierten 3D-Bewegung in dem Sinne, dass es formal definiert werden kann, in der Praxis ist es jedoch normalerweise nur möglich, eine Näherung des Bewegungsfelds aus den Bilddaten zu bestimmen.


Wie Sie profitieren


(I) Einblicke und Validierungen zu den folgenden Themen:


Kapitel 1: Bewegungsfeld


Kapitel 2 : Kettenregel


Kapitel 3: Curl (Mathematik)


Kapitel 4: Polarkoordinatensystem


Kapitel 5: Satz von Green


Kapitel 6: Linienelement


Kapitel 7: Kameramatrix


Kapitel 8: Lochkameramodell


Kapitel 9: Ableitung der Navier-Stokes-Gleichungen


Kapitel 10: Relativistische Lagrange-Mechanik


(II) Beantwortung der häufigsten öffentlichen Fragen zum Bewegungsfeld.


(III) Beispiele aus der Praxis für die Verwendung des Bewegungsfelds in vielen Bereichen .


Für wen sich dieses Buch eignet


Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über grundlegendes Wissen oder Informationen hinausgehen möchten jede Art von Bewegungsfeld.


 


 

SpracheDeutsch
Erscheinungsdatum12. Mai 2024
Bewegungsfeld: Erkundung der Dynamik von Computer Vision: Bewegungsfeld enthüllt

Mehr von Fouad Sabry lesen

Ähnlich wie Bewegungsfeld

Titel in dieser Serie (100)

Mehr anzeigen

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Bewegungsfeld

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Bewegungsfeld - Fouad Sabry

    Kapitel 1: Bewegungsfeld

    Das Bewegungsfeld ist die perfekte Projektion von 3D-Bewegung auf das Bild einer Kamera und wird häufig in der Computer Vision verwendet.

    Unter der Annahme eines minimal komplexen Kameramodells ist jeder Punkt (y_{{1}},y_{{2}}) im Bild die Projektion eines Punktes in der 3D-Szene, aber die Position der Projektion eines festen Punktes im Raum kann mit der Zeit variieren.

    Da alle Bildpunkte festen 3D-Koordinaten entsprechen, kann das Bewegungsfeld formal als zeitliche Ableitung der Bildposition aller Bildpunkte definiert werden.

    Das Bewegungsfeld kann dann als Funktion ausgedrückt werden, die Bildkoordinaten in einen zweidimensionalen Vektor umwandelt.

    Formal ist das Bewegungsfeld die perfekte Beschreibung der projizierten 3D-Bewegung, aber in der Praxis ist es in der Regel nur möglich, das Bewegungsfeld aus den Bilddaten zu schätzen.

    Ein Kameramodell bildet jeden Punkt (x_{{1}},x_{{2}},x_{{3}}) im 3D-Raum gemäß einigen Mapping-Funktionen (y_{{1}},y_{{2}}) auf einen 2D-Bildpunkt  ab {\displaystyle m_{1},m_{2}} :

    {\displaystyle {\begin{pmatrix}y_{1}\\y_{2}\end{pmatrix}}={\begin{pmatrix}m_{1}(x_{1},x_{2},x_{3})\\m_{2}(x_{1},x_{2},x_{3})\end{pmatrix}}}

    Für eine dynamische Szene, in der sich Objekte zueinander bewegen, in der Objekte verformt werden und in der sich die Kamera selbst in Bezug auf die Szene bewegt, wird ein Fixpunkt im 3D-Raum verschiedenen Stellen im Bild zugeordnet. Das Ergebnis der Zeitdifferenzierung des vorherigen Ausdrucks ist

    {\displaystyle {\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}(x_{1},x_{2},x_{3})}{dt}}\\[2mm]{\frac {dm_{2}(x_{1},x_{2},x_{3})}{dt}}\end{pmatrix}}={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}\,{\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}

    Hier

    {\displaystyle \mathbf {u} ={\begin{pmatrix}{\frac {dy_{1}}{dt}}\\[2mm]{\frac {dy_{2}}{dt}}\end{pmatrix}}}

    ist das Bewegungsfeld und der Vektor u ist sowohl von der Bildposition  als (y_{{1}},y_{{2}}) auch von der Zeit t abhängig.

    Ähnlich {\displaystyle \mathbf {x'} ={\begin{pmatrix}{\frac {dx_{1}}{dt}}\\[2mm]{\frac {dx_{2}}{dt}}\\[2mm]{\frac {dx_{3}}{dt}}\end{pmatrix}}}

    stellt die Bewegung des 3D-Punktes in Bezug auf das Bewegungsfeld dar und

    {\displaystyle \mathbf {u} =\mathbf {M} \,\mathbf {x} '}

    wobei {\mathbf {M}} die von der Bildposition abhängige 2\times 3 Matrix ist

    {\displaystyle \mathbf {M} ={\begin{pmatrix}{\frac {dm_{1}}{dx_{1}}}&{\frac {dm_{1}}{dx_{2}}}&{\frac {dm_{1}}{dx_{3}}}\\[2mm]{\frac {dm_{2}}{dx_{1}}}&{\frac {dm_{2}}{dx_{2}}}&{\frac {dm_{2}}{dx_{3}}}\end{pmatrix}}}

    Entsprechend dieser Verbindung ist das Bewegungsfeld an einer festen Stelle im Bild unveränderlich gegenüber 3D-Bewegungen, die im Nullraum von liegen {\mathbf {M}} .

    Beispiel: Alle Bewegungskomponenten im 3D-Raum, die senkrecht zum Brennpunkt der Kamera stehen, werden von einer Lochkamera übersehen.

    Das Bewegungsfeld \mathbf {v} ist definiert als:

    {\displaystyle \mathbf {v} =f{\frac {Z\mathbf {V} -V_{z}\mathbf {P} }{Z^{2}}}}

    wo

    {\displaystyle \mathbf {V} =-\mathbf {T} -\mathbf {\omega } \times \mathbf {P} } .

    wo

    \mathbf {P} ist ein Punkt in der Szene, wobei Z die Entfernung zu diesem Szenenpunkt ist.

    \mathbf {V} ist die relative Bewegung zwischen der Kamera und der Szene, \mathbf {T} ist die translatorische Komponente der Bewegung und

    \mathbf {\omega } ist die Winkelgeschwindigkeit der Bewegung.

    Wie oben erläutert, ist das Bewegungsfeld eine theoretische Schöpfung, die auf der Annahme basiert, dass die Bewegungsrichtung für jedes Pixel in einem Bild bestimmt werden kann. In der Realität können Messungen an Bilddaten jedoch nur als Annäherung an das zugrunde liegende Bewegungsfeld dienen. Das Problem ist, dass die Mobilität jedes Bildpunkts in den meisten Fällen einzigartig ist und lokal mit einer Art Nachbarschaftsoperation an den Bilddaten bewertet werden muss. Daher muss für einige Arten von Nachbarschaften anstelle des wahren Bewegungsfeldes eine Näherung verwendet werden, die allgemein als optischer Fluss bezeichnet wird. Eine Nachbarschaft mit konstanter Intensität kann beispielsweise einem Bewegungsfeld entsprechen, das nicht Null ist, aber der optische Fluss in einem solchen Bereich wäre Null, weil keine lokale Bildbewegung messbar wäre. Ebenso kann der optische Fluss nur die normale Komponente eines Bewegungsfeldes aufzeichnen, selbst wenn eine Nachbarschaft, die intrinsisch 1-dimensional ist (z. B. eine Kante oder Linie), einem beliebigen Bewegungsfeld entsprechen kann. Bildrauschen, 3D-Okklusion und zeitliches Aliasing sind Faktoren, die bei jeder optischen Flussmesstechnik natürlich auftreten und zu Diskrepanzen zwischen den gemessenen und tatsächlichen Bewegungsfeldern führen.

    Zusammenfassend lässt sich sagen, dass das Bewegungsfeld eine Annäherung an den optischen Fluss ist, da es unmöglich ist, das Bewegungsfeld für alle Bildpositionen genau zu messen. Der optische Fluss kann auf verschiedene Arten berechnet werden, von denen jede einen einzigartigen Satz von Kriterien zur Bestimmung der Genauigkeit einer optischen Schätzung berücksichtigt.

    {Ende Kapitel 1}

    Kapitel 2: Kettenregel

    In der Infinitesimalrechnung ist die Kettenregel ein mathematischer Ausdruck, der verwendet werden kann, um die Ableitung der Kombination zweier differenzierbarer Funktionen, f und g, in Bezug auf die Ableitungen von f und g zu definieren.

    Genauer gesagt, wenn {\displaystyle h=f\circ g} die Funktion so ist, dass {\displaystyle h(x)=f(g(x))} für jedes x, wenn dies der Fall ist, die Kettenregel unter Verwendung der Notation von Lagrange, {\displaystyle h'(x)=f'(g(x))g'(x).}

    oder gleichwertig

    {\displaystyle h'=(f\circ g)'=(f'\circ g)\cdot g'.}

    Die Kettenregel kann auch mit der von Leibniz verwendeten Notation angegeben werden. Wenn eine Variable, z, von einer anderen Variablen, y, abhängig ist und beide Variablen von einer dritten Variablen, x, abhängig sind (d.h. y und z sind abhängige Variablen), dann ist z auch auf x angewiesen, indem die Variable y als Vermittler verwendet wird. In diesem speziellen Fall wird die Kettenregel wie folgt angegeben:

    {\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}},}

    und

    {\displaystyle \left.{\frac {dz}{dx}}\right|_{x}=\left.{\frac {dz}{dy}}\right|_{y(x)}\cdot \left.{\frac {dy}{dx}}\right|_{x},}

    um zu signalisieren, an welchen Stellen die Derivate bewertet werden müssen.

    Wenn es um die Integration geht, ist die Ersetzungsregel diejenige, die der Kettenregel entspricht.

    Intuitiv besagt die Kettenregel, dass man, wenn man die momentane Änderungsrate von z relativ zu y und die von y relativ zu x kennt, in der Lage ist, die momentane Änderungsrate von z relativ zu x als Produkt der beiden Änderungsraten zu berechnen. Wenn man die momentane Änderungsrate von z relativ zu x kennt, dann kann man die momentane Änderungsrate von z relativ berechnen.

    In den Worten von George F.

    Wenn sich ein Fahrzeug doppelt so schnell bewegen kann wie ein Fahrrad und ein Fahrrad viermal so schnell fahren kann wie eine Person, die zu Fuß geht, dann sagt Simmons Folgendes: Dann fährt das Auto 2 × 4 = 8 Mal so schnell wie der Mensch."

    Im Folgenden wird der Zusammenhang zwischen dieser speziellen Abbildung und der Kettenregel beschrieben:.

    Seien z, y und x die (variablen) Positionen des Autos, des Fahrrads bzw. des Mannes, der zu Fuß ging.

    Die Änderungsrate der relativen Positionen des Autos und des Fahrrads ist {\textstyle {\frac {dz}{dy}}=2.} ähnlich, {\textstyle {\frac {dy}{dx}}=4.} also ist das Tempo, mit dem sich die relativen Positionen des Autos und des Fußgängers ändern,

    {\displaystyle {\frac {dz}{dx}}={\frac {dz}{dy}}\cdot {\frac {dy}{dx}}=2\cdot 4=8.}

    Die Rate der Positionsänderung ist gleich dem Verhältnis der Geschwindigkeiten, und die Geschwindigkeit wird berechnet, indem die Ableitung der Position in Bezug auf die Zeit genommen wird; Dies bedeutet, dass die Änderungsrate der Position gleich 1 ist, {\displaystyle {\frac {dz}{dx}}={\frac {\frac {dz}{dt}}{\frac {dx}{dt}}},}

    oder gleichwertig {\displaystyle {\frac {dz}{dt}}={\frac {dz}{dx}}\cdot {\frac {dx}{dt}},}

    Hier ist ein weiteres Beispiel für die Kettenregel in Aktion.

    Es wird angenommen, dass Gottfried Wilhelm Leibniz der erste war, der die Kettenregel anwandte.

    Er benutzte sie, um die

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1