Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Zittern: Dither: Visuelles Rauschen in Computer Vision
Zittern: Dither: Visuelles Rauschen in Computer Vision
Zittern: Dither: Visuelles Rauschen in Computer Vision
eBook150 Seiten1 Stunde

Zittern: Dither: Visuelles Rauschen in Computer Vision

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist Dither


Dither ist eine absichtlich angewendete Form von Rauschen, die zur Randomisierung von Quantisierungsfehlern verwendet wird und so großflächige Muster wie Farbstreifen in Bildern verhindert. Dithering wird routinemäßig bei der Verarbeitung digitaler Audio- und Videodaten verwendet und ist oft einer der letzten Schritte beim Mastern von Audio auf eine CD.


Ihre Vorteile


(I) Einblicke und Validierungen zu den folgenden Themen:


Kapitel 1: Dither


Kapitel 2: Analog-Digital-Wandler


Kapitel 3: Dynamikumfang


Kapitel 4: Signal-Rausch-Verhältnis


Kapitel 5: Halbton


Kapitel 6: Vergleich von analoger und digitaler Aufnahme


Kapitel 7: Komprimierungsartefakte


Kapitel 8: Abtastung (Signalverarbeitung)


Kapitel 9: Quantisierung (Signalverarbeitung)


Kapitel 10: Graustufen


(II) Beantwortung der häufigsten öffentlichen Fragen zum Thema Dither.


(III) Beispiele aus der Praxis für die Verwendung von Dither in vielen Bereichen.


Für wen sich dieses Buch eignet


Profis, Studenten und Doktoranden, Enthusiasten, Bastler und diejenigen, die über das Grundwissen oder die Informationen für jede Art von Dithering hinausgehen möchten.


 


 

SpracheDeutsch
Erscheinungsdatum5. Mai 2024
Zittern: Dither: Visuelles Rauschen in Computer Vision

Mehr von Fouad Sabry lesen

Ähnlich wie Zittern

Titel in dieser Serie (100)

Mehr anzeigen

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Zittern

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Zittern - Fouad Sabry

    Kapitel 1: Dither

    Dither ist eine absichtliche Art von Rauschen, die verwendet wird, um Quantisierungsfehler zu randomisieren und so großflächige Muster wie Farbstreifen in Fotos zu verhindern. Dither wird häufig bei der Verarbeitung von digitalen Audio- und Videodaten eingesetzt und ist häufig einer der letzten Schritte beim Mastering von Audio für eine CD.

    In der Regel wird Dither verwendet, um ein Graustufenbild in Schwarzweiß umzuwandeln, sodass die Dichte der schwarzen Punkte im resultierenden Bild dem durchschnittlichen Grauwert des Originalbildes entspricht.

    … Eine der frühesten Anwendungen von Dither kam im Zweiten Weltkrieg.

    Die Bomber nutzten mechanische Computer zur Navigation und Berechnung der Flugbahn der Bombe.

    Seltsamerweise arbeiteten diese Computer (Kisten mit Hunderten von Zahnrädern und Zahnrädern) an Bord des Flugzeugs präziser und weniger fest etabliert.

    Die Ingenieure stellten fest, dass die Vibrationen des Flugzeugs den Fehler minimierten, der durch klebrige bewegliche Teile verursacht wurde.

    Anstatt sich in schnellen Rucken zu bewegen, sollten Sie sich sanft bewegen, Sie bewegten sich mit größerer Konsistenz.

    Miniatur-Vibrationsmotoren wurden in die Computer eingebaut, Der Begriff Dither leitet sich vom mittelenglischen Verb didderen ab, was schütteln bedeutet. Wenn heute ein mechanisches Messgerät angezapft wird, um seine Genauigkeit zu verbessern, verwenden Sie Dither, Moderne Wörterbücher definieren Dither als einen zutiefst ängstlichen Geisteszustand, verwirrten oder aufgeregten Zustand.

    In winzigen Mengen macht Dither ein digitales System im positiven Sinne des Wortes analoger.

    Ken Pohlmann, Grundlagen des digitalen Audios

    Kurz nach dem Zweiten Weltkrieg wurde der Begriff Dither in der Literatur über analoge Berechnungen und hydraulisch angetriebene Waffen veröffentlicht.

    Dither wird in zahlreichen Bereichen eingesetzt, darunter die digitale Verarbeitung und Analyse. Zu diesen Anwendungen gehören digitales Audio, digitales Video, digitale Fotografie, Seismologie, Radar und Wettervorhersagesysteme, die eine digitale Signalverarbeitung erfordern.

    Quantifizierung führt zu Fehlern. Wenn diese Ungenauigkeit mit dem Signal zusammenhängt, kann das Ergebnis zyklisch oder vorhersehbar sein. In einigen Bereichen, insbesondere in denen, in denen der Rezeptor empfindlich auf solche Verzerrungen reagiert, führen zyklische Fehler zu unerwünschten Artefakten. Durch die Einführung von Dither in diesen Bereichen wird der Fehler in zufälliges Rauschen umgewandelt. Die Audioindustrie ist ein Paradebeispiel dafür. Das menschliche Ohr verhält sich ähnlich wie eine Fourier-Transformation, indem es unterschiedliche Frequenzen wahrnimmt.

    In einem analogen System ist das Signal kontinuierlich, während in einem digitalen PCM-System die Amplitude des Signals auf einen festen Satz von Werten oder Zahlen beschränkt ist. Diese Methode wird als Quantisierung bezeichnet. Jeder codierte Wert ist ein diskreter Schritt. Wenn ein Signal ohne Dither quantisiert wird, kommt es zu einer Quantisierungsverzerrung, die mit dem ursprünglichen Eingangssignal verbunden ist... Um dies zu verhindern, wird das Signal gerastert, ein Verfahren, das Oberschwingungen und andere höchst unerwünschte Verzerrungen mathematisch eliminiert und durch einen konstanten, festen Rauschpegel ersetzt.

    Während des Produktionsprozesses wird oft eine größere Anzahl von Bits verwendet, um jede Probe darzustellen. Diese muss auf 16 Bit reduziert werden, um eine Compact Disc zu erstellen.

    Es gibt zahlreiche Möglichkeiten, dies zu erreichen. Man kann zum Beispiel die zusätzlichen Bits verwerfen; Dies wird als Trunkierung bezeichnet. Zusätzlich kann man überschüssige Bits auf den nächsten Wert runden. Jede dieser Strategien führt jedoch zu Fehlern, die vorhersehbar und kalkulierbar sind. Durch Dithering werden diese Ungenauigkeiten durch ein kontinuierliches, festes Rauschen ersetzt.

    Beispiele für Audiobeispiele für die 6-Bit-Kürzung

    16-Bit-Sinuskurve


    auf sechs Bit reduziert


    reduziert auf 6 Bit


    Haben Sie Probleme beim Abspielen dieser Dateien? Weitere Informationen finden Sie unter Medienunterstützung.

    Nehmen wir zum Beispiel eine Wellenform mit den folgenden Werten:

    1 2 3 4 5 6 7 8

    Wenn die Wellenform um 20 % verringert wird, ergeben sich folgende Werte:

    0.8 1.6 2.4 3.2 4.0 4.8 5.6 6.4

    Wenn diese Werte gekürzt werden, ergeben sich folgende Daten:

    0 1 2 3 4 4 5 6

    Werden diese Werte stattdessen gerundet, ergeben sich folgende Daten:

    1 2 2 3 4 5 6 6

    Die Technik, die Amplitude einer Originalwellenform um 20 Prozent zu verringern, führt zu konsistenten Fehlern. Stellen Sie sich eine Sinuswelle vor, die für einen Teil der oben genannten Parameter erfüllt. Wie im obigen Beispiel gezeigt, wäre das verkürzte Ergebnis jedes Mal, wenn der Wert der Sinuswelle 3,2 erreicht, um 0,2 falsch. Wenn der Wert der Sinuswelle 4,0 erreicht, gibt es keinen Fehler, da das verkürzte Ergebnis um 0,0 abweicht, wie zuvor dargestellt. Während des gesamten Zyklus der Sinuswelle ändert sich die Größe des Fehlers regelmäßig und wiederholt. Dieser Fehler offenbart sich konkret als Verzerrung. Was das Ohr als Verzerrung wahrnimmt, ist die zusätzliche Information bei diskreten Frequenzen, die aus einem wiederkehrenden Quantisierungsfehler resultiert.

    Ein möglicher Ansatz wäre, die zweistellige Zahl (z. B. 4,8) in beide Richtungen zu runden. Er könnte einmal auf fünf und beim nächsten Mal auf vier gerundet werden. Dies würde den langfristigen Durchschnitt auf 4,5 statt auf 4 erhöhen, was den Wert im Laufe der Zeit näher an seinen wahren Wert bringen würde. Dies führt jedoch immer noch zu einem bestimmbaren (wenn auch komplizierteren) Fehler. Jedes zweite Mal, wenn der Wert 4,8 erreicht wird, ist das Ergebnis ein Fehler von 0,2 Prozent, und in den anderen Fällen beträgt der Fehler 0,8. Dies führt immer noch zu einem quantifizierten, wiederholten Fehler.

    Eine alternative Möglichkeit wäre, 4,8 so zu runden, dass sie in vier von fünf Fällen auf 5 und beim fünften Mal auf 4 abgerundet wird. Langfristig würde dies im Durchschnitt genau 4,8 betragen. Leider führt dies immer noch zu wiederkehrenden und vorhersehbaren Fehlern, und diese Fehler zeigen sich weiterhin als hörbare Verzerrungen.

    Daraus ergibt sich die Lösung des Ditherings. Anstatt auf vorhersehbare, sich wiederholende Weise auf- oder abzurunden, ist es möglich, nach dem Zufallsprinzip aufzu- oder abzurunden. Wenn eine Reihe von Zufallszahlen zwischen 0,0 und 0,9 (z. B. 0,6, 0,1, 0,3, 0,6, 0,9 usw.) erstellt und zu 4,8 addiert wird, wird das Ergebnis in zwei von zehn Fällen wieder auf 4 gekürzt (wenn 0,0 oder 0,1 zu 4,8 addiert werden) und in acht von zehn Fällen wird das Ergebnis auf 5 gekürzt. Jede Bedingung hat eine Wahrscheinlichkeit von 20 %, auf 4 gerundet zu werden, und eine Wahrscheinlichkeit von 80 %, auf 5 gerundet zu werden. Der langfristige Durchschnitt dieser Ergebnisse beträgt 4,8, und ihr Quantisierungsfehler ist zufälliges Rauschen. Dieses Geräusch ist für das Ohr weniger störend als die messbare Verzerrung, die bei anderen Lösungen entsteht.

    Vor der Quantisierung oder Re-Quantisierung wird Dither eingeführt, um das Quantisierungsrauschen vom Eingangssignal zu entkoppeln und nichtlineares Verhalten (Verzerrung) zu verhindern. Die Quantisierung mit geringerer Bittiefe erfordert mehr Dither. Die Technik führt immer noch zu Verzerrungen, aber die Verzerrung ist zufällig, daher wird das resultierende Rauschen im Wesentlichen mit dem gewünschten Signal korreliert.

    Lipshitz und Vanderkooi zeigten in einer bahnbrechenden Studie, die im AES Journal veröffentlicht wurde, dass verschiedene Rauscharten mit unterschiedlichen Wahrscheinlichkeitsdichtefunktionen (PDFs) unterschiedlich reagieren, wenn sie als Dither-Signale verwendet werden. In der Regel ist zufälliges Rauschen weniger störend als die harmonischen Töne, die durch Grenzzyklen erzeugt werden.

    Funktion der rechteckigen Wahrscheinlichkeitsdichte (RPDF) Jeder Wert innerhalb des definierten Bereichs hat die gleiche Wahrscheinlichkeit, innerhalb des Dither-Rauschens aufzutreten.

    Funktion der Dreieckswahrscheinlichkeitsdichte (TPDF) Dither-Rauschen hat eine Dreiecksverteilung; Die Wahrscheinlichkeit des Auftretens ist bei Werten in der Mitte des Bereichs am größten. Es ist möglich, eine Dreiecksverteilung zu erhalten, indem zwei separate RPDF-Quellen kombiniert werden.

    Die Gaußsche PDF-Verteilung hat eine Normalverteilung. Diese glockenförmige oder Gaußsche Kurve ist charakteristisch für Dither, das von analogen Quellen wie Mikrofonvorverstärkern erzeugt wird. Wenn die Bittiefe einer Aufnahme ausreichend ist, ist das Vorverstärkerrauschen ausreichend, um die Aufnahme zu dithern.

    Noise Shaping ist ein Filterverfahren, das die spektrale Energie des Quantisierungsfehlers modifiziert, oft um Frequenzen zu deakzentuieren, für die das Ohr am empfindlichsten ist, oder um Signal- und Rauschbänder vollständig

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1