Zittern: Dither: Visuelles Rauschen in Computer Vision
Von Fouad Sabry
()
Über dieses E-Book
Was ist Dither
Dither ist eine absichtlich angewendete Form von Rauschen, die zur Randomisierung von Quantisierungsfehlern verwendet wird und so großflächige Muster wie Farbstreifen in Bildern verhindert. Dithering wird routinemäßig bei der Verarbeitung digitaler Audio- und Videodaten verwendet und ist oft einer der letzten Schritte beim Mastern von Audio auf eine CD.
Ihre Vorteile
(I) Einblicke und Validierungen zu den folgenden Themen:
Kapitel 1: Dither
Kapitel 2: Analog-Digital-Wandler
Kapitel 3: Dynamikumfang
Kapitel 4: Signal-Rausch-Verhältnis
Kapitel 5: Halbton
Kapitel 6: Vergleich von analoger und digitaler Aufnahme
Kapitel 7: Komprimierungsartefakte
Kapitel 8: Abtastung (Signalverarbeitung)
Kapitel 9: Quantisierung (Signalverarbeitung)
Kapitel 10: Graustufen
(II) Beantwortung der häufigsten öffentlichen Fragen zum Thema Dither.
(III) Beispiele aus der Praxis für die Verwendung von Dither in vielen Bereichen.
Für wen sich dieses Buch eignet
Profis, Studenten und Doktoranden, Enthusiasten, Bastler und diejenigen, die über das Grundwissen oder die Informationen für jede Art von Dithering hinausgehen möchten.
Mehr von Fouad Sabry lesen
Neue Technologien in der Landwirtschaft [German]
Ähnlich wie Zittern
Titel in dieser Serie (100)
Bildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden Bewertung: 0 von 5 Sternen0 BewertungenLärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung Bewertung: 0 von 5 Sternen0 BewertungenGamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik Bewertung: 0 von 5 Sternen0 BewertungenUnterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen Bewertung: 0 von 5 Sternen0 BewertungenModell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen Bewertung: 0 von 5 Sternen0 BewertungenFarbraum: Erkundung des Spektrums von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenRetinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex Bewertung: 0 von 5 Sternen0 BewertungenHomographie: Homographie: Transformationen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenInpainting: Überbrückung von Lücken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAnisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion Bewertung: 0 von 5 Sternen0 BewertungenComputer Vision: Erkundung der Tiefen des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAktive Kontur: Weiterentwicklung der Computer Vision mit aktiven Konturtechniken Bewertung: 0 von 5 Sternen0 BewertungenTonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenKonturerkennung: Enthüllung der Kunst der visuellen Wahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenVisuelle Wahrnehmung: Einblicke in die computergestützte visuelle Verarbeitung Bewertung: 0 von 5 Sternen0 BewertungenAdaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung Bewertung: 0 von 5 Sternen0 BewertungenGemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard Bewertung: 0 von 5 Sternen0 BewertungenHistogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenRadon-Transformation: Aufdecken verborgener Muster in visuellen Daten Bewertung: 0 von 5 Sternen0 BewertungenAffine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenCanny Edge Detector: Enthüllung der Kunst der visuellen Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenComputer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFilterbank: Einblicke in die Filterbanktechniken von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarberscheinungsmodell: Wahrnehmung und Darstellung in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenHough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenHadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarbmodell: Das Spektrum des Computer Vision verstehen: Farbmodelle erkunden Bewertung: 0 von 5 Sternen0 BewertungenZufallsstichprobenkonsens: Robuste Schätzung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGeometrisches Hashing: Effiziente Algorithmen zur Bilderkennung und -anpassung Bewertung: 0 von 5 Sternen0 Bewertungen
Ähnliche E-Books
Farbstreifenbildung: Erkundung der Tiefen des Computersehens: Das Geheimnis der Farbstreifenbildung lüften Bewertung: 0 von 5 Sternen0 BewertungenKantenglättung: Verbesserung der visuellen Klarheit in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenDatenkompression: Erhöhen Sie die Effizienz von Computer Vision durch Datenkomprimierung Bewertung: 0 von 5 Sternen0 BewertungenAudiovisuelle Spracherkennung: Fortschritte, Anwendungen und Erkenntnisse Bewertung: 0 von 5 Sternen0 BewertungenLärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung Bewertung: 0 von 5 Sternen0 BewertungenModell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen Bewertung: 0 von 5 Sternen0 BewertungenTonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenSmart Recording: Aufnehmen, Mischen, Mastern - Einfach & Effizient Bewertung: 0 von 5 Sternen0 BewertungenCanny Edge Detector: Enthüllung der Kunst der visuellen Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenCNC-Fräsen für Maker und Modellbauer: Grundlagen – Technik – Praxis Bewertung: 0 von 5 Sternen0 BewertungenAnisotrope Filterung: Entschlüsselung der visuellen Komplexität in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenSound-Design mit Zebra² Bewertung: 0 von 5 Sternen0 BewertungenRendering mit hohem Dynamikbereich: Erschließung des visuellen Spektrums: Fortgeschrittene Techniken in der Computer Vision Bewertung: 0 von 5 Sternen0 Bewertungen30 Minuten Online-Meetings Bewertung: 0 von 5 Sternen0 BewertungenBildbearbeitung für Anfänger: 30 Top Tipps für die Bildbearbeitung von digitalen Bildern Bewertung: 0 von 5 Sternen0 BewertungenMusik produzieren Das Nachschlagewerk: Homestudio Musikband Tonstudio - Pop Rock Techno World Music House Hip Hop EDM Electro Soul Jazz Bewertung: 0 von 5 Sternen0 BewertungenFarbprofil: Erforschung der visuellen Wahrnehmung und Analyse in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenHandbuch: Praxis der akustischen Fledermauserfassung Bewertung: 0 von 5 Sternen0 BewertungenCorrect Maintenance - Cognex DataMan 8600 Bewertung: 0 von 5 Sternen0 BewertungenKeine Angst vorm Synthesizer: Theoretische und praktische Erläuterungen aus der Welt der elektronischen Klangerzeugung Bewertung: 0 von 5 Sternen0 BewertungenComputergestützte Audio- und Videotechnik: Multimediatechnik in der Anwendung Bewertung: 0 von 5 Sternen0 BewertungenAdaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung Bewertung: 0 von 5 Sternen0 BewertungenFarbzuordnung: Erforschung der visuellen Wahrnehmung und Analyse in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAutomatische Zielerkennung: Fortschritte in Computer-Vision-Techniken zur Zielerkennung Bewertung: 0 von 5 Sternen0 BewertungenFarbmanagementsystem: Optimierung der visuellen Wahrnehmung in digitalen Umgebungen Bewertung: 0 von 5 Sternen0 BewertungenKantenerkennung: Grenzen in der Computer Vision erkunden Bewertung: 0 von 5 Sternen0 BewertungenPHOTOKOLLEGIUM 6: Farbdruck & Colormanagement in der digitalen Fotografie Bewertung: 0 von 5 Sternen0 BewertungenUnterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen Bewertung: 0 von 5 Sternen0 Bewertungen
Künstliche Intelligenz (KI) & Semantik für Sie
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5 Bewertung: 0 von 5 Sternen0 BewertungenChatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken Bewertung: 0 von 5 Sternen0 BewertungenPsychologie des Sozialismus Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen Bewertung: 0 von 5 Sternen0 BewertungenKI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch Bewertung: 0 von 5 Sternen0 BewertungenRoboter im Alltag: Maschinen (beinahe) wie Menschen Bewertung: 0 von 5 Sternen0 BewertungenDie KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen Bewertung: 1 von 5 Sternen1/5Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German Bewertung: 0 von 5 Sternen0 BewertungenChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler Bewertung: 0 von 5 Sternen0 BewertungenDie Zukunft der Arbeit: Digitalisierung, Automatisierung, KI Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz: Die vierte industrielle Revolution Bewertung: 0 von 5 Sternen0 BewertungenMenschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt Bewertung: 0 von 5 Sternen0 BewertungenWissen statt Glauben!: Das Weltbild des neuen Humanismus Bewertung: 0 von 5 Sternen0 BewertungenEinstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte Bewertung: 0 von 5 Sternen0 BewertungenAufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen Bewertung: 0 von 5 Sternen0 BewertungenDigitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit? Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz in Sozialen Medien Bewertung: 0 von 5 Sternen0 Bewertungen
Rezensionen für Zittern
0 Bewertungen0 Rezensionen
Buchvorschau
Zittern - Fouad Sabry
Kapitel 1: Dither
Dither ist eine absichtliche Art von Rauschen, die verwendet wird, um Quantisierungsfehler zu randomisieren und so großflächige Muster wie Farbstreifen in Fotos zu verhindern. Dither wird häufig bei der Verarbeitung von digitalen Audio- und Videodaten eingesetzt und ist häufig einer der letzten Schritte beim Mastering von Audio für eine CD.
In der Regel wird Dither verwendet, um ein Graustufenbild in Schwarzweiß umzuwandeln, sodass die Dichte der schwarzen Punkte im resultierenden Bild dem durchschnittlichen Grauwert des Originalbildes entspricht.
… Eine der frühesten Anwendungen von Dither kam im Zweiten Weltkrieg.
Die Bomber nutzten mechanische Computer zur Navigation und Berechnung der Flugbahn der Bombe.
Seltsamerweise arbeiteten diese Computer (Kisten mit Hunderten von Zahnrädern und Zahnrädern) an Bord des Flugzeugs präziser und weniger fest etabliert.
Die Ingenieure stellten fest, dass die Vibrationen des Flugzeugs den Fehler minimierten, der durch klebrige bewegliche Teile verursacht wurde.
Anstatt sich in schnellen Rucken zu bewegen, sollten Sie sich sanft bewegen, Sie bewegten sich mit größerer Konsistenz.
Miniatur-Vibrationsmotoren wurden in die Computer eingebaut, Der Begriff Dither
leitet sich vom mittelenglischen Verb didderen
ab, was schütteln
bedeutet. Wenn heute ein mechanisches Messgerät angezapft wird, um seine Genauigkeit zu verbessern, verwenden Sie Dither, Moderne Wörterbücher definieren Dither als einen zutiefst ängstlichen Geisteszustand, verwirrten oder aufgeregten Zustand.
In winzigen Mengen macht Dither ein digitales System im positiven Sinne des Wortes analoger.
— Ken Pohlmann, Grundlagen des digitalen Audios
Kurz nach dem Zweiten Weltkrieg wurde der Begriff Dither in der Literatur über analoge Berechnungen und hydraulisch angetriebene Waffen veröffentlicht.
Dither wird in zahlreichen Bereichen eingesetzt, darunter die digitale Verarbeitung und Analyse. Zu diesen Anwendungen gehören digitales Audio, digitales Video, digitale Fotografie, Seismologie, Radar und Wettervorhersagesysteme, die eine digitale Signalverarbeitung erfordern.
Quantifizierung führt zu Fehlern. Wenn diese Ungenauigkeit mit dem Signal zusammenhängt, kann das Ergebnis zyklisch oder vorhersehbar sein. In einigen Bereichen, insbesondere in denen, in denen der Rezeptor empfindlich auf solche Verzerrungen reagiert, führen zyklische Fehler zu unerwünschten Artefakten. Durch die Einführung von Dither in diesen Bereichen wird der Fehler in zufälliges Rauschen umgewandelt. Die Audioindustrie ist ein Paradebeispiel dafür. Das menschliche Ohr verhält sich ähnlich wie eine Fourier-Transformation, indem es unterschiedliche Frequenzen wahrnimmt.
In einem analogen System ist das Signal kontinuierlich, während in einem digitalen PCM-System die Amplitude des Signals auf einen festen Satz von Werten oder Zahlen beschränkt ist. Diese Methode wird als Quantisierung bezeichnet. Jeder codierte Wert ist ein diskreter Schritt. Wenn ein Signal ohne Dither quantisiert wird, kommt es zu einer Quantisierungsverzerrung, die mit dem ursprünglichen Eingangssignal verbunden ist... Um dies zu verhindern, wird das Signal gerastert
, ein Verfahren, das Oberschwingungen und andere höchst unerwünschte Verzerrungen mathematisch eliminiert und durch einen konstanten, festen Rauschpegel ersetzt.
Während des Produktionsprozesses wird oft eine größere Anzahl von Bits verwendet, um jede Probe darzustellen. Diese muss auf 16 Bit reduziert werden, um eine Compact Disc zu erstellen.
Es gibt zahlreiche Möglichkeiten, dies zu erreichen. Man kann zum Beispiel die zusätzlichen Bits verwerfen; Dies wird als Trunkierung bezeichnet. Zusätzlich kann man überschüssige Bits auf den nächsten Wert runden. Jede dieser Strategien führt jedoch zu Fehlern, die vorhersehbar und kalkulierbar sind. Durch Dithering werden diese Ungenauigkeiten durch ein kontinuierliches, festes Rauschen ersetzt.
Beispiele für Audiobeispiele für die 6-Bit-Kürzung
16-Bit-Sinuskurve
auf sechs Bit reduziert
reduziert auf 6 Bit
Haben Sie Probleme beim Abspielen dieser Dateien? Weitere Informationen finden Sie unter Medienunterstützung.
Nehmen wir zum Beispiel eine Wellenform mit den folgenden Werten:
1 2 3 4 5 6 7 8
Wenn die Wellenform um 20 % verringert wird, ergeben sich folgende Werte:
0.8 1.6 2.4 3.2 4.0 4.8 5.6 6.4
Wenn diese Werte gekürzt werden, ergeben sich folgende Daten:
0 1 2 3 4 4 5 6
Werden diese Werte stattdessen gerundet, ergeben sich folgende Daten:
1 2 2 3 4 5 6 6
Die Technik, die Amplitude einer Originalwellenform um 20 Prozent zu verringern, führt zu konsistenten Fehlern. Stellen Sie sich eine Sinuswelle vor, die für einen Teil der oben genannten Parameter erfüllt. Wie im obigen Beispiel gezeigt, wäre das verkürzte Ergebnis jedes Mal, wenn der Wert der Sinuswelle 3,2 erreicht, um 0,2 falsch. Wenn der Wert der Sinuswelle 4,0 erreicht, gibt es keinen Fehler, da das verkürzte Ergebnis um 0,0 abweicht, wie zuvor dargestellt. Während des gesamten Zyklus der Sinuswelle ändert sich die Größe des Fehlers regelmäßig und wiederholt. Dieser Fehler offenbart sich konkret als Verzerrung. Was das Ohr als Verzerrung wahrnimmt, ist die zusätzliche Information bei diskreten Frequenzen, die aus einem wiederkehrenden Quantisierungsfehler resultiert.
Ein möglicher Ansatz wäre, die zweistellige Zahl (z. B. 4,8) in beide Richtungen zu runden. Er könnte einmal auf fünf und beim nächsten Mal auf vier gerundet werden. Dies würde den langfristigen Durchschnitt auf 4,5 statt auf 4 erhöhen, was den Wert im Laufe der Zeit näher an seinen wahren Wert bringen würde. Dies führt jedoch immer noch zu einem bestimmbaren (wenn auch komplizierteren) Fehler. Jedes zweite Mal, wenn der Wert 4,8 erreicht wird, ist das Ergebnis ein Fehler von 0,2 Prozent, und in den anderen Fällen beträgt der Fehler 0,8. Dies führt immer noch zu einem quantifizierten, wiederholten Fehler.
Eine alternative Möglichkeit wäre, 4,8 so zu runden, dass sie in vier von fünf Fällen auf 5 und beim fünften Mal auf 4 abgerundet wird. Langfristig würde dies im Durchschnitt genau 4,8 betragen. Leider führt dies immer noch zu wiederkehrenden und vorhersehbaren Fehlern, und diese Fehler zeigen sich weiterhin als hörbare Verzerrungen.
Daraus ergibt sich die Lösung des Ditherings. Anstatt auf vorhersehbare, sich wiederholende Weise auf- oder abzurunden, ist es möglich, nach dem Zufallsprinzip aufzu- oder abzurunden. Wenn eine Reihe von Zufallszahlen zwischen 0,0 und 0,9 (z. B. 0,6, 0,1, 0,3, 0,6, 0,9 usw.) erstellt und zu 4,8 addiert wird, wird das Ergebnis in zwei von zehn Fällen wieder auf 4 gekürzt (wenn 0,0 oder 0,1 zu 4,8 addiert werden) und in acht von zehn Fällen wird das Ergebnis auf 5 gekürzt. Jede Bedingung hat eine Wahrscheinlichkeit von 20 %, auf 4 gerundet zu werden, und eine Wahrscheinlichkeit von 80 %, auf 5 gerundet zu werden. Der langfristige Durchschnitt dieser Ergebnisse beträgt 4,8, und ihr Quantisierungsfehler ist zufälliges Rauschen. Dieses Geräusch ist für das Ohr weniger störend als die messbare Verzerrung, die bei anderen Lösungen entsteht.
Vor der Quantisierung oder Re-Quantisierung wird Dither eingeführt, um das Quantisierungsrauschen vom Eingangssignal zu entkoppeln und nichtlineares Verhalten (Verzerrung) zu verhindern. Die Quantisierung mit geringerer Bittiefe erfordert mehr Dither. Die Technik führt immer noch zu Verzerrungen, aber die Verzerrung ist zufällig, daher wird das resultierende Rauschen im Wesentlichen mit dem gewünschten Signal korreliert.
Lipshitz und Vanderkooi zeigten in einer bahnbrechenden Studie, die im AES Journal veröffentlicht wurde, dass verschiedene Rauscharten mit unterschiedlichen Wahrscheinlichkeitsdichtefunktionen (PDFs) unterschiedlich reagieren, wenn sie als Dither-Signale verwendet werden. In der Regel ist zufälliges Rauschen weniger störend als die harmonischen Töne, die durch Grenzzyklen erzeugt werden.
Funktion der rechteckigen Wahrscheinlichkeitsdichte (RPDF) Jeder Wert innerhalb des definierten Bereichs hat die gleiche Wahrscheinlichkeit, innerhalb des Dither-Rauschens aufzutreten.
Funktion der Dreieckswahrscheinlichkeitsdichte (TPDF) Dither-Rauschen hat eine Dreiecksverteilung; Die Wahrscheinlichkeit des Auftretens ist bei Werten in der Mitte des Bereichs am größten. Es ist möglich, eine Dreiecksverteilung zu erhalten, indem zwei separate RPDF-Quellen kombiniert werden.
Die Gaußsche PDF-Verteilung hat eine Normalverteilung. Diese glockenförmige oder Gaußsche Kurve ist charakteristisch für Dither, das von analogen Quellen wie Mikrofonvorverstärkern erzeugt wird. Wenn die Bittiefe einer Aufnahme ausreichend ist, ist das Vorverstärkerrauschen ausreichend, um die Aufnahme zu dithern.
Noise Shaping ist ein Filterverfahren, das die spektrale Energie des Quantisierungsfehlers modifiziert, oft um Frequenzen zu deakzentuieren, für die das Ohr am empfindlichsten ist, oder um Signal- und Rauschbänder vollständig