Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Optische Braille-Erkennung: Ermöglichung der Barrierefreiheit durch visuelle Intelligenz
Optische Braille-Erkennung: Ermöglichung der Barrierefreiheit durch visuelle Intelligenz
Optische Braille-Erkennung: Ermöglichung der Barrierefreiheit durch visuelle Intelligenz
eBook138 Seiten1 Stunde

Optische Braille-Erkennung: Ermöglichung der Barrierefreiheit durch visuelle Intelligenz

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist optische Braille-Erkennung


Optische Braille-Erkennung ist eine Technologie zur Erfassung und Verarbeitung von Bildern von Braille-Zeichen in natürliche Sprachzeichen. Es dient dazu, Braille-Dokumente für Personen, die sie nicht lesen können, in Text umzuwandeln sowie zur Aufbewahrung und Reproduktion der Dokumente.


Ihre Vorteile


(I) Erkenntnisse und Validierungen zu den folgenden Themen:


Kapitel 1: Optische Braille-Erkennung


Kapitel 2: Computer Vision


Kapitel 3: Optische Zeichenerkennung


Kapitel 4: Handschrifterkennung


Kapitel 5: Bildscanner


Kapitel 6: Dokumentenlayoutanalyse


Kapitel 7: Dokumentenverarbeitung


Kapitel 8: Videoverfolgung


Kapitel 9: 3D-Scannen


Kapitel 10: Optische Musikerkennung


(II) Beantwortung der öffentlichen Frage Fragen zur optischen Braille-Erkennung.


(III) Beispiele aus der Praxis für den Einsatz der optischen Braille-Erkennung in vielen Bereichen.


Für wen dieses Buch gedacht ist


Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über das Grundwissen oder die Informationen zur optischen Braille-Erkennung hinausgehen möchten.


 


 

SpracheDeutsch
Erscheinungsdatum4. Mai 2024
Optische Braille-Erkennung: Ermöglichung der Barrierefreiheit durch visuelle Intelligenz

Mehr von Fouad Sabry lesen

Ähnlich wie Optische Braille-Erkennung

Titel in dieser Serie (100)

Mehr anzeigen

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Optische Braille-Erkennung

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Optische Braille-Erkennung - Fouad Sabry

    Kapitel 1: Optische Braille-Erkennung

    Die optische Braille-Erkennung ist eine Technik, die Fotos von Braille-Symbolen in Zeichen in einfacher Sprache umwandelt. Es wird verwendet, um Braille-Dokumente für Personen, die sie nicht lesen können, in Text zu übersetzen sowie die Dokumente zu bewahren und zu reproduzieren.

    Im Jahr 1984 entwickelte ein Team von Forschern der Technischen Universität Delft ein Braille-Lesetablett, bei dem ein Lesekopf mit lichtempfindlichen Zellen über ein Linealpaar bewegt wurde, um Braille-Text Zeile für Zeile zu erfassen.

    Die Beschaffenheit von Braille-Dokumenten stellt viele der Hindernisse für die erfolgreiche Verarbeitung von Braille-Text dar. Brailleschrift wird oft auf einfarbigem Papier gedruckt, ohne dass Tinte verwendet wird, um einen Kontrast zwischen den erhabenen Zeichen und dem Hintergrund zu erzeugen. Seitenfehler können jedoch in einem Scan oder Foto der Seite sichtbar sein.

    Zahlreiche Dokumente werden punktübergreifend oder doppelseitig gedruckt. So scheinen die Vertiefungen der Brailleschrift der einen Seite mit den Vorsprüngen der Brailleschrift der anderen Seite überlagert zu sein.

    Einige optische Braille-Identifikationssysteme verwenden eine schräge Beleuchtung und eine Kamera, um die Schatten der Vertiefungen und Vorsprünge der Brailleschrift sichtbar zu machen. Andere verwenden auf dem Markt erhältliche Dokumentenscanner.

    {Ende Kapitel 1}

    Kapitel 2: Maschinelles Sehen

    Die Untersuchung, wie Computer aus digitalen Bildern oder Videos Wissen auf hohem Niveau ableiten können, steht im Mittelpunkt des multidisziplinären Wissenschaftsbereichs Computer Vision. Aus technologischer Sicht untersucht und versucht es, Aktivitäten zu automatisieren, die im Rahmen der Möglichkeiten des menschlichen visuellen Systems liegen.

    Zu den Aufgaben im Zusammenhang mit Computer Vision gehören Techniken zum Erhalten, Verarbeiten, Analysieren und Verstehen digitaler Bilder sowie die Extraktion hochdimensionaler Daten aus der physischen Umgebung, um numerische oder symbolische Informationen, wie z. B. Urteile, zu erstellen.

    Computer Vision ist ein Teilgebiet der Informatik, das die theoretischen Grundlagen künstlicher Systeme untersucht, die Informationen aus Bildern ableiten sollen. Die visuellen Daten können in einer Vielzahl von Formaten dargestellt werden, einschließlich Videosequenzen, Bildern, die von mehreren Kameras erhalten wurden, mehrdimensionalen Daten, die von einem 3D-Scanner oder medizinischen Scangeräten erhalten wurden, und so weiter. Das Ziel des technischen Bereichs Computer Vision ist es, die Ideen und Modelle, die es im Prozess des Aufbaus von Computer-Vision-Systemen entwickelt hat, umzusetzen.

    Die Bereiche Szenenrekonstruktion, Objekterkennung, Ereigniserkennung, Videoverfolgung, Objekterkennung, 3D-Posenschätzung, Lernen, Indizierung, Bewegungsschätzung, visuelle Servoisierung, 3D-Szenenmodellierung und Bildwiederherstellung sind allesamt Teilbereiche des maschinellen Sehens. Zu den weiteren Teilbereichen des maschinellen Sehens gehört die 3D-Szenenmodellierung.

    Computer Vision ist eine multidisziplinäre Studie, die untersucht, wie Computer programmiert werden können, um aus digitalen Bildern oder Filmen Wissen auf hohem Niveau zu extrahieren. In diesem Bereich geht es darum, wie Computern beigebracht werden kann, das zu verstehen, was ihnen gezeigt wird. Aus Sicht des Ingenieurwesens besteht das Ziel darin, Wege zu finden, um Vorgänge zu automatisieren, die bereits vom menschlichen visuellen System ausgeführt werden können. Computer Vision ist ein Studiengebiet im Bereich der Informationstechnologie, das sich auf die Anwendung bestehender Theorien und Modelle auf den Prozess des Aufbaus von Computer-Vision-Systemen konzentriert.

    In den späten 1960er Jahren waren Colleges, die auf dem neuesten Stand der künstlichen Intelligenz waren, die ersten, die mit Computer Vision experimentierten. Sein Zweck war es, ähnlich wie das menschliche Sehsystem zu funktionieren, mit dem Ziel, Robotern intelligentes Verhalten zu verleihen. In den 1990er Jahren wurden einige der zuvor untersuchten Untersuchungsgebiete aktiver als die anderen. Das Studium projektiver dreidimensionaler Rekonstruktionen führte zu einem tieferen Verständnis der Kalibrierung einer Kamera. Mit der Einführung von Optimierungstechniken für die Kamerakalibrierung wurde deutlich, dass eine signifikante Anzahl der Konzepte zuvor von der Disziplin der Photogrammetrie mit der Bündelanpassungstheorie untersucht worden war. Dies kam als Folge dieser Entwicklung ans Licht. Dies führte zur Entwicklung von Techniken zur spärlichen dreidimensionalen Rekonstruktion von Szenen mit mehreren Fotografien. Sowohl das Problem der dichten Stereokorrespondenz als auch die Entwicklung weiterer Multi-View-Stereo-Ansätze zeigten ein gewisses Maß an Vorwärtsbewegung. Gleichzeitig wurden viele Varianten des Graphenschnitts verwendet, um das Problem der Bildsegmentierung zu lösen. Dieses Jahrzehnt war von besonderer Bedeutung, da es das erste Mal war, dass statistische Lernmethoden in der Praxis eingesetzt wurden, um Gesichter in Fotografien zu erkennen (siehe Eigenface). Die Bereiche Computergrafik und Computer Vision sind in den letzten Jahren enger miteinander verflochten, was zu einem starken Anstieg der Zusammenarbeit zwischen den beiden geführt hat. Dabei handelte es sich um frühe Formen des Lichtfeld-Renderings, des Zusammenfügens von Panoramabildern, des Bildmorphings, der Ansichtsinterpolation und des bildbasierten Renderings. Der Bereich Computer Vision hat durch die Entwicklung von Algorithmen, die auf Deep Learning basieren, neues Leben erhalten. Die Genauigkeit von Deep-Learning-Algorithmen auf zahlreichen Benchmark-Computer-Vision-Datensätzen für Aufgaben, die von der Klassifizierung bis zum optischen Fluss reichen, hat die früherer Ansätze übertroffen. Zu diesen Aufgaben gehören die Segmentierung von Bildern und der optische Fluss.

    Solid-State Computer Vision ist eng mit einer Reihe anderer Disziplinen verbunden, darunter auch mit der Physik. Die überwiegende Mehrheit der Computer-Vision-Systeme basiert auf Bildsensoren, also Geräten, die in der Lage sind, elektromagnetische Strahlung zu erkennen. Diese Strahlung manifestiert sich in der Regel entweder als sichtbares oder infrarotes Licht. Bei der Entwicklung der Sensoren kam die Quantenphysik zum Einsatz. Die wissenschaftliche Disziplin der Physik liefert eine Erklärung für die Methode, mit der Licht mit Oberflächen wechselwirkt. Das Verhalten der Optik, die ein grundlegender Bestandteil der meisten bildgebenden Systeme ist, kann durch die Physik erklärt werden. Um ein umfassendes Wissen über den Entstehungsprozess eines Bildes bieten zu können, benötigen hochentwickelte Bildsensoren den Einsatz der Quantenmechanik. Computer Vision kann auch verwendet werden, um eine Vielzahl von Messproblemen zu lösen, die in der Physik auftreten, z. B. solche, die die Bewegung von Flüssigkeiten betreffen.

    Die wissenschaftliche Disziplin der Neurobiologie, insbesondere die Erforschung des biologischen visuellen Systems. Die Augen, die Neuronen und die Gehirnregionen, die für die Verarbeitung visueller Reize sowohl beim Menschen als auch bei verschiedenen Tieren zuständig sind, waren im Laufe des letzten Jahrhunderts Gegenstand einer umfangreichen Forschung. Als Konsequenz daraus ist eine einfache, aber komplizierte Beschreibung der Funktionsweise tatsächlicher Bildverarbeitungssysteme entstanden, um verschiedene bildverarbeitungsbezogene Aufgaben zu erfüllen. Als Konsequenz aus diesen Erkenntnissen hat sich ein Teilgebiet des maschinellen Sehens herausgebildet, in dem künstliche Systeme die Verarbeitung und das Verhalten biologischer Systeme mit unterschiedlicher biologischer Ähnlichkeit imitieren sollen. Viele der lernbasierten Ansätze, die im Bereich des maschinellen Sehens entwickelt wurden, haben ihre Wurzeln in der Biologie. Einige Beispiele für diese lernbasierten Methoden sind neuronale Netze und Deep-Learning-basierte Bild- und Merkmalsanalyse und -kategorisierung.

    Einige Zweige der Computer-Vision-Forschung sind dem Studium des biologischen Sehens sehr ähnlich. Viele Zweige der KI-Forschung sind auch der Erforschung des menschlichen Bewusstseins und der Anwendung von zuvor erworbenem Wissen zur Interpretation, Integration und Nutzung von visuellem Input sehr ähnlich. Die Untersuchung und Modellierung der physiologischen Mechanismen, die der visuellen Wahrnehmung bei Menschen und anderen Tieren zugrunde liegen, ist das Fachgebiet der akademischen Disziplin des biologischen Sehens. Auf der anderen Seite ist Computer Vision die Untersuchung und Beschreibung der Prozesse, die in Software und Hardware implementiert sind, die künstlichen Bildverarbeitungssystemen zugrunde liegen. Die interdisziplinäre Zusammenarbeit zwischen den Wissenschaften des biologischen Sehens und des maschinellen Sehens hat sich für beide Bereiche als vorteilhaft erwiesen.

    Signalverarbeitung ist ein weiteres Forschungsgebiet, das mit Computer Vision verbunden ist. In der Computer Vision kann die Verarbeitung von Signalen mit zwei Variablen oder Signalen mit mehreren Variablen auf natürliche Weise von der Verarbeitung von Signalen mit einer Variablen, oft zeitlichen Signalen, erweitert werden. Dies ermöglicht ein höheres Maß an Flexibilität bei der Signalanalyse. Aufgrund der einzigartigen Eigenschaften von Bildern hat das Feld des maschinellen Sehens jedoch eine Vielzahl von Techniken hervorgebracht, die nicht mit der Verarbeitung von Signalen vergleichbar sind, die nur eine einzige Variable enthalten. In Verbindung mit der Tatsache, dass das Signal selbst mehrdimensional ist, entsteht dadurch ein Sektor innerhalb der Signalverarbeitung,

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1