Entdecken Sie Millionen von E-Books, Hörbüchern und vieles mehr mit einer kostenlosen Testversion

Nur $11.99/Monat nach der Testphase. Jederzeit kündbar.

Visuelles Wort: Erschließen Sie die Kraft des Bildverständnisses
Visuelles Wort: Erschließen Sie die Kraft des Bildverständnisses
Visuelles Wort: Erschließen Sie die Kraft des Bildverständnisses
eBook145 Seiten1 Stunde

Visuelles Wort: Erschließen Sie die Kraft des Bildverständnisses

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist visuelles Wort


Visuelle Wörter, wie sie in Bildabrufsystemen verwendet werden, beziehen sich auf kleine Teile eines Bildes, die Informationen zu den Merkmalen oder Änderungen enthalten Vorkommen in den Pixeln wie Filterung, Low-Level-Feature-Deskriptoren.


Wie Sie davon profitieren


(I) Einblicke und Validierungen zu Folgendem Themen:


Kapitel 1: Visuelles Wort


Kapitel 2: Code


Kapitel 3: Informationsabruf


Kapitel 4: Bildsegmentierung


Kapitel 5: Automatische Zusammenfassung


Kapitel 6: Latente semantische Analyse


Kapitel 7: Inhaltsbasierter Bildabruf


Kapitel 8: N -gram


Kapitel 9: Dokument-Begriffs-Matrix


Kapitel 10: Volltextsuche


(II) Beantwortung der häufigsten öffentlichen Fragen zu visuellen Wörtern.


(III) Beispiele aus der Praxis für die Verwendung visueller Wörter in vielen Bereichen.


Für wen dieses Buch gedacht ist


Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über das Grundwissen oder die Informationen für jede Art von Visual Word hinausgehen möchten.


 


 

SpracheDeutsch
Erscheinungsdatum4. Mai 2024
Visuelles Wort: Erschließen Sie die Kraft des Bildverständnisses

Mehr von Fouad Sabry lesen

Ähnlich wie Visuelles Wort

Titel in dieser Serie (100)

Mehr anzeigen

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Mehr anzeigen

Ähnliche Artikel

Rezensionen für Visuelles Wort

Bewertung: 0 von 5 Sternen
0 Bewertungen

0 Bewertungen0 Rezensionen

Wie hat es Ihnen gefallen?

Zum Bewerten, tippen

Die Rezension muss mindestens 10 Wörter umfassen

    Buchvorschau

    Visuelles Wort - Fouad Sabry

    Kapitel 1: Visuelles Wort

    Visuelle Wörter, wie sie in Bildabrufsystemen verwendet werden, beziehen sich auf kurze Abschnitte eines Bildes, die Informationen über die Merkmale (z. B. Farbe, Form oder Textur) oder Änderungen in den Pixeln enthalten, wie z. B. die filternden Low-Level-Merkmalsdeskriptoren (SIFT oder SURF).

    Methoden des Text-Retrieval-Systems (oder Information Retrieval Systems)

    Bedenken Sie, dass die Pixel eines Bildes, die die kleinsten Teile eines digitalen Bildes sind und nicht weiter unterteilt werden können, den alphabetischen Buchstaben einer Sprache ähneln. Dann bildet eine Gruppe von Pixeln innerhalb eines Bildes (ein Patch oder Arrays von Pixeln) ein Wort. Dann kann jedes Wort innerhalb eines morphologischen Systems neu verarbeitet werden, um einen verwandten Begriff zu erhalten. Dann beziehen sich mehrere Wörter mit der gleichen Bedeutung auf dasselbe Konzept (wie in jeder Sprache). Zahlreiche Wörter haben die gleiche Bedeutung und bilden die gleiche Phrase (haben die gleichen Informationen). Entsprechend dieser Perspektive können die Forscher Text-Retrieval-Techniken an Bild-Retrieval-Systeme anpassen.

    Dieser Ansatz kann auf Spiele angewendet werden, um zu bestimmen, welche Wörter und Phrasen in unseren Bildern vorkommen werden. Ziel ist es, zu versuchen, die Bilder mit einem Vokabular von visuellen Wörtern zu verstehen.

    Ein kleiner Bereich eines Bilds, der beliebige Informationen in einem beliebigen Feature-Bereich enthalten kann, z. B. Farb- oder Texturänderungen.

    Im Allgemeinen existieren visuelle Wörter (VWs) in einem Merkmalsraum kontinuierlicher Werte, was eine große Anzahl von Wörtern und folglich eine riesige Sprache impliziert. Da Bildabrufsysteme Textabruftechniken in Abhängigkeit von natürlichen Sprachen verwenden müssen, die eine Begrenzung der Anzahl von Begriffen und Wörtern haben, muss die Anzahl der visuellen Wörter reduziert werden.

    Es gibt zahlreiche Möglichkeiten, dieses Problem zu lösen, z. B. die Partitionierung des Featurebereichs in Bereiche mit gemeinsam genutzten Features (die als dasselbe Wort betrachtet werden können). Diese Technik weist jedoch zahlreiche Mängel auf, darunter die Divisionsstrategie und die Breite des Bereichs im Feature-Bereich. Die Verwendung einer Clustering-Methode zur Klassifizierung und Zusammenführung von Wörtern, die allgemeine Informationen vermitteln, in eine endliche Anzahl von Begriffen ist eine weitere Lösung, die von Forschern vorgestellt wurde.

    Die Konsequenz der Clusterbildung im Merkmalsraum (Mittelpunkte der Cluster). Mehrere Patches können die nächstgelegenen Informationen im Merkmalsraum liefern, sodass wir sie als gleichwertig betrachten können.

    Da sich der Begriff in einem Text (das unendliche Verb, die Substantive und die Artikel) auf zahlreiche gebräuchliche Wörter mit den gleichen Eigenschaften bezieht, bezieht sich der visuelle Begriff (mit seinem Clustering-Ergebnis) auf alle gebräuchlichen Wörter, die die gleichen Informationen in einem Merkmalsraum teilen.

    Wenn schließlich alle Bilder den gleichen visuellen Konzepten entsprechen, können sie alle in derselben Sprache (oder visuellen Sprache) kommunizieren.

    Eine Sammlung von visuellen Wörtern und Phrasen.

    Betrachtet man nur die visuellen Begriffe, so ist das Visuelle Vokabular, das das Referenz- und Abrufsystem sein wird, das für das Abrufen von Bildern darauf angewiesen ist.

    Diese visuelle Sprache stellt alle Bilder als eine Sammlung visueller Wörter oder einen Sack visueller Wörter dar.

    Eine Sammlung von visuellen Wörtern, die zusammen die Bedeutung eines Teils oder des gesamten Bildes erklären.

    Auf der Grundlage dieser Art der Bilddarstellung ist es möglich, ein Bildabrufsystem mit Hilfe von Textabruftechniken zu erstellen. Da jedoch alle Textabrufsysteme auf Begriffen basieren, müssen die Abfragebilder des Benutzers in eine Sammlung visueller Wörter innerhalb des Systems umgewandelt werden. Das System vergleicht dann diese visuellen Begriffe mit jedem visuellen Begriff in der Datenbank.

    {Ende Kapitel 1}

    Kapitel 2: Code

    Für die Zwecke der Kommunikation und Informationsverarbeitung ist ein Code eine Reihe von Prinzipien, die Informationen – wie z. B. einen Brief, ein Wort, einen Ton, ein Bild oder eine Geste – in eine andere, manchmal kürzere oder geheime Form umwandeln, um sie auf einem Speichergerät zu speichern oder über einen Kommunikationskanal zu übertragen. Ein frühes Beispiel ist die Entwicklung der Sprache, die es den Menschen ermöglichte, verbal auszudrücken, was sie anderen gegenüber dachten, sahen, hörten oder fühlten. Das Sprechen beschränkt das Publikum jedoch auf diejenigen, die zum Zeitpunkt der Rede anwesend sind, und begrenzt den Kommunikationsbereich auf die Entfernung, die eine Stimme zurücklegen kann. Das Aufkommen der Schrift, die die verbale Kommunikation in visuelle Symbole verwandelte, erhöhte das Potenzial für die Kommunikation über Zeit und Distanz hinweg.

    Codierung ist der Prozess der Umwandlung von Daten aus einer Quelle in Symbole für die Übertragung oder Speicherung. Das umgekehrte Verfahren, das als Dekodierung bezeichnet wird, besteht darin, Codesymbole in eine Sprache zu übersetzen, die der Empfänger verstehen kann, z. B. Englisch und/oder Spanisch.

    Codierung wird verwendet, um die Kommunikation in Situationen zu erleichtern, in denen es schwierig oder unmöglich wäre, dies in normaler einfacher Sprache zu tun, entweder mündlich oder schriftlich. Zum Beispiel verschlüsselt die Semaphore Teile der Nachricht, in der Regel einzelne Zeichen und Zahlen, indem sie die Anordnung der Flaggen verwendet, die vom Signalgeber oder den Armen des Semaphorturms gehalten werden. Die Flaggen können von jemandem in der Ferne gelesen werden, und sie können die gesendeten Nachrichten wiederholen.

    Ein Code wird in der Informationstheorie und Informatik typischerweise als eine Methode betrachtet, die Symbole aus einem Quellalphabet diskret durch kodierte Zeichenfolgen darstellt, die sich in einem anderen Zielalphabet befinden können. Das Verketten der codierten Zeichenfolgen ergibt eine Erweiterung des Codes für die Codierung von Symbolsequenzen im Quellalphabet.

    Dies ist ein kleines Beispiel, bevor eine mathematisch exakte Definition bereitgestellt wird. Das Diagramm

    C = \{\, a\mapsto 0, b\mapsto 01, c\mapsto 011\,\}

    Der Code, dessen Quellalphabet die Menge und \{a,b,c\} dessen Zielalphabet die Menge ist \{0,1\} .

    Mit der Erweiterung des Codes kann die kodierte Zeichenfolge 0011001 in Codewörter als 0 011 0 01 gruppiert werden, und diese wiederum können verwendet werden, um die Reihenfolge der ursprünglichen Symbole, acab, zu dekodieren.

    Unter Verwendung von Konzepten aus der formalen Sprachtheorie Im Folgenden finden Sie eine detaillierte mathematische Definition dieser Idee: S und T sollten zwei endliche Mengen sein, Alphabete, die als Quelle bzw. Ziel bekannt sind.

    Ein Code C:\, S \to T^* ist eine Gesamtfunktion, die jedes Symbol von S auf eine Sequenz von Symbolen über T abbildet.

    Die Erweiterung C' von C ist ein Homomorphismus von S^{*} in T^{*} , Es wandelt automatisch jeden Satz von Quellsymbolen in einen Satz von Zielsymbolen um.

    In diesem Abschnitt sprechen wir über Codes, die jedes Quellzeichen (Klartext) in ein Codewort aus einem Wörterbuch übersetzen, das bei Verkettung eine codierte Zeichenfolge ergibt. Wenn Klartextzeichen unterschiedliche Wahrscheinlichkeiten haben, sind Codes mit variabler Länge äußerst hilfreich. Siehe auch Entropiekodierung.

    Ein Präfixcode ist ein Code, der die Eigenschaft Präfixeigenschaft besitzt: Kein anderes gültiges Codewort in der Menge hat ein Präfix (Start), das auch ein gültiges Codewort im System ist. Der bekannteste Algorithmus zur Generierung von Präfixcodes ist die Huffman-Codierung. Auch wenn der Präfixcode nicht von einer Huffman-Methode generiert wurde, wird er häufig als Huffman-Codes bezeichnet. Die Länder- und Verlagsabschnitte von ISBNs, Ländervorwahlen und die sekundären Synchronisationscodes, die vom UMTS WCDMA 3G Wireless Standard verwendet werden, sind zusätzliche Instanzen von Präfixcodes.

    Die möglichen Mengen von Codewortlängen in einem Präfixcode werden durch die Kraftsche Ungleichung beschrieben. Fast jeder Eins-zu-Viele-Code, der eindeutig dekodiert werden kann, nicht nur Präfixcodes, muss Krafts Ungleichung erfüllen.

    Darüber hinaus können Codes verwendet werden, um Daten so darzustellen, dass sie widerstandsfähiger gegen Übertragungs- oder Speicherfehler sind. Die Art und Weise, wie dieser angeblich fehlerkorrigierende Code funktioniert, besteht darin, Redundanz sorgfältig in die gespeicherten (oder übertragenen) Daten zu konstruieren. Beispiele hierfür sind die Raum-Zeit-Codes, Paritätsprüfungscodes mit niedriger Dichte, Reed-Solomon, Reed-Muller, Walsh-Hadamard, Bose-Chaudhuri-Hochquenghem, Turbo, Golay und Goppa. Fehlererkennungsalgorithmen können verbessert werden, um zufällige oder Burst-Fehler zu finden.

    Durch das Ersetzen von Wörtern wie Schiff oder Rechnung durch kürzere Wörter ermöglicht ein Kabelcode, dass dieselben Informationen mit weniger Zeichen, schneller und für weniger Geld übermittelt werden können.

    Der Kürze halber können

    Gefällt Ihnen die Vorschau?
    Seite 1 von 1