Inhaltsbasierter Bildabruf: Visuelle Datenbanken freischalten
Von Fouad Sabry
()
Über dieses E-Book
Was ist inhaltsbasierter Bildabruf?
Inhaltsbasierter Bildabruf, auch bekannt als Abfrage nach Bildinhalt und inhaltsbasierter visueller Informationsabruf (CBVIR), ist die Anwendung von Computer-Vision-Techniken bis hin zum Problem des Bildabrufs, also der Schwierigkeit, in großen Datenbanken nach digitalen Bildern zu suchen. Andere Namen für diese Technik sind inhaltsbasierter visueller Informationsabruf. Im Gegensatz zu den herkömmlichen konzeptbasierten Methoden ist die inhaltsbasierte Bildsuche eine neuere Entwicklung.
Ihr Nutzen
(I) Insights und Validierungen zu den folgenden Themen:
Kapitel 1: Inhaltsbasierter Bildabruf
Kapitel 2: Informationsabruf
Kapitel 3: Bildabruf
Kapitel 4: Automatische Bildanmerkung
Kapitel 5: Tag-Cloud
Kapitel 6: Videosuchmaschine
Kapitel 7: Bild-Organizer
Kapitel 8: Bild-Metasuche
Kapitel 9: Umgekehrte Bildsuche
Kapitel 10: Visuelle Suchmaschine
(II) Beantwortung der öffentlichen Frage Fragen zum inhaltsbasierten Bildabruf.
(III) Beispiele aus der Praxis für den Einsatz des inhaltsbasierten Bildabrufs in vielen Bereichen.
Für wen dieses Buch gedacht ist
Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die für jede Art von inhaltsbasierter Bildsuche über das Grundwissen oder die Informationen hinausgehen möchten.
Mehr von Fouad Sabry lesen
Neue Technologien In Der Materialwissenschaft [German]
Ähnlich wie Inhaltsbasierter Bildabruf
Titel in dieser Serie (100)
Multispektrale Bildgebung: Das Spektrum erschließen: Fortschritte in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden Bewertung: 0 von 5 Sternen0 BewertungenComputer Vision: Erkundung der Tiefen des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAffine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenComputer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildkompression: Effiziente Techniken zur visuellen Datenoptimierung Bewertung: 0 von 5 Sternen0 BewertungenLärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung Bewertung: 0 von 5 Sternen0 BewertungenTonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenInpainting: Überbrückung von Lücken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenUnterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen Bewertung: 0 von 5 Sternen0 BewertungenFarbraum: Erkundung des Spektrums von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenRetinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex Bewertung: 0 von 5 Sternen0 BewertungenHough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFilterbank: Einblicke in die Filterbanktechniken von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard Bewertung: 0 von 5 Sternen0 BewertungenHadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik Bewertung: 0 von 5 Sternen0 BewertungenRadon-Transformation: Aufdecken verborgener Muster in visuellen Daten Bewertung: 0 von 5 Sternen0 BewertungenHomographie: Homographie: Transformationen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAnisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion Bewertung: 0 von 5 Sternen0 BewertungenFarbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenHistogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenModell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen Bewertung: 0 von 5 Sternen0 BewertungenEpipolare Geometrie: Erschließung der Tiefenwahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarbmanagementsystem: Optimierung der visuellen Wahrnehmung in digitalen Umgebungen Bewertung: 0 von 5 Sternen0 BewertungenAdaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung Bewertung: 0 von 5 Sternen0 BewertungenDirekte lineare Transformation: Praktische Anwendungen und Techniken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGeometrisches Hashing: Effiziente Algorithmen zur Bilderkennung und -anpassung Bewertung: 0 von 5 Sternen0 BewertungenCanny Edge Detector: Enthüllung der Kunst der visuellen Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenKonturerkennung: Enthüllung der Kunst der visuellen Wahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 Bewertungen
Ähnliche E-Books
Kontextuelle Bildklassifizierung: Visuelle Daten für eine effektive Klassifizierung verstehen Bewertung: 0 von 5 Sternen0 BewertungenAutomatische Bildanmerkung: Verbesserung des visuellen Verständnisses durch automatisiertes Tagging Bewertung: 0 von 5 Sternen0 BewertungenLernen geometrischer Merkmale: Visuelle Einblicke durch das Lernen geometrischer Merkmale erschließen Bewertung: 0 von 5 Sternen0 BewertungenSkalierungsinvariante Feature-Transformation: Enthüllung der Leistungsfähigkeit der skaleninvarianten Merkmalstransformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildsegmentierung: Erkenntnisse durch Pixelpräzision erschließen Bewertung: 0 von 5 Sternen0 BewertungenObjekterkennung: Fortschritte, Anwendungen und Algorithmen Bewertung: 0 von 5 Sternen0 BewertungenBildabruf: Erschließen Sie die Kraft visueller Daten Bewertung: 0 von 5 Sternen0 BewertungenComputer Vision: Erkundung der Tiefen des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGesichtserkennungssystem: Erschließen Sie die Kraft der visuellen Intelligenz Bewertung: 0 von 5 Sternen0 BewertungenAktives Erscheinungsmodell: Erschließung der Leistungsfähigkeit aktiver Darstellungsmodelle in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenSynthese anzeigen: Erkundung von Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenUmgekehrte Bildsuche: Entdecken Sie die Geheimnisse der visuellen Erkennung Bewertung: 0 von 5 Sternen0 BewertungenBildkompression: Effiziente Techniken zur visuellen Datenoptimierung Bewertung: 0 von 5 Sternen0 BewertungenNeo4j 2.0: Eine Graphdatenbank für alle Bewertung: 0 von 5 Sternen0 BewertungenVisuelles Sensornetzwerk: Erkundung der Leistungsfähigkeit visueller Sensornetzwerke in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenMerkmalskonstruktion für Machine Learning: Prinzipien und Techniken der Datenaufbereitung Bewertung: 0 von 5 Sternen0 BewertungenOptische Braille-Erkennung: Ermöglichung der Barrierefreiheit durch visuelle Intelligenz Bewertung: 0 von 5 Sternen0 BewertungenDokumentmosaikierung: Visuelle Einblicke durch Dokumentmosaikierung erschließen Bewertung: 0 von 5 Sternen0 BewertungenVektorgrafik-Editor: Ermöglichen Sie die visuelle Erstellung mit fortschrittlichen Algorithmen Bewertung: 0 von 5 Sternen0 BewertungenEigenface: Erkunden Sie die Tiefen der visuellen Erkennung mit Eigenface Bewertung: 0 von 5 Sternen0 BewertungenRastergrafik-Editor: Visuelle Realitäten transformieren: Rastergrafik-Editoren in Computer Vision beherrschen Bewertung: 0 von 5 Sternen0 BewertungenBlob-Erkennung: Aufdecken von Mustern in visuellen Daten Bewertung: 0 von 5 Sternen0 BewertungenApache Mahout: Empfehlen, clustern, klassifizieren Bewertung: 0 von 5 Sternen0 BewertungenSchätzung der artikulierten Körperhaltung: Erschließung menschlicher Bewegung in Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenCSS: Grundlagen und Best Practices Bewertung: 0 von 5 Sternen0 BewertungenAphelion-Software: Vision freischalten: Erkundung der Tiefen der Aphelion-Software Bewertung: 0 von 5 Sternen0 BewertungenBewegungsschätzung: Fortschritte und Anwendungen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenQualitative und quantitative Ursache-Wirkungsmodellierung: Komplexitätsmanagement mit dem iMODELER (Version 7.0) und der systemischen KNOW-WHY-Methode Bewertung: 0 von 5 Sternen0 Bewertungen
Künstliche Intelligenz (KI) & Semantik für Sie
Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI Bewertung: 0 von 5 Sternen0 BewertungenChatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit Bewertung: 0 von 5 Sternen0 BewertungenChatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken Bewertung: 0 von 5 Sternen0 BewertungenKI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch Bewertung: 0 von 5 Sternen0 BewertungenDie KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen Bewertung: 1 von 5 Sternen1/5ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler Bewertung: 0 von 5 Sternen0 BewertungenRoboter im Alltag: Maschinen (beinahe) wie Menschen Bewertung: 0 von 5 Sternen0 BewertungenEinstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz: Die vierte industrielle Revolution Bewertung: 0 von 5 Sternen0 BewertungenWissen statt Glauben!: Das Weltbild des neuen Humanismus Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen Bewertung: 0 von 5 Sternen0 BewertungenPsychologie des Sozialismus Bewertung: 0 von 5 Sternen0 BewertungenMeistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz in Sozialen Medien Bewertung: 0 von 5 Sternen0 BewertungenMenschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5 Bewertung: 0 von 5 Sternen0 BewertungenDigitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit? Bewertung: 0 von 5 Sternen0 BewertungenAufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen Bewertung: 0 von 5 Sternen0 Bewertungen
Rezensionen für Inhaltsbasierter Bildabruf
0 Bewertungen0 Rezensionen
Buchvorschau
Inhaltsbasierter Bildabruf - Fouad Sabry
Kapitel 1: Inhaltsbasierter Bildabruf
Mit Hilfe von Computer-Vision-Techniken löst der inhaltsbasierte Bildabruf (auch bekannt als Query by Image Content (QBIC) und Content-based Visual Information Retrieval (CBVIR)) das Problem der Suche nach digitalen Bildern in großen Datenbanken (siehe diese Umfrage für einen wissenschaftlichen Überblick über das CBIR-Feld). Traditionelle konzeptbasierte Ansätze werden durch inhaltsbasierte Bildabrufe in Frage gestellt (siehe Konzeptbasierte Bildindizierung).
Wenn nach einem Bild gesucht wird, bedeutet inhaltsbasiert
, dass die Suche nicht auf Metadaten wie Schlüsselwörtern, Tags oder Beschreibungen basiert, sondern auf dem Bild selbst. Farben, Formen, Texturen und alle anderen Informationen, die aus einem Bild extrapoliert werden können, sind Beispiele für Inhalt
in diesem Sinne. Da die reine Metadatensuche so sehr von der Qualität und Vollständigkeit der Annotation abhängt, ist CBIR sehr wünschenswert.
Ein Mensch, der Bilder in einer großen Datenbank mit Schlüsselwörtern oder Metadaten manuell kommentiert hat, kann ein zeitaufwändiger Prozess sein, der möglicherweise immer noch nicht alle gewünschten Schlüsselwörter erfasst. Es ist nicht klar definiert, wie die Wirksamkeit der Keyword-Bildersuche gemessen werden kann. In ähnlicher Weise haben CBIR-Systeme Schwierigkeiten, wenn sie versuchen, Erfolg zu definieren.
Toshikazu Kato, ein Ingenieur am Japanischen Elektrotechnischen Labor, hat 1992 den Begriff inhaltsbasierter Bildabruf
geprägt, um seine Arbeit an einem System zu beschreiben, das Bilder automatisch aus einer Datenbank abrufen kann, indem es die darin enthaltenen Farben und Formen analysiert.
IBMs QBIC war das erste kommerziell erhältliche CBIR-System (Query By Image Content).
Da metadatenbasierte Systeme ihre eigenen Einschränkungen haben und ein effizienter Bildabruf für so viele verschiedene Arten von Anwendungen eingesetzt werden kann, ist das Interesse an CBIR gestiegen. Die bestehende Technologie macht es einfach, nach Textinformationen über Bilder zu suchen, aber diese Methode erfordert, dass Menschen jedes Bild in der Datenbank manuell beschreiben. Bei extrem großen Datenbanken oder automatisch generierten Bildern (z. B. von Überwachungskameras) kann dies unpraktisch sein. Bilder, die mit mehreren Synonymen beschrieben werden, können ebenfalls unbemerkt bleiben. Semantische Bildklassifizierungssysteme, die Katze
als Unterklasse von Tier
behandeln, sind immun gegen das Problem der Fehlkategorisierung, aber sie zwingen den Benutzer, härter zu arbeiten, um Bilder zu finden, die Katzen sein könnten, aber stattdessen als Tiere gekennzeichnet sind. Es gibt eine Fülle von Bildklassifizierungsstandards, aber sie alle werden von Skalierungs- und Fehlklassifizierungsproblemen geplagt.
Trotz der Verbreitung von CBIR-Systemen wurde das Problem des Abrufs von Bildern auf der Grundlage ihres Pixelgehalts noch 2006 nicht zufriedenstellend gelöst.
Verschiedene CBIR-Implementierungen und Abfragemethoden verwenden eine Vielzahl von Benutzerabfrageformaten.
Diese Abfragemethode wird als QBE oder Query By Example
bezeichnet.
Beispiele für Bilder, die zum Trainieren des Systems verwendet werden können, sind:
Es wird ein vom Benutzer bereitgestelltes oder zufällig ausgewähltes vorhandenes Image verwendet.
Der Benutzer fertigt eine gekritzelte Skizze des gewünschten Bildes an, die ihm möglicherweise nur in groben Farbstrichen oder einigen Grundformen ähnelt.
Diese Abfragemethode beseitigt die Probleme, die auftreten können, wenn Sie versuchen, visuelle Inhalte nur mit Text zu beschreiben.
Benutzergenerierte Abfragen, wie z. B. Finde Bilder von Abraham Lincoln
, dienen als Grundlage für das semantische Retrieval. Computer haben große Probleme mit dieser Art von unstrukturierter Arbeit; Lincoln schaut vielleicht nicht immer in die Kamera oder behält die gleiche Pose bei. Daher werden Textur, Farbe und Form häufig in CBIR-Systemen verwendet. Entweder werden Schnittstellen, die die Eingabe der Kriterien vereinfachen, zusammen mit diesen Merkmalen verwendet, oder Datenbanken, die bereits für den Abgleich von Merkmalen (z. B. Gesichter, Fingerabdrücke oder Formabgleich) trainiert wurden. Für den Bildabruf ist jedoch in der Regel menschlicher Input erforderlich, um abstrakte Konzepte zu erkennen.
Es kann eine Herausforderung sein, die verschiedenen CBIR-Suchtechniken mit der Vielzahl möglicher Benutzer und ihrer Absichten zu kombinieren. Die Fähigkeit, die Absichten des Benutzers abzuleiten, ist entscheidend für den Erfolg von CBIR.
Der Einsatz von maschinellem Lernen und iterativen Methoden in CBIR ist auf dem Vormarsch.
Neben den oben genannten Methoden gibt es auch multimodale Abfragen,