Bildsegmentierung: Erkenntnisse durch Pixelpräzision erschließen

eBook153 Seiten1 Stunde

Bildsegmentierung: Erkenntnisse durch Pixelpräzision erschließen

Name: Bildsegmentierung: Erkenntnisse durch Pixelpräzision erschließen
Author: Fouad Sabry

Von Fouad Sabry

Bewertung: 0 von 5 Sternen

()

Vorschau lesen

Über dieses E-Book

Was ist Bildsegmentierung

In der digitalen Bildverarbeitung und Computer Vision ist Bildsegmentierung der Prozess der Aufteilung eines digitalen Bildes in mehrere Bildsegmente, auch Bildregionen genannt Bildobjekte. Das Ziel der Segmentierung besteht darin, die Darstellung eines Bildes zu vereinfachen und/oder in etwas zu ändern, das aussagekräftiger und einfacher zu analysieren ist. Bildsegmentierung wird typischerweise verwendet, um Objekte und Grenzen in Bildern zu lokalisieren. Genauer gesagt ist Bildsegmentierung der Prozess, bei dem jedem Pixel in einem Bild eine Beschriftung zugewiesen wird, sodass Pixel mit derselben Beschriftung bestimmte Eigenschaften aufweisen.

Ihre Vorteile

(I) Erkenntnisse und Validierungen zu den folgenden Themen:

Kapitel 1: Bildsegmentierung

Kapitel 2: Kantenerkennung

Kapitel 3: Skalierungsinvariante Feature-Transformation

Kapitel 4: Schwellenwert (Bildverarbeitung)

Kapitel 5: Otsus Methode

Kapitel 6: Eckenerkennung

Kapitel 7: Graphenschnitte in Computer Vision

Kapitel 8: Mittlere Verschiebung

Kapitel 9: Bereichssegmentierung

Kapitel 10: Wasserscheide (Bildverarbeitung)

(II) Beantwortung der häufigsten öffentlichen Fragen zur Bildsegmentierung.

(III) Beispiele aus der Praxis für die Verwendung der Bildsegmentierung in vielen Bereichen.

Für wen sich dieses Buch eignet:

Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über grundlegende Kenntnisse oder Informationen für jede Art von Bildsegmentierung hinausgehen möchten.

Karussell überspringen

SpracheDeutsch

HerausgeberEine Milliarde Sachkundig [German]

Erscheinungsdatum11. Mai 2024

Autor

Fouad Sabry

Mehr von Fouad Sabry lesen

Karussell überspringen

Neue Technologien In Der Luft Und Raumfahrt [German]
eBook-Reihen
Neue Technologien In Der Luft Und Raumfahrt [German]
vonFouad Sabry
Neue Technologien In Der Elektronik [German]
eBook-Reihen
Neue Technologien In Der Elektronik [German]
vonFouad Sabry
Neue Technologien in den Neurowissenschaften [German]
eBook-Reihen
Neue Technologien in den Neurowissenschaften [German]
vonFouad Sabry
Neue Technologien Im Transportwesen [German]
eBook-Reihen
Neue Technologien Im Transportwesen [German]
vonFouad Sabry

Ähnlich wie Bildsegmentierung

Titel in dieser Serie (100)

Karussell überspringen

Histogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung
eBook
Histogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Gamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik
eBook
Gamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Computer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision
eBook
Computer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Anisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion
eBook
Anisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Tonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision
eBook
Tonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Unterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen
eBook
Unterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Bildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden
eBook
Bildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Affine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision
eBook
Affine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Retinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex
eBook
Retinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Visuelle Wahrnehmung: Einblicke in die computergestützte visuelle Verarbeitung
eBook
Visuelle Wahrnehmung: Einblicke in die computergestützte visuelle Verarbeitung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Inpainting: Überbrückung von Lücken in der Computer Vision
eBook
Inpainting: Überbrückung von Lücken in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Bildkompression: Effiziente Techniken zur visuellen Datenoptimierung
eBook
Bildkompression: Effiziente Techniken zur visuellen Datenoptimierung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Computer Vision: Erkundung der Tiefen des Computer Vision
eBook
Computer Vision: Erkundung der Tiefen des Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Hough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision
eBook
Hough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Kantenerkennung: Grenzen in der Computer Vision erkunden
eBook
Kantenerkennung: Grenzen in der Computer Vision erkunden
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farbraum: Erkundung des Spektrums von Computer Vision
eBook
Farbraum: Erkundung des Spektrums von Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Radon-Transformation: Aufdecken verborgener Muster in visuellen Daten
eBook
Radon-Transformation: Aufdecken verborgener Muster in visuellen Daten
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Filterbank: Einblicke in die Filterbanktechniken von Computer Vision
eBook
Filterbank: Einblicke in die Filterbanktechniken von Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Gemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard
eBook
Gemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Harris Eckendetektor: Enthüllung der Magie der Bildmerkmalserkennung
eBook
Harris Eckendetektor: Enthüllung der Magie der Bildmerkmalserkennung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Hadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision
eBook
Hadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Modell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen
eBook
Modell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Lärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung
eBook
Lärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Orientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung
eBook
Orientiertes Gradienten-Histogramm: Enthüllung des visuellen Bereichs: Erkundung des Histogramms mit orientierten Farbverläufen in der Bildverarbeitung
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Homographie: Homographie: Transformationen in der Computer Vision
eBook
Homographie: Homographie: Transformationen in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen
eBook
Farbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Konturerkennung: Enthüllung der Kunst der visuellen Wahrnehmung in der Computer Vision
eBook
Konturerkennung: Enthüllung der Kunst der visuellen Wahrnehmung in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Farbmodell: Das Spektrum des Computer Vision verstehen: Farbmodelle erkunden
eBook
Farbmodell: Das Spektrum des Computer Vision verstehen: Farbmodelle erkunden
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Zufallsstichprobenkonsens: Robuste Schätzung in der Computer Vision
eBook
Zufallsstichprobenkonsens: Robuste Schätzung in der Computer Vision
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen
Blob-Erkennung: Aufdecken von Mustern in visuellen Daten
eBook
Blob-Erkennung: Aufdecken von Mustern in visuellen Daten
vonFouad Sabry
Bewertung: 0 von 5 Sternen
0 Bewertungen

Künstliche Intelligenz (KI) & Semantik für Sie

Karussell überspringen

Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit
eBook
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit
vonSvetlana Badak
Bewertung: 0 von 5 Sternen
0 Bewertungen
ChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5
eBook
ChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5
vonRolf Jeger
Bewertung: 0 von 5 Sternen
0 Bewertungen
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
eBook
ChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler
vonChrista Stuber
Bewertung: 0 von 5 Sternen
0 Bewertungen
Chatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken
eBook
Chatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken
vonSvetlana Badak
Bewertung: 0 von 5 Sternen
0 Bewertungen
Psychologie des Sozialismus
eBook
Psychologie des Sozialismus
vonGustave Le Bon
Bewertung: 0 von 5 Sternen
0 Bewertungen
Künstliche Intelligenz: Die vierte industrielle Revolution
eBook
Künstliche Intelligenz: Die vierte industrielle Revolution
vonVasil Teigens
Bewertung: 0 von 5 Sternen
0 Bewertungen
KI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch
eBook
KI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch
vonJhon Dujardin
Bewertung: 0 von 5 Sternen
0 Bewertungen
ChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen
eBook
ChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen
vonHema
Bewertung: 0 von 5 Sternen
0 Bewertungen
Roboter im Alltag: Maschinen (beinahe) wie Menschen
eBook
Roboter im Alltag: Maschinen (beinahe) wie Menschen
vonAndreas Dripke
Bewertung: 0 von 5 Sternen
0 Bewertungen
Die KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen
eBook
Die KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen
vonJhon Dujardin
Bewertung: 1 von 5 Sternen
1/5
Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German
eBook
Meistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German
vonVasyl Kolomiiets
Bewertung: 0 von 5 Sternen
0 Bewertungen
GPT-4: Ein umfassender Leitfaden mit Unterschieden zu GPT-3 und Anwendungsbeispielen: ChatGPT4, GPT-3 - eine kleine Zeitreise in die Vergangenheit und Zukunft
eBook
GPT-4: Ein umfassender Leitfaden mit Unterschieden zu GPT-3 und Anwendungsbeispielen: ChatGPT4, GPT-3 - eine kleine Zeitreise in die Vergangenheit und Zukunft
vonHenrik Roth
Bewertung: 0 von 5 Sternen
0 Bewertungen
Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI
eBook
Die Zukunft der Arbeit: Digitalisierung, Automatisierung, KI
vonFrankfurter Allgemeine Archiv
Bewertung: 0 von 5 Sternen
0 Bewertungen
Menschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt
eBook
Menschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt
vonEdwin Hübner
Bewertung: 0 von 5 Sternen
0 Bewertungen
Wissen statt Glauben!: Das Weltbild des neuen Humanismus
eBook
Wissen statt Glauben!: Das Weltbild des neuen Humanismus
vonBernd Vowinkel
Bewertung: 0 von 5 Sternen
0 Bewertungen
Künstliche Intelligenz in Sozialen Medien
eBook
Künstliche Intelligenz in Sozialen Medien
vonIntroBooks Team
Bewertung: 0 von 5 Sternen
0 Bewertungen
Die destruktive Wirkung der Informationstechnologie auf die intellektuelle Entwicklung des Menschen: Eine technophilosophische Betrachtung
eBook
Die destruktive Wirkung der Informationstechnologie auf die intellektuelle Entwicklung des Menschen: Eine technophilosophische Betrachtung
vonTom Landon
Bewertung: 1 von 5 Sternen
1/5
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
eBook
Einstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte
vonShahin Amiriparian
Bewertung: 0 von 5 Sternen
0 Bewertungen
Aufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen
eBook
Aufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen
vonMartin Ford
Bewertung: 0 von 5 Sternen
0 Bewertungen
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
eBook
Digitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit?
vonSascha Berger
Bewertung: 0 von 5 Sternen
0 Bewertungen

Buchvorschau

Bildsegmentierung - Fouad Sabry

Kapitel 1: Bildsegmentierung

Die Bildsegmentierung, auch bekannt als Bildbereichs- oder Objektsegmentierung, ist eine Technik, die in der Computer Vision und Bildverarbeitung verwendet wird, um ein digitales Bild in kleinere, überschaubarere Teile (Pixelsätze) zu unterteilen. Der Zweck der Segmentierung besteht darin, die Darstellung eines Bildes in eine verständlichere und informativere umzuwandeln. Das Segmentieren eines Bildes ist eine gängige Technik zum Auffinden von Merkmalen wie Linien, Kurven und anderen Berandungen in einem Bild. Genauer gesagt ist die Bildsegmentierung der Prozess der Beschriftung jedes Pixels in einem Bild, sodass Pixel mit derselben Beschriftung gemeinsame Eigenschaften haben.

Das Segmentieren eines Bildes ergibt eine Sammlung von Unterbildern oder Konturen, die zusammen das Originalbild bilden (siehe Kantenerkennung). Alle Pixel in einem bestimmten Bereich weisen eine Ähnlichkeit in mindestens einer berechneten Eigenschaft auf, z. B. Farbton, Sättigung oder Textur. Unterschiedliche Farbgebung zwischen benachbarten Regionen für dieselben Features.

Die Bildsegmentierung hat viele praktische Anwendungen, einschließlich der folgenden:

Bildabruf basierend auf dem Inhalt

Industrielle Bildverarbeitung

Diagnostische Bildgebungsverfahren wie Computertomographie (CT) und Magnetresonanztomographie (MRT) mit Volumenwiedergabe.

Diagnostizieren Sie Krebs und andere Pathologien

Messen Sie das Gewebevolumen

Studium der Anatomie und Diagnose

OP-Planung

Virtuelle Operationssimulation

Nicht funktionsfähige Leitsysteme

Strahlentherapie

Objekterkennung

Fußgängererkennung

Gesichtserkennung

Bremslicht-Erkennung

Erkennen Sie Dinge in Weltraumbildern (Straßen, Wälder, Feldfrüchte usw.)

Erkennungsaufgaben

Gesichtserkennung

Fingerabdruck-Erkennung

Iris-Erkennung

Verkehrsleitsysteme

Videoüberwachung

Aktionserkennung und Co-Segmentierung in Videos

Zahlreiche universelle Algorithmen und Methoden zur Bildsegmentierung wurden entwickelt. Diese Methoden erfordern in der Regel domänenspezifisches Wissen, um effektiv auf Segmentierungsprobleme innerhalb einer bestimmten Domäne angewendet zu werden.

Es gibt zwei Arten von Segmentierungsmethoden.

Konventionelle Techniken in der Computer Vision

KI-basierte Techniken

Die semantische Segmentierung ist eine Methode, die jedem einzelnen Pixel eines Objekts eine Klasse zuweist. Die Segmentierung einer Figur in ihre Bestandteile wie ihre Menschen und ihren Hintergrund würde zu zwei unterschiedlichen Objekten führen.

Die Instanzsegmentierung ist eine Methode, die jedes Pixel der richtigen Objektinstanz zuweist. Er findet jedes einzelne Objekt im Bild. Die Segmentierung wird beispielsweise verwendet, wenn jeder einzelne Teil einer Figur als separate Einheit behandelt wird.

Semantische und Instanzsegmentierung werden in der panoptischen Segmentierung zusammengeführt. Ähnlich wie bei der semantischen Segmentierung bestimmt die panoptische Segmentierung die Klassenzugehörigkeit des Pixels. Die panoptische Segmentierung kann im Gegensatz zur semantischen Segmentierung Mitglieder derselben Klasse unterscheiden.

Schwellenwerte sind die einfachste Methode der Bildsegmentierung. Der Clip-Level (oder Schwellenwert) ist die Grundlage dieser Technik zum Konvertieren eines Graustufenbildes in ein binäres Bild.

Die Auswahl des geeigneten Schwellenwerts ist für diesen Ansatz entscheidend (oder Werte, wenn mehrere Ebenen ausgewählt sind). Die Methode der maximalen Entropie, die Methode der ausgeglichenen Histogramm-Schwellenwerte, die Methode von Otsu (maximale Varianz) und die k-Means-Clustering-Methode sind in der Wirtschaft weit verbreitet.

In letzter Zeit sind Schwellentechniken für Computertomographie (CT)-Bilder aufgetaucht. Die Hauptidee ist, dass die Schwellenwerte aus den Röntgenbildern abgeleitet werden und nicht aus dem (rekonstruierten) Bild, wie bei Otsus Methode.

Um ein Bild in K-Gruppen zu unterteilen, verwendet der K-Means-Algorithmus iterative Techniken. Standardverfahren ist

Wählen Sie K Knoten für einen Cluster nach dem Zufallsprinzip oder mit einer heuristischen Technik wie K-Means++ aus.

Pixel sollten Clustern basierend auf der kürzesten Entfernung zu den Cluster-Mittelpunkten zugewiesen werden.

Berechnen Sie Cluster-Mittelpunkte neu, indem Sie Cluster-Pixel mitteln.

Um eine Konvergenz zu erreichen, sollten die Schritte 2 und 3 wiederholt werden (d. h. keine Pixel wechseln die Cluster).

Der Abstand zwischen einem einzelnen Pixel und dem Mittelpunkt eines Clusters wird als quadratischer oder absoluter Abstand ausgedrückt. Farbe, Helligkeit, Textur und Position einzelner Pixel oder eine Kombination davon spielen oft eine Rolle bei der Feststellung der Unterscheidung. Der Wert von K kann empirisch, beliebig oder heuristisch gewählt werden. Es gibt eine Konvergenzgarantie für diesen Algorithmus, aber er liefert möglicherweise nicht die beste Antwort. Die Wirksamkeit der Lösung wird durch die eingangs angegebene Anzahl von Clustern und den Parameter K bestimmt.

Der Mean Shift-Algorithmus ist eine Methode zum Gruppieren von Bildern in Teilmengen, deren Anzahl nicht im Voraus bestimmt werden kann. Die Tatsache, dass dies keine Vorkenntnisse über einen solchen Parameter erfordert, macht es zu einer überlegenen allgemeinen Lösung für ein breiteres Spektrum von Problemen.

Um die Segmentierung durchzuführen, verwendet die bewegungsbasierte Methode die Bewegungsinformationen des Bildes.

Das Konzept ist einfach: Vergleichen und kontrastieren Sie einfach zwei Bilder. Wenn das Ziel der Studie in Bewegung ist, ist die Differenz das Ziel selbst.

Kenney et al. [2] schlugen die interaktive Segmentierung als Verbesserung dieser Idee vor. Um das für die bewegungsbasierte Segmentierung erforderliche Bewegungssignal zu erzeugen, wird ein Roboter verwendet, um an Objekten zu stochern.

Dov Katz [3, 4] und Oliver Brock [3, 4] schlugen den interaktiven Wahrnehmungsrahmen vor, auf dem die interaktive Segmentierung basiert.

Die bewegungsbasierte starre Bewegungssegmentierungstechnik ist eine weitere Option.

Nach den Grundsätzen komprimierungsbasierter Ansätze ist der beste Weg, Daten in überschaubare Blöcke aufzuteilen, wobei die kleinste Codierungslänge die optimale Lösung ist. Die Segmentierung sucht nach Mustern in einem Bild, und diese Muster können ausgenutzt werden, um komprimierte Versionen des Originals zu erstellen. Die Technik charakterisiert jeden Abschnitt durch seine Grenzstruktur und Kontur. Um die Codierungslänge jedes dieser Teile zu bestimmen, verwenden wir Wahrscheinlichkeitsverteilungsfunktionen als Modelle:

Die glatte Kontur von Regionen in natürlichen Bildern wird durch die Grenzkodierung ausgenutzt. Die Huffman-Codierung verwendet dies vor dem Codieren des Differenzkettencodes der Konturen eines Bildes. Je kürzer die Codierungslänge, desto glatter die Grenze.

Die verlustbehaftete Komprimierung wird verwendet, um Texturen analog zum MDL-Prinzip zu codieren. Die Länge der Daten, die dem Modell gegeben sind, entspricht jedoch ungefähr der Anzahl der Stichproben multipliziert mit der Entropie des Modells. Eine multivariate Normalverteilung wird verwendet, um die Textur in jedem Bereich zu modellieren, und die Entropie dieser Verteilung kann in geschlossener Form ausgedrückt werden. Die geschätzte Entropie hat Obergrenzen, die mit der wahren Entropie der Daten übereinstimmen, was eine faszinierende Eigenschaft dieses Modells ist. Dies liegt an der Tatsache, dass die Entropie einer Normalverteilung die höchste aller Verteilungen für einen bestimmten Mittelwert und eine bestimmte Kovarianz ist. Aus diesem Grund kann das Ziel des Algorithmus, die Codierung zu minimieren, die tatsächliche Codierungslänge nicht überschreiten.

Die Anzahl der Bits, die benötigt werden, um ein Bild basierend auf einer bestimmten Segmentierung zu kodieren, wird nach diesem Schema berechnet. Daher besteht das Ziel darin, unter allen möglichen Bildsegmentierungen diejenige zu identifizieren, die die kürzeste Codierungslänge ergibt. Ein einfacher agglomerativer Clustering-Ansatz reicht hier aus. Die Grobheit der Segmentierung wird durch verlustbehaftete Komprimierungsverzerrung festgelegt, und die beste Einstellung kann sich von Bild zu Bild ändern. Dieser Parameter kann grob geschätzt werden, indem der Texturkontrast eines Bildes als Richtlinie verwendet wird. Eine stärkere Empfindlichkeit und damit eine geringere Quantisierung ist erforderlich, wenn z. B. die Texturen in einem Bild ähnlich sind, wie bei Tarnbildern.

Im Vergleich zu anderen Bildsegmentierungstechniken zeichnen sich histogrammbasierte Methoden dadurch aus, dass sie in der Regel nur einen einzigen Durchgang durch die Pixel benötigen. Bei der Methode wird ein Histogramm aus den Pixeln des Bildes erstellt und dann die Spitzen und Täler des Histogramms verwendet, um die Cluster zu lokalisieren. Die Skala kann auf Farbton oder Helligkeit basieren.

Die rekursive Anwendung der Histogramm-Suchmethode auf Bildcluster, um sie in kleinere Cluster zu unterteilen, ist eine Verfeinerung dieser Technik. Bis keine neuen Cluster mehr gebildet werden können, wird dieser Vorgang mit immer kleineren Clustern wiederholt.

Es kann schwierig sein, wirklich signifikante Höhen und Tiefen in einem Bild zu erkennen, wenn Sie die Technik der

Gefällt Ihnen die Vorschau?

Seite 1 von 1

Bildsegmentierung: Erkenntnisse durch Pixelpräzision erschließen

Über dieses E-Book

Fouad Sabry

Mehr von Fouad Sabry lesen

Ähnliche Autoren

Ähnlich wie Bildsegmentierung

Titel in dieser Serie (100)

Ähnliche E-Books

Künstliche Intelligenz (KI) & Semantik für Sie

Ähnliche Podcast-Episoden

Ähnliche Artikel

Verwandte Kategorien

Rezensionen für Bildsegmentierung

Wie hat es Ihnen gefallen?

Buchvorschau

Bildsegmentierung - Fouad Sabry

Kapitel 1: Bildsegmentierung