Computer-Vision-Grafikschnitte: Erforschung von Graphschnitten in der Computer Vision
Von Fouad Sabry
()
Über dieses E-Book
Was ist Computer Vision Graph Cuts?
Bei der Anwendung im Bereich Computer Vision kann die Graph Cut-Optimierung eingesetzt werden, um eine Vielzahl von Low-Level-Computer Vision-Problemen effizient zu lösen Probleme wie Bildglättung, Stereokorrespondenzproblem, Bildsegmentierung, Objekt-Co-Segmentierung und viele andere Computer-Vision-Probleme, die im Hinblick auf Energieminimierung formuliert werden können. Viele dieser Energieminimierungsprobleme können durch die Lösung eines Maximalflussproblems in einem Diagramm angenähert werden. Bei den meisten Formulierungen solcher Probleme in der Bildverarbeitung entspricht die minimale Energielösung der maximalen a-posteriori-Schätzung einer Lösung. Obwohl viele Computer-Vision-Algorithmen das Schneiden eines Diagramms beinhalten, wird der Begriff „Graph Cuts“ speziell für Modelle verwendet, die eine Max-Flow/Min-Cut-Optimierung verwenden.
Ihre Vorteile
(I) Einblicke und Validierungen zu den folgenden Themen:
Kapitel 1: Diagrammschnitte in Computer Vision
Kapitel 2: Max-Flow min -Schnitt-Theorem
Kapitel 3: Bildsegmentierung
Kapitel 4: Schnitt (Graphentheorie)
Kapitel 5: Minimaler Schnitt
Kapitel 6: Watershed (Bildverarbeitung)
Kapitel 7: GrabCut
Kapitel 8: Random-Walker-Algorithmus
Kapitel 9: Graph-Cut-Optimierung
Kapitel 10: Videomatten
(II) Beantwortung der häufigsten öffentlichen Fragen zu Computer-Vision-Grafikschnitten.
(III) Beispiele aus der Praxis für die Verwendung von Computer-Vision-Grafikschnitten in vielen Bereichen Fachgebiete.
An wen sich dieses Buch richtet
Profis, Studenten und Doktoranden, Enthusiasten, Hobbyisten und diejenigen, die über das Grundwissen oder die Informationen hinausgehen möchten für jede Art von Computer Vision Graph Cuts.
Mehr von Fouad Sabry lesen
Neue Technologien In Der Energie [German]
Ähnlich wie Computer-Vision-Grafikschnitte
Titel in dieser Serie (100)
Bildhistogramm: Visuelle Einblicke enthüllen und die Tiefen von Bildhistogrammen in der Computer Vision erkunden Bewertung: 0 von 5 Sternen0 BewertungenLärmminderung: Verbesserung der Klarheit, fortschrittliche Techniken zur Rauschunterdrückung in der Bildverarbeitung Bewertung: 0 von 5 Sternen0 BewertungenGamma-Korrektur: Verbesserung der visuellen Klarheit in der Computer Vision: Die Gammakorrekturtechnik Bewertung: 0 von 5 Sternen0 BewertungenUnterwasser-Computervision: Erkundung der Tiefen der Computer Vision unter den Wellen Bewertung: 0 von 5 Sternen0 BewertungenModell des menschlichen visuellen Systems: Wahrnehmung und Verarbeitung verstehen Bewertung: 0 von 5 Sternen0 BewertungenFarbraum: Erkundung des Spektrums von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenRetinex: Enthüllen Sie die Geheimnisse des computergestützten Sehens mit Retinex Bewertung: 0 von 5 Sternen0 BewertungenHomographie: Homographie: Transformationen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenInpainting: Überbrückung von Lücken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAnisotrope Diffusion: Verbesserung der Bildanalyse durch anisotrope Diffusion Bewertung: 0 von 5 Sternen0 BewertungenComputer Vision: Erkundung der Tiefen des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenAktive Kontur: Weiterentwicklung der Computer Vision mit aktiven Konturtechniken Bewertung: 0 von 5 Sternen0 BewertungenTonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenKonturerkennung: Enthüllung der Kunst der visuellen Wahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenVisuelle Wahrnehmung: Einblicke in die computergestützte visuelle Verarbeitung Bewertung: 0 von 5 Sternen0 BewertungenAdaptiver Filter: Verbesserung der Computer Vision durch adaptive Filterung Bewertung: 0 von 5 Sternen0 BewertungenGemeinsame Fotoexpertengruppe: Erschließen Sie das Potenzial visueller Daten mit dem JPEG-Standard Bewertung: 0 von 5 Sternen0 BewertungenHistogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenRadon-Transformation: Aufdecken verborgener Muster in visuellen Daten Bewertung: 0 von 5 Sternen0 BewertungenAffine Transformation: Visuelle Perspektiven freischalten: Erforschung der affinen Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenCanny Edge Detector: Enthüllung der Kunst der visuellen Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenComputer-Stereo-Vision: Erforschung der Tiefenwahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFilterbank: Einblicke in die Filterbanktechniken von Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarberscheinungsmodell: Wahrnehmung und Darstellung in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenHough-Transformation: Enthüllung der Magie der Hough-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarbanpassungsfunktion: Spektrale Empfindlichkeit in Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenHadamard-Transformation: Enthüllung der Leistungsfähigkeit der Hadamard-Transformation in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarbmodell: Das Spektrum des Computer Vision verstehen: Farbmodelle erkunden Bewertung: 0 von 5 Sternen0 BewertungenZufallsstichprobenkonsens: Robuste Schätzung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGeometrisches Hashing: Effiziente Algorithmen zur Bilderkennung und -anpassung Bewertung: 0 von 5 Sternen0 Bewertungen
Ähnliche E-Books
Bündelanpassung: Optimieren visueller Daten für eine präzise Rekonstruktion Bewertung: 0 von 5 Sternen0 BewertungenComputergeometrie: Erforschung geometrischer Erkenntnisse für Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenDreidimensionale Multi-View-Rekonstruktion: Fortgeschrittene Techniken zur räumlichen Wahrnehmung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBildsegmentierung: Erkenntnisse durch Pixelpräzision erschließen Bewertung: 0 von 5 Sternen0 BewertungenLevel-Set-Methode: Weiterentwicklung der Computer Vision, Erforschung der Level-Set-Methode Bewertung: 0 von 5 Sternen0 BewertungenBump-Mapping: Bump Mapping: Erforschung der Tiefe der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenEigenface: Erkunden Sie die Tiefen der visuellen Erkennung mit Eigenface Bewertung: 0 von 5 Sternen0 BewertungenBewegungsschätzung: Fortschritte und Anwendungen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenKontextuelle Bildklassifizierung: Visuelle Daten für eine effektive Klassifizierung verstehen Bewertung: 0 von 5 Sternen0 BewertungenRastergrafik-Editor: Visuelle Realitäten transformieren: Rastergrafik-Editoren in Computer Vision beherrschen Bewertung: 0 von 5 Sternen0 BewertungenVolumen Rendern: Erforschung des Visuellen Realismus in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenSkalieren Sie den Raum: Erforschung von Dimensionen in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenVektorgrafik-Editor: Ermöglichen Sie die visuelle Erstellung mit fortschrittlichen Algorithmen Bewertung: 0 von 5 Sternen0 BewertungenTonzuordnung: Tone Mapping: Erhellende Perspektiven in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenTextur Zuordnung: Erforschung der Dimensionalität im Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenRaytracing-Grafiken: Erforschung des fotorealistischen Renderings in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenFarbzuordnung: Erforschung der visuellen Wahrnehmung und Analyse in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenDigitale Rastergrafik: Enthüllung der Leistungsfähigkeit digitaler Rastergrafiken in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenHistogrammausgleich: Verbesserung des Bildkontrasts für eine verbesserte visuelle Wahrnehmung Bewertung: 0 von 5 Sternen0 BewertungenMesh-Generierung: Fortschritte und Anwendungen bei der Computer Vision Mesh Generation Bewertung: 0 von 5 Sternen0 BewertungenVerfahrensoberfläche: Erforschung der Texturgenerierung und -analyse in Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenStrichzeichnungsalgorithmus: Beherrschen von Techniken zur präzisen Bildwiedergabe Bewertung: 0 von 5 Sternen0 BewertungenRastergrafiken: Die Grundlagen der Rastergrafik in der Computer Vision verstehen Bewertung: 0 von 5 Sternen0 BewertungenAktives Erscheinungsmodell: Erschließung der Leistungsfähigkeit aktiver Darstellungsmodelle in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenBresenham-Linien-Algorithmus: Effiziente pixelgenaue Linienwiedergabe für Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenGeometrische Modellierung: Erforschung der geometrischen Modellierung in der Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenEntfernung verdeckter Linien: Das Unsichtbare enthüllen: Geheimnisse des Computer Vision Bewertung: 0 von 5 Sternen0 BewertungenClusterbasierte Datenanalyse auf Grundlage genetischer Algorithmen in SAP-BI: Ein Verfahren zur selbständigen Ermittlung der optimalen Anzahl Cluster Bewertung: 0 von 5 Sternen0 BewertungenScan Linien Rendern: Erforschung des visuellen Realismus durch Scan Linien Rendern Techniken Bewertung: 0 von 5 Sternen0 Bewertungen
Künstliche Intelligenz (KI) & Semantik für Sie
Chatbotische Medien-Gestaltung leicht gemacht: Von der Idee zum viralen Hit Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Begegnung mit einer neuen Welt: Lernen Sie Künstliche Intelligenz mit der Gratisversion ChatGPT 3.5 Bewertung: 0 von 5 Sternen0 BewertungenChatbotische Landingpages: Wie du deine Konkurrenz in den digitalen Staub schicken Bewertung: 0 von 5 Sternen0 BewertungenPsychologie des Sozialismus Bewertung: 0 von 5 Sternen0 BewertungenChatGPT: Epische Reise des Erfolgs - 'Steigern Sie Ihren Reichtum': Mit Screenshots aus dem echten Leben - Erreichen Sie finanzielle Höhen Bewertung: 0 von 5 Sternen0 BewertungenKI-Innovationen: Wie die Technologie die Grenzen verschiebt Künstliche Intelligenz verstehen und nutzen: Ein AI-Buch Bewertung: 0 von 5 Sternen0 BewertungenDie KI Bibel, mit künstlicher Intelligenz Geld verdienen: Echte Fallbeispiele und Anleitungen zum Umsetzen Bewertung: 1 von 5 Sternen1/5Roboter im Alltag: Maschinen (beinahe) wie Menschen Bewertung: 0 von 5 Sternen0 BewertungenChatGPT – Für Einsteiger: Schreibprofi mit KI, Zeit und Geld sparen ohne peinliche Fehler Bewertung: 0 von 5 Sternen0 BewertungenMeistern von ChatGPT: Entriegeln Sie die Kraft der KI für verbesserte Kommunikation und Beziehungen: German Bewertung: 0 von 5 Sternen0 BewertungenDie Zukunft der Arbeit: Digitalisierung, Automatisierung, KI Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz: Die vierte industrielle Revolution Bewertung: 0 von 5 Sternen0 BewertungenMenschlicher Geist und Künstliche Intelligenz: Die Entwicklung des Humanen inmitten einer digitalen Welt Bewertung: 0 von 5 Sternen0 BewertungenWissen statt Glauben!: Das Weltbild des neuen Humanismus Bewertung: 0 von 5 Sternen0 BewertungenEinstieg ins Machine Learning: Grundlagen, Prinzipien, erste Schritte Bewertung: 0 von 5 Sternen0 BewertungenAufstieg der Roboter: Wie unsere Arbeitswelt gerade auf den Kopf gestellt wird - und wie wir darauf reagieren müssen Bewertung: 0 von 5 Sternen0 BewertungenDigitalotopia: Sind wir bereit für die (R)Evolution der Wirklichkeit? Bewertung: 0 von 5 Sternen0 BewertungenKünstliche Intelligenz in Sozialen Medien Bewertung: 0 von 5 Sternen0 Bewertungen
Rezensionen für Computer-Vision-Grafikschnitte
0 Bewertungen0 Rezensionen
Buchvorschau
Computer-Vision-Grafikschnitte - Fouad Sabry
Kapitel 1: Diagrammschnitte in der Computer Vision
Die Optimierung des Graphenschnitts kann, wenn sie auf das Thema Computer Vision angewendet wird, verwendet werden, um eine breite Palette von Problemen der Computer Vision auf niedriger Ebene (auch bekannt als frühe Sehprobleme) auf effektive und effiziente Weise anzugehen (und somit nach dem Max-Flow-Min-Cut-Theorem einen minimalen Schnitt des Graphen zu definieren). Die meisten Ansätze zur Formulierung solcher Probleme in der Computer Vision stimmen darin überein, dass die Antwort mit dem geringsten Energieaufwand der höchsten a posteriori Schätzung einer Lösung entspricht. Obwohl viele Computer-Vision-Algorithmen das Schneiden eines Diagramms beinhalten (z. B. normalisierte Schnitte), bezieht sich der Begriff Diagrammschnitte
insbesondere auf Modelle, die eine Max-Flow/Min-Cut-Optimierung verwenden. Dies liegt daran, dass viele Computer-Vision-Methoden das Schneiden eines Diagramms beinhalten (andere Algorithmen zum Schneiden von Diagrammen können als Algorithmen zur Partitionierung von Graphen betrachtet werden).
Mit dieser Methode können binäre
Probleme, wie z. B. das Entrauschen eines Binärbildes, genau gelöst werden; Probleme, bei denen Pixel mit mehr als zwei verschiedenen Beschriftungen beschriftet werden können, wie z. B. Stereokorrespondenz oder Rauschunterdrückung eines Graustufenbildes, können nicht genau gelöst werden; Die produzierten Lösungen sind jedoch in der Regel sehr nahe am globalen Optimum.
In ihrer bahnbrechenden Studie waren Greig, Porteous und Seheult von der Durham University diejenigen, die die Idee der Graphenschnitte erstmals auf den Prozess der Optimierung von Computer Vision anwandten. Graphenschnitte sind eine Technik der Optimierung. Allan Seheult und Bruce Porteous waren Mitglieder der damaligen Statistikgruppe von Durham, die von Julian Besag und Peter Green (Statistiker) geleitet wurde, wobei die Optimierungsexpertin Margaret Greig als erste weibliche Mitarbeiterin des Durham Mathematical Sciences Department bekannt war.
Im Bayes'schen statistischen Kontext der Glättung verrauschter (oder beschädigter) Bilder zeigten sie, wie die maximale a posteriori Schätzung eines binären Bildes genau durch Maximierung des Flusses durch ein zugehöriges Bildnetzwerk erhalten werden kann, was die Einführung einer Quelle und Senke beinhaltet. So konnten sie zeigen, wie die maximale a posteriori Schätzung eines Binärbildes exakt erhalten werden kann. Als Ergebnis wurde gezeigt, dass das Problem erfolgreich behoben werden kann. Vor dieser Erkenntnis wurden Approximationsansätze wie das simulierte Glühen, das von den Gebrüdern Geman vorgestellt wurde, verwendet, um ähnliche Probleme der Bildglättung anzugehen. Aber jetzt, da wir diese Lösung haben, können wir diese Probleme genauer lösen.
Obwohl das allgemeine k Farbproblem für k>2, den Ansatz von Greig ungelöst bleibt, wird erwartet, dass Porteous und Seheult ein breites Anwendungsspektrum in allgemeinen Computer-Vision-Fragen haben werden.
Greig, Es ist gängige Praxis, die Porteous- und Seheult-Methoden iterativ auf eine Reihe von binären Problemen anzuwenden, was oft zu Lösungen führt, die dem Ideal sehr nahe kommen.
Im Jahr 2011 hat C.
Couprie et al.
Es wurde ein umfassendes Framework für die Bildsegmentierung vorgestellt, das oft als Power Watershed
bezeichnet wird und das bestmögliche Ergebnis für eine reellwertige Indikatorfunktion erzielte, die von [0,1] in einem Diagramm reicht, das durch die von Benutzern gepflanzten Samen (oder unären Termen) bis 0 bzw. 1 begrenzt ist, wobei die Minimierung der Indikatorfunktion über das Diagramm in Bezug auf einen Exponenten optimiert ist p .
Wenn p=1 , ermöglichen Diagrammschnitte die Optimierung des Leistungseinzugsgebiets, wenn p=0 das Leistungseinzugsgebiet durch kürzeste Wege optimiert wird, p=2 durch den Random-Walker-Algorithmus optimiert wird und p=\infty durch den Wasserscheidenalgorithmus (Bildverarbeitungsalgorithmus) optimiert wird.
In diesem Fall ist es möglich, sich das Power Watershed als eine Erweiterung von Diagrammschnitten vorzustellen, die eine einfache Verbindung zu mehreren anderen Segmentierungs-/Clustering-Techniken zur Energieoptimierung bietet.
Bild: x\in \{R,G,B\}^{N}
Ausgabe: Segmentierung (auch Deckkraft genannt) S\in R^{N} (weiche Segmentierung).
Für harte Segmentierung
S\in \{0{\text{ for background}},1{\text{ for foreground/object to be detected}}\}^{N}Energiefunktion: E(x,S,C,\lambda ) wobei C der Farbparameter und λ der Kohärenzparameter ist.
E(x,S,C,\lambda )=E_{{{\rm {color}}}}+E_{{{\rm {coherence}}}}Optimierung: Die Segmentierung kann als globales Minimum über S geschätzt werden: {\arg \min }_{S}E(x,S,C,\lambda )
Die Standard-Diagrammschnitte zielen darauf ab, die Effizienz der Energiefunktion über die Segmentierung (unbekannter S-Wert) zu maximieren.
Schnitte in einem iterierten Diagramm:
In der ersten Phase wird eine K-Means-Optimierung für die Farbparameter durchgeführt.
Der Standardalgorithmus zum Schneiden von Diagrammen wird in der zweiten Stufe ausgeführt.
Diese beiden Prozesse werden rekursiv ausgeführt, bis die Konvergenz erreicht ist.
Durch die Verwendung dynamischer Graphenschnitte kann die Technik deutlich schneller erneut ausgeführt werden, sobald das Problem geändert wurde (z. B. nachdem ein Benutzer neue Seeds hinzugefügt hat).
{\displaystyle \Pr(x\mid S)=K^{-E}}wobei sich die Energie E aus zwei verschiedenen Modellen zusammensetzt ( E_{{{\rm {color}}}} und E_{{{\rm {coherence}}}} ):
E_{{{\rm {color}}}} — unärer Begriff, der die Wahrscheinlichkeit jeder Farbe beschreibt.
Dieser Begriff kann auf verschiedene Arten dargestellt werden, einschließlich lokaler (z. B. Texons) oder globaler (z. B. Histogramme, GMMs und Adaboost-Wahrscheinlichkeit), die alle unten beschrieben werden.
Um Histogramme für die Objekt- (Vordergrund) und Hintergrundintensitätsverteilungen zu erzeugen, verwenden wir die Intensitäten von Pixeln, die als Seeds identifiziert wurden: Sowohl P(I|O) als auch P(I|B).
Danach bestimmen wir die regionalen Strafen, indem wir diese Histogramme verwenden und sie als negative Log-Wahrscheinlichkeiten festlegen.
In den meisten Fällen verwenden wir zwei Verteilungen: eine für die Modellierung des