Unter «Segmentierung» versteht man die Unterteilung der digitalen Bildfläche nach unterschiedlichen algorithmischen Kriterien und stellt sich so einem zentralen Problem der «Computer Vision» — dem Erkennen von Objekten vor einem Hintergrund. Dazu werden zur Zeit hauptsächlich drei Methoden eingesetzt: die schwellen-basierte («Threshold-based»), die kanten-basierte («Edge-based») und die bereich-basierte Technik («Region-based technique»).
Die «Threshold technique» unterscheidet die Bildbereiche nach den Farbwerten der Pixel und ist demnach geeignet, wenn sich die abgebildeten Objekte auf dem Bild stark gegeneinander abzeichnen. Um dies zu erreichen wird der Wert jedes Pixels zu den Werten der anderen Pixel in seiner Umgebung in Beziehung gesetzt. Die Kriterien der Unterscheidung einzelner Pixel werden auf die gewünschte Differenzierung angepasst. Erfüllt ein Pixel die Kriterien seiner Nachbarn, wird dieselbe Kennung zugewiesen. Besitzen einige beieinanderliegende Pixel beispielsweise einen ähnlichen Rot-Anteil, handelt es sich mit hoher Wahrscheinlichkeit um einen Bereich. Pixel, die nicht auf diese Kriterien passen, wird eine andere Kennung zugewiesen.[1] Diese Kennung ermöglicht es nun, das Bild in verschiedene «homogene» Bereiche aufzuteilen. Unscharfe Objekte bereiten dieser Technik allerdings Probleme.
Die «Edge-based Method» erkennt Konturen nach Kantenfiltern. Diese Filter subtrahieren meist das Ziel-Bild von einer weichgezeichneten Version desselben Bildes und erkennen durch die Differenz die Kanten zwischen zwei Farbflächen. Diese Methode ziegt besonders Schwächen, die erkannten Konturen zu einer (geschlossenen) Linie und damit einer weiter prozessierbaren Form zu verbinden.[2]
Die Stärke der «Region-based Method» ist das Zusammenspiel verschiedener Methoden: «A region-based method usually proceeds as follows: the image is partitioned into connected regions by grouping neighboring pixels of similar intensity levels. Adjacent regions are then merged under some criterion involving perhaps homogeneity or sharpness of region boundaries.»[3]

Diese Segmentierung des ersten Bildes im World Wide Web wurde durch das Modul «IMG_SRC» von «Sourcerer» durch ein Vergleichen der einzelnen Pixel durch die «Threshold Technique» erreicht — besitzt ein Pixel eine ähnliche Farbe wie seine Nachbarn, wird dieselbe Kennung zugewiesen.
Wie man sieht, bedeutet diese Segmentierung jedoch nicht, dass diese oberflächlich unterschiedlichen Bereiche auch semantisch zu unterscheiden sind.