a) Einleitung
Die «Viper-Gruppe» ist eine Forschungsgruppe an der Universität zu Genf, die sich mit dem Prozessieren und dem Verwalten multimedialer Daten auseinander setzt. Im Besonderen beschäftigt sich diese Gruppe mit der Organisation und dem «Retrieval» — dem Abfragen — dieser Daten.
Bezüglich der Bildersuche gilt für das «Viper-Team»: «Wir wollen das Konzept von voll automatisierten Interpretationssystemen für visuelle Inhalte nicht ganz aufgeben. Vielmehr wollen wir sie praktikabler machen, indem wir die menschliche Interaktion mit einbeziehen, wann immer sie (vorübergehend) benötigt wird.»[1]
Die Entwickler von «Viper» legen bei der Entwicklung ihrer Software und Datenbestände ein großes Augenmerk darauf, dass keine «Grauzone» in dem Bestand der verwendeten Datenbanken entsteht. Eine Grauzone sind Daten, die aufgrund struktureller Gegebenheiten zu anderen Daten benachteiligt sind, also schwieriger abzufragen oder gar nicht zugänglich sind.
Durch die Genfer «Viper-Gruppe» wurde auch das GNU Image Finding Tool («GIFT») entwickelt.[2] «GIFT» ist eine Open-Source-Software, die es ermöglicht Bilder nach ihrem Inhalt abzufragen. In der Medienkunst arbeitet zum Beispiel der «Eye Vision Bot» von Lasse Scherffig mit «GIFT».[3]
b) Beschreibung des Interfaces und Beobachtungen
Das Interface von «Viper» ist in schlichtem, «wissenschaftlichen» HTML gehalten. Eine Einflussnahme durch den Benutzer erfolgt durch Web-Elemente wie Submit-Buttons, Links und Drop-Down-Leisten. Die von CSS unberührten H1-Tags für Überschriften, «horizontal rulers» und der gekachelte Hintergrund zeugen vom wissenschaftlichen Ausgangspunkt der «Viper-Gruppe».
Auf der Seite der «Viper-Gruppe» finden sich zwei Interfaces. Das erste ist in PHP realisiert, das zweite ist ein Java-Applet. Da PHP eine serverseitige Skript-Sprache ist, die Programme beim Laden einer Internet-Seite ausführen, ist das Benutzen des PHP-Interface von Viper[4] durch eine Benutzerführung über mehrere Seiten angelegt.
Anmeldeformular «Viper PHP Demo» der «Viper-Gruppe»
Auswahl des durch die «Viper PHP Demo» zu verwendenden Algorithmus
Nachdem man sich auf der ersten Seite anonym eingeloggt hat, kann man auf der nächsten Seite per Drop-Down-Menü den zu verwendenden Algorithmus, die zu durchsuchende Bildersammlung sowie die Anzahl der im Suchergebnis angezeigten Bilder auswählen. In der zweiten Zeile hat man die Möglichkeit, auf die Konfiguration des Such-Algorithmus Einfluß zu nehmen: Unter «Algorithm options» kann man den Schalter «Modify default configuration» auf «ja<» oder «nein» stellen. Am unteren Ende der Seite wird das Interface durch die Buttons «Random», «Query» und «Clear», die jeweils mit einem kurzen erläuternden Hinweis versehen sind, abgeschlossen.
Ein Klick auf «Random» zeigt nach dem Laden der nächsten Seite ein zufälliges Bilderset aus der Datenbank an. Unter jedem dieser Bilder kann man per Drop-Down-Box das Bild als «neutral», «relevant» oder «nicht relevant» markieren. Beim Klick auf «Query» werden neue Bilder geladen, die einem vorher als «relevant» markierten Bild ähneln (oder nicht, wenn das vorherige Bild als nicht relevant markiert wurde). Dieses Prozedere setzt sich fort, bis der Benutzer ein seinen eigenen Vorstellungen entsprechendes Bild gefunden hat.
c) Folgerungen und Kritik
«Die verbreitete Annahme, dass der User immer nach etwas Spezifischem sucht bzw. weiß, was er sucht, scheint nicht immer richtig zu sein.»[5]
Dieser Ansatz der «Viper-Gruppe» setzt daher den User ins Zentrum der Suche und betont die Vorgänge zwischen Mensch und Computer. Durch dieses schrittweise Spezifizieren von relevanten bzw. nicht relevanten Bildern durch den Benutzer ergibt sich ein Prozess mit «Gedächtnis», der alle bisherigen Benutzereingaben in das aktuelle Suchergebnis münden lässt. Der Mensch steht dabei im Mittelpunkt des Systems: «Unser Ansatz räumt dem User den zentralen Platz im System ein und rückt damit von der Forderung ab, dass die Interaktion zwischen Mensch und Computer im Mittelpunkt stehen sollte.»[6]
Das Interface thematisiert den Such-Algorithmus zwar über eine Auswahlbox — eine die algorithmische Wirkungsweise versinnbildliche Entsprechung sucht man im Interface selbst allerdings vergebens.
Der Benutzer kann zudem bei der hier vorgestellten Technologie generell nur auf bestehende Bilder zurückgreifen. Dieses Vorgehen setzt die «Hemmschwelle» zur Formulierung einer Suchanfrage sicherlich sehr herab, allerdings wird so auch eine personalisierte (und damit auf Seiten des Benutzers konkret nützliche) Suche damit unterbunden.
Die Verwaltung von visuellen Multimedia-Informationen wird von der «Viper-Gruppe» in einem Kontext gesehen, der «ohne Suchanfrage» auskommt. Nach Auffassung der Viper Gruppe sieht sich der User heute vor allem mit einer (großen) Anzahl an Multimedia-Daten konfrontiert. «Die Tools sollen dem User dabei behilflich sein, auf effektive Art und Weise einen umfassenden Überblick über den Inhalt dieser Datenbanken zu bekommen.»[5]
Der Ähnlichkeits-Algorithmus des «GIFT» benutzt jeweils die gesamte Bildoberfläche zur Suche nach ähnlichen Bildern. Damit unterbunden wird eine Suche eines Bildteils. Kann man mit «QBIC» noch eine Suchanfrage formulieren, die die Spezifizierung eines Bildbereichs ermöglicht, wird bei «Viper» die Suche stets auf die gesamte Bildfläche appliziert.
Zudem kann man am Beispiel von Viper erkennen, dass Technologien wie die der «Rich Internet Applications» von Macromedia[6] oder das mit Javascript und der Schnittstelle «XMLHttpRequest» realisierte «AJAX»[7], die nicht bei jeder Anfrage an den Server eine komplette Seite neu laden müssen, durchaus ihre Vorzüge haben könnten. Besonders bei einer visuellen Bildersuche scheint dies der Fall zu sein, da Viper durchaus eine Minderung seiner Leistung durch diese Verzögerung erfährt.
Diese Beobachtung bestätigt sich, wenn man die PHP Version mit dem Java-Applet vergleicht[8]. Obwohl sich an der Struktur nichts geändert hat, wirkt die Benutzung dieser Variante viel komfortabler. Das Auswählen der Bilder nach relevant und nicht-relevant erfolgt hier durch einen Links- bzw. Rechtsklick und sofort nach der Auswahl der Bilder werden die Ergebnisse zur Suchanfrage angezeigt. Neue Technologien wie Flash mit Serverinteraktion oder «AJAX» erfahren einen Mehrwert im Bereich der visuellen Bildersuche, da mit ihnen eine schnellere Reaktion des Systems auf die Anfrage des menschlichen Benutzers gewährleistet werden kann.