nandoo.net versteht und kürzt Texte

Es klingt ein bisschen nach Science Fiction: Die “Text-Verstehmaschine” nandoo.net (www.nandoo.net) soll erkennen, welche Art von Nachrichten der Nutzer wünscht. Das System ist lernfähig und filtert Suchergebnisse nach deren Relevanz. Die etwas andere Nachrichtenplattform startete bereits im Februar mit einer ersten Version. “Richtig los” geht es aber erst jetzt.

Die “Textverstehmaschine” wurde in Potsdam von Cyber Consult, einem seit 1997 existierenden Internetdienstleister, in Zusammenarbeit mit dem Linguistiker Manfred Stede entwickelt. Bevor sie aktiv wird, ist die Maschine allerdings auf die Hilfe des Nutzers angewiesen. Aus unzähligen Themengebieten, die andere User angelegt haben, wählt er seine Interessensgebiete – beispielsweise Web 2.0 – aus. Wenn unter den Beispielthemen das eigene Thema fehlt, kann der Nutzer es anlegen und mit einigen Beispielartikeln aus dem Nachrichtenpool spicken. Dadurch “lernt” die Maschine, für welche Themen sich der User interessiert und versorgt ihn mit entsprechenden Nachrichten. “Durch dieses Verfahren kann man ein Thema sehr genau zuschneiden, was über eine Stichwortsuche weit hinausgeht”, erklärt Produktmanager Bernd Mrohs. Klickt man als Exil-Schwabe zum Beispiel auf das Themengebiet “Schwäbische Alb”, erhält man Artikel über Streiks in schwäbischen Kindergärten und einen “Sensationsfund” der Universität Tübingen. Außerdem erfährt man die Neuigkeit, dass bei einem Viehtransporterunglück zwei – natürlich schwäbische – Kühe verendeten. Die Maschine findet also auch Artikel, in denen der genannte Begriff nicht unbedingt vorkommt. Passt einer der Artikel nicht zum Thema, kann der Nutzer ihn entfernen und die Maschine damit “trainieren”.

Texte kürzen – ohne Sinnverlust

Bei ihrer Suche nach passenden Nachrichten bedient sich die Maschine statistischer und linguistischer Methoden. Welche Wörter relevant sind, ermittelt sie aufgrund ihrer genannten Häufigkeit und ihrer Position im Text. Zusätzlich werden die Ergebnisse automatisch mit Wikipedia und Wiktionary auf ihre Relevanz hin überprüft. Aktuell stöbert die “Textversteherin” nach eigenen Angaben in über 150.000 Nachrichten in über 30 Quellen, darunter dpa, Heise Online und Spiegel Online. Dass die Maschine Texte wirklich “versteht”, wird anhand der “Slider”-Funktion deutlich: Mit dem Schieberegler kann der Nutzer Texte auf eine bestimmte Größe stutzen, ohne dass Syntax und Verständlichkeit Schaden nehmen sollen. So kann der Nutzer die Leselänge der Artikel selbst bestimmen.

Jedoch geht das Konzept von nandoo.net über eine personalisierte Online-Zeitung hinaus. “Die personalisierten Nachrichten sollen in die Webpräsenz der Nutzer eingebaut werden”, so Mrohs. Bei nandoo.net kann der Interessent bestimmte Themen abonnieren und dann die aktuellen Meldungen auf seine Website einbauen – als sogenannte Newslets. “Ein auf Unterhaltsrecht spezialisierter Rechtsanwalt zum Beispiel kann so auf seiner Seite Nachrichten zu diesem Thema einbinden, hat dadurch immer aktuelle News für seine Klienten”, erklärt der Produktmanager. Mrohs sieht noch einen weiteren Vorteil darin: Auch kleinere Content-Partner wie zum Beispiel Blogger, die nur eine bestimmte Nische bedienen, finden ein interessiertes Publikum.

Eine Million Euro kostete dieTechnologie bisher

Längerfristig will Cyber Consult das Nachrichtenangebot über die Newslets finanzieren. Verschiedene Erlösmodelle stehen zur Debatte: Zum einen könne man personalisierte Nachrichten mit zielgerichteter Werbung verbinden. Zum anderen sei auch der Verkauf von newslets an kommerzielle Zeitungen angedacht. Außerdem ist das Erheben von Gebühren von den Content-Anbietern, die in den News-Pool aufgenommen werden, angedacht. Bisher trägt Cyber Consult die Kosten für die “Text-Verstehmaschine”: Rund eine Million Euro haben die Betreiber nach eigenen Angaben bereits in die Technologie investiert. Die Suche nach passenden Investoren läuft noch.