Yantzu entwickelt Textanalysesystem
Yantzu hat ein eigenes Textanalysesystem entwickelt, mit dem Nachrichten automatisch einem bestimmten Ressort zugeordnet werden können. Das System durchsucht jede eingehende Nachricht nach bestimmten Signalwörtern und bestimmt dann, in welche Nachrichtenkategorie die Meldung eingeordnet wird. Grundlage dafür ist ein Wörterbuch mit über 60.000 Wörtern, die selbst jeweils einer bestimmten Kategorie zugeordnet wurden. So unterscheidet das System zwischen unwichtigen und wichtigen Wörtern und weist anhand gefundener Signalwörter die Meldung einem bestimmten Ressort zu.
Erkennung von Nachrichten-Threads
Außerdem vergleicht Yantzu eingehende Meldungen sofort mit den Nachrichten, die bereits im System liegen. Bei Übereinstimmungen erkennt das System, dass es sich mit hoher Wahrscheinlichkeit um eine Meldung zum gleichen Thema handelt und wertet die ältere Meldung in diesem Nachrichten-Thread ab. Überholte Meldungen verschwinden so automatisch aus dem Nachrichtenpool. Der Nutzer erhält nicht nur den von ihm gewünschten Nachrichtenressort-Mix. Er bekommt auch immer die aktuellste Meldung zu einem bestimmten Thema.
Erweiterung auf Speech-to-Text geplant
Künftig sollen alle eingehenden Audio-Dateien nach diesem System erfasst werden können. Yantzu integriert dazu gerade eine Speech-to-Text-Erfassung, die Audio-Dateiformate wie mp3 oder wav in geschriebene Texte umwandelt. Zusammen mit dem Textanalysesystem können so alle neuen Audio-Dateien auch inhaltlich kategorisiert werden. Das ermöglicht nicht nur die Zuordnung von Audio-Nachrichten im Yantzu-Newsplayer. Es erleichtert künftig auch die Auffindbarkeit von Audiodateien etwa in Suchmaschinen oder die Verwendung für Social Media.