Kooperation zwischen Bayerischem Rundfunk und European Media Laboratory - Automatische Verschriftung von Sendungen des "BR-Alpha Forums"
Heidelberg/München. Die automatische Umwandlung von gesprochener Sprache in Text, die Transkription, hat in den letzten Jahren große Fortschritte erzielt. Gründe dafür liegen in den kontinuierlich verbesserten Erkennungsalgorithmen, der wachsenden Rechnerleistung und der Möglichkeit, riesige Datenmengen zu verarbeiten. So haben beispielsweise die Sprachtechnologen des European Media Laboratory (EML) ein Transkriptionssystem entwickelt, mit dem Fernsehsendungen automatisch verschriftet werden können. Um dieses System aber auch in der Praxis nutzen zu können, muss es auf den jeweiligen Bereich, die sogenannte Sprachdomäne, angepasst werden.
In einem neuen Projekt gemeinsam mit dem Bayerischen Rundfunk (BR) wird das Transkriptionssystem an die Sendung "BR Alpha Forum" angepasst. "BR Alpha Forum" ist eine tägliche Sendung, in der Persönlichkeiten aus Politik und Wirtschaft, Wissenschaft und Gesellschaft, Religion und Kultur in 45 Minuten ausführlich zu Wort kommen. Im Forschungsprojekt wird das Transkriptionssystem mit bereits ausgestrahlten Sendungen von BR Alpha Forum gefüttert. Es "lernt" wie ein Schüler anhand der Manuskripte das Vokabular, das in dieser Sendung verwendet wird. Außerdem "hört" es den Sprechern genau zu und trainiert so die akustische Spracherkennung.
"Es handelt sich hier nicht um Künstliche Intelligenz, sondern um intelligente Sprachtechnologie", erklärt EML-Forschungs- und Entwicklungsleiter Dr. Siegfried Kunzmann. "Wir trainieren die Spracherkennungssysteme mit vielen Texten und gesprochenen Aufnahmen der entsprechenden Domäne." Erkennungsfehler werden mit grammatikalischer Analyse und Korrektur verbessert und "nicht-gesprochene" Satzzeichen eingefügt. Damit erreichen die Forscher eine verbesserte Textdarstellung und -strukturierung. Als Ergebnis der automatischen Transkription liegen dann sowohl der gesprochene Text mit Zeichensetzung als auch die Zeitzuordnung für jedes Wort vor.
Das Pilotprojekt von EML und Bayerischem Rundfunk hat zum Ziel, die BR Alpha Forum-Gespräche automatisch zu transkribieren und in Vortragsmanuskripte umzuwandeln. "Außerdem soll die Suche und Wiedergabe von Sendungen im Video-Archiv über freie Suchbegriffe möglich werden", so Herbert Tillmann, Direktor Produktion und Technik beim Bayerischen Rundfunk. Und zuletzt soll es möglich sein, die Sendung und den transkribierten Text innerhalb eines Internet-Browsers oder auch als Videosendung mit eingeblendeter Text-Informationen zu zeigen.
Das Projekt wurde von der gemeinnützigen Klaus Tschira Stiftung als Maßnahme zum Technologietransfer in Auftrag gegeben und wird sechs Monate dauern.
Für weitere Informationen wenden Sie sich bitte an:
Dr. Peter Saueressig
Presse- und Öffentlichkeitsarbeit
European Media Laboratory GmbH
Tel.: +49-(0)6221-533245
Peter.Saueressig@eml.org
Rudolf Küffner
BR-Pressestelle
Bayerischer Rundfunk
Tel.: +49-(0) 89-5900-2176
rudolf.kueffner@brnet.de
http://www.eml-development.de/deutsch/presse/presseberichte.php?we_objectID=369 Pressemitteilung des EML
Merkmale dieser Pressemitteilung:
Elektrotechnik, Informationstechnik, Medien- und Kommunikationswissenschaften, Sprache / Literatur
überregional
Forschungsprojekte
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).