Kooperation zwischen Bayerischem Rundfunk und European Media Laboratory - Automatische Verschriftung von Sendungen des "BR-Alpha Forums"
Heidelberg/München. Die automatische Umwandlung von gesprochener Sprache in Text, die Transkription, hat in den letzten Jahren große Fortschritte erzielt. Gründe dafür liegen in den kontinuierlich verbesserten Erkennungsalgorithmen, der wachsenden Rechnerleistung und der Möglichkeit, riesige Datenmengen zu verarbeiten. So haben beispielsweise die Sprachtechnologen des European Media Laboratory (EML) ein Transkriptionssystem entwickelt, mit dem Fernsehsendungen automatisch verschriftet werden können. Um dieses System aber auch in der Praxis nutzen zu können, muss es auf den jeweiligen Bereich, die sogenannte Sprachdomäne, angepasst werden.
In einem neuen Projekt gemeinsam mit dem Bayerischen Rundfunk (BR) wird das Transkriptionssystem an die Sendung "BR Alpha Forum" angepasst. "BR Alpha Forum" ist eine tägliche Sendung, in der Persönlichkeiten aus Politik und Wirtschaft, Wissenschaft und Gesellschaft, Religion und Kultur in 45 Minuten ausführlich zu Wort kommen. Im Forschungsprojekt wird das Transkriptionssystem mit bereits ausgestrahlten Sendungen von BR Alpha Forum gefüttert. Es "lernt" wie ein Schüler anhand der Manuskripte das Vokabular, das in dieser Sendung verwendet wird. Außerdem "hört" es den Sprechern genau zu und trainiert so die akustische Spracherkennung.
"Es handelt sich hier nicht um Künstliche Intelligenz, sondern um intelligente Sprachtechnologie", erklärt EML-Forschungs- und Entwicklungsleiter Dr. Siegfried Kunzmann. "Wir trainieren die Spracherkennungssysteme mit vielen Texten und gesprochenen Aufnahmen der entsprechenden Domäne." Erkennungsfehler werden mit grammatikalischer Analyse und Korrektur verbessert und "nicht-gesprochene" Satzzeichen eingefügt. Damit erreichen die Forscher eine verbesserte Textdarstellung und -strukturierung. Als Ergebnis der automatischen Transkription liegen dann sowohl der gesprochene Text mit Zeichensetzung als auch die Zeitzuordnung für jedes Wort vor.
Das Pilotprojekt von EML und Bayerischem Rundfunk hat zum Ziel, die BR Alpha Forum-Gespräche automatisch zu transkribieren und in Vortragsmanuskripte umzuwandeln. "Außerdem soll die Suche und Wiedergabe von Sendungen im Video-Archiv über freie Suchbegriffe möglich werden", so Herbert Tillmann, Direktor Produktion und Technik beim Bayerischen Rundfunk. Und zuletzt soll es möglich sein, die Sendung und den transkribierten Text innerhalb eines Internet-Browsers oder auch als Videosendung mit eingeblendeter Text-Informationen zu zeigen.
Das Projekt wurde von der gemeinnützigen Klaus Tschira Stiftung als Maßnahme zum Technologietransfer in Auftrag gegeben und wird sechs Monate dauern.
Für weitere Informationen wenden Sie sich bitte an:
Dr. Peter Saueressig
Presse- und Öffentlichkeitsarbeit
European Media Laboratory GmbH
Tel.: +49-(0)6221-533245
Peter.Saueressig@eml.org
Rudolf Küffner
BR-Pressestelle
Bayerischer Rundfunk
Tel.: +49-(0) 89-5900-2176
rudolf.kueffner@brnet.de
http://www.eml-development.de/deutsch/presse/presseberichte.php?we_objectID=369 Pressemitteilung des EML
Criteria of this press release:
Electrical engineering, Information technology, Language / literature, Media and communication sciences
transregional, national
Research projects
German
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).