idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store



Instance:
Share on: 
10/27/2009 10:42

Sprachtechnologie: TV-Sendungen werden automatisch zu Text und durchsuchbar

Dr. Peter Saueressig Presse- und Öffentlichkeitsarbeit
European Media Laboratory GmbH

    Kooperation zwischen Bayerischem Rundfunk und European Media Laboratory - Automatische Verschriftung von Sendungen des "BR-Alpha Forums"

    Heidelberg/München. Die automatische Umwandlung von gesprochener Sprache in Text, die Transkription, hat in den letzten Jahren große Fortschritte erzielt. Gründe dafür liegen in den kontinuierlich verbesserten Erkennungsalgorithmen, der wachsenden Rechnerleistung und der Möglichkeit, riesige Datenmengen zu verarbeiten. So haben beispielsweise die Sprachtechnologen des European Media Laboratory (EML) ein Transkriptionssystem entwickelt, mit dem Fernsehsendungen automatisch verschriftet werden können. Um dieses System aber auch in der Praxis nutzen zu können, muss es auf den jeweiligen Bereich, die sogenannte Sprachdomäne, angepasst werden.

    In einem neuen Projekt gemeinsam mit dem Bayerischen Rundfunk (BR) wird das Transkriptionssystem an die Sendung "BR Alpha Forum" angepasst. "BR Alpha Forum" ist eine tägliche Sendung, in der Persönlichkeiten aus Politik und Wirtschaft, Wissenschaft und Gesellschaft, Religion und Kultur in 45 Minuten ausführlich zu Wort kommen. Im Forschungsprojekt wird das Transkriptionssystem mit bereits ausgestrahlten Sendungen von BR Alpha Forum gefüttert. Es "lernt" wie ein Schüler anhand der Manuskripte das Vokabular, das in dieser Sendung verwendet wird. Außerdem "hört" es den Sprechern genau zu und trainiert so die akustische Spracherkennung.

    "Es handelt sich hier nicht um Künstliche Intelligenz, sondern um intelligente Sprachtechnologie", erklärt EML-Forschungs- und Entwicklungsleiter Dr. Siegfried Kunzmann. "Wir trainieren die Spracherkennungssysteme mit vielen Texten und gesprochenen Aufnahmen der entsprechenden Domäne." Erkennungsfehler werden mit grammatikalischer Analyse und Korrektur verbessert und "nicht-gesprochene" Satzzeichen eingefügt. Damit erreichen die Forscher eine verbesserte Textdarstellung und -strukturierung. Als Ergebnis der automatischen Transkription liegen dann sowohl der gesprochene Text mit Zeichensetzung als auch die Zeitzuordnung für jedes Wort vor.

    Das Pilotprojekt von EML und Bayerischem Rundfunk hat zum Ziel, die BR Alpha Forum-Gespräche automatisch zu transkribieren und in Vortragsmanuskripte umzuwandeln. "Außerdem soll die Suche und Wiedergabe von Sendungen im Video-Archiv über freie Suchbegriffe möglich werden", so Herbert Tillmann, Direktor Produktion und Technik beim Bayerischen Rundfunk. Und zuletzt soll es möglich sein, die Sendung und den transkribierten Text innerhalb eines Internet-Browsers oder auch als Videosendung mit eingeblendeter Text-Informationen zu zeigen.
    Das Projekt wurde von der gemeinnützigen Klaus Tschira Stiftung als Maßnahme zum Technologietransfer in Auftrag gegeben und wird sechs Monate dauern.

    Für weitere Informationen wenden Sie sich bitte an:

    Dr. Peter Saueressig
    Presse- und Öffentlichkeitsarbeit
    European Media Laboratory GmbH
    Tel.: +49-(0)6221-533245
    Peter.Saueressig@eml.org

    Rudolf Küffner
    BR-Pressestelle
    Bayerischer Rundfunk
    Tel.: +49-(0) 89-5900-2176
    rudolf.kueffner@brnet.de


    More information:

    http://www.eml-development.de/deutsch/presse/presseberichte.php?we_objectID=369 Pressemitteilung des EML


    Images

    Criteria of this press release:
    Electrical engineering, Information technology, Language / literature, Media and communication sciences
    transregional, national
    Research projects
    German


     

    Help

    Search / advanced search of the idw archives
    Combination of search terms

    You can combine search terms with and, or and/or not, e.g. Philo not logy.

    Brackets

    You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

    Phrases

    Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

    Selection criteria

    You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

    If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).