YouTube Captions
Die Untertitel bei YouTube erkennen nun Geräusche – wenn auch bisher nur drei verschiedene.
Foto: Google
Die automatische Spracherkennung ist für viele YouTuber-Schauer ein wahrer Segen: Vor allem Hörgeschädigten helfen die YouTube Captions sehr. Die Sprache in Videos erkennt YouTube schon wunderbar und schreibt sie häufig fehlerfrei nieder – aber: Was ist mit Geräuschen? Wie oft kommen in einem Clip Töne vor oder aber ist der Klang undeutlich! Soundeffekte sind ein großes Gebiet, doch genau deren Erkennung geht das Videoportal jetzt an, wie ein Bericht auf dem Google Research Blog verkündet.


YouTube Captions: Applaus, Lachen, Musik


YouTube hat den Algorithmen hinter der Spracherkennung bisher drei Worte beigebracht: „Applaus“, „Lachen“ und „Musik“. Weitere Begriffe sollen folgen, auch wenn die Erkennung und Umsetzung schon jetzt ein Problem darstellen. So ist etwa „Musik“ ein sehr simpler Begriff und definiert nicht, was für eine Art von Melodie gerade läuft. Zudem haben viele Wörter, zum Beispiel „Klingeln“, mehrere Bedeutungen: Bezieht es sich nun auf eine Tür, ein Telefon oder eine Glocke? Es dauert wohl noch einige Zeit, bis Googles Algorithmen diese feinen Unterschiede verstehen und wiedergeben ...
YouTube
YouTube-Downloader & Co.: Die nützlichsten Tools