Advertencia
  • JUser: :_load: No se ha podido cargar al usuario con 'ID': 713

YouTube añade efectos de sonido a los subtítulos automáticos

YouTube ahora tiene un sistema de subtítulos de efectos de sonido que puede identificarse automáticamente música, sonido y risas en videos.

Es una pequeña pero significativa adición a las características de accesibilidad del sitio de transmisión de video de Internet, una filial de Google. YouTube ha subido los subtítulos en las pistas de los idiomas en el reconocimiento de voz desde Google desde 2009. Sin embargo, subtitular los efectos de sonido es una tarea mucho más difícil, según los ingenieros de Google, y que solo es factible con los avances en el aprendizaje de máquinas que han tenido lugar desde hace un par de años.

El problema no es tanto la capacidad de una computadora para detectar y clasificar las cosas (productos como Google Imágenes y capacidades de detección de imágenes, por ejemplo), sino la falta de una base de datos importante de efectos de sonido para el entrenamiento de la red neuronal que los identifica.


"Mientras que la información de sonido ambiental es difícil de conseguir, hemos conseguido un conjunto de datos lo suficientemente grande para el entrenamiento con datos débilmente etiquetados", escribió un ingeniero de Google,  en una entrada de blog. El equipo decidió centrarse primero en la música, el sonido y la música, lo que añaden un contexto significativo al diálogo de un video para las personas sordas o con problemas de audición.

Después de anotar millas de horas de video, YouTube ahora tiene un algoritmo de inteligencia artificial para efectos de sonido, que puede ver en videos, como este clip de America's Got Talent (haz clic en el botón CC para activar subtítulos). Sin embargo, aún falta trabajo, según el ingeniero de Google Noah Wang.

"Los desafíos del futuro pueden incluir la adición de otras clases de sonidos comunes, sonidos y golpes, que presentan problemas particulares. Por ejemplo, con el timbre, tenemos que poder descifrar si se trata de un reloj de alarma, una puerta. o un teléfono ", escribió.

(0 votes)