Hace unos días, Google anunció que su producto Google Assistant, herramienta que funciona como traductor, cuenta ahora con la función de intérprete en tiempo real.

Ahora, mediante un comunicado, informó el mecanismo del funcionamiento de inteligencia artificial para la nueva funcionalidad que implica la transcripción del audio en tiempo real.

De este modo, se obtiene un texto mientras se está grabando en simultáneo.

Cómo funciona la transcripción instantánea de audios de Google
Cómo funciona la transcripción instantánea de audios de Google

Google ofrece así la traducción instantánea y la transcripción instantánea con su Asistente

Cómo funciona

El procesado de los audios se realiza completamente offline, sin necesidad de subirse a la nube.

Alllí, por este mecanismo, el audio se despieza y se categoriza. El audio se divide por palabras y todas ellas se referencian a puntos concretos en el texto que se ha transcrito.

Entonces, Google se dedica a separar los distintos tipos de audio que está grabando en ese momento, todo ello analizando bloques de 50 milisegundos que va tiñendo de uno y otro color. Así, la máquina de inteligencia artificial de Google sabe cuándo se está hablando, cuándo se está reproduciendo música y es también capaz de reconocer lo que está sonando. 

Así es cómo funciona la inteligencia artificial detrás de la transcripción en tiempo real de audios de la grabadora de Google.