La restauración y limpieza de audio es un proceso complejo y delicado. Para su trabajo se requieren herramientas y tecnología específica que nos permita mejorar notablemente la calidad de una grabación de audio, siempre dentro de los parámetros que permita la física acústica. Además, hay que tener en cuenta las limitaciones del propio archivo de audio: resolución de bits, frecuencia de muestreo, ancho de banda, etc.
En este articulo presentamos un caso en el que necesitamos mejorar la inteligibilidad de una conversación grabada desde la grabadora de voz de un teléfono móvil para poder realizar la transcripción literal completa. La grabación de audio presenta númerosos eventos de ruido procedentes de diversas fuentes que enmascaran gran parte del contenido de la conversación, sobre todo en ciertos momentos del discurso que son clave para entender los hechos que se denuncian: insultos, amenazas y deslealtad en el ámbito laboral.
Este problema se agrava en el momento en el que los interlocutores se solapan mientras hablan, se alejan del dispositivo grabador o suprimen algunos fonemas durante los actos del habla.
¿Qué metodología se lleva a cabo para que tenga validez judicial?
La metodología utilizada incluye los siguientes procedimientos forenses validados por la comunidad de expertos, y que en ningún caso supone alteración (mediante corta-pega) o manipulación del contenido de las grabaciones desde un punto de vista semántico expresivo.
- Escucha crítica y análisis del audio en los diferentes dominios (amplitud-frecuencia-tiempo) para la detección de los eventos electroacústicos sobre los que se decide eliminar. En este caso el ruido provocado por el rozamiento del micrófono en la ropa.
- Se aplican los diferentes filtros y herramientas de ecualización y normalización en la señal de audio con el objetivo de eliminar o atenuar ruidos que dificultan el entendimiento del mensaje y con ello mejorar la sonoridad de los hablantes, extraer frases clave como insultos y amenazas.
A continuación detallamos paso a paso el procedimiento utilizado con la herramienta IZOTOPE RX10 Advanced :
- GANANCIA (amplificación/atenuación del volumen).
Primero seleccionamos los formantes de voz y aplicamos ganancia (amplificamos 6 db) sobre aquellas frecuencias de la señal de voz más débiles para igualar con el resto de hablantes. - DE NOISER (redución de ruido ambiente)
Como segundo procedimiento de limpieza utilizamos un plugin De Noiser para eliminar el ruido ambiente y colchón de fondo provocado por los sonidos ambientales que puedan enmascarar la voz: ruido exterior de coches y ruido por rozamiento del micrófono en la ropa.
- GANANCIA (amplificación/atenuación del volumen).
La siguiente imagen corresponde al espectrograma de la señal de audio antes y después de aplicar el filtro sobre el segmento de voz que interesa limpiar.
Utilizando adecuadamente el filtro De Noiser se pueden obtener segmentos vocálicos y fonemas con un buen ancho de banda rico en frecuencias armónicas.
- ECUALIZACIÓN
Para mejorar la inteligibilidad del mensaje en el rango de frecuencias que afectan a la inteligibilidad de la voz, es necesario actuar sobre algunas frecuencias que dificultan la claridad del mensaje (frecuencias graves inferior a 150hz).
En este caso se han aplicado varios filtros con valores de ganancia y frecuencias de corte tal y como se muestra en la siguiente imagen.
El nuevo audio generado se guarda y se obtiene su correspondiente firma digital hash que se incorporará como parte del procedimiento forense dentro del informe pericial.
Una vez limpiado el audio se procede a la transcripción literal si fuera necesario, o está listo para presentarse como prueba directamente, esto depende de la estrategia del abogado. Este trabajo nos permite extraer información más allá del contenido, también de situación, si hay movimiento, cuestiones importantes para la recreación de la situación.
En cualquier de los casos, este servicio, siempre va acompañado de otros, como verificación de locutor y transcripción literal.