Seminario de Acústica Forense: Análisis de Integridad y Detección de Audios Generados con IA
Detectar audios con
Iteligencia Artificial
La Acústica Forense:
Una Necesidad Formativa Emergente en Criminología y Ciberseguridad
En los últimos años, hemos identificado un creciente interés y una clara demanda de formación en áreas de la Criminología como la Acústica Forense, una especialidad que se está consolidando como una herramienta crucial en el análisis de evidencias digitales de audio. Este campo, fundamental en contextos judiciales y de litigio, es desconocido para muchos profesionales, a pesar de su relevancia.
En el pasado, hemos tenido el privilegio de colaborar en el diseño de contenidos para programas académicos de prestigio, como el grado en Criminología de la Universidad CEU-San Pablo y el Máster Universitario en Ciberdelincuencia de la Universidad Nebrija de Madrid. En estos programas, nos hemos centrado en acercar a los estudiantes al campo del Audio Forense y sus aplicaciones prácticas, brindándoles una sólida base teórica acompañada de ejemplos prácticos que ilustran cómo se aplica esta disciplina en casos reales.
Motivados por el interés creciente y el desconocimiento que aún existe sobre cómo la Acústica Forense puede contribuir en el esclarecimiento de disputas o litigios, hemos desarrollado diversos programas formativos especializados. Estos cursos están diseñados para proporcionar a los profesionales una formación completa, que les permita integrar de manera efectiva las técnicas de análisis de audio en sus prácticas profesionales.
Nuestro objetivo es ofrecer un conocimiento accesible y práctico, dirigido especialmente a profesionales de la Criminología, Ciberseguridad y Peritos Tecnológicos. De esta manera, pueden contar con herramientas avanzadas que les permitan generar mayor valor en sus servicios y, a su vez, contribuir a la resolución de casos complejos con un análisis forense de audio preciso y confiable.
¿Por qué un Seminario de Análisis de Integridad de Audio?
La autenticidad y la integridad de un archivo de audio son factores esenciales en la evaluación de pruebas sonoras dentro de un proceso judicial. Estos procedimientos forenses no solo verifican si una grabación es una secuencia de audio única o ha sido editada, sino que permiten identificar manipulaciones, ediciones o incluso falsificaciones en archivos de audio que, a simple vista, podrían parecer genuinos.
¿Qué contenidos del seminario suscitan mayor interés?
¿Qué herramientas se presentarán en el seminario?
Más allá de explorar cada una de las metodologías forenses que nos permite tener un análisis de integridad 360 sobre las evidencias digitales de audio, haremos especial hincapié en la generación de Deep fakes de audio y como detectarlo para obtener la evidencia científica y con ello las pruebas para defender frente a la ante la autoridad judicial.
Algunos desarrolladores de software avanza ya en la generación de redes neuronales profundas entrenadas (Deep Neural Network, DNN), alimentadas con una base de grabaciones de audio representativa, conteniendo numerosos ejemplos de todo tipo de ataques de suplantación de identidad. Estas bases de datos de grabaciones de audio suelen contener varios miles de muestras. Cuanto más voluminosa sea la base, más precisa funcionará la red neuronal.
En estos casos, el módulo de detección de voz clonada, recibe en la entrada un fichero de audio y entrega en la salida un índice de probabilidad, sobre la posibilidad de ser voz sintética o no.
Más allá de explorar cada una de las metodologías forenses que nos permite tener un análisis de integridad 360 sobre las evidencias digitales de audio, haremos especial hincapié en la generación de Deep fakes de audio y como detectarlo para obtener la evidencia científica y con ello las pruebas para defender frente a la ante la autoridad judicial.
Algunos desarrolladores de software avanza ya en la generación de redes neuronales profundas entrenadas (Deep Neural Network, DNN), alimentadas con una base de grabaciones de audio representativa, conteniendo numerosos ejemplos de todo tipo de ataques de suplantación de identidad. Estas bases de datos de grabaciones de audio suelen contener varios miles de muestras. Cuanto más voluminosa sea la base, más precisa funcionará la red neuronal.
En estos casos, el módulo de detección de voz clonada, recibe en la entrada un fichero de audio y entrega en la salida un índice de probabilidad, sobre la posibilidad de ser voz sintética o no.
La decisión final la toma el experto en base a un examen exhaustivo de la grabación de audio, donde también el perito debería responder a las siguientes preguntas:
¿Coincide la entonación con el significado del habla?
¿Coincide la manifestación emocional con el significado de lo que se dice?
¿Coincide la pausa con el significado del discurso?
¿Se corresponde el entorno acústico (ruido, reverberación) con el contenido del habla y las circunstancias en las que se realizó la grabación?
Y en los casos qué tenemos una grabación de audio en su mayoría original y solo un fragmento separado es un spoofing, ¿es posible detectarlo de alguna manera y determinar el comienzo y el final de dicho fragmento?
En esos casos, el análisis se focalizará en identificar los puntos de edición y ruptura de la integridad del audio, y en segundo lugar la verificación y localización de los fragmentos con voz sintética.
Para ello es muy útil poder disponer de una herramienta que analice cada fragmento de audio para detectar potenciales fragmentos de audio falso, indicando el porcentaje de probabilidad en fragmentos cortos de habla.