En los últimos años, las grabaciones de audio se han convertido en una de las pruebas más habituales en procedimientos judiciales, tanto en casos de corrupción como en conflictos laborales, familiares o civiles. Sin embargo, la irrupción de la inteligencia artificial ha añadido una nueva complejidad: la posibilidad de crear voces sintéticas casi indistinguibles de la voz humana.
Esto ha dado lugar a una estrategia defensiva cada vez más común: alegar que la grabación ha sido manipulada o que la voz ha sido falsificada mediante IA, lo que puede llevar a la nulidad de la prueba.
Aunque el peritaje forense especializado permite detectar indicios de manipulación, el simple hecho de alegar que la voz es sintética puede generar dudas razonables en un procedimiento judicial.
Contexto legal: validez de las grabaciones como prueba
En España, el Tribunal Supremo ha establecido de forma reiterada que una persona puede grabar legalmente una conversación en la que participa, sin necesidad de informar al resto de interlocutores (doctrina consolidada desde 1984, conocida por casos como el del “Padre Coraje”.
No obstante, la prueba será nula si:
- Vulnera derechos fundamentales, como el derecho a la intimidad (art. 18 CE).
- Ha sido obtenida de forma ilícita (por ejemplo, mediante espionaje o hackeo).
- Ha sido manipulada, alterando su contenido original.
Esto significa que la autenticidad del audio se convierte en el punto central cuando una parte impugna la grabación.
¿Cómo se impugna una grabación alegando manipulación o voz sintética?
Existen dos estrategias principales que puede seguir la defensa:
- Negar la existencia de la conversación: alegando que nunca se produjo y que la voz ha sido generada artificialmente.
- Reconocer la conversación, pero sostener que ha sido editada o alterada, cambiando fragmentos del contenido.
Con el auge de herramientas de IA capaces de clonar voces a partir de grabaciones previas, la primera estrategia ha ganado fuerza. Esto ha ocurrido recientemente en casos mediáticos como el caso Koldo, donde figuras públicas como José Luis Ábalos han declarado ante el juez que “no es mi voz” en los audios presentados como prueba
Nulidad de la prueba por manipulación o falsificación
Si se demuestra que la grabación ha sido manipulada o que la voz fue generada artificialmente, la defensa puede solicitar su nulidad, basándose en:
- Artículo 11.1 de la Ley Orgánica del Poder Judicial (LOPJ): Inadmisión de pruebas obtenidas de forma ilícita.
- Artículo 18 de la Constitución Española: Protección del derecho a la intimidad.
- Artículo 24 CE: Derecho a un proceso con todas las garantías.
El juez podrá declarar la nulidad si considera que la prueba carece de fiabilidad y autenticidad, impidiendo su uso para fundamentar una condena.
El papel de la pericia forense en la detección de manipulaciones
Aunque la IA puede engañar al oído humano, los peritos expertos en acústica forense, disponen de herramientas y técnicas avanzadas para detectar los diferentes casos de spoofing o falsificación.
Disponer de pruebas sólidas irrefutables, proporcionan una capa de seguridad y confort al abogado que necesita reforzar su estrategia procesal con argumentos sólidos, incuestionables.
Metodología forense que debe incluir todos estos procedimientos:
-Identificación de fragmentos de voz sintética y obtención de la firma inequívoca sobre el software de IA utilizado. Basando el análisis en herramientas forenses sofisticadas que trabajan con redes neuronales profundas entrenadas en diferentes canales (microfónico y telefónico), con rangos de probabilidad para cada segmento de audio analizado, proporcionando así una conclusión basada en datos objetivos, para que sea admitido como prueba.

- Análisis de rasgos suprasegmentales del lenguaje, como es el acento, la entonación, y ritmo, compatible o no con el habla natural o sintética.
- Localización de puntos de edición por cambios en la respuesta en frecuencia y fase acústica.
- Identificación de pausas intencionadas o cortes desde la propia aplicación o dispositivo grabador durante los actos del habla.
- Identificación de trazas de otros códecs de audio y resampling de la señal digital.
- Identificación de señales coincidentes procedente de un proceso posterior copy-paste.
- Análisis espacial y ubicación de hablantes.
¿En qué casos es más frecuente el análisis forense de voz?
Después de más de 15 años colaborando con abogados de diferentes áreas de práctica, hemos acumulado conocimiento especializado en todo tipo de casos en los que una grabación de voz aporta información de valor que permita llegar a la verdad sobre los hechos denunciados.
Algunos ejemplos se detallan a continuación:
Ámbito Penal: Defensa a investigados. Estafas. Corrupción. Tráfico de Drogas. Enriquecimiento ilícito. Violencia familiar, Asesinato. Informes Contrapericiales
Laboral: Incumplimiento de pactos. Despidos. Acoso
Civil: Reclamaciones de cantidad y Herencias
Familia: Divorcios, guarda y custodia. Amenazas
Riesgos actuales y retos futuros
Si bien la tecnología forense actual permite detectar alteraciones, la evolución de la IA plantea un desafío a medio plazo:
- Hoy en día, es posible engañar a una persona, pero no al análisis técnico forense profundo. Cada vez es más necesario la formación especializada en Acústica forense por parte de peritos informáticos y expertos tecnológicos.
- La empresas se enfrentan a nuevos riesgos reputacionales con las voces indubitadas de sus altos ejecutivos, disponibles en internet. Un nuevo vector de ataque que hay que mitigar.
- Esto obligará a jueces, abogados y fiscales a entender cuál debe ser la mejor manera de gestionar las evidencias digitales de audio y cómo acreditar su integridad con las nuevas amenazas de Deep fake, y evitar la fácil coartada judicial con la frase: “No me reconozco”.
Propuesta de Graudio Forensics
En Graudio tratamos siempre de estar actualizados 360, en constante contacto con las marcas y fabricantes de referencia, presentes en foros y ferias internacionales y lo más importante para nosotros: La calidad y diversidad de clientes y casos que nos “empuja” a evolucionar constantemente.
Los nuevos retos para expertos en Ciberseguridad, también los son en el ámbito pericial forense. La estafa del “fraude del CEO”, por ejemplo, es cada vez más sofisticada con el uso de la Inteligencia Artificial generando audios y videos clonados, muy difíciles de detectar en algunos casos, y con un impacto muy negativo para la reputación de una empresa.
En Graudio, el análisis de Integridad de un audio se realiza considerando todos los elementos que integran una grabación de voz (dispositivo grabador, soporte de almacenamiento) y no solo un fragmento de audio publicado en un medio de comunicación, como hemos visto recientemente en el caso Ábalos.
Frente a la pregunta: ¿Es posible determinar si los audios publicados han sido manipulados con voz artificial?, ya explicamos en diferentes televisiones que la respuesta a la verdad jurídica, dependerá del material examinado y las capacidades de análisis del perito forense a disposición del caso.

En los procedimientos penales, lo que no se prueba, no existe, y la carga de la prueba recae sobre el Ministerio Fiscal que tendrá que basar su acusación sobre indicios y pruebas sólidas.
De no ser así, el principio de “Indubio pro reo”, dice qué en caso de duda razonable, se deberá favorecer al acusado.