Desmintiendo mitos geopolíticos

Analizamos si la amenaza global proviene realmente de aplicaciones chinas gratuitas o si estamos ignorando a los actores más peligrosos de Occidente y Europa del Este.

Existe una creencia popular de que China es el principal motor de la amenaza deepfake a nivel mundial. Sin embargo, los datos de 2025 sugieren que este análisis es incompleto y, en gran medida, erróneo. Aunque China produce herramientas de consumo masivo, la verdadera infraestructura de ataque y los actores más agresivos están distribuidos en una red global que tiene sus raíces en Occidente y centros de ciberdelincuencia en Rusia y Corea del Norte.

La Tecnología nació en Occidente

Para entender la amenaza, hay que mirar atrás. El origen de los deepfakes de audio no está en Asia, sino en laboratorios académicos estadounidenses y británicos. En 1997, investigadores de la Universidad Carnegie Mellon ya documentaban la reanimación facial por video, y en 2016, el sistema WaveNet de DeepMind (Google) en el Reino Unido revolucionó la síntesis de voz al generar ondas de audio mediante redes neuronales profundas, superando las voces mecánicas del pasado. Hoy en día, las herramientas de clonación más utilizadas para el fraude corporativo, como ElevenLabs o Resemble AI, son de origen occidental y están disponibles globalmente.   

Xanthorox AI: El verdadero «monstruo» local

Mientras el público se preocupa por las apps chinas gratuitas, el submundo criminal ha desarrollado plataformas como Xanthorox AI. Identificada en 2025, esta herramienta es la antítesis de la app gratuita: opera en servidores locales auto-hospedados fuera de la nube pública, lo que la hace invisible para los detectores corporativos. Integra modelos capaces de realizar llamadas de voz conversacionales en tiempo real, permitiendo a los atacantes improvisar respuestas durante una estafa, algo que va mucho más allá de lo que permite una versión gratuita de una red social china.

¿Quiénes son los agresores reales?

Las estadísticas de ataques de 2025 muestran una distribución geográfica que contradice el mito de la centralización china:

  • Norteamérica (39%) y Europa (26%) son los focos principales de ataques de fraude ejecutivo y desinformación política.
  • Corea del Norte (Lazarus Group/BlueNoroff): Este grupo estatal ha escalado hacia el uso de deepfakes en Zoom para suplantar a ejecutivos y robar criptomonedas, financiando así su programa nuclear.
  • Rusia y Europa del Este: Grupos como UNC6040 han logrado penetrar en financieras occidentales clonando la voz de altos cargos, orquestando transferencias de más de 12 millones de dólares.
  • América Latina: Colectivos como SilverPhantom han pivotado desde estafas románticas hacia el fraude en departamentos de compras en Brasil y Argentina utilizando voces sintéticas.

La siguiente imagen resume el ecosistema global de aplicaciones de IA para voz, destacando lideres geográficos y capacidades tecnológicas.

Siendo la clonación de voz la especialidad principal, con un dominio de Europa y Asia Pacífico, que ya cubren el 68% del mercado de la IA de voz.

 

China: Herramientas locales, regulación estricta

Es cierto que empresas como MiniMax, Baidu o Tencent ofrecen herramientas de clonación de voz asombrosas. Sin embargo, estas plataformas están orientadas principalmente al mercado interno chino y operan bajo un nuevo marco normativo para prohibir el uso de contenido audiovisual para difundir noticias falsas o información que pueda considerarse perjudicial para la economía, la seguridad nacional o la imagen de China.

Una regulación estatal extremadamente estricta que exige marcas de agua digitales. CapCut, aunque muy popular, es una herramienta de edición creativa para el consumidor y no hay evidencia de que esté siendo utilizada como infraestructura para campañas maliciosas globales de vishing.  

Conclusión: La amenaza no está localizada en un país específico. El peligro real es la democratización global de la tecnología. Con un aumento del 1,600% en ataques de vishing con deepfake en el primer trimestre de 2025, el problema no es quién fabricó la aplicación gratuita, sino la facilidad con la que actores criminales de cualquier rincón del mundo pueden acceder a modelos occidentales, rusos o norcoreanos para saltarse las fronteras de la confianza humana.

Desde Graudio Forensics hacemos un seguimiento sobre los diferentes avances en tecnologías de clonación, analizando audios manipulados y ediciones digitales complejas con voz sintética, que solo pueden detectarse con una metodología forense 360, desde diferentes ángulos y con herramientas de audio forense que permiten detectar fallas y ruptura de integridad de audio de diferente tipología y naturaleza. 

 

 

Graudio Forensics
Resumen de privacidad

Esta web utiliza cookies para que podamos ofrecerte la mejor experiencia de usuario posible.

La información de las cookies se almacena en tu navegador y realiza funciones tales como reconocerte cuando vuelves a nuestra web o ayudar a nuestro equipo a comprender qué secciones de la web encuentras más interesantes y útiles.

Nunca almacenamos información personal.

Tienes toda la información sobre privacidad, derechos legales y cookies en nuestra página de Política de Cookies.