Los Periodistas

Los deepfakes subieron de nivel en 2025: esto es lo que viene a continuación | The Conversation

Los generadores de imágenes y videos con IA ahora producen contenido totalmente realista. 
Imagen generada con IA por Siwei Lyu con Google Gemini 3.

Profesor de Ciencias de la Computación e Ingeniería; Director del Laboratorio Forense de Medios de la UB, Universidad de Buffalo

A lo largo de 2025, los deepfakes mejoraron drásticamente. Los rostros, voces y representaciones de cuerpo entero generados por IA que imitan a personas reales aumentaron en calidad mucho más allá de lo que muchos expertos esperaban hace tan solo unos años. Además, se utilizaron cada vez más para engañar a la gente.

En muchas situaciones cotidianas, especialmente en videollamadas de baja resolución y contenido multimedia compartido en redes sociales, su realismo es ahora lo suficientemente alto como para engañar con fiabilidad a espectadores inexpertos. En la práctica, los medios sintéticos se han vuelto indistinguibles de las grabaciones auténticas para la gente común y, en algunos casos, incluso para las instituciones.

Y este aumento no se limita a la calidad. El volumen de deepfakes ha crecido exponencialmente: la firma de ciberseguridad DeepStrike estima un aumento de aproximadamente 500.000 deepfakes en línea en 2023 a unos 8 millones en 2025, con un crecimiento anual cercano al 900 %.

Soy informático e investigo deepfakes y otros medios sintéticos. Desde mi perspectiva, preveo que la situación probablemente empeorará en 2026, a medida que los deepfakes se conviertan en actores sintéticos capaces de reaccionar ante las personas en tiempo real.

Mejoras espectaculares

Varios cambios técnicos subyacen a esta drástica escalada. En primer lugar, el realismo de video dio un salto significativo gracias a los modelos de generación de video diseñados específicamente para mantener la consistencia temporal . Estos modelos producen videos con movimiento coherente, identidades consistentes de las personas retratadas y contenido coherente de un fotograma a otro. Los modelos separan la información relacionada con la representación de la identidad de una persona de la información sobre el movimiento, de modo que un mismo movimiento puede asignarse a diferentes identidades , o una misma identidad puede tener múltiples tipos de movimientos.

Estos modelos producen rostros estables y coherentes sin parpadeos, deformaciones ni distorsiones estructurales alrededor de los ojos y la mandíbula que alguna vez sirvieron como evidencia forense confiable de deepfakes.

En segundo lugar, la clonación de voz ha traspasado lo que yo llamaría el «umbral indistinguible». Unos pocos segundos de audio bastan ahora para generar una clonación convincente , con entonación, ritmo, énfasis, emoción, pausas y ruido de respiración naturales. Esta capacidad ya está fomentando el fraude a gran escala. Algunos grandes minoristas informan recibir más de 1000 llamadas fraudulentas generadas por IA al día. Los indicios perceptivos que antes delataban las voces sintéticas han desaparecido prácticamente.

En tercer lugar, las herramientas para el consumidor han reducido la barrera técnica prácticamente a cero. Las actualizaciones de Sora 2 de OpenAI y Veo 3 de Google , junto con una oleada de startups, permiten que cualquiera pueda describir una idea, dejar que un modelo de lenguaje extenso como ChatGPT de OpenAI o Gemini de Google redacte un guion y generar contenido audiovisual de alta calidad en minutos . Los agentes de IA pueden automatizar todo el proceso. La capacidad de generar deepfakes coherentes y basados ​​en argumentos a gran escala se ha democratizado de forma efectiva.

Esta combinación de cantidad creciente y personajes casi indistinguibles de los humanos reales crea serios desafíos para la detección de deepfakes , especialmente en un entorno mediático donde la atención de la gente está fragmentada y el contenido se difunde a mayor velocidad de la que puede verificarse. Ya se han producido daños reales —desde desinformación hasta acoso selectivo y estafas financieras— gracias a deepfakes que se propagan antes de que la gente tenga la oportunidad de darse cuenta de lo que está sucediendo.

El futuro es tiempo real

De cara al futuro, la trayectoria para el próximo año es clara: los deepfakes avanzan hacia la síntesis en tiempo real, capaz de producir vídeos que se asemejan mucho a los matices de la apariencia humana, lo que facilita su evasión de los sistemas de detección. La frontera se está desplazando del realismo visual estático a la coherencia temporal y conductual: modelos que generan contenido en directo o casi en directo en lugar de clips pre-renderizados.

El modelado de identidad está convergiendo en sistemas unificados que capturan no solo la apariencia de una persona, sino también cómo se mueve, suena y habla en distintos contextos . El resultado va más allá de «esto se parece a la persona X» a «esto se comporta como la persona X con el tiempo». Espero que todos los participantes de la videollamada se sinteticen en tiempo real; actores interactivos controlados por IA cuyos rostros, voces y gestos se adapten instantáneamente a una indicación; y estafadores que implementen avatares responsivos en lugar de videos fijos.

A medida que estas capacidades maduren, la brecha perceptual entre los medios humanos sintéticos y auténticos seguirá reduciéndose. La línea de defensa significativa se alejará del juicio humano. En su lugar, dependerá de protecciones a nivel de infraestructura. Estas incluyen la procedencia segura, como medios firmados criptográficamente, y herramientas de contenido de IA que utilizan las especificaciones de la Coalición para la Procedencia y Autenticidad del Contenido . También dependerá de herramientas forenses multimodales como el Deepfake-o-Meter de mi laboratorio .

Simplemente mirar con más atención los píxeles ya no será suficiente.

Fuente: https://theconversation.com/deepfakes-leveled-up-in-2025-heres-whats-coming-next-271391

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio