Page 38 - Anuario AC/E de cultura digital 2024
P. 38

 Conceptos de IA relacionados con la voz
   Deepfake: voz inglesa que surge de la unión de los términos deep (de deep learning, aprendizaje profundo, y deep neural networks, redes neuronales profundas) y fake (falso).
Cheapfake: deepfakes de baja calidad; por ejemplo, vídeos manipulados con herramientas baratas y accesibles (frente a las creaciones realizadas por un equipo de profesionales, generalmente con una mayor inversión económica). Aunque para la realización de los cheapfakes también se puede usar tecnología de redes neuronales, el resultado es de menor calidad y por eso suelen ser más fáciles de detectar.
Vishing: tipo de estafa de ingeniería social,
similar al phishing y al smishing. En este caso, se trata de un fraude telefónico: a través de una llamada, se suplanta la identidad de una empresa, organización o persona de confianza, con el fin de obtener información personal y sensible de la víctima. El término es una combinación del inglés voice (voz) y phishing, que a su vez es un término que proviene del inglés fishing (pesca), pues hace alusión al uso de un cebo para que las víctimas muerdan el anzuelo.
  38
de imagen, un cheapfake sería, por ejemplo, una imagen generada por IA que, a simple vista, puede parecer una foto de un humano real, pero si nos paramos a observarla con mayor detalle, vemos, por ejemplo, que las manos tienen más de cinco dedos. En Maldita.es nos aconsejan cómo identificar deepfakes de imagen y vídeo no profesionales;24 básicamente, debemos atender a imperfecciones y detalles, como el que acabamos de explicar, y otros, como podrían ser rostros borrosos, perspectivas erróneas, desajuste del color de piel, etc.
Sin embargo, la voz es hoy el gran reto en la detección de deepfakes y queda mucho por investigar. No encontramos realmente una lista de pistas a las que podamos atender para saber cuándo estamos ante un posible deepfake de
voz, más allá de algunos consejos básicos que encontramos en páginas web como la del Incibe (Instituto Nacional de Ciberseguridad)25 y que afectan, sobre todo, a formatos multimodales, como los vídeos, en los que hay voz, pero tam- bién imagen. Allí se recomienda básicamente que «afinemos el oído»: «Si el sonido no coincide
con la imagen, detectas algún tono fuera de lugar en la voz del protagonista o una falta de sincronización, posiblemente se tratará de una falsificación». También recomiendan sospechar de los vídeos especialmente cortos, pues en ellos es más fácil camuflar los posibles errores y lograr una simulación lo más detallista posible.
Con un objetivo claramente aplicado (distinguir deepfakes de voces reales, evitar delitos de robo de identidad vocal, etc.) nace el proyecto de investigación del que soy investigadora principal: ¿Qué hace humana a una voz? Hacia una mejor comprensión de las características fonéticas que permiten distinguir voces reales de deepfakes
24 https://maldita.es/malditatecnologia/20231026/ detectar-deepfakes-diferencia-contenidos-inteli- gencia-artificial/
25 https://www.incibe.es/ciudadania/blog/deep- fakes-como-se-aprovechan-de-esta-tecnologia-pa- ra-enganarnos
(Proyecto PID2021-124995OA-l00 financiado por MCIN/AEI/10.13039/501100011033 y por Feder. Una manera de hacer Europa).
Entre los objetivos del proyecto se encuentra descubrir científicamente qué hace humana a una voz, para así poder distinguirla de los deep- fakes. El proyecto nace con una vocación cla- ramente divulgativa y pretende dialogar, desde la lingüística, con otras disciplinas científicas que se ocupan también de abordar los retos de la IA en nuestra sociedad. Un ejemplo de ello es nuestra participación en la mesa redonda Ciencia ante la desinformación: Fake news e inteligencia artificial el pasado 8 de noviembre de 2023.26
PROFUNDIZANDO EN LOS DEEPFAKES: ¿QUÉ HACE HUMANA A UNA VOZ? · EUGENIA SAN SEGUNDO FERNÁNDEZ
26 https://www.youtube.com/ watch?v=T93skphUmgs
                                                   Anuario AC/E de cultura digital 2024

















































































   36   37   38   39   40