Page 35 - Anuario AC/E de cultura digital 2024
P. 35
distinguir las noticias reales de las falsas, o bulos (en inglés, fake news). De ahí que estemos pre- senciando una falta de confianza sin precedentes en los medios, con las consecuencias políticas y sociales que esto puede generar.
En el análisis de un posible deepfake convendría distinguir las rasgos vocales (esto es, de la voz) de otros fenómenos que caracterizan el habla.
¿Puede la IA alterar un proceso democrático? Que se lo pregunten a Martí Batres, gobernador de Ciudad de México. En noviembre de 2023 se hizo viral un audio de WhatsApp en el que se puede escuchar a alguien que supuestamente
es Martí Batres conspirando para obstaculizar
la candidatura de Omar García Harfuch, uno
de los precandidatos de otro partido para las elecciones de la ciudad. El propio Martí no tardó en desmentir el supuesto bulo. Lo hizo a través de un tuit: «No soy yo, es una voz generada por inteligencia artificial». Sin embargo, el debate
ya estaba servido: ¿cómo distinguir una voz real de una artificial? Ante la novedad de encontrar un supuesto caso de voz generada por IA,
ahora también en español, algunos ingenieros y abogados especializados en nuevas tecnologías se pronunciaron al respecto en este artículo de The Wired.20 Por suerte, existe una disciplina científica que se encarga del estudio de la voz
y el habla humanas. Se llama «fonética». ¿Qué podrían decir los fonetistas al respecto? ¿En qué se fijaría un fonetista al escuchar el fragmento de audio de Batres, originalmente compartido a través de TikTok?
2.2. Unas pinceladas de ciencia
En el audio dubitado21 de Martí Batres,22 de ape- nas treinta segundos, percibimos varios fenóme- nos del habla y gran diversidad de características vocales (es decir, relacionadas específicamente con la voz). No solo las escuchamos, sino que, en su mayoría, las podríamos medir y analizar acústicamente.
Hay que señalar que la voz y el habla no son exactamente lo mismo. Es cierto que ambos términos se utilizan de formas diversas, a veces indistintamente. Por ello, no resulta fácil pro- porcionar una definición unívoca. Como indica la investigadora Jody Kreiman (2011, p. 5), «la amplia gama de funciones que cubre la voz ha dificultado la tarea de proporcionar una única definición polivalente que resulte válida y útil para todas las disciplinas, tradiciones académi- cas y aplicaciones científicas». En palabras del estudioso de la voz Johann Sundberg, «todo
el mundo sabe qué es la voz hasta que intenta definirla». En el uso científico habitual —y el que sigue Kreiman, por cierto—, el término «voz» tiene un significado físico y una base fisiológica que se refiere a la señal acústica generada por el sistema de producción de voz del ser humano. Así, existen dos tendencias fundamentales a
la hora de definir una voz. Para los que optan por una definición muy estrecha en términos fisiológicos, la voz es el sonido producido por la vibración de las cuerdas vocales. Cuando se usa en este sentido, por ejemplo, Brackett (1971),
21 En fonética forense, más concretamente en la tarea conocida como comparación forense de hablantes, llamamos dubitada a la grabación de un hablante desconocido, que comparamos con la grabación de uno o varios sospechosos (muestras indubitadas). Véase San Segundo (2023a, 2023b). La fonética fo- rense, en un sentido amplio, «es la disciplina que se encarga de cualquier aplicación legal de la fonética; es decir, de aplicar los conceptos y métodos de la fonética general a la investigación y resolución de delitos en los que el habla o la voz están de algún modo implicados» (San Segundo, 2023a, p. 15).
22 https://www.youtube.com/watch?v=Z5sAjIJCKmI
20 https://es.wired.com/articulos/voces-genera- das-por-ia-indistinguibles-las-humanas-en-espanol
ANUARIO AC/E DE CULTURA DIGITAL 2024
Anuario AC/E de cultura digital 2024
35