Redacción. Accenture, compañía global de servicios de estrategia, consultoría, marketing, tecnología y operaciones, y CereProc, proveedor de tecnología de texto a voz, han colaborado para crear la primera solución integral de voz no binaria del mundo, a la que han denominado Sam.
Según un informe de Juniper Research puesto de relieve por Accenture, los consumidores interactuaron el año pasado con 4.200 millones de asistentes de voz digitales en todo el mundo, y se espera que ese número se duplique hasta 8.400 millones de dispositivos para 2024.
La gran mayoría de las voces de los dispositivos en la actualidad son femeninas, y esta diversidad tan limitada resulta, según Accenture, problemática. En este sentido, un informe de la Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (Unesco) de 2019 señala que el uso de voces femeninas para los asistentes de voz refuerza los prejuicios de género y fomenta un comportamiento negativo, tanto con asistentes digitales como con personas reales.
Además, las voces disponibles hoy en día son binarias y no reflejan la comunidad transgénero o de género no conforme, que representa al 12 % de los millennials.
Para ayudar a abordar estas cuestiones, investigadores de Accenture Labs han colaborado con miembros de la comunidad de género no binario en el desarrollo de la voz Sam. Accenture ha entrevistado a personas no binarias y utilizado sus respuestas y archivos de audio para influir no solo en el tono, sino también en los patrones de habla, la entonación y la elección de las palabras.
CereProc ha creado posteriormente el modelo de texto a voz usando su tecnología de inteligencia artificial (IA). El resultado es una voz que combina aspectos de voces masculinas y femeninas que resuene mejor en la comunidad a representar.
"Aunque ya se han publicado anteriormente muestras de voz neutras en cuanto al género, Sam es la primera voz no binaria, basada en la inteligencia artificial, que puede incorporarse a cualquier solución de software y que cuenta con una voz que suena humana", explica Marc Carrel-Billiard, senior managing director y Technology Innovation lead de Accenture.
"Este proyecto es un gran ejemplo de cómo la tecnología y la creatividad humana pueden unirse y fomentar un cambio social que puede beneficiar a muchas personas. Creemos que es esencial que los asistentes de voz representen con mayor precisión la diversidad de la población mundial", añade Carrel-Billiard.
Software libre
Accenture ha publicado como software libre todos los componentes necesarios para desarrollar el asistente de voz no binario, en el que se incluye una versión de texto a voz que funciona mediante código abierto, junto con datos de entrenamiento de voz para fomentar una adopción más amplia.
La compañía también está trabajando con investigadores de la Universidad Heriot-Watt, que utilizarán la voz para un estudio, en colaboración con otras universidades, centrado en el diseño de asistentes de conversación para reducir los prejuicios de género.
Según Paul Welham, director ejecutivo de CereProc, “al crear una voz no binaria junto a Accenture, CereProc desafía a la opinión generalizada, muy arraigada en el ámbito de la informática, de que una voz sintética tiene que ser claramente masculina o femenina”.
“Uno de los objetivos clave de CereProc desde su creación ha sido animar a los diseñadores de aplicaciones a desafiar el statu quo en el habla. Con esta voz no binaria nos gustaría incrementar la conciencia sobre este tema tan relevante, en la próxima generación de sistemas de voz digitales basados en la inteligencia artificial que se desarrollen”, añade Welham.