Además, nuestro compañero José Romero nos comparte en otro artículo 4 casos de uso para potenciar procesos de trabajo en el sector digital.
Orígenes y contexto de la Inteligencia Artificial
Pensar que las máquinas puedan interactuar con los seres humanos no es nada nuevo.
Por ejemplo, en la mitología griega, el dios del fuego Hefestos creó varios autómatas para servirle. En la misma Grecia clásica, Herón de Alejandría diseñó autómatas para su uso en teatros. Siglos más tarde, ya en periodo renacentista e influenciado por toda la tradición antigua, Leonardo Da Vinci creó en 1495 el primer robot occidental humanoide capaz de moverse. Y existen muchos más ejemplos a lo largo de la historia con los que podemos comprobar cierta fascinación de crear seres semejantes a nosotros con los que interactuar.
Matemáticas y lenguajes de programación
En el s. XX, se establece la lógica formal y moderna de las matemáticas. Además, el desarrollo de tecnologías promueve el reemplazo del cálculo analógico por el digital. Nuevas necesidades surgidas en la Segunda Guerra Mundial fomentan estudios influyentes que aúnan artificialidad e inteligencia. Por ejemplo, en 1943, Warren McCulloch y Walter Pitts sientan las bases de la redes neuronales artificiales, George Pólya publica en 1945 uno de los libros más influyentes sobre Inteligencia Artificial (“How to solve it”). 5 años más tarde, Alan Touring presenta su famoso test homónimo para poner a prueba si una máquina es capaz de simular una conversación humana y al mismo tiempo comprobar si un interlocutor es capaz de distinguir con quién está hablando.
¿Y si las máquinas pudieran aprender solas?
Todos estos hallazgos tienen en común pensar en la inteligencia artificial como algo puramente racional. Pero claro, el desarrollo computacional avanza y se empieza a pensar que podría llegar a aprender y comunicarse de una manera similar a la nuestra.
Desde entonces, todos los esfuerzos han ido encaminados a desarrollar y perfeccionar el Procesamiento de Lenguaje Natural (PLN) y entrenar a las máquinas para que aprendan de manera automática (Machine Learning).
De hecho, el primer chatbot de la historia, ELIZA, surge en el MIT allá por 1964 con la intención de procesar lenguaje natural, identificando palabras clave para continuar “chateando”.
A finales del siglo XX, en 1997, se produce un hecho popular e histórico. El programa Deep Blue, creado por IBM, vence a Kasparov, el campeón mundial de ajedrez.
Sin embargo, el punto de inflexión llega en 2015 cuando Google DeepMind, diseña Alphago. Un programa de inteligencia artificial que trata de reproducir redes neuronales del cerebro humano aplicado a videojuegos. Alphago ya no se basa en “memorizar partidas y estrategias”, como hacía Deep Blue, sino en aprender las reglas y “entrenarse a sí mismo”. De esta forma, Alphago consiguió en 2016 ganar 5 a 0 al, por entonces, triple campeón de Europa.
¿Y si las máquinas pudieran conversar?
¿Qué tiene de especial el lenguaje humano? Sí, somos racionales, pero también emocionales. Aunque es muy probable que una máquina nunca llegue a sentir de verdad, la intención es que pueda al menos detectar las emociones y tener la capacidad para expresarlas. Es lo que llamó Rosalind W. Picard: “aparentar que tienen inteligencia emocional”.
Con esta lógica, así es como todos los estudios y proyectos sobre inteligencia artificial giran en torno a esta doble inteligencia que cualquier máquina debe contemplar a la hora de ser creada para parecerse a nosotros y, por tanto, tener “cierta personalidad”.
En todo caso, cualquier interfaz conversacional, no importa qué tecnología utilice, necesita al ser humano. Ya sea para ser programada, entrenada o constantemente testada para su constante perfección.
Si bien, en los últimos años, la tecnología de inteligencia artificial y lenguaje natural está más desarrollada y las empresas han despertado el interés de desarrollar nuevos servicios digitales de interacción con sus clientes, aún las interfaces conversacionales no están del todo a la altura de las expectativas de los usuarios.
Eso sí, desde luego, es el momento de empezar a trabajarlas para estar preparados, obtener expertise y conocimiento acumulativo para el negocio porque, sin lugar a dudas, la opción de conversar con las máquinas ha llegado para quedarse. Y si no, pregunten a ChatGPT para comprobar sus múltiples aplicaciones.
Ahora sí, hablemos del caso de uso: ¡toc, toc! Llaman a la puerta de Flat 101 para diseñar un asistente virtual con personalidad propia.
Y no solo eso, sino también ayudarle a dar sus primeros pasos, emitir sus primeras palabras y colaborar en todo el proceso hasta incluso poder hablar e interactuar de viva voz con usuarios.
Investigación secundaria: qué ocurre actualmente con los asistentes virtuales.
Se realiza búsqueda teórica y práctica. Comprobamos una clara tendencia visual en la industria de diseños de avatares de chatbots abstractos, neutros y sin género. Aprendemos qué tipo de asistentes virtuales hay y cómo son a día de hoy. Los hay lineales, que solo permiten al usuario ir de botón en botón, pero también conversacionales, con los que se puede interactuar por medio de botones, escribiendo…
El que se quiere desarrollar es ambicioso. No es solo un chatbot sin más. Quiere ser muy inteligente y tratar muchos asuntos. Con tecnología puntera de IA y voz en un futuro próximo. Pero de momento, debe permitir al usuario poder interactuar escribiendo, también guiarle por botones y flujos muy variopintos. En pocas palabras, un proceso de menos a más.
Al mismo tiempo, se hace un benchmark internacional buscando todo tipo de asistentes virtuales. Generamos un cuadro de buenas y malas prácticas.
En definitiva, información valiosa que nos ayuda a tener más ideas y cada vez más claras.
Pero antes de darle forma, se nos pide otorgar a esta entidad a punto de nacer de una personalidad acorde a la marca y sus objetivos. ¿Cómo abordamos esto?
El workshop: una técnica muy apropiada de alineamiento para generar información
Cerca de 20 personas en una sola jornada, con miembros del equipo de diseño de Flat 101 de varios departamentos de la compañía. Dos facilitadores y un planteamiento a ejecutar que persigue conocer de primera mano la marca, misión y valores de la compañía.
Qué es, cómo se ve y a dónde quiere llegar. También, aplicamos casos de uso propios del sector. Los trabajamos a fondo y los llevamos al terreno de los asistentes virtuales para generar al final de la sesión una plantilla de cómo sería el asistente virtual ideal con su propia personalidad y tipo de tono a emplear.
Resultado: mucha información a analizar, clusterizar y categorizar.
Varias personalidades y atributos esenciales a validar
El proceso de análisis cristaliza en varias fichas con personalidades muy definidas y varios rasgos de la personalidad fundamentales.
Mientras tanto, en la cocina de Flat 101 se realiza un brainstorming para idear varios nombres para el asistente, en base a varios criterios basados en tendencia actual y la propia marca. Hacemos varios test de guerrilla que resultan en 6 firmes candidatos..
Resultado: una base para diseñar visualmente al asistente mediante dos personalidades ganadoras, 6 atributos esenciales y un nombre. Parece que tenemos fecha para el bautizo.
Diseño visual del asistente y test con usuarios: el neuromarketing como técnica de investigación innovadora.
El equipo de diseño de Flat 101 genera múltiples avatares visuales. Más de 20, en base a las personalidades y rasgos seleccionados. Interacciones varias con cliente terminan con 2 avatares finalistas.
Pero…¿qué piensan los usuarios?
Se detecta que las técnicas de neuromarketing pueden ser reveladoras en este punto del proceso. Se diseña y ejecuta un test no moderado que nos permite obtener información de cuál de los 6 rasgos de la personalidad se asocian más a cada uno de los dos avatares.
El test se divide en dos partes:
- Primeramente, un test de Priming Semántico donde los usuarios asocian los dos avatares con los atributos que definen la personalidad.
Resultado: una asociación inmediata y casi instintiva de cada avatar con cada rasgo y la fuerza de dichas asociaciones, con rigor estadístico y muy poco margen de error.
- Y después, una encuesta sobre el sector, los avatares en movimiento y los atributos y comunicación con la compañía.
Resultado: una respuesta más racional y meditada con respuestas cualitativas que nos sirvió para dar más profundidad a los resultados cuantitativos de la prueba de neuromarketing.
En resumen, con esta pruebas con usuarios obtuvimos resultados innovadores y un claro avatar ganador con unos atributos más sobresalientes que otros.
Metodología de trabajo y UX Conversacional
Se seleccionan las rutinas, consultas y conversaciones más recurrentes del sector para generar un diseño conversacional centrado en el usuario y en sintonía con las necesidades del negocio. Es decir, se antepone la interacción con los canales digitales de la compañía al tiempo que se contemplan los “user flows”, necesidades de los usuarios y “Jobs To Be Done”.
Como es necesario imprimir una personalidad distinta al asistente conversacional, vamos generando las interacciones de un modo cercano, fresco y lo más natural posible. Además, con el fin de conseguir una lectura más fácil, incluimos negritas en palabras clave junto con emojis y una forma de estructurar la información mucho más clara y amena para los usuarios.
Test del MVP con usuarios reales mediante la técnica del Mago de Oz.
Una vez establecidas y desarrolladas las consultas más frecuentes, necesitamos comprobar de primera mano si vamos por buen camino respecto de la coherencia de los flujos, la estructura de la información, la personalidad y el tono del asistente.
Ahora bien, tenemos un problema. El asistente aún no se puede probar porque no está implementado en pre-producción ni se ha desarrollado aún el widget.
¿Solución? Hacer pruebas con usuarios mediante la técnica del Mago de Oz. Es decir, hacemos sesiones de una hora por participante con una aplicación de mensajería instantánea sin el layout definitivo. Esto nos permite tener menos distracciones visuales y centrarnos en la conversación.
Entonces, ¿en qué consiste el Mago de Oz?
Básicamente, uno de nuestros researcher haciendo la labor del asistente por detrás sin que el participantes lo sepa. Es decir, lanzando la respuesta predefinida y correspondiente al diálogo de cada tarea planteada.
Resultado: surgen varios findings que nos permiten refinar la experiencia de usuario, limar la personalidad actual y ciertos detalles que no habíamos tenido en cuenta para seguir avanzando con buen pie.
Test con usuarios reales frecuentes
El desarrollo del asistente no solo requiere de sprints constantes para alimentar y entrenar las conversaciones, sino que también, cuando se implementa en la fase de pre-producción, se realizan varias mejoras visuales y funcionalidades nuevas dentro del widget, tales como la generación de atajos, botones y enlaces.
Se plantean y se ejecutan test de usabilidad del asistente en su entorno real con usuarios. Pruebas de usabilidad que, en realidad, van a ser un contínuo a lo largo de todo el proyecto para detectar con frecuencia áreas de mejora y de oportunidad.
Y ahora os preguntaréis, ¿existe alguna diferencia entre un test de usuario de una app o web y hacer un test con un asistente?
Diríamos que sí y que no al mismo tiempo. Sí, porque al final sometemos igualmente a prueba la experiencia de uso para detectar posibles errores y mejoras. No, por varios motivos. Pero sobre todo porque estamos realizando pruebas con algo distinto: la conversación natural. Es decir, los usuarios tienden a ser más exigentes y los pains points son aún más delicados.
Asimismo, no hay métricas estandarizadas y con un consenso amplio en la comunidad. En cualquier caso, se puede y se debe comprobar la usabilidad, el diseño y experiencia de uso pero también necesitamos evaluar el éxito por tarea, satisfacción, utilidad y la propia percepción sobre la conversación con el fin de obtener una serie de métricas que nos sirvan para medir su evolución.
La clave aquí, como en cualquier trabajo de research, es tener siempre un buen planteamiento que permita explorar la percepción más allá de la herramienta digital, una ejecución correcta y un análisis bien trabajado.
Además, con la salida a producción del MVP, se crea un dashboard de visualización de data digital que permite tener información adicional de los usuarios sobre consultas frecuentes, flujo de navegación, fallos a tener en cuenta para futuros sprints.
Resultado: una iteración y refinamiento constante que interrelaciona pruebas reales con datos digitales y métricas para seguir desarrollando el alcance del proyecto por medio de su constante evolución y perfeccionamiento.
En resumen…
Ya hemos visto que la interacción humano-máquina viene de lejos. Que la tecnología de inteligencia artificial acompaña a los tiempos actuales. Que el lenguaje natural en la interacción es más viable que nunca. Además, las empresas se están poniendo al día ya mismo en IA porque crear un canal digital con personalidad supone varias ventajas pero que es, al mismo tiempo, costoso, requiere tiempo y mucho esfuerzo humano para que tenga consistencia.
Por todo ello, con este caso real de uso sobre la creación de un asistente virtual en Flat 101, hemos querido describir la complejidad del proceso de diseño desde los propios orígenes, sin nada tangible, hasta la actualidad, es decir, con el constante entrenamiento e implementación de nuevas historias de usuario, funcionalidades y operativas acordes a las necesidades del negocio de nuestro cliente.
En definitiva, un proyecto en constante evolución que exige plena dedicación y flexibilidad de adaptación a una tecnología digital de IA relativamente nueva que demanda mucho esfuerzo, pero también trabajo artesanal para dotar a la conversación de personalidad y fluidez natural pero, sobre todo, mucha mejora constante de experiencia de usuario que va de menos a más.
Porque, a pesar de movernos en un entorno de inteligencia artificial, sin el refuerzo y el entrenamiento contínuo de profesionales detrás y de la participación de usuarios de verdad no sería posible que una máquina sea de utilidad.
Ya por último, y parafraseando a Lucy Suchman, contando con las representaciones particulares de los diseñadores, y, por tanto, de sus sesgos inherentes, si no obtenemos información de la acción situada de los usuarios con sus particularidades, existen muchas más probabilidades de caer en una ceguera que crea moldes con los que el usuario no para de luchar por llevar a cabo su cometido. Es decir, contad siempre con la perspectiva de los usuarios.