Un asistente de voz es el que permite utilizar el teléfono sin pulsar ni una sola tecla, solo necesita el sonido, la voz, para cumplir con las instrucciones que se le mandan. Es el resultado de la Inteligencia Artificial y de la constante evolución del Machine Learning, Natural Language Processing y procesamiento de lenguas naturales.
Los asistentes de voz estaban originalmente pensados para los smartphones, pero poco a poco han ido saliendo de ese ámbito y se han hecho un lugar en los ordenadores, y desde la integración de algunos de ellos, como Amazon Echo, Google Home o HomePod en altavoces en el hogar, en elementos cada día más cotidianos y a mano en la propia casa.
La voz es el elemento más lógico, la forma más natural de transmitir un pensamiento desde que se gesta en el cerebro. Dirigirse a un aparato inteligente tal como se haría con otra persona es un gran logro en el que interviene de forma directa la Inteligencia Artificial. Facilita enormemente la vida, la hace más cómoda, aumenta la productividad y permite que los móviles hagan tareas que pueden memorizar para luego tomar la iniciativa porque conoce los hábitos del usuario. Por no hablar de las posibilidades que ofrece a personas que padezcan algún tipo de discapacidad o a los niños, que podrían manejar algunos aparatos sin riesgo para su integridad.
Breve historia de los asistentes de voz
El primer asistente fue Audrey, desarrollado por los Laboratorios Bell en 1952. Era capaz de reconocer números absolutos con indicaciones de voz. Más tarde se fue perfeccionando con el reconocimiento de palabras y números y algunas operaciones matemáticas. Todavía no podía analizar el sentido completo de una frase.
10 años después, llegó Shoebox de IBM, con sistema de reconocimiento mecánico del lenguaje y capaz de reconocer 16 palabras. En 1978, Harpy, desarrollado en la Universidad Carnegie Mellon ya podía reconocer 1000 palabras.
Con la llegada del Modelo oculto de Márkov en los ochenta, se consiguió analizar la probabilidad estadística de que a una palabra determinada le siguiera otra, lo que mejoró la comprensión de conjunto y permitió el desarrollo del primer modelo predictivo de asistente de voz.
En los noventa llegó el reconocimiento de voz al ordenador. IBM, Dragon, Philips, Microsoft y Learnout & Hauspie. En el 2000 se empezaron a introducir en los ordenadores y se consolidaron diez años después en los smartphones. Apple se convirtió en un pionero. Steve Jobs, en 2011, añadió un asistente de voz en el Iphone 4S, Siri, que aunaba IA y la búsqueda de geodata para mejorar la interacción con el usuario.
Lógicamente comenzó una fuerte competencia entre empresas. Google, Microsoft y también Amazon han trabajado para elaborar sus asistentes: Google Assistant, Cortana, Amazon Echo, Alexa e incluso Facebook está desarrollando el suyo, que de momento solo es de texto.
Tecnología IoT
Tal como vaticinó en 1999 Kevin Ashton, el Iot, Internet de las Cosas, "tenía el potencial de cambiar el mundo de la misma forma que lo haría Internet". Efectivamente así ha sido, con la conexión de todos los equipos electrónicos que nos rodean, la medición de los parámetros externos y la automatización de la mayoría de las actividades que realiza el ser humano. La tecnología IoT se ha integrado con los asistentes de voz, conseguiendo que el control de voz sea útil para gestionar objetos inteligentes conectados en todo tipo de entornos, lo que permite la creación de hogares y ciudades inteligentes.
¿Cómo sucederá? O mejor dicho ¿está ocurriendo ya? A través de varias áreas. Smarthomes: hogares inteligentes en los que podrán controlar los dispositivos electrónicos, monitorizar y personalizar las casa dependiendo de las necesidades de cada usuario. Desde el encendido de las luces, la temperatura de la casa o la ducha, hasta ayuda en la cocina. Empresas como Ikea, Amazon, Google, Electrolux ya están diseñando desde bombillas hasta robots de cocina y aplicaciones de salud.
Smartcars: coches conectados que gestionan las llamadas y mensajes con instrucciones de voz, reproducen música. También se está trabajando en la conducción autónoma por GPS, llegando al punto elegido por el usuario antes de comenzar el trayecto.
La economía también se ha adaptado a las nuevas tecnologías. El Smart Retail busca mejorar la interacción con los clientes y ha transformado el proceso de compra en una experiencia adaptada a ellos. Su relación con el producto ha cambiado totalmente. Los usuarios quieren un acceso fácil, rápido y lo más realista a aquello que desean comprar. Y aquí es donde entra en juego la tecnología que permite la interacción entre vendedor y cliente y entre éste y el producto. El Smart Retail está revolucionando el mundo del comercio.
Los expertos opinan que en apenas un par de años, cada uno de nosotros tendrá como mínimo 3 dispositivos electrónicos conectados a la Red, unos 20.000 millones en todo el mundo.
Las grandes compañías han desarrollado su propio asistente en un intento tanto de mejorar las prestaciones al usuario como por superar a los de las empresas rivales. Estos son algunos de ellos:
Siri
Siri es el asistente de voz de Apple. Se lanzó en 2007 y se relanzó de nuevo con el iPhone 4s en 2011. Era la gran novedad que presentaba Apple, un asistente personal que a través del reconocimiento de voz permitía que el móvil hiciera algunas funciones básicas. Desde entonces, gracias al procesamiento de lenguaje natural, interactúa con el usuario de una manera tan natural que parece casi humana. Responde preguntas, localiza lugares, agenda citas o busca información en Internet. Incluso se permite contestar de forma graciosa cualquier pregunta impertinente.
Google Now
Es el primer asistente de voz de Google. Para activarlo solo es necesario decirle OK, Google y ya está disponible. Se puede decir que es el que mejor conoce al usuario, ya que la compañía tiene una gran cantidad de información que ha ido recopilando a través de sus diferentes servicios. Se puede buscar cualquier cosa, además de poder interactuar con aplicaciones y funciones ya instaladas en el smarphone: realizar llamadas, enviar emails y sms con la voz, abrir aplicaciones, obtener indicaciones de GPS sin usar el teclado.
Google Assistant
Se trata de la versión mejorada de Google Now en la que ya entra en juego la inteligencia artificial. Se puso en marcha a finales de 2016 y se puede descargar en español. Solo hay que tener instalado Android Marshmallow o hacerlo a través de Google Allo.
Bixby
Es el asistente que Samsung ha instalado en el Galaxy S8. Trabaja con el reconocimiento de voz por medio de un software que permite usar el dispositivo solo con hablar al móvil. Se accede a él a través de un botón para navegar a través de las aplicaciones del smartphone con comandos de voz, táctiles y de texto. Se ha integrado también con funciones y apps nativas, cámara, contactos, galería, mensajes y ajustes. Está previsto que se amplíen sus capacidades.
Bixby ofrece contenido que se ajusta a los intereses del usuario basándose en lo que aprende a través de la información que proporcionan sus hábitos y situación, por lo que es capaz de mostrar recordatorios sobre eventos o viajes.
Cortana
Es el asistente de Microsoft y el más parecido a Siri. Funciona de forma parecida a un ordenador con Windows 10. Dispone de un acceso directo en la pantalla de inicio a través del cual el usuario puede interactuar con él. Es un asistente proactivo que contesta basándose en los gustos e intereses del usuario, capaz también de bromear y contar chistes. También realiza llamadas, abre aplicaciones, encuentra archivos y lugares, facilita recordatorios, seguimiento de cualquier interés del usuario y crea notas entre otras cosas. Se instala fácilmente descargando Microsoft Apps.
Robin
Se trata de un asistente de voz independiente para Android, pensado principalmente para ofrecer ayuda a la conducción. Puede realizar análisis semántico, trasladar una consulta a un contexto y responder de manera pertinente. De momento se encuentra en fase beta y solo está disponible en inglés. Sus principales funcionalidades son indicar direcciones y lugares, consultas sobre el estado del tráfico, recordatorios, realizar llamadas, enviar correos y mensajes y poner al día las Redes Sociales.
Sherpa
Sherpa es una aplicación creada en España. Es un asistente de voz muy completo, que funciona con algoritmos de inteligencia artificial basados en modelos probabilísticos que predicen la información que puede interesar al usuario. Quiere adelantarse y ofrecerla antes incluso de que la pida.
Hound
Este aistente consigue hacer dos procesos a la vez: el reconocimiento vocal y la extrapolación de las palabras clave. Es decir, Hound consigue entender inmediantamente lo que le pide el usuario a diferencia de los otros asistentes, que primero transcriben y luego comprenden. Por eso es el más rápido y correcto en sus respuestas, mucho más que Siri y Google Now.
Alexa
Es el asistente de Amazon que tiene presencia física y que se puede poner en cualquier sitio. Solo tiene que escuchar cómo se le nombra para empezar a realizar tareas, desde poner música a hacer la compra online. Alexa for Business está pensada ayudar a las empresas en la organización de las tareas en la oficina y solventar las más tediosas.
Watson Assistant
IBM presenta una solución empresarial para crear asistentes personalizados a la medida de la empresa que lo contrate. Watson Assistant permite a las empresas crear su asistente personalizado sin tener que programarlo al completo, algo que consume tiempo y recursos. Una ventaja añadida es que el propietario de los datos a los que accede el asistente no pertenece nunca a IBM, sino a la empresa contratante, algo que no sucede con Google Assitant o Amazon Alexa.
Xiao AI
Es el asistente específico para los smartphones de Xiaomi. Está dotado de inteligencia artificial y puede controlar el móvil y todo tipo de dispositivos. De momento solo se puede utilizar en chino y ocupará un lugar estratégico en el mercado ya que Google Assistant no está disponible en China. Estará preinstalado en los Xiaomi Mi Mix 25 pero se podrá descargar en cualquier móvil de la misma marca.
El asistente tiene las herramientas clásicas. Está claramente orientado al mercado chino por lo que está asociado a servicios como Wechat y su propio ecosistema.
Xiao AI recuerda bastante al asistente de Google. posible que este asistente forme parte del acuerdo de colaboración entre Xiaomi y Microsoft ya que tiene algunos rasgos característicos de Cortana y la compañía hace tiempo que es pionera en traducción en chino mandarín en tiempo real.
¿En qué medida afectarán los asistentes de voz y digitales al mundo de la empresa?
Son infinitos los cambios y mejoras que se pueden introducir, desde la gestión de los datos y tomar notas, a la organización de reuniones.
Los asistentes de voz pueden ayudar enormemente simplificando y perfeccionando procesos como corrección ortográfica o predicción de textos. El gran desafío seguramente se encuentra en mejorar las relaciones humano-máquina, en ambos sentidos, y del lenguaje y sus matices.
¿Cuál es el asistente más utilizado?
Un estudio de Mindmeld afirma que Siri copa el 36% del mercado. Le siguen Google Now (28%) y Cortana de Microsoft (9%). Este tipo de aplicaciones es utilizado en gran parte por personas de entre 18 y 24 años, de los que más de la mitad, un 55%, afirman usar algún asistente de voz a diario.
Es significativo que al preguntar a los usuarios por la satisfacción tan solo un 21% asegure estarlo completamente, mientras que un 39% solo es en grado medio. ¿En qué les gustaría que mejorara? Un 44% respondió que les gustaría que los asistentes les entendieran mejor y un 72% aseguró que utilizarían estos asistentes si no hubiera problemas de comprensión.
Resulta curioso que Siri sea una fuente de diversión para los usuarios ya que a muchos les resulta muy graciosa la manera en que contesta algunas preguntas. Vamos, como si bromearan con un amigo de la pandilla.
Imagen: deskmodder.de