Los chatbots, los asistentes personales y los dispositivos inteligentes no son nuevos para el público. Los dispositivos de voz han impactado en nuestros teléfonos celulares, computadoras, relojes inteligentes, nuestros autos, e incluso nuestras casas con empresas de seguridad doméstica inteligentes como Vivint. Hoy en día, el reconocimiento del habla abarca desde las finanzas, los recursos humanos, el marketing, el crimen e incluso el transporte público con el objetivo de reducir los costes empresariales, simplificar procesos anticuados, mejorar la experiencia del usuario (UX) y aumentar la eficiencia general. A medida que la tecnología avance en las áreas de computación en nube, ciencia de los datos y aprendizaje automático, la tecnología de reconocimiento del habla sólo mejorará y cambiará los modelos de negocios en los mercados cada vez más competitivos.
En este artículo, cubriremos cómo la inteligencia artificial perturbará la tecnología de reconocimiento de voz en el ámbito privado y en nuestra vida cotidiana.
¿Qué es el reconocimiento de voz?
De acuerdo con TechTarget"El reconocimiento de voz es la capacidad de una máquina o programa para identificar palabras y frases en el lenguaje hablado y convertirlas a un formato legible por máquina". Los esfuerzos de reconocimiento del habla se han llevado a cabo activamente desde el decenio de 1950, pero no llegaron a aceptar el habla natural hasta finales del decenio de 1990. El aprendizaje automático (ML) ha proporcionado la mayoría de los avances en el reconocimiento del habla en este siglo. La primera sociedad cautivadora fue Siri de Apple, el asistente digital alimentado por la IA que humanizó el reconocimiento del habla hasta ese momento. El hecho de que Apple fuera pionera en este sentido llevó a las empresas de la competencia a tomar nota y hacer versiones propias. Microsoft pronto siguió con el lanzamiento de Cortana y luego Amazon con Alexa, dando a luz a toda una industria marcada por el comando de voz.
Hoy en día, la tecnología de reconocimiento de voz está en todas partes. Tanto los consumidores como los tecnólogos se dan cuenta de los beneficios del comando de la voz, como ayudar a las personas con diferencias de aprendizaje o impedimentosjunto con la reducción del papeleo, el tiempo y los costos asociados con operaciones comerciales. La inteligencia artificial ya ha comenzado a acelerar las capacidades del comando de voz. Google Home y Amazon Echo son ejemplos de tecnologías de comando de voz de uso común que dependen en gran medida de la inteligencia artificial y el reconocimiento de voz para satisfacer las expectativas de los usuarios y automatizar las tareas domésticas cotidianas.
El auge de la inteligencia artificial
Con los importantes avances en el lenguaje natural y las tasas de precisión del habla, los avances en la tecnología de reconocimiento del habla han llevado a una creciente presión para que las empresas construyan experiencias habilitadas por la voz que superen las expectativas de los usuarios. Las mejoras en tándem en la IA, la computación en nube y la ciencia de los datos han permitido que la tecnología como el comando de voz avance a velocidades sin precedentes, cambiando la forma en que las empresas diseñan sus tácticas de servicio al cliente.
Los grandes avances en el aprendizaje automático permiten a los sistemas de conversación reconocer mejor el habla en sí y transformar el texto en habla real, dos elementos clave en el procesamiento del lenguaje natural (PNL). Los agentes de la conversación, como los asistentes personales, pueden entonces responder con una velocidad similar a la de los humanos, ya sea a través de la voz o del texto. Esto crea la demanda de perfección en el habla, impulsando un movimiento de la industria hacia nivel cinco de la IA conversacional de nivel tres.
Donde los hablantes inteligentes viven en casas americanas. (Obtenido por TechCrunch)
La IA ha estado impactando en la tecnología durante años, pero el conocimiento público de la IA, junto con la carrera hacia la transformación digital entre las empresas, ha acelerado la integración de la IA en plataformas, aplicaciones y la formación de tecnologías totalmente construidas con IA. Aplicaciones como Google Maps usan comandos de voz para interactuar con los conductores a diario; Amazon Alexa se ha convertido en una forma de vida para muchos estadounidenses, especialmente ahora que "casi uno de cada cinco adultos de los EE.UU. tiene hoy en día acceso a un altavoz inteligente", según una nueva investigación proporcionada por Voicebot.ai. Ese número tampoco espera disminuir.
En el caso de las empresas, la IA conservadora se está adoptando ampliamente para reducir los costos empresariales, mejorar el servicio al cliente y ayudar a las empresas a competir en un panorama cada vez más volátil. Los empleados pueden ahorrar tiempo con la IA conversacional para introducir datos, sacar informes o realizar otras tareas mundanas para el trabajo. En la Encuesta de CIO de Gartner de 2019, los CIOs identificaron los chatbots en particular como "la principal aplicación basada en la IA utilizada en sus empresas". En todo caso, esto es un indicio importante de que las empresas están explorando los beneficios de invertir en tecnología de comando de voz y asistentes personales con IA.
A medida que el mercado de la IA conversacional comienza a madurar, las empresas están empezando a desarrollar sus propias tecnologías de voz para ayudar a impulsar las estrategias de experiencia del cliente. El Banco de América Erica y el de Capital One Eno son ejemplos de bancos líderes que han construido grandes equipos para desarrollar IA conversacional, mientras que otros bancos confían en Google y Amazon para suministrar la tecnología OEM para construir chatbots con el mismo propósito.
En la industria de las nuevas empresas, las compañías competidoras como Limonada están en el camino de construir empresas autónomas que dependen del comando de voz para atender a los clientes. En el caso de Lemonade, un usuario que necesita un seguro se inscribe en la cobertura mediante un chatbot a través de una aplicación con una interfaz de usuario atractiva. Todo el proceso toma minutos, algo inaudito en la industria de los seguros. Esta tecnología también juega con la creciente tendencia de descentralización como el público exige tener mayor control sobre la tecnología y las decisiones de compra.
Tendencias de los consumidores en el uso del reconocimiento del habla en la vida diaria. (Imagen obtenida por La puesta en marcha)
El futuro de la tecnología de reconocimiento de voz
De acuerdo con Gartner, "El 70% de los trabajadores de cuello blanco interactuarán con plataformas de conversación diariamente para el 2022." En resumen, el reconocimiento de voz y la inteligencia artificial detrás de él sólo se van a hacer más sofisticados en el futuro. A medida que las industrias de diseño y tecnología se mueven hacia la inclusión total, IA intencional se está convirtiendo en algo imperativo para servir a una gama más amplia de demografía, junto con la demanda de experiencias positivas de los usuarios. A fin de ser más inclusivos, los tecnólogos y científicos han comenzado a mejorar la IA para reconocer una diversa gama de acentos y dialectos. La Harvard Business Review ha publicado investigaciones recientes en las que el reconocimiento de la voz "sigue teniendo importantes prejuicios de género y raza", lo que consolida la necesidad de mejorar para atender a poblaciones diversas sin discriminación.
Incluso con agujeros en la tecnología, la industria está saturada de empresas que experimentan con la integración de la IA en sus productos y servicios con asistentes de voz digitales. Una de las mayores industrias afectadas por la tecnología es el entretenimiento, con juegos de realidad aumentada explotando en la escena (hola, Pokémon Go). La realidad virtual y la biorretroalimentación en videojuegos controlados por voz se están volviendo más populares también.
Además de los cambios en la tecnología actual, la industria de la publicidad responderá y tendrá que adaptarse. La voz será cada vez más difícil de ganar dinero con los anuncios visuales, haciendo que los ingresos se desvíen de la publicidad hacia los modelos de suscripción. Las plataformas de medios sociales como Snapchat y TikTok ya están Aprovechando la voz en sus anuncios. En el caso de TikTok en particular, la aplicación construida y ejecutada enteramente con IA para dar una experiencia de usuario verdaderamente personalizada sólo alimenta el poder de los anunciantes para llegar a los usuarios. El arte de contar historias seguirá siendo una fuerza de marca en la nueva era de la tecnología de reconocimiento de voz impulsada por la IA, permitiendo que las plataformas crezcan en tamaño, poder y autoridad de compra.
"Los sistemas de IA que estamos desarrollando van a tener fortalezas y debilidades. Y la gente tiene fortalezas y debilidades. Así que el mayor impacto vendrá de averiguar la mejor manera de tener a la gente y a las computadoras trabajando bien juntas", dice Murray Campbell de IBM, un distinguido investigador y arquitecto de DeepBlue. Incorporar conscientemente la IA a los productos y servicios requerirá paciencia y las mejores prácticas éticas a medida que los modelos de negocio sigan evolucionando.
¿Su empresa está aprovechando los muchos beneficios de la IA? Nuestra plataforma de gestión de procesos empresariales (BPM) se integra con software alimentado por la IA, como la automatización de procesos robóticos (RPA), para que las empresas funcionen de manera más eficiente. Descubra cómo nuestra solución híbrida inteligente está ayudando a reducir el tiempo y a aumentar la funcionalidad del negocio en www.processmaker.com.
Sobre ProcessMaker:
ProcessMaker es un software de gestión de procesos empresariales y de flujo de trabajo de bajo código. ProcessMaker facilita a los analistas de negocios la colaboración con TI para automatizar procesos de negocios complejos que conectan a las personas y los sistemas existentes de la compañía. Con sede en Durham, Carolina del Norte en los Estados Unidos, ProcessMaker tiene una red de socios distribuidos en 35 países en cinco continentes. Cientos de clientes comerciales, incluidas muchas empresas de la lista Fortune 100, confían en ProcessMaker para transformar digitalmente sus procesos empresariales básicos, lo que permite una toma de decisiones más rápida, un mejor cumplimiento y un mejor rendimiento.