El futuro está en la comunicación multimodal

Por NewsMDirector
10 mins

La comunicación multimodal, según la definición en su entrada de la Wikipedia es «aquella en la que intervienen modos humanos, como por ejemplo: la voz o el habla, los gestos, los ojos, los movimientos, etc. El objetivo de la comunicación multimodal es hacer más natural la interacción hombre máquina«.

Se trata de una de las barreras actuales en lo referente a comunicación y tecnología. De hecho, todavía se está trabajando en la manera de incorporar los datos en interfaces electrónicas, propias de las máquinas. Y en cómo hacer que esta comunicación permita la interacción entre seres humanos y máquinas.

Y es que estamos entrando en una nueva era de transformación digital. Cada producto y cada servicio podrá conectarse y medirse. Ya sea una lavadora, un smartwatch o cualquiera de los miles de dispositivos con los que el ser humano se relaciona.

Pero entonces, ¿cómo podrán los editores crear contenido que esté preparado para cualquier objeto? La solución hasta ahora ha sido estructurar el contenido, pero no ha resultado ser lo correcto. El futuro del contenido ya no hace referencia a nuevos formatos o canales, sino a nuevos modos de interacción.

[bannerHero]

Metadatos, eje de la comunicación multimodal

Para hacer frente a esta realidad emergente, la estrategia de contenidos necesita un nuevo conjunto de mejoras prácticas. Y éstas deben estar centradas, básicamente, en el uso estratégico de los metadatos, que son los que permiten una comunicación multimodal.

Por ello, el reto en innovación más reciente consiste en proporcionar vías de acceso simples y naturales a los servicios de las futuras redes de información. Sobre todo hacia aquellas que estén creadas sobre las tecnologías de conocimiento.

Todo parte de la idea de crear modos de interacción simples y naturales que estén adaptados a las redes de comunicación. Y, para ello, como puedes imaginar, es vital que se integren todos los tipos de comunicación: La visual, la oral, la parte auditiva, gestual, etc. Así se proporcionarían vías más potentes de interacción entre usuarios y máquinas.

El fin de esa interacción natural es permitir a los usuarios que puedan utilizar todos los recursos de comunicación combinando varios modos de interacción. Por lo que esta comunicación multimodal supone un potencial brutal para el futuro.

El futuro del contenido con la comunicación multimodal

Durante muchos años se ha investigado cuál es el tipo de contenido que necesitan los usuarios. En la actualidad se puede ofrecer información en cualquier formato, en cualquier momento y mediante cualquier canal. Pero parece no ser suficiente.

Algunos expertos defienden la idea del single source publishing y COPE (crear contenido una vez y publicarlo en todas partes), que parece proporcionar la solución ideal a la proliferación de dispositivos. Y, de hecho, hasta ahora ha sido la solución.

Sin embargo, estos dos enfoques no han anticipado un nuevo paradigma, un contenido sin pantalla. ¿Se te ocurre cómo podría ser esto posible? ¿Cómo va a consumir el contenido la gente en un futuro a corto plazo?

Una nueva manera de comunicarse

Por ejemplo, ¿cómo podría un usuario tener acceso a una receta? Las recetas son contenidos estructurados y se tiende a pensar que se necesitan en papel. Pero lo que la comunicación multimodal viene a decir es que las recetas, directamente, ni siquiera necesitan ser leídas.

En un futuro es posible que necesites hacer un bizcocho, pero la manera de ejecutarlo será diferente. Un bizcocho requiere del toque humano para estar bien cocinado o tener ese toque más artesanal y casero. Pero, sin embargo, algunos pasos de su preparación pueden ser desarrollados por máquinas.

Y esto no es muy diferente a cómo será la cocina del futuro. No hay más que fijarse en los dispositivos como Amazon Echo o Google Home, que estarán conectados al Internet de las Cosas.

En este caso solo tendrás que pedir al asistente de voz que encuentre una receta y automáticamente la tendrás. La receta, en este caso, se leerá en voz alta. Y será el asistente el que vaya lanzando preguntas. Entre ellas, si necesitas ver un vídeo para saber cómo batir los huevos o cualquier explicación técnica.

Una comunicación no vinculada a una pantalla concreta

A medida que esta interacción avanza, la propia receta es la que envía un mensaje al horno inteligente para avisarle de que debe ir calentándose. Y, cómo no, le dice a qué temperatura debe estar. ¿Qué papel tiene el usuario entonces?

Una vez que el bizcocho sale del horno, sería el momento de darle el toque humano, el punto artesanal. La comunicación multimodal plantea una rutina en la que obtendrías instrucciones del dispositivo de voz acerca de cómo decorarlo. Y, en caso de tener dudas, podrías consultarlas a viva voz.

Como ves, una acción tan sencilla como hacer un bizcocho es un ejemplo perfecto de la comunicación multimodal. Es, nada más y nada menos, que la interacción entre el hombre y la tecnología. La característica esencial de la interacción multimodal es que las personas no están vinculadas a una pantalla específica, incluso si es muy móvil y portátil.

[bannerHero]

El contenido fluye hacia donde se necesita cuando se necesita

El anterior ejemplo del bizcocho hace alusión a tres diferentes maneras de intercambio de contenido:

  1. La interfaz de pantalla. Es la que muestra el contenido a los ojos.
  2. La interfaz de conversación. Es la que dice y escucha. Y. por lo tanto, se basa en los oídos y en la voz.
  3. La interfaz de la máquina. En este caso procesa instrucciones y alertas y depende del código.

La única incertidumbre de la comunicación multimodal es saber si el contenido estará preparado para soportar estos escenarios.

Pero éstos no son los únicos factores que podrían llegar a ser importantes en el futuro. Los gestos, la realidad aumentada y las interacciones basadas en sensores pueden ser más habituales. En otras palabras, la lectura y la visualización de pantallas ya no será la única vía de consumir el contenido. Lo que se debe a que las máquinas de todo tipo tendrán acceso a este contenido.

La comunicación multimodal supone crear una tecnología de procesamiento de lenguaje natural. Es decir, los contenidos escritos no son adecuados para la comunicación máquina a máquina. Como, por ejemplo, tener una receta y que ésta le diga al horno cuándo comenzar. Las máquinas necesitan información mas explícita y completa.

Por lo tanto, el contenido estructurado basado en módulos nunca fue diseñado para interacciones rápidas de dar y recibir.

Los metadatos proporcionan la solución para el contenido multimodal

Como has podido comprobar, los metadatos son la esencia del contenido. Son los que permiten a cada plataforma comprender qué se necesita saber y cómo utilizar esa información para interactuar con el usuario y otros dispositivos.

Las máquinas escuchan metadatos en el contenido y los metadatos son los que hacen que la interfaz de voz y el horno se comuniquen con el usuario. Por ejemplo, las recetas que están publicadas en la web ya están bien descritas con metadatos. Lo que quiere decir que el contenido básico ya está cubierto. De hecho, schema.org, el estándar de metadatos popular actualmente, ya proporciona información detallada.

Los bits adicionales que hacen falta para permitir que las máquinas actúen sobre los metadatos de las recetas todavía están en proceso. Schema.org supone un conjunto básico de acciones que podrían extenderse para crear también las de IOT.

Aunque también está desarrollando una entidad HowTo que puede especificar instrucciones más detalladas relacionadas con recetas. Y éstas podrían permitir a los electrodomésticos ir un paso más allá: Actuar.

Los metadatos, en una comunicación multimodal, no eliminan la necesidad de crear texto escrito. O de crear contenidos en vídeo. Pero consiguen que esos contenidos se detecten de manera mas fácil y efectiva. Por ejemplo, un usuario puede pedirle a Alexa, Siri o a Google que encuentren una receta para un plato. Y existe la posibilidad de pedir a estos sistemas que lean en voz alta la información que se ha encontrado.

Pero en este caso, lo que se necesita es la capacidad de transformar el contenido tradicional, como los artículos o los vídeos, en un contenido conectado y digitalmente nativo. Los metadatos pueden liberar el contenido de ser una vía de comunicación unidireccional y transformarla en natural.

El contenido debe acomodarse al diálogo

Las personas y las máquinas deben ser capaces de responder al contenido. Y éste, por su parte, debe proporcionar una respuesta que tenga sentido para el contexto.

En el momento en el que el horno dice que el bizcocho está listo, la receta debe decirle al cocinero qué es lo que debería estar haciendo después. Los metadatos permiten que se produzca una interacción perfecta entre el horno, el asistente de voz y el usuario.

En definitiva, un contenido preparado para el futuro necesita ser agnóstico sobre cómo se utilizará. Y los metadatos, en este caso, son quienes abren las puertas a este futuro. Aún así, la evolución de la interacción entre el hombre y las máquinas va avanzando hacia caminos como:

Hasta entonces, la red está llena de herramientas que permiten la personalización de los mensajes en los diferentes canales y medios de comunicación. Las opciones de hacer Cross-Channel son múltiples, pero hay una herramienta que destaca sobre todas, MDirector.

MDirector es un software de marketing digital que permite unificar en un solo espacio la estrategia en email, SMS, landings, redes y retargeting. La ventaja de esta plataforma es que podrás crear una estrategia y trabajarla de manera conjunta. El cliente será el mismo, pero podrás llegar hasta él desde diversos canales. Lo que incrementa, así, las posibilidades de comunicarte con tus usuarios.

Suscríbete a la Newsletter y disfruta 10% de descuento en nuestras tarifas

Suscríbete

¿Quieres más información sobre nuestros productos?

Contáctanos
Salir de la versión móvil