La voz es la próxima pantalla de los Teléfonos portátiles

• Fecha: 6 de junio, 2017

La voz es la próxima pantalla de los Teléfonos portátiles

Los programas de reconocimiento de voz y asistentes virtuales como Siri, Alexa, Google Assistant y ahora Bixby se vuelven más inteligentes pero siguen presentando limitaciones

Buenos Aires-(Nomyc)-Los avances tecnológicos han dibujado en las sociedades un ecosistema en donde los aparatos electrónicos quieren ayudar a las personas en algunas tareas diarias aunque existen implicaciones socio-económicas, pero hasta ahora, el método en que el ser humano interactuaba y controlaba esos aparatos se basa en dos elementos, pantallas y texto y ahora la voz quiere cambiarlo todo y tiene como mejor socio a los teléfonos móviles más avanzados.

Desde hace tiempo la industria de la tecnología busca un nuevo método para dar instrucciones a las máquinas y el empleo de la voz empieza a ser una alternativa a seguir ya que en el mundo de la telefonía, donde muchos modelos actuales cuentan con asistentes virtuales que reconocen las palabras y actúan en consecuencia y uno de los últimos en sumarse es Samsung, que recientemente ha presentado su nuevo buque insignia, el Galaxy S8.

Entre sus novedades se encuentra un novedoso mayordomo llamado “Bixby” que fue desarrollado por los creadores de Siri, integrado en productos de Apple y en el siguiente paso, se incorporará de manera más natural en los dispositivos y se lo dotará de capacidades “inteligentes” que dejen a un lado los comandos de voz convencionales y traten a la persona con un lenguaje natural. De tú a tú.

Pero “Bixby” debutará en el nuevo terminal con un catálogo de opciones limitadas, aunque la firma surcoreana aspira a que pronto otros fabricantes y desarrolladores adopten esta nueva forma de interactuar en sus servicios.

Un gran paso en comparación con otros rivales es que es capaz de ejecutar instrucciones desde la propia pantalla una vez que el usuario lo invoca, logrando minimizar las interrupciones que se producen cuando se le da una instrucción.

A diferencia de su competencia, se basa en dos pilares, la Inteligencia Artificial, capaz de “aprender” sobre la marcha y mantener auténticas conversaciones con el usuario y la Cámara que permite reconocer objetos, por lo que se si una persona pronuncia las palabras adecuadas, puede activar y gestionar algunas de las aplicaciones principales.

La voz está integrada en la terminal, de forma que se le puede pedir que seleccione una imagen determinada y la coloque como portada de pantalla, aunque por ahora, solo entiende dos idiomas, inglés y español internacional.

El reto tecnológico en la actualidad es que estos mayordomos digitales sean más eficientes, aprendan a captar el tono de las palabras, sean más precisos en el reconocimiento y hasta comprendan del comportamiento humano mientras se incorporan de manera habitual a nuestras vidas.

Convivencia con el texto Se han dado pasos importantes en este tema, gracias a las supercomputadoras como en el caso de Watson, desarrollado por IBM y que está basado en computación cognitiva e intenta emular y superar al cerebro humano para lo que se centra en interpretar el lenguaje natural y aprender a medida que opera y registra nueva información, es decir, a través de un entrenamiento continuado, al igual que “AlphaGo”, desarrollado por Google.

“En la actualidad ya nos comunicamos con dispositivos a través de la voz y lo que iremos viendo es una evolución en los próximos años para que más y más dispositivos utilicen la voz como la forma de comunicarse” explica Elisa Martín, directora de tecnología de IBM.

“Esto no quiere decir que la forma en la que la actuamos actualmente desaparecerá, sino que las utilizaremos cuando lo necesitemos”, agrega la directora de tecnología de IBM.

Esa idea de “hablarle” a las máquinas y equipos informáticos no es nueva, pero en los últimos años se ha visto un gran interés en la industria de la tecnología de consumo por incorporar en sus productos estos mayordomos digitales capaces de controlar algunas funciones.

“Siri”, de Apple; “Alexa”, de Amazon; “Assistant” de Google o Cortana de Microsoft, son algunos de los más sonados y al que se le acaba de unir “Bixby”, pero todavía tienen muchas limitaciones y sufren fallos habituales, aunque según los especialistas, el futuro de la voz está ahí.

¿Estamos llegando al punto de madurez para que la voz se imponga sobre la pantalla? “De manera clara, los últimos años los márgenes de error de reconocimiento han bajado. Antes era de un 20 por ciento, de cada cien palabras podría equivocarse en veinte palabras y había que corregirlo, pero ahora estamos en un 3 por ciento, por lo que si agarras un celular y le dices que busque algo de manera coloquial, funciona” explica Martín.

“Eso va a transformar la manera en la que te comunicas con el móvil”, sostiene Sergio Guadarrama, ingeniero de aprendizaje profundo de Google.

Aunque por ahora están disponibles en dispositivos móviles y altavoces inteligentes, los gigantes de la tecnología trabajan para que estos mayordomos digitales estén presentes en infinidad de aparatos que nos rodean, desde neveras, televisores, termostatos o sistemas domésticos.

El camino hacia la verdadera edad de oro de la Inteligencia Artificial es complejo ya que de manera normal, estos sistemas operan a través de una base de datos cargadas previamente, pero los expertos creen que el uso continuado por parte de las personas contribuirá a ser más eficientes en sus comportamiento y ampliarán, con ello, las tareas que son capaces.

“Cuando hablamos de aprendizaje informático hablamos de técnicas que permiten a partir de ejemplos intentar extraer cómo se han producido, es decir, cuál es el comportamiento del humano que las ha generado” sostiene José Manuel López Molina, catedrático del departamento de Informática de la universidad Carlos III de Madrid. Pero estamos en la prehistoria digital.

“Cuando Google te da una sugerencia de palabras lo que hace es aunar comportamientos similares de otras personas para extraer una generalización. Del hecho de extraer el comportamiento de muchas personas se pueden utilizar escrituras en un futuro y dar mejores respuestas”, agrega López Molina.

Pero estamos en la prehistoria digital.¿Nos escuchan? Los peligros de los asistentes de voz Los asistentes virtuales, como Siri, de Apple, se encuentran en smartphones, tablets o en dispositivos como altavoces inteligentes de Amazon Echo o de Google Home y los usuarios los utilizan para encender y apagar la música, comprobar la predicción del tiempo, ajustar la temperatura de la habitación, pedir cosas por Internet, entre otras muchas funciones.

¿Tienen algo de malo estos micrófonos que nos acompañan a diario? Según la firma de seguridad Kaspersky Lab sí, ya que puede filtrar información personal y corporativa. Además, los ciberdelincuentes podrían usar para ganar dinero con estas escuchas: ¿nunca has dictado los números de la tarjeta de crédito y las contraseñas para rellenar los formularios de las webs?

De hecho, los altavoces inteligentes pueden reconocer voces incluso en entornos ruidosos o con música. No tienes que hablar de forma muy clara para que te entienda. Ya existen algunos ejemplos relacionados con diferentes asistentes de voz y con dispositivos inteligentes. En enero de 2017, en San Diego, California, el canal CW6 emitió noticias sobre las vulnerabilidades de los altavoces Amazon Echo, equipados con el asistente virtual Alexa.

El sistema no es capaz de distinguir las voces de las personas, lo que significa que el sistema sigue las órdenes de cualquiera que esté cerca. Como resultado, unos niños podían realizar compras online, sin saber la diferencia entre pedirles a sus padres que les dieran de comer y pedir a Alexa que les diera un juguete. Amazon aseguró a las víctimas de la “rebelión de la IA” que podían cancelar sus pedidos sin pagar nada. Nomyc-6-6-17