El artículo de hoy va dedicado a Siri, el asistente personal de Apple que viene incluido en el iPhone 4S (y sólo en el 4S, por ahora) y que en mi opinión va a ser el centro del desarrollo de los productos de Apple en los próximos años, una nueva revolución de los de la manzanita.
Todos tenemos claro que la llegada del iPhone 4S ha sido algo desilusionante, ya que después del retraso acumulado, todo el mundo comentaba que era debido a un cambio de hardware, de diseño y de mil otras cosas, y al final, la mayor revolución era un tal «Siri», que a la gente le supo a poco. Supongo que nuestra experiencia con el reconocimiento de voz de las máquinas ha sido tan nefasta que todos vimos a Siri como otro cacharro más sin utilidad. Estoy convencido de que Siri ha sido además la razón principal del retraso en la salida del nuevo iPhone y que habrán pasado muchas largas noches poniendo a punto un reconocimiento de voz a la altura de lo que los clientes de iPhone esperan (y cualquier cliente que se gaste esa cantidad de pasta en un producto).
Mi experiencia con softwares de reconocimiento de voz.
Mi primera experiencia de este tipo fue un intento de hace varios años de controlar la domótica de mi casa desde mi ordenador. Con un software bastante cutre, pude programar comandos para ejecutar tareas sencillas. Los comandos había que grabarlos primero y luego los reconocía si los decíamos igual. Muy divertido pero poco práctico.
Este marzo, me rompí una clavícula, y decidí aprovechar para instalar un software de reconocimiento de voz más actualizado en el ordenador. Una de los objetivos era intentar escribir al menos algún artículo en el Blog usando solamente el software de reconocimiento de voz. El programa que utilicé fue el Dragon Naturally Speaking en la versión española 9.0, y ya os digo que no funcionó.
Primero hay que dedicarle un rato a enseñarle como hablas, leyendo un texto que te sugiere y después de ese paso, ya puedes contarle tu vida al ordenador. Su principal uso es el de dictado, aunque permite lanzar programas desde el escritorio y mover el ratón. Realmente, el reconocimiento de voz es muy bueno, reconoce realmente bien lo que le dices y si te equivocas sólamente hay que decir «borra eso» y borraba lo último que había escrito. Pero no es práctico, ni para escribir ni para manejar el ordenador.
Cuando hablamos, no solo decimos aquello que queremos escribir, hacemos paradas, no nombramos los puntos ni las comas, tosemos, reimos, etc. Todo eso lo reconoce el software del ordenador y lo escribe como le suena, es decir bastante mal. Es muy difícil dictar algo sin leerlo, sacarlo directamente de la cabeza al papel, y eso sin hacer ningún tipo de sonido que cualquier persona interpreta e ignora pero una máquina (hasta ahora) no. Lo mismo sucedía con los comandos, «Microsoft Office Word» no es fácil de decir para arrancar el procesador de textos, con lo fácil que sería decir, «Arranca el Word», y así con todo lo demás.
Siri te entiende
Al haber comprobado «lo bien» que funcionaba el reconocimiento de voz en mi ordenador, con un software de hace un par de años, y tras enterarme de que Siri utilizaba el mismo software de Nuance, tenía muy claro que Siri iba a reconocer bien lo que decíamos. Pero claro, una cosa es reconocer las palabras y una muy distinta es entenderlas y hacer lo que se le pide, eso sin usar comandos preestablecidos. Y esa es la principal novedad de Siri, y por lo visto en las diferentes revisiones y vídeos, lo hace realmente bien. Pocas veces vemos a Siri confundir palabras o entender mal las frases, lo que sucede es que no entiende que queremos decir, pero eso es esperable.
En este momento las cosas que Siri puede hacer se limitan a interactuar con los programas internos del iPhone, es decir, teléfono, mensajes, notas, recordatorios, agenda y calendarios, etc, y por otro lado se conecta a internet (los servidores de Apple y otros) para descargar contenido de cualquier tipo, el tiempo, busqueda en internet, y preguntas a WolframAlpha (que si no conocen es un buscador muy interesante). No parece poco, pero al final, en un uso normal del teléfono, no me veo pidiendo a un ordenador que apunte las citas por mi (tal vez sea porque no he podido probarlo).
Un (muy) pequeño listado de las cosas que Siri puede hacer: pedirle que mande un SMS a alguien, que llame a alguien, que nos diga el tiempo, que busque algo en internet, que nos avise a una hora o en la siguiente cita, etc. No podemos pedirle que nos lea los mensajes, (cosa que android si puede hacer automáticamente), no podemos enviar un WhatsApp, no podemos pedirle que arranque el TomTom para ir a casa y cualquier otra cosa que implique interactuar o otras aplicaciones.
Siri también puede ser muy divertido a veces, la de horas que habrán pasado los programadores pensando las chorradas que podemos llegar a decirle a Siri. En esta web van colocando algunas cosas que Siri dice, con perlas como las que os dejo a continuación:
Siempre se puede mejorar
Pero también hay cosas que Siri debería mejorar, lo que más me sorprende es que siendo un dispositivo principalmente pensado para manos libres, tengamos que apretar un botón durante un par de segundos para activarlo, luego decirle lo que queremos y confiar en que no se equivoca. En ese tiempo,ya he abierto la aplicación correspondiente y he mirado lo que quería. Si queremos hablar a Siri, no deberíamos tener que apretar ningún botón, sino simplemente decir un comando en voz alta que lo active, eso ayudaría mucho en el coche o en la moto, en incluso si estamos en el salón de casa. También habrá que ver como funciona en español, con los diferentes acentos y expresiones, estoy seguro de que no estará siendo una tarea fácil para los programadores. Y seguro que el software podrá mejorar para interpretar mejor lo que decimos, aunque el resultado por ahora es sorprendentemente bueno.
Siri no es muy útil en un teléfono, ya que no me imágino a nadie dictandole al teléfono por la calle ni hablando en alto para que nos diga el tiempo, cuando lo tenemos al alcance de un par de movimientos de dedo. Si puedo imaginarme usándolo como manos libres al conducir, o cuando voy circulando en moto, pero la mayoría de las veces, lo único que necesitamos es que nos indique las direcciones a las que queremos ir o que nos ponga música (porque la radio con el iPhone va a ser complicado). La parte de la música parece que está bastante lograda pero al no poder interactuar con otras aplicaciones, el navegador GPS por ejemplo, no podemos pedir a Siri que nos indique la forma de llegar a algún sitio.
Por Photo Giddy.
Otro problema de Siri como teléfono es que para sacarle partido, hay que estar conectado a Internet y con el GPS encendido. Esto hace que la batería de nuestro iPhone que ya de por si no dura mucho, pueda fundirse en pocas horas. Una razón más para que el principal uso de Siri sea en casa (con wifi y enchufado a la red).
Pero esta claro que esta primera versión de Siri abre las puertas a una forma de comunicarnos con los ordenadores totalmente nueva. Ya han sacado productos que nos permiten hablar en voz alta a nuestro iPhone cuando lo tenemos tranquilamente colocado en un soporte en el salón de casa, como el Iris 9000 (los parecidos de Siri con Hal 9000 siempre van a estar ahí :P). Y saldrán muchos más aparatos y programas en un futuro, podemos estar seguros.
Apple apuesta por Siri
Pensemos que es una Beta, que no ha sido probada hasta la fecha y que esto es sólo el principio. Tengo muy claro que la intención de Apple es continuar este desarrollo, primero para conseguir que otras aplicaciones puedan usar Siri, que abriría un mundo de posibilidades y segundo para incorporarlo al iPad en próximas versiones. Creo además (y sigo suponiendo) que Apple va a incorporarlo a su Apple TV (y ya se comenta que Apple va a sacar su propia TV) y a sus ordenadores de sobremesa, de modo que Siri se convierta en nuestro asistente personal en casa. Pedirle al teléfono que nos diga el tiempo no tiene mucho sentido, pero decirle que nos grabe el partido de mañana o que nos ponga una buena película de suspense de nuestra colección bajando las luces al 50%, o que baje la calefacción un par de grados y que ponga la alarma del garage cuando nos vamos a dormir si parecen cosas más interesantes para pedirle a un ordenador. Es decir, en mi opinión, Siri cobra sentido cuando estamos haciendo tareas repetitivas en casa y relacionado principalmente con la domótica, tareas que hasta la fecha hacemos a mano o usando un mando a distancia clásico pero que pueden automatizarse con la tecnología actual.
Como ejemplo de que Apple ya pensaba en esto hace años, os dejo un vídeo conceptual de los años 90, que es imposible no comparar con lo que Siri viene a ofrecernos ahora:
Queda tiempo para que todo eso podamos tenerlo en casa, pero Siri es el primer sistema de Inteligencia Artificial que responde a comandos de voz normales (y que parece que funciona) y creo que va a suponer una revolución absoluta en el mundo de la tecnología y la domótica en menos de dos años. Veremos a ver que pasa.
NOTA: al terminar de escribir este artículo me llega una gran noticia, la primera es que ya empiezan a salir «imitadores» en Android, Cloe se llama y tiene muy buena pinta, lo cual es estupendo. Esperemos que pronto podamos disfrutar de un Siri completamente Open Source para todos sin tener que depender de Apple.
darkpollo dice
Gracias a ti! :D