Jue. Nov 7th, 2024

Bard tiene los días contados. Fue presentado hace solo un año de forma precipitada como respuesta a la irrupción de ChatGPT, de OpenAI, para ofrecer una alternativa automática de respuesta conversacional. Pero era solo un modelo recién salido de los laboratorios de Google, donde se ha seguido desarrollando el sistema que aspira a ser definitivo: Gemini. Este jueves, la multinacional ha anunciado que Bard pasa a ser Gemini y que está disponible en la web y en aplicaciones para móviles con sistemas Android y también con iOS (Apple). En una primera etapa solo dispone de versión en inglés y se irá ampliando a idiomas asiáticos (primero en japonés y coreano) y, posteriormente, al español. Las versiones de pago permitirán su uso en herramientas de trabajo comunes como los documentos o correos electrónicos.

Durante años, Google ha liderado el mercado de búsquedas en internet. Pero OpenAI dio un vuelco al sistema al desarrollar un modelo de inteligencia artificial, ChatGPT, que ya no solo aportaba webs que, con más o menos acierto, incluían información relacionada con la búsqueda. El nuevo bot (programa automatizado con respuestas a instrucciones específicas que imita al cerebro humano) era capaz de resumir y expresar soluciones propias, una capacidad que se introdujo de forma vertiginosa en todos los ámbitos, desde las tareas escolares a la programación, desde consultas cotidianas a procesos industriales.

La amenaza al mercado hegemónico de Google llevó a una respuesta precipitada y se presentó Bard hace un año con una marca de nacimiento de provisionalidad. Este jueves se ha confirmado y el modelo pasa a ser ya Gemini. El nuevo sistema pretende ser no solo un sustituto del buscador, sino también, según Sissie Hsiao, vicepresidenta de Google, “un verdadero asistente de inteligencia artificial, conversacional, multimodal y más útil que nunca”.

La directiva de la compañía resume que la nueva aplicación aporta respuestas a preguntas escritas u orales y también interactúa con imágenes. Se convertirá en el asistente principal del teléfono, al que se podrá acceder mediante un nuevo acceso directo o por el conocido comando de voz (Hi Google) o por los atajos del terminal. Se podrán mantener conversaciones, reanudarlas desde el mismo móvil o desde el ordenador de escritorio.

Asistente

“Puede generar un título basado en la foto que has tomado o que estés leyendo un artículo y que la aplicación te permita no solo comprender el artículo más profundamente, sino también hacer preguntas sobre el mismo. Muchas funciones de Google Voice estarán disponibles a través de la aplicación Gemini, incluida la configuración de temporizadores, hacer llamadas y controlar dispositivos domésticos inteligentes”, explica Hsiao.

Imagen comercial de Gemini.Google

Estas aplicaciones estarán disponibles para los usuarios de Google, pero la época del todo gratis ha llegado a su fin y la compañía pretende monetizar desde el principio los sistemas más completos. De esta forma, según Sundar Pichai, máximo responsable de la compañía, la versión Gemini Advanced, que estará disponible por suscripción, “es más capaz de razonar, seguir instrucciones, codificar y colaborar de forma creativa”. “Por ejemplo”, añade, “puede ser tu tutor personal y adaptarse a tu estilo de aprendizaje. O puede ser un socio creativo y ayudarte a planificar una estrategia de contenidos o a crear un plan de negocio”.

Esta versión avanzada, como se anunció durante su presentación y recuerda ahora Pichai, “utiliza una combinación de 57 materias, incluidas matemáticas, física, historia, derecho, medicina y ética, con las que se pone a prueba tanto el conocimiento como la capacidad de resolución de problemas”.

Gemini Advanced estará disponible a través del nuevo plan Google One AI Premium y, con la suscripción, compatible con hasta cinco usuarios, se podrá utilizar con Gmail, Docs, Sheets, Slides y Meet. Incluye soporte técnico, edición profesional de imágenes, recomendaciones y acceso anticipado a funciones de prueba. La oferta inicial en Estados Unidos supone, para los ya suscriptores de Premiun, una cuota de 10 dólares (9,28 euros) más al mes.

La versión Duet AI, más orientada a empresas y desarrolladores, se convertirá en Gemini para Google Workspace y Google Cloud. Este último modelo dispone de habilidades específicas de gestión de procesos, desarrollo de programas y protección ante ciberataques, según la compañía.

ChatGPT 5

La maniobra empresarial de Google se produce ante la intención de OpenAI de lanzar este año la quinta versión de ChatGPT, según el máximo responsable de la empresa, Sam Altman, quien ha adelantado algunas de sus características en el podcast de Bill Gates.

El bot pretende avanzar en precisión, personalización y habilidades multimodales, por lo que la interacción será con todo tipo de archivos de texto, numéricos y audiovisuales, por separado o de forma conjunta.

De esta forma, ChatGPT5 pretende ofrecer una conversación más fluida y natural, con habilidades para comprender el contexto del usuario, aportar más capacidades creativas y ganar en seguridad ante posibles usos maliciosos.

Para conseguirlo, se han ampliado los modelos de lenguaje para su entrenamiento y se ha programado para aprender de la interacción con los usuarios. Entre sus usos más comunes, la compañía prevé que permita ofrecer servicios de atención personalizados, incorporarse como herramienta educativa o de entretenimiento e incorporarse a las tareas de gestión empresarial.

Puedes seguir a EL PAÍS Tecnología en Facebook y X o apuntarte aquí para recibir nuestra newsletter semanal.