Google ha impregnado de IA generativa su buscador web, por ahora tan sólo en Estados Unidos, a fin de reforzar su posición frente a competidores como Microsoft y OpenAI en el ámbito de dicha tecnología, que en estos momentos suscita tanto interés.

Durante la conferencia anual de desarrolladores I/O celebrada el 14 de mayo, Sundar Pichai (en la foto), consejero delegado de Alphabet y Google, ha explicado que los AI Overviews (Resúmenes con IA) ya funcionan en Estados Unidos, pero a finales de 2024 llegarán también a miles de millones de usuarios de otros países.

Los AI Overviews se sirven de Gemini, el modelo de IA de Google, para crear unos resúmenes de búsqueda que aparecen junto a los resultados de búsqueda tradicionales en forma de enlaces.

En dicha conferencia, Liz Reid, máxima responsable de la división de Búsquedas de Google, ha afirmado que “la búsqueda mediante IA generativa nos ofrecerá ventajas que ni siquiera imaginábamos.”

Ha añadido que “bastará con pedir cualquier cosa que se nos pase por la cabeza, cualquier cosa que tengamos que hacer, y Google lo googleará para nosotros”.

La directiva ha explicado que los AI Overviews proporcionan una serie de posibles respuestas y enlaces a búsquedas más exhaustivas a partir de una consulta general. Además, responde en cuestión de segundos a preguntas y subpreguntas más complejas, al efectuar un “razonamiento múltiple” en el marco de la búsqueda.

En el mismo acto, Google ha anunciado mejoras en su modelo Gemini Pro 1.5 para consumidores. Pichai ha afirmado que el modelo ha duplicado su ventana contextual hasta los 2 millones de tokens, con lo que puede responder a preguntas con mayor rapidez o ingestar vídeo de mayor definición.

Pichai ha destacado un futuro asistente chatbot de IA llamado Project Astra, capaz de utilizar las cámaras del smartphone para hallar objetos tales como unas gafas o identificar lugares. Demis Hassabis, el responsable de Google DeepMind, ha afirmado que Project Astra es un agente de IA multimodal y universal “que puede resultar muy útil en la vida cotidiana”.

Hassabis también ha presentado Gemini 1.5 Flash para aplicaciones que necesitan una menor latencia, por un coste más económico que el del modelo Gemini 1.5 Pro. Ha explicado que Flash está “diseñado para que sea rápido y rentable en el servicio a escala, sin dejar de ofrecer capacidades de razonamiento multimodal”.

En otro anuncio, Google ha presentado un modelo de IA de texto a vídeo denominado Veo, que puede crear secuencias generadas por ordenador a partir de instrucciones escritas o de imágenes, así como aplicar efectos visuales al resultado.

El gigante de internet también ha mostrado nuevas funciones de IA generativa en Fotos y en sus aplicaciones de ofimática Workspace, como los resúmenes y las respuestas automáticas inteligentes en el correo electrónico Gmail.