Batalla tecnológica

Google lanza Gemini, su inteligencia artificial más potente

Gemini se utilizará desde este mismo miércoles para potenciar Bard, el asistente conversacional de la compañía

Sundar Pichai, consejero delegado de Google.

Sundar Pichai, consejero delegado de Google. / Reuters

2
Se lee en minutos
Carles Planas Bou

Google pisa el acelerador. Este miércoles, el gigante tecnológico estadounidense ha anunciado el lanzamiento de Gemini, su modelo de inteligencia artificial (IA) más potente hasta la fecha.

Un modelo de lenguaje es el algoritmo de aprendizaje profundo que se entrena con grandes volúmenes de datos para permitir a las máquinas reconocer, resumir, traducir y crear texto, así como imágenes, vídeos, áudios o código informático. Dicho de otra forma, es la tecnología que está detrás de aplicaciones de IA generativa como el popular ChatGPT, impulsado por OpenAI Microsoft, y al que Google quiere desbancar.

Gemini se utilizará desde este mismo miércoles para potenciar Bard, el asistente conversacional de la compañía. Sin embargo, su uso irá mucho más allá. Google concederá licencias a sus clientes empresariales para que puedan integrar esta IA en sus propias 'apps'. Los desarrolladores de Android también podrán utilizarla para usarla para dispositivos móviles.

Aunque está diseñado para ser multimodal, de momento Gemini no generará vídeos, imágenes o voz y solamente responderá con código o texto a las peticiones de los usuarios.

Tres modelos

Creado junto a DeepMind, la filial de investigación en IA de Google, Gemini tendrá tres tamaños: Gemini Ultra, el más potente y desarrollado para tareas "muy complejas"; Gemini Pro, que funcionará para una gran variedad de tareas; y Gemini Nano, operacional para tareas específicas en dispositivos. Este último impulsará las tareas de IA generativa del teléfono móvil Google Pixel 8 Pro.

Gemini Ultra "es el primer modelo que supera a los expertos humanos en comprensión de lenguaje multitarea, uno de los métodos más populares para poner a prueba los conocimientos y la capacidad de resolución de problemas de los modelos de IA", según ha asegurado la compañía a través de un comunicado en su página corporativa. De momento, esta versión será testeada por expertos para evitar fallos y no estará disponible al público hasta principio del año que viene.

Gemini Pro sí estará disponible para desarrolladores y clientes empresariales de Google a partir del 13 de diciembre.

"Generalizar y comprender"

Noticias relacionadas

Aunque las capacidades del modelo anunciado hoy aún están por ser contrastadas, el director general de Google, Sundar Pichai, ha asegurado que "puede generalizar y comprender sin problemas" materias complejas como matemáticas, física, derecho, medicina, historia y ética. Gemini Pro superaría GPT-3.5, el modelo de lenguaje detrás de ChatGPT, pero se desconoce si podría equipararse a GPT-4, el más avanzado de OpenAI.

Google no ha aclarado si tiene previsto cobrar a los usuarios por el uso de la versión más avanzada de Bard, su ChatGPT, y si pretende monetizar este nuevo modelo de IA. Tampoco ha dado detalles sobre cómo ha entrenado Gemini.