Copiar enlace

Es oficial: el gigante tecnológico Google ha desvelado Gemini, su propio modelo de lenguaje de inteligencia artificial (IA) con el que buscará hacerle frente a ChatGPT; así lo dio a conocer la empresa basada en California, Estados Unidos, este 06 de diciembre.

La compañía dio a conocer que este nuevo LLM (large language model) llegará en tres tamaños diferentes: Nano, Pro y Ultra, cada uno de ellos adaptándose a las diferentes necesidades y complejidades de cada task. La versión Pro ya está disponible en varios dispositivos y herramientas (como Bard) en más de 170 países, su versión más potente, Gemini Ultra, llegará hasta principios de 2024.

Google introduce Gemini  como una IA multimodal

Si bien Google en apariencia ha tardado demasiado en realizar las pruebas y evaluaciones para lanzar su propia IA, al parecer la espera ha valido al pena, ya que el gigante de internet destaca que la funcionalidad de Gemini rompe con las expectativas actuales en el mercado, ya que sus resultados fueron los mejores en 30 de las 32 pruebas académicas de uso generalizado, alcanzando una puntuación del 90,0% en MMLU (massive multitask language understanding) y superando por poco al modelo de OpenAI.

Gemini es el resultado de los esfuerzos colaborativos a gran escala de los equipos en Google, incluyendo a nuestros colegas en Google Research. Fue construida desde cero para ser multimodal, lo que significa que puede generalizar y comprender sin problema alguno, operando y combinando a través de diferentes tipos de información, incluyendo texto, código, audio, imagen y video“, señala la empresa en su comunicado.


Las 3 versiones de Gemini se dividen de acuerdo a las diferentes tareas a las que estará asignado:

  • Nano: modelo que ejecutará tareas directamente desde dispositivos
  • Pro: diseñado para escalar en varios tipos de tasks
  • Ultra: el modelo más potente, diseñado específicamente para tareas de gran complejidad

Su capacidad ofrece comprensión de texto, código, imágenes y más

Con el modelo Gemini 1.0, la compañía apunta a democratizar sus capacidades sofisticadas de razonamiento, permitiendo que los usuarios puedan darle sentido a información compleja tanto en imagen como en texto. De esta forma, la IA podrá extraer insights de cientos de documentos a la vez, filtrando la información a nuevas velocidades nunca antes vistas. Además, su modelo de lenguaje es tan avanzado que incluso tendrá la capacidad de entender y brindar información de disciplinas como matemáticas o física.

Para los desarrolladores esta IA contará con la facultad para entender, explicar y generar código de alta calidad en distintos lenguajes de programación, tales como Python, Java C++ y Go. La compañía asegura que desde Gemini Ultra, los desarrolladores no solo tendrán la oportunidad de diseñar mejores servicios, sino que también podrán hacerlo mucho más rápido.

“Gemini fue diseñado para que sea multimodal de forma nativa, preentrenado desde el comienzo en diferentes modalidades y, después, fue perfeccionado con datos multimodales para refinar aún más su eficacia. Esto ayuda a que Gemini pueda entender y razonar a la perfección sobre cualquier tipo de entrada, mucho mejor que los modelos multimodales existentes”.

Desde hoy, Gemini se presenta en su versión Pro en Google Bard, marcando la mayor actualización desde su lanzamiento. Google destaca que esto lo posiciona como uno de los modelos gratuitos más avanzados globalmente. Inicialmente en inglés y disponible en más de 170 países, la empresa asegura que en los próximos meses se expandirá a otros territorios e idiomas.

Con respecto a Gemini Ultra, la variante más potente de este modelo, Google afirma que estará accesible para algunos clientes, desarrolladores y especialistas en seguridad, quienes tendrán la primicia de probarlo antes de su lanzamiento general a todos los desarrolladores en los primeros meses de 2024.

En cuanto a la versión Nano, Gemini hace su entrada en el móvil de élite de Google, el Pixel 8 Pro. Este añadido brinda al smartphone nuevas capacidades, como la integración de respuestas inteligentes del teclado Gboard en WhatsApp, entre otras funciones. Para el año 2024, la compañía asegura que extenderá la presencia de Gemini a diversas aplicaciones de mensajería.

Mantente informado de las noticias más relevantes en nuestro canal de Telegram