Google lanzó su esperada herramienta de inteligencia artificial llamada Gemini, descrita como una solución más potente que cualquier otra disponible en el mercado, incluso por encima del popular ChatGPT, desarrollado por OpenAI y Microsoft.

La compañía resaltó la "multimodalidad" de su nueva plataforma, ya que puede "razonar fluidamente a través de textos, imágenes, video, audio y código" mediante el modelo MMLU, que representa la "comprensión masiva de lenguaje multitareas" en inglés.

Durante la presentación general brindada por la compañía, se detalló que Gemini será ofrecido en tres versiones: 

Google presentó Gemini, su nueva inteligencia artificial

Gemini tiene la capacidad de recibir todo tipo de información, ya sea visual o auditiva, como notas musicales, imágenes o palabras, para luego producir contenido propio en forma de texto, audio o imágenes.

En la presentación, Gemini demostró su habilidad para identificar errores en problemas matemáticos complejos, proporcionar la respuesta correcta y explicar los pasos necesarios para llegar a ella. 

A su vez, mostró su capacidad para ofrecer información detallada sobre animales (en la presentación se pidió que describiera a un pato), a partir de un simple dibujo, incluso proporcionando la traducción de "pato" a cinco idiomas diferentes.

Gemini recibirá información ya sea visual o auditiva, como notas musicales, imágenes o palabras, para luego generar contenido en forma de texto, audio o imágenes

Además, la herramienta es capaz de participar en desafíos populares con los usuarios, como el clásico "piedra, papel o tijera", o en el juego de los tres cubiletes.

Gemini opera con los lenguajes de programación más comunes, entre ellos:

Aunque aún es susceptible a cometer errores, Google indicó que puede fácilmente corregirlos cuando se le notifiquen, logrando una resolución del 90% de los casos.

El potencial de Gemini se integrará en su otra IA existente, Bard, que ya está operativo en varios idiomas desde hace varios meses

En cuanto a la monetización de esta nueva herramienta, la compañía no dio detalles claros en este momento. Únicamente se limitó a anunciar que estará disponible a partir del 13 de diciembre.

Gemini: sus principales diferencias con Bard

Gemini y Bard, la nueva pareja de hermanos generativa de Google, cuentan con varias diferencias en sus funciones y aplicaciones. 

Gemini contará con tres versiones: Nano, Pro y Ultra.

Gemini opera como un sistema de gestión de datos que automatiza la clasificación, organización y análisis de la información.

Utiliza la nueva familia de modelos de lenguaje de inteligencia artificial PaLM 2, desarrollada por Google, que otorga mayor precisión y fluidez en comparación con otros sistemas semejantes. 

Su enfoque está centrado en ayudar a empresas y organizaciones a extraer valor de sus datos mediante técnicas de procesamiento de lenguaje natural, aprendizaje automático y visión por computadora

Gemini es capaz de reconocer tipos, formatos y contenidos de datos, asignarles etiquetas, categorías y metadatos, así como generar resúmenes, gráficos y tablas para facilitar la comprensión y visualización de la información.

Por su parte, Bard es una plataforma de chat por inteligencia artificial diseñada estrictamente para el usuario final. 

Su objetivo es brindar una experiencia conversacional natural, divertida y educativa, mediante técnicas de generación de texto, comprensión del contexto y personalización.

Bard, el chatbot de inteligencia artificial de Google.

Bard es capaz de responder preguntas, contar historias, hacer bromas, crear imágenes y más. 

Además, tiene la capacidad de adaptarse al estilo, tono y humor del usuario, incluso aprendiendo sus preferencias y gustos. 

Ambos sistemas, Gemini y Bard, aprovechan la avanzada tecnología de PaLM 2 para ofrecer soluciones más precisas y fluidas en sus respectivos ámbitos.

Con la implementación de Gemini, Google busca posicionarse fuerte en el sector de la IA, y ser un referente con sus nuevos lanzamientos

Te puede interesar