Google Gemini es una familia de modelos de IA, como el GPT de OpenAI. La principal diferencia: aunque Gemini puede entender y generar texto como otros LLM, también puede entender, operar y combinar de forma nativa otros tipos de información como imágenes, audio, vídeos y código. Por ejemplo, puedes darle una pregunta del tipo "¿qué pasa en esta foto?" y adjuntarle una imagen, y te describirá la imagen y responderá a preguntas más complejas.
Dado que ya hemos entrado en la era de la competencia corporativa de la IA, la mayoría de las empresas guardan bastante silencio sobre los detalles del funcionamiento y las diferencias de sus modelos. Aun así, Google ha confirmado que los modelos Gemini utilizan una arquitectura de transformador y se basan en estrategias como el preentrenamiento y el ajuste fino, al igual que otros LLM como GPT-4. La principal diferencia con un LLM típico es que también se entrena en imágenes, audio y vídeo al mismo tiempo que en texto; no son el resultado de un modelo separado que se añade al final.
En teoría, esto debería significar que entiende las cosas de una manera más intuitiva. Tomemos una frase como "monerías": si una IA sólo se entrena con imágenes etiquetadas como "monerías" y "monerías", es probable que sólo piense en monos con traje cuando se le pida que dibuje algo relacionado con ello.
Cada cambio tecnológico es una oportunidad para avanzar en los descubrimientos científicos, acelerar el progreso humano y mejorar la vida de las personas. Creo que la transición que estamos viendo ahora con la IA será la más profunda de nuestras vidas, mucho mayor que el cambio al móvil o a la web. La IA tiene el potencial de crear oportunidades -de lo cotidiano a lo extraordinario- para personas de todo el mundo. Aportará nuevas olas de innovación y progreso económico e impulsará el conocimiento, el aprendizaje, la creatividad y la productividad a una escala nunca vista.
Eso es lo que me entusiasma: la posibilidad de hacer que la IA sea útil para todos, en cualquier parte del mundo.
Tras casi ocho años de andadura como empresa que da prioridad a la IA, el ritmo del progreso no hace más que acelerarse: Millones de personas utilizan ahora la IA generativa en nuestros productos para hacer cosas que hace un año ni siquiera podían, desde encontrar respuestas a preguntas más complejas hasta utilizar nuevas herramientas para colaborar y crear. Al mismo tiempo, los desarrolladores están utilizando nuestros modelos e infraestructura para crear nuevas aplicaciones de IA generativa, y startups y empresas de todo el mundo están creciendo con nuestras herramientas de IA.
Se trata de un impulso increíble y, sin embargo, sólo estamos empezando a arañar la superficie de lo que es posible.