Gemma 4 12B: el modelo multimodal de Google que corre en tu portátil con 16 GB de RAM y procesa texto, imagen y voz sin encoders separados
Gemma 4 12B: el modelo multimodal de Google que corre en tu portátil con 16 GB de RAM y procesa texto, imagen y voz sin encoders separados
Google anuncia Gemini Omni como su nuevo modelo multimodal para crear y editar video con IA en el I/O 2026
Phi-4-reasoning-vision-15B: el modelo multimodal compacto de Microsoft que “piensa” solo cuando conviene
OpenAI lanza Sora 2, su nuevo modelo de IA que genera vídeos con diálogos y efectos de sonido sincronizados
ChatGPT ahora puede crear imágenes realistas gracias al nuevo modelo de OpenAI
¿Cómo Magma el nuevo modelo multimodal de Microsoft puede ayudar a programadores en sus proyectos?
OpenAI lanza GPT-4o: un nuevo modelo multimodal que trabaja con voz, texto e imagen al mismo tiempo
¿Qué es Sora de OpenAI y que lo hace tan increíble?
‘Google Gemini’: qué es y cómo funciona el nuevo modelo de inteligencia artificial que compite contra ‘ChatGPT’
Fuyu-8B: El modelo multimodal que simplifica la Inteligencia Artificial
Cookies
Usamos cookies en nuestro sitio web para brindarte la experiencia más relevante recordando tus preferencias y visitas repetidas. Al hacer clic en "Aceptar", aceptas el uso de TODAS las cookies necesarias.
A continuación le mostramos las cookies que usamos en nuestro sitio. Alguna de ellas podrías ser requerida para el funcionamiento del sistema y por ese motivo no podrá desactivarla.