🎙️ Nuevo Episodio: Open Source vs Frontier, la IA local y por qué necesitas un plan B

La brecha entre los modelos de IA open source y los frontier casi desapareció. En este capítulo hablamos sobre si bloquear a China es estrategia o un autogol, las novedades de IA y mucho más!

¡Hola 👋🏽! ¿cómo estás?

Nueva semana, nuevo podcast! En esta oportunidad nos juntamos los tres (Cristian, Diego y yo) a conversar sobre la pelea global por la IA: los bloqueos de Estados Unidos, el avance de los modelos chinos open source y por qué la diferencia con los modelos frontier casi desapareció.

Sin invitado, pero con harta tela que cortar (y, según Diego, muy poco hate 😏).

En este capítulo conversamos sobre algo que nadie quiere mirar de frente: la dependencia que estamos generando con un puñado de modelos de IA, y qué pasa cuando un gobierno decide cortarte el acceso. De ahí saltamos al reality check de la IA local (correr un modelo "gratis" puede costarte medio millón de dólares en hardware), a por qué Minimax 3 se siente como el Opus que extrañábamos, y a la confesión de que Cristian terminó cerrando sus agentes en la nube para volver a lo local.

El capítulo está repleto de ejemplos concretos, comparaciones de modelos y una moraleja simple para cualquiera que ya esté trabajando con IA todos los días: ten un plan de contingencia.

📹 Ver en YouTube

Qué aprenderás:

Por qué la brecha entre los modelos frontier y los open source casi desapareció (y qué significa para ti)
Cuánto cuesta de verdad correr un modelo "gratis" como GLM 5.2 en tu propio hardware
Por qué siempre deberías tener un plan B y no depender de un solo modelo de IA
Qué es Diffusion Gemma y por qué un modelo de texto por difusión es tan rápido en local
Cuándo conviene un agente en la nube y cuándo uno local (y por qué los tres terminamos en local)
Cómo medir el impacto real de la IA en tu trabajo, más allá del "token maxing"
Las 5 herramientas de IA que uso todos los días

Dónde encontrar a los hosts:

Rodrigo Rojo: LinkedIn
Cristian Tala: LinkedIn
Diego Arias: LinkedIn

Comunidades:

La Patrulla Roja — comunidad de Rodrigo
Cágala, Aprende, Repite — comunidad de Cristian

Referencias y recomendaciones:

Herramientas y agentes:

Handy — dictado por voz local y open source (lo que uso yo)
WhisperFlow — alternativa de pago: transcribe y formatea con IA según el contexto
Granola — graba y transcribe reuniones
Claude / Claude Code — mi asistente de IA principal
Perplexity — mi buscador con IA por defecto
OpenClaw — agente 24/7 (¡acaba de salir su app para Android e iPhone!)
Hermes — el agente que usan Cristian y Diego
n8n — automatización de flujos
Ollama — correr modelos en local
OpenRouter — acceso a modelos vía API

Modelos mencionados:

GLM 5.2 (Z.ai) — el modelo abierto que disparó la acción de la empresa un 30% en un día
Minimax 3 — el favorito chino del episodio
Kimi / Kimi Code (Moonshot)
Qwen 3.6 (Alibaba)
Diffusion Gemma (Google) — modelo de texto por difusión, sorprendentemente rápido en local
Nemotron 3 Super (NVIDIA) — para planning en local
De contexto: Opus 4.8, Fable 5, GPT 5.5/5.6, GROK 4.3, Gemini

Hardware para IA local:

NVIDIA DGX Spark
Mac Studio / MacBook M4 Max (RAM unificada de 128 GB o más)

Hosting (con descuento):

Hostinger — hosting con descuento que nos ayuda a seguir creando este contenido

💡

Si tienes un MacBook (o Mac) con 32 GB de RAM o más, prueba Diffusion Gemma en local y cuéntanos cuántos tokens por segundo te da. En el episodio quedamos con la duda y nos encantaría comparar números con la comunidad.

Algunos de los enlaces pueden ser enlaces de afiliados. No te cobran más, pero me llega una comisión que me ayuda a seguir creando este tipo de contenido 💪🏽