🎙️ Nuevo Episodio: Open Source vs Frontier, la IA local y por qué necesitas un plan B
La brecha entre los modelos de IA open source y los frontier casi desapareció. En este capítulo hablamos sobre si bloquear a China es estrategia o un autogol, las novedades de IA y mucho más!
¡Hola 👋🏽! ¿cómo estás?
Nueva semana, nuevo podcast! En esta oportunidad nos juntamos los tres (Cristian, Diego y yo) a conversar sobre la pelea global por la IA: los bloqueos de Estados Unidos, el avance de los modelos chinos open source y por qué la diferencia con los modelos frontier casi desapareció.
Sin invitado, pero con harta tela que cortar (y, según Diego, muy poco hate 😏).
En este capítulo conversamos sobre algo que nadie quiere mirar de frente: la dependencia que estamos generando con un puñado de modelos de IA, y qué pasa cuando un gobierno decide cortarte el acceso. De ahí saltamos al reality check de la IA local (correr un modelo "gratis" puede costarte medio millón de dólares en hardware), a por qué Minimax 3 se siente como el Opus que extrañábamos, y a la confesión de que Cristian terminó cerrando sus agentes en la nube para volver a lo local.
El capítulo está repleto de ejemplos concretos, comparaciones de modelos y una moraleja simple para cualquiera que ya esté trabajando con IA todos los días: ten un plan de contingencia.

Qué aprenderás:
- Por qué la brecha entre los modelos frontier y los open source casi desapareció (y qué significa para ti)
- Cuánto cuesta de verdad correr un modelo "gratis" como GLM 5.2 en tu propio hardware
- Por qué siempre deberías tener un plan B y no depender de un solo modelo de IA
- Qué es Diffusion Gemma y por qué un modelo de texto por difusión es tan rápido en local
- Cuándo conviene un agente en la nube y cuándo uno local (y por qué los tres terminamos en local)
- Cómo medir el impacto real de la IA en tu trabajo, más allá del "token maxing"
- Las 5 herramientas de IA que uso todos los días
Dónde encontrar a los hosts:
Comunidades:
- La Patrulla Roja — comunidad de Rodrigo
- Cágala, Aprende, Repite — comunidad de Cristian
Referencias y recomendaciones:
Herramientas y agentes:
- Handy — dictado por voz local y open source (lo que uso yo)
- WhisperFlow — alternativa de pago: transcribe y formatea con IA según el contexto
- Granola — graba y transcribe reuniones
- Claude / Claude Code — mi asistente de IA principal
- Perplexity — mi buscador con IA por defecto
- OpenClaw — agente 24/7 (¡acaba de salir su app para Android e iPhone!)
- Hermes — el agente que usan Cristian y Diego
- n8n — automatización de flujos
- Ollama — correr modelos en local
- OpenRouter — acceso a modelos vía API
Modelos mencionados:
- GLM 5.2 (Z.ai) — el modelo abierto que disparó la acción de la empresa un 30% en un día
- Minimax 3 — el favorito chino del episodio
- Kimi / Kimi Code (Moonshot)
- Qwen 3.6 (Alibaba)
- Diffusion Gemma (Google) — modelo de texto por difusión, sorprendentemente rápido en local
- Nemotron 3 Super (NVIDIA) — para planning en local
- De contexto: Opus 4.8, Fable 5, GPT 5.5/5.6, GROK 4.3, Gemini
Hardware para IA local:
- NVIDIA DGX Spark
- Mac Studio / MacBook M4 Max (RAM unificada de 128 GB o más)
Hosting (con descuento):
- Hostinger — hosting con descuento que nos ayuda a seguir creando este contenido
Algunos de los enlaces pueden ser enlaces de afiliados. No te cobran más, pero me llega una comisión que me ayuda a seguir creando este tipo de contenido 💪🏽