🚀 Convergencia - Resumen Resumido #146
Se acaba el año y en este mega-resumen te traigo un resumen de todo lo que vivimos este año en IA y tecnología. ¡Y fue increíble!
⏱️ El Resumen Resumido de hoy se lee en tan sólo MUCHOS minutos. ¡Que esperabas! Es el mega-resumen del año!
Únete a los más de 1.400 lectores que se mantienen actualizados semanalmente con el Resumen Resumido, y recibe lo último de Tecnología e Inteligencia Artificial para potenciar tu marca y negocio.
Bienvenido al último Resumen Resumido de 2024, un año increíble lleno de aventuras donde me lancé como independiente y aprendí más que todos los años anteriores juntos.
Pero hoy no es el momento de contarte mis aprendizajes, esos vendrán después. Hoy es momento de mirar todo lo que pasó este año en el mundo de la IA y tecnología y pensar futuro.
En esta edición voy a tratar de hacer un mega-resumen de lo que hemos ido conversando en el Resumen Resumido. Desde las mejores aplicaciones de Inteligencia Artificial, hasta los últimos desarrollos de IA.
Este newsletter nació hace un par de años para compartir semanalmente lo que voy aprendiendo, las cosas que me gustan, y los desafíos que veo. Este año casi fue exclusivamente de Inteligencia Artificial, y eso fue simplemente por una cosa: no dejó de sorprender, semana tras semana vimos avances increíbles.
- ¿Pensabas que llegado final de año ibas a poder crear una canción completa con un solo clic?
- ¿Tomar una foto vieja, sacarle a esa persona colada en el fondo, y luego animar la foto?
- ¡Y para qué hablar de automatizar cosas con IA!
Estamos de nuevo en la era de la exploración ¡exploremos juntos!
La Era de la Exploración 2.0 - Creada con Suno.ai
✨ Las mejores App de Inteligencia Artificial en 2024
Para cerrar el año quise hacer alguna especie de recuento de las mejores aplicaciones de IA, pero no quería hacerlo arbitrariamente yo, así que decidí invitar a mis amigos y gente que admiro.
Le pregunté a 27 personas que trabajan en distintas industrias y tienen distintos roles: desde Gerentes en empresas de tecnología como Microsoft o Google, hasta creadores de contenido sobre Inglés, Fondos Corfo, pasando por Marketing, Recursos Humanos, Emprendimiento y muchísimo más.
La pregunta fue:
¿Cuáles son tus tres app de IA favoritas? ¿y por qué elegiste cada una de ellas?
Y tuvimos 77 respuestas donde se mencionaron a 36 aplicaciones.
Los resultados fueron los siguientes: ChatGPT en primer lugar, Perplexity en segundo lugar, y triple empate en tercer lugar con Gemini, NotebookLM y Claude.
Si quieres conocer quiénes fueron mis entrevistados, y qué herramientas recomendaron, puedes continuar leyendo el post que escribí sobre las Mejores App de IA en 2024.
🫶🏽 Mis aplicaciones favoritas de 2024
Podría haber incluido mis respuestas en la encuesta, pero no quise hacerlo, quiero que esa selección sea exclusiva de quienes contestaron.
Así que acá voy con mis aplicaciones favoritas de Inteligencia Artificial del año.
- Claude: es mi asistente de IA preferido, lo uso desde que me ayude cuando estoy pegado en un puzzle, hasta para planificar mis campañas de Dungeons & Dragons. Me encanta como escribe, y siento que itero menos veces con Claude que con ChatGPT. En el iPhone lo tengo asignado al Botón de Acción.
- NotebookLM: es mi favorito para aprender e investigar. Es una interfaz muy distinta a lo que estamos acostumbrados, y eso me gusta, porque es de las primeras IA de rápido crecimiento que plantea una forma distinta de interactuar con la IA. Y la función de podcasts es una maravilla.
- ChatGPT: no puedo no mencionar a ChatGPT, todo el año fue sacando funcionalidades nuevas sin parar. El modo búsqueda y el modo avanzado de voz son dos funcionalidades que me hacen volver siempre. Y los GPT Personalizados son excelentes cuando tienes tareas repetitivas.
- Cove.ai: esta app me gustó mucho este año. Se trata de un canvas o tablero donde las respuestas de la IA se van "colgando" como notas. La gracia es que puedes ir editándolas, pedirle que profundice en cosas, etc, y lo que va haciendo es modificar las notas actuales o crear nuevas en caso de que el tema sea distinto.
- Suno y Udio: el nivel de consistencia al que llegó la IA de música este año es notable. Ya puedes crear canciones bastante buenas con un simple prompt, y he visto gente que produce música usándola como parte de su proceso creativo para explorar ideas, y en sus manos es una mina de oro. Hoy me gustan más los resultados de Suno, pero la interfaz de Udio.
- Midjourney: sigue siendo mi herramienta favorita para crear imágenes con IA. Sé que hay más flujos, Flux tuvo avances tremendos y se puede instalar local, pero hay algo que me trae de vuelta a Midjourney siempre. ¿Será porque fue la primera IA que usé a inicios de 2022?
- Notion AI: mi mundo profesional lo tengo dentro de Notion, así que con la nueva versión de su IA que permite trabajar con múltiples fuentes y hacer cosas muy entretenidas, pasó a ser parte de mi día a día.
- Descript: transcribir y subtitular vídeos. ¡check! Descript entiende mi español mal hablado con bastante certeza (aunque casi siempre tengo que actualizar un par de cosas) y me permite subtitular rápidamente los vídeos que hago.
Probé muchísimas más este año, pero a las que vuelvo constantemente son estas. Menciones especiales a Runway, ElevenLabs, HeyGen y Gamma, que las uso con menos frecuencia y para cosas muy puntuales pero son mis preferidas cuando se trata de vídeo, audio, avatars y presentaciones respectivamente.
¿Y cuáles fueron tús favoritas? Escríbeme con tus app más usadas 😄
🤖 El Rincón de la IA
Ponte al día con las últimas noticias de Inteligencia Artificial
En esta edición más que hablar de las últimas noticias de IA, quiero que hagamos un barrido rápido sobre lo incréiblemente brutal que fue este año en el mundo de la inteligencia artificial.
Si tuviera que hacer un resumen de todo lo que conversamos a lo largo del Resumen Resumido este año, lo dividiría en las siguientes categorías:
🤖 La consolidación del Asistente de IA
Este año vimos como los asistentes de IA tipo chatbot se consolidaron como herramientas que permiten hacer más, mejor y en menos tiempo.
OpenAI lanzó infinidad de cosas súper interesantes:
- Partió el año lanzando la tienda de GPTs Personalizados.
- GPT-4o, su primer modelo base multimodal
- Lanzó ChatGPT Search, su nueva función de búsqueda.
- Mejoras en la interfaz de la aplicación para hacer más simple el onboarding
- Sora su modelo de generación de vídeos (que anunciaron a principio de año y liberaron en diciembre)
- La función de memoria para mantener cierta información sobre ti a través de distintos chats
- Lanzó un acuerdo con Apple para estar nativamente en Apple Intelligence (en iPhone, iPad y Mac) y ayudar al usuario cuando una tarea le quede grande a Siri.
- Lanzó o1 su modelo que "razona" antes de contestar, buscando la mejor respuesta antes de generarla, junto a o1-mini una versión más pequeña del modelo.
- Su tier "pro" de 200 USD con o1-pro, Sora con más generación de vídeos y mucho más.
- Lanzó sus aplicaciones de escritorio tanto para Mac como para Windows
- Lanzó el Canvas, un espacio donde la IA puede ir editando archivos en vivo.
- Lanzó el modo avanzado de voz
- Y lanzó muchas mejoras en los "12 días de adviento" en diciembre como el Modo Santa, Vídeo en vivo con el asistente de voz avanzado, Proyectos, Canvas mejorado, y el lanzamiento oficial de Sora.
Anthropic por su parte liberó muchas cosas:
- Anunció en marzo Claude 3, sus nuevos modelos de frontera con la serie Haiku (pequeña y ágil), Sonnet (ideal para tareas de todos los días) y Opus (la más poderosa e intensiva en recursos).
- Unos meses más tarde las reemplazó por las versiones 3.5 de Sonnet, y luego una actualización en octubre donde lanzó otra versión de Sonnet 3.5, sumó a Haiku 3.5 y agregó la que yo creo fue la función más revolucionaria: Computer Use. La capacidad de que Claude pueda hacer cosas en tu computador.
- Agregó la capacidad de usar Herramientas externas a sus modelos.
- Lanzó los Projects, que es una especie de GPT Personalizado que además te ayuda a organizar mejor los chats (en Diciembre ChatGPT copió casi igual esta idea)
- Lanzó los Artefactos, que permiten crear mini-aplicaciones dentro del chat.
- Lanzó el plan para equipos, y también la app de iOS.
- Unos meses después lanzó la app de Android
- Un generador de prompts increíble en su consola.
- Agregó la herramienta de Análisis de Datos, para trabajar directamente con data en Claude.
- Y muchísimas mejoras más a nivel de API y herramientas para developers.
Y Google, o Google, por fin se puso las pilas con un montón de actualizaciones:
- Partieron el año anunciando la nueva función de IA en Search, que estuvo experimental por gran parte del año y el segundo semestre se habilitó para todos.
- Lanzaron Gemini 1.5 Pro, su modelo para rivalizar a GPT-4o.
- Lanzaron Gemma 1.0, su modelo open source. Unos meses después lanzaron Gemma 2.0
- Lanzaron ImageFX, MusicFX y otros modelos creativos.
- Lanzaron modelos predictivos de inundaciones
- Lanzaron funciones de IA para editar fotos en su app Google Photos
- Liberaron AlphaFold su modelo para identificar estructuras moleculares para usar en medicina.
- NotebookLM pasó a poder ser accesible a nivel mundial, agregaron nuevas fuentes de datos, y unos meses después potenciaron NotebookLM con nuevas funciones como el Audio Overview (que crea podcasts de los temas de tu cuaderno), una nueva interfaz, mayores límites para las fuentes, plan de pago y mucho más. Mi app favorita de Google.
- Gemini pasó a ser parte central de Android
- Lanzaron una IA para detectar incendios usando imágenes satelitales.
- Lanzaron la App de Gemini en iOS, y está bastante buena!
- Terminó el año lanzando Gemini 2.0, en particular con el modelo Flash que es su modelo más pequeño y es una gozada. Es un modelo preparado para "la era de los agentes". Por fin una IA de Google que está a la altura de los modelos que lideraban como GPT y Claude. Con todo lo que esperas de esos modelos y más: capacidad de hablar, de interactuar en vivo con imágenes y vídeo, entre otras cosas.
- Anunciaron Willow, un chip cuántico estado del arte, que permitiría llevar todo a un nuevo nivel de computo.
- Agregaron Deep Research, una función que permite a Gemini "razonar" y armar un plan de investigación antes de lanzarse a responder
📊 Se cierra el gap entre los modelos cerrados y abiertos
Dejó los modelos abiertos para esta sección, porque este año vimos como modelos open source como Mistral, Llama de Meta y Deepseek dieron saltos agigantados y ya están al nivel de los modelos cerrados en muchísimos de los tests.
Acá un resumen de las principales noticias:
- Meta lanza Llama 3 en abril, y durante el año lo actualiza a las versiones 3.1, 3.2 y termina el año lanzando 3.3 70B. Un modelo más pequeño que 3.1 405B, pero a una fracción del costo. También anunció (pero aún no lanza) MovieGen, sus modelos de vídeo.
- Alibaba lanza Qwen 2.5, y con el pasar de los meses lanza versiones específicas para código, agranda la ventana de contexto, y termina liberando una versión nueva llamada QVQ que tiene visión.
- Deepseek lanza Deepseek v3, 3x veces más rápido que la V2, y entrenado con una cantidad de recursos 11 veces más pequeña que el modelo similar de Meta
- Blackforest lanzó Flux 1.1 Pro, uno de los mejores modelos de creación de imágenes de código abierto, superando según muchos a Midjourney. Con el pasar de los meses lanzó las versiones Ultra y Raw, y le agregó la funcionalidad de Tools.
Lo interesante de esto (y otras noticias que no pongo, pero porque ya me extendí demasiado) es que hoy tenemos la capacidad de correr modelos de manera local (dependiendo de la capacidad del computador) y eso habilita un montón de casos de uso súper interesantes. En particular a mí me llaman la atención mucho más los modelos pequeños, que son los que corren de forma más eficiente.
📹 El gran salto audiovisual
Este año donde vi los mayores avances fue con respecto a la generación audiovisual: modelos de vídeo más consistentes (pero que aún es como tirar una moneda), modelos de música y voz que ya están a un nivel increíble, y la imagen ya resuelta.
- Udio y Suno lanzaron sus herramientas para generar música, y son increíbles. En particular Suno con la V4 logra cosas realmente increíbles (como la canción que puse al inicio del Resumen)
- RunwayML, la IA para generar vídeos, lanzó un montón de mejoras como su nuevo modelo Gen-3 Alpha, Runway API para Gen-3 Alpha Turbo, anunciaron el partnership con Lionsgate, y funcionalidades como Video Extend, Act-one y su modelo Frames para generar imágenes.
- Salieron nuevos modelos súper buenos de generación de vídeo como Hailuo Minimax, Kling, y Tencent Huanyuan.
- Pika lanzó mejoras a su plataforma y agregó efectos rápidos muy interesantes.
- OpenAI lanzó Sora, con resultados mixtos, y luego llegó Google con Veo2 que, a mi parecer fue un golpe de gracia, lamentablemente es con acceso vía waitlist.
Hubo muchísimas más herramientas que salieron este año, muchas, nuevos modelos, nuevas técnicas para generar modelos, uff!! fue brutal. Pero acá dejé lo principal. Si quieres mantenerte al día durante 2025 considera suscribirte al newsletter!
💊 La píldora
Todas las semanas te traigo una píldora para abrir la mente y salir de la Matrix.
Ahora que se viene el 2025, nunca olvides cuál es tu North Star Metric: esa métrica que guía todo lo que haces.
No lo pongas a nivel de dinero, ponlo a nivel de aquello donde aportas valor a tu cliente:
- Uber mide el número de viajes por semana (y gana dinero con cada viaje, pero no es el foco)
- Spotify mide el tiempo que pasa un usuario escuchando música (y el usuario puede ser gratuito o pago)
- Las redes sociales miden usuarios activos por periodo de tiempo (diario, semanal, mensual)
La idea de esa métrica es que si sube es una señal de que lo estás haciendo bien (porque si baja, quiere decir que estás prestando un mal servicio).
Todo lo que tu empresa y los colaboradores hacen es en pos de que esa métrica suba. TODO.
💡 Datos Random
Descubrimientos entretenidos de mi semana
🪨 El poder de Obsidian
Desde que leí el post de "File over App" (archivo sobre aplicación) de Steph Ango, me convencí de que una parte de lo que hago en el día a día debe vivir en un lugar donde yo tenga el control. Así que decidí llevar parte de mis notas a Obsidian que es una aplicación súper flexible y muy poderosa. Te dejo un par de vídeos sobre ella.
🛕 La Arquitectura de El Viaje de Chihiro
Me encantó este vídeo de Ter hablando sobre el Viaje de Chihiro desde una perspectiva arquitectónica. Lo que más me gustó es lo increíble que le quedó la estructura y la animación. Una locura.
🐲 Mi mundo de aventuras fantásticas
Si vienen leyendo de hace algunas ediciones este Resumen, sabrán que lancé una nueva aventura episódica de Dungeons & Dragons donde todas las semanas estamos jugando "episodios autocontenidos". Esta semana tuvimos 4 nuevos jugadores que se sumaron, así que decidí hacer un vídeo privado para contar sobre lo que estamos haciendo.
Ahora lo estoy haciendo público. Si lo ves, y tu reacción es "qué increíble quiero ser parte" escríbeme.
🗒️ El poder de un buen blog
Como sabes me encantan los blogs (y lo sabes porque este newsletter en realidad es un blog). Y me encanta encontrar nuevas formas de leer blogs. Hace poco di con el blog de Andy Matuschak, investigador de cómo podemos hacer que la gente potencie su pensamiento y aprendizaje.
Tiene su blog configurado como una red de notas interconectadas donde al final sientes que te estás perdiendo en las entrañas de su cerebro. Es para estar horas leyendo.
🛠️ Herramientas Recomendadas
¡Nuevas herramientas todas las semanas!
En esta edición voy a aprovechar de recomendar algunas herramientas que ya he recomendado pero que me encantan y uso prácticamente todos los días, por lo que me acompañarán en 2025, y espero que a ti también:
- Notion AI: llevo la documentación de mi negocio en Notion, y con sus nuevas funciones de IA puedo hacer cosas muy entretenidas para acelerar mi día a día. La pago feliz.
- Claude: como conté más arriba, es mi asistente de IA principal, lo tengo como el botón acción en el iPhone, con atajo de teclado en el Mac, y en la barra de inicio de Windows. La uso TODOS los días.
- Hey Mail: es mi proveedor de correo, uso Hey desde prácticamente que salió. Es de los mismos creadores de Basecamp, y es un "software con opinión". Eso me gusta. Y también me gusta mucho como permite separar los distintos tipos de mails y algunas funciones power.
- Beeper: es una aplicación que te permite gestionar las bandejas de mensajes de varias redes sociales en un mismo lugar: Messenger, LinkedIn, Whatsapp, Telegram, etc. Y tiene app en el iPad, así puedo usar Whatsapp desde allá.
👋 Palabras al Cierre
¡Y hasta aquí llegó la última edición de 2024! Espero que sigamos leyéndonos en 2025, que seguro será un gran año lleno de aventuras.
Si te gusta lo que hago y quieres ayudar a que el Resumen Resumido ™ siga creciendo, puedes apoyarme en Patreon por el precio de un café ☕, donde además accederás a beneficios exclusivos.
Cualquier comentario o consulta escríbeme en LinkedIn, o en Twitter a @rodrigorojop, me hace muy feliz recibir tu feedback.