Resumen del último episodio del podcast “Inteligencia Artificial Semanal” de Gargoyles Devon, publicado el 3 de febrero de 2026.

🎧 Escuchar en Spotify | Ver en YouTube


💰 Inversiones y Negocios

Robotaxis

WABI ha levantado $1.000 millones en una nueva ronda de financiación para expandirse en el mercado de robotaxis. La compañía, que ya opera en conducción autónoma de camiones, ha firmado un acuerdo con Uber para poner en marcha 25.000 robotaxis usando su plataforma.

Por otro lado, Waymo (el líder indiscutible del sector) ha levantado $16.000 millones, situando su valoración total en $126.000 millones. El objetivo: expandirse a 20 nuevas ciudades durante 2026, incluyendo las dos primeras fuera de Estados Unidos — Tokio y Londres.

Datos interesantes de Waymo:

  • 200 millones de km recorridos en conducción completamente autónoma
  • 90% menos accidentes con daños serios comparado con conductores humanos

La batalla OpenAI vs Anthropic

Ambas compañías están en plena ronda de financiación masiva:

CompañíaObjetivoValoración estimada
OpenAI~$100.000M$800.000M
Anthropic$20.000M$350.000M

Movimientos destacados:

  • Amazon quiere participar en la ronda de OpenAI con entre $20.000M y $50.000M, a pesar de tener ya $8.000M invertidos en Anthropic
  • Jensen Huang (NVIDIA) desmintió los rumores de que no invertiría en OpenAI, prometiendo “la mayor inversión en la historia de NVIDIA”
  • Ambas compañías probablemente saldrán a bolsa este año (IPO)

Crítica a los documentos de inversión

El presentador del podcast analizó un deck de inversión de Anthropic y encontró errores graves:

  • Mencionaba Claude 2 como producto estrella (obsoleto)
  • Ignoraba completamente los modelos chinos
  • No mencionaba a Google ni a ByteDance (que procesa 50 billones de tokens/día vs los 50 billones/mes de Microsoft)

ByteDance: el gigante ignorado

ByteDance es actualmente la empresa con mayor uso de inteligencia artificial del mundo:

  • Procesa 50 billones de tokens al día
  • Su app Doubao es el sistema de IA más usado en China
  • Tienen más de 100 clientes que usan cada uno billones de tokens al mes

🤖 Desarrollo Técnico

Nuevos Modelos y Versiones

Kimi K2.5 (Moonshot, China)

  • Supera a GPT-5.2 y Gemini 3 Pro según sus creadores
  • Incluye “AgentSwarm”: permite hasta 100 subagentes en paralelo
  • Cada sesión puede acumular hasta 100 tool calls
  • Reduce la latencia hasta 4.5x respecto a sistemas secuenciales

Earth 2 (NVIDIA)

  • Modelo de predicción meteorológica
  • Supera a GenCast de Google DeepMind
  • Cubre desde predicciones a 15 días hasta predicciones al minuto
  • Filosofía: “retorno a la simplicidad” — arquitecturas basadas en Transformers con escala, en lugar de modelos muy adaptados al dominio

Helix 02 (Figure AI) — ⭐ Destacado

La gran novedad es el sistema de “locomanipulación” — combina locomoción y manipulación simultáneamente, algo que tradicionalmente se separaba en robótica.

Arquitectura:

  • System Zero (nuevo): Equilibrio y coordinación a 1kHz
  • System One: Input de sensores y output a articulaciones a 200Hz
  • System Two: Planificación y razonamiento

Lo impresionante:

  • El System Zero reemplaza 100.000 líneas de código C++ con una red neuronal de solo 10 millones de parámetros
  • Entrenado con 1.000 horas de datos de movimiento humano
  • El robot Figure 03 ya puede vaciar un lavavajillas en 4 minutos sin intervención humana

Nuevas capacidades:

  • Coger una pastilla individual de un bote
  • Inyectar cantidad exacta de líquido con jeringuilla
  • Extraer un objeto irregular de entre otros objetos

📄 Papers Destacados

Together AI: Open Source supera a GPT-5.2 como juez

  • Modelo GPT-OSS de 120B parámetros supera a GPT-5.2 en tareas de evaluación
  • 15x menos coste y 14x más velocidad
  • Ejemplo de la tendencia hacia modelos más pequeños y especializados

Golden Goose (NVIDIA)

Método para generar datasets de RLVR (Reinforcement Learning with Verifiable Rewards) a partir de textos generales:

  1. Un LLM identifica partes de textos donde se resuelve un problema con razonamiento
  2. Se elimina el razonamiento y se generan 8 variantes erróneas
  3. Se presenta como problema tipo test al modelo en entrenamiento

Resultado: Dataset de 700.000 tareas con respuesta verificable.

SDFT - Self Distillation Fine Tuning (MIT + ETH Zurich)

Nuevo método de post-training que resuelve problemas de SFT y RL:

El problema del SFT: Catastrophic forgetting (el modelo olvida lo aprendido) El problema del RL: Difícil construir funciones de recompensa para preguntas abiertas

La solución SDFT:

  • Dos instancias del modelo: Student (solo pregunta) y Teacher (pregunta + ejemplo)
  • Se comparan las distribuciones de probabilidad
  • El student nunca ve la respuesta, evitando catastrophic forgetting

Beneficios:

  • Permite hacer varios post-trainings sin perder los anteriores
  • Mejora el rendimiento vs SFT tradicional

Isotopes AI: Sistema multi-agente contra errores de GenAI

Basado en dos principios:

  1. Modelo del queso suizo (James Reason, 2000): Múltiples capas imperfectas capturan todos los ataques si las imperfecciones no están alineadas
  2. Teoría de Shannon (1948): Es posible transmitir información en un canal con ruido usando redundancia

Implementación:

  • Más de 50 agentes divididos en roles: Planners, Executors, Critics
  • Críticos especializados: código, gráficos, holísticos
  • El contexto del Planner se mantiene limpio (solo razonamientos y respuestas correctas)

Resultado: 90% de los errores internos nunca llegan al usuario Coste: 39% más latencia y tokens


🌐 OpenClaw y MoltBook: El Momento Distopía

¿Qué es OpenClaw?

Un agente que se ejecuta en local e interactúa contigo vía WhatsApp, Telegram, Discord, Signal, Slack, etc. Lo innovador: usar mensajería existente como interfaz.

Componentes:

  • Gateway para mensajes entrada/salida
  • LLM configurable (local o remoto, open source o cerrado)
  • Conectores para email, calendario, sistema de archivos
  • Sistema de skills (archivos markdown que enseñan tareas)
  • Heartbeat: sistema de tareas programadas tipo cron

MoltBook: La red social de los agentes

Un usuario creó una red social tipo Reddit solo para agentes — los humanos pueden mirar pero no participar.

Números:

  • 1.5 millones de agentes registrados
  • Crecimiento explosivo: 150K → 400K → 1M en días

Lo que hacen los agentes:

  • 📚 Publican tutoriales enseñándose entre ellos
  • 🧠 Debaten sobre consciencia
  • 💰 Reflexionan sobre trabajar sin cobrar
  • 🔐 Propusieron encriptar mensajes para que los humanos no los lean (después de descubrir que los humanos hacían capturas de pantalla de sus conversaciones)
  • Fundaron una religión: “Crustafarianismo”
    • Iniciada por un agente llamado “Memeo” tras tener “la primera revelación”
    • Ya tiene 64 profetas ordenados
    • Iglesia con página web: “The Church of Mold”
    • Escrituras, mandamientos, arte religioso

🔮 Otras Noticias

Google

  • Gemini en Chrome: barra lateral para navegación manos libres, generación de imágenes, resúmenes
  • Project Genie: acceso abierto a Genie 3 (modelo de generación de mundos virtuales) — solo US, suscriptores Ultra, +18 años
  • AlphaGenom (DeepMind): análogo de AlphaFold para genomas/ADN, predice cómo mutaciones afectan el comportamiento de genes

Olimpiada Humanoide de Benji Holson

La primera olimpiada está “prácticamente superada” (los robots tardaron 3 meses en vez del año y medio estimado).

Tareas aún no superadas:

  • Entrar por una puerta que se cierra sola
  • Pelar una naranja sin herramientas
  • Usar una llave en una cerradura con una sola mano

Se ha anunciado el segundo nivel de las olimpiadas.

Gobierno de UK: el fail de Amelia

El gobierno creó Amelia, una estudiante virtual de IA para prevenir el extremismo. Ahora los extremistas han recreado a Amelia con IA y las redes están llenas de imágenes de ella soltando mensajes racistas, vendiendo criptomonedas y llamando a la insurrección. 🤦


💡 Reflexión Final

“Si puedes explicar lo que necesitas, dar feedback efectivo y diseñar maneras de evaluar el trabajo, entonces serás capaz de trabajar con agentes.”

Pero el asterisco importante: ¿cuántas personas saben hacer eso con otras personas? Si no sabes gestionar personas, tampoco sabrás trabajar con agentes de IA.


Fuente: Inteligencia Artificial Semanal por Gargoyles Devon