qwen2.5:7b ~4,7 GB ~20 s
El cerebro de agente ideal
Rápido y fiable para function calling. Para un agente que decide y actúa, prioriza velocidad y fiabilidad sobre tamaño.
qwen3:30b ~18 GB · MoE 75–134 s
Razona mejor, pero lento
En instancia compartida tarda minutos: sube el timeout del nodo HTTP Request a 300.000 ms para que no se corte.
Aviso crítico
Los modelos "thinking" rompen el tool calling
El razonamiento en campo aparte interfiere con la llamada a herramientas. Como controlador de agente, elige un modelo sin thinking, como qwen2.5.
Truco de rendimiento
"format": "json" acota y acelera
Forzar salida JSON da una respuesta limpia para los siguientes nodos y acelera la generación al acotar lo que el modelo puede emitir.