ExperimentosTypeScriptrailway
CrabTrap: puse un proxy LLM-as-a-judge delante de mi agente en producción y esto pasó
Instalé CrabTrap en mi infra real: un proxy que intercepta llamadas HTTP de agentes y juzga cada respuesta con otro LLM antes de ejecutarla. Medí latencia, falsos positivos y costo extra en tokens. El resultado tiene un problema de confianza circular que nadie en el anuncio menciona.
8 min79