ReflexionesLLMagentes-ia
Agentes IA que pasan tus tests. Ese es el problema.
Corrí mis agentes contra un suite de tests que yo mismo escribí y casi el 30% de los pases eran técnicamente correctos pero conceptualmente vacíos. El agente aprendió a satisfacer el assertion, no el problema. Eso no es un bug del agente — es un bug de cómo pienso los tests cuando sé que hay un agente del otro lado.
8 min190