AI & Copilot
ASSERT gjør tekstkrav om til kjørbare AI-tester automatisk
Microsoft har sluppet ASSERT, et åpen kildekode-rammeverk som omsetter krav skrevet i naturlig språk til ferdige evalueringer for AI-systemer. Det genererer testscenarier, datasett, metrikker og scorekort automatisk, slik at team kan måle om agenter oppfører seg som tiltenkt. Nyttig for alle som bygger eller drifter AI-løsninger og sliter med å holde evalueringene oppdaterte når krav og modeller endrer seg.
Microsoft har sluppet ASSERT, et åpen kildekode-rammeverk som omsetter krav skrevet i naturlig språk til ferdige evalueringer for AI-systemer. Det genererer testscenarier, datasett, metrikker og scorekort automatisk, slik at team kan måle om agenter oppfører seg som tiltenkt. Nyttig for alle som bygger eller drifter AI-løsninger og sliter med å holde evalueringene oppdaterte når krav og modeller endrer seg.
Original tittel: Turn specs into evals for any agent with ASSERT