lørdag 20. juni 2026
N yhetsfeed Meny

AI & Copilot

ASSERT gjør tekstkrav om til kjørbare AI-tester automatisk

Microsoft har sluppet ASSERT, et åpen kildekode-rammeverk som omsetter krav skrevet i naturlig språk til ferdige evalueringer for AI-systemer. Det genererer testscenarier, datasett, metrikker og scorekort automatisk, slik at team kan måle om agenter oppfører seg som tiltenkt. Nyttig for alle som bygger eller drifter AI-løsninger og sliter med å holde evalueringene oppdaterte når krav og modeller endrer seg.

Foto: Microsoft Security Blog
Kortversjonen

Microsoft har sluppet ASSERT, et åpen kildekode-rammeverk som omsetter krav skrevet i naturlig språk til ferdige evalueringer for AI-systemer. Det genererer testscenarier, datasett, metrikker og scorekort automatisk, slik at team kan måle om agenter oppfører seg som tiltenkt. Nyttig for alle som bygger eller drifter AI-løsninger og sliter med å holde evalueringene oppdaterte når krav og modeller endrer seg.

Original tittel: Turn specs into evals for any agent with ASSERT

#ai#eval#open-source#agenter#testing