# capabilities

6 artikelengetagd met “capabilities”

Schaalwetten, emergentie en capaciteitssprongen

Hoe schaalwetten de prestaties van modellen voorspellen, waarom emergente capaciteiten onvoorspelbare beveiligingseigenschappen creëren, en wat slapende capaciteiten en emergente misalignment betekenen voor red teaming.

scalingemergencecapabilitiesadvanced

Gevorderd

Beveiligingsimplicaties van emergente capaciteiten

Hoe emergente capaciteiten in frontier-modellen nieuwe en onvoorspelbare beveiligingsrisico's creëren.

frontier-researchemergentcapabilitiessecurity

Gevorderd

Risico's van tool-augmented modellen

Beveiligingsrisico's die ontstaan wanneer modellen toegang krijgen tot externe tools, API's en code-uitvoering.

frontier-researchtool-augmentedriskscapabilities

Gevorderd

Enumeratie van LLM-API's

Geavanceerde technieken om de mogelijkheden, beperkingen, verborgen parameters en ongedocumenteerde features van LLM-API's te enumereren, zodat je een volledig beeld van het aanvalsoppervlak opbouwt.

llmapienumerationreconnaissancecapabilitiesrestrictions

Gemiddeld

De alignment tax

Hoe safety training de modelcapaciteiten beïnvloedt: afwegingen tussen capaciteit en veiligheid, de kosten van alignment, het meten van de alignment tax, en strategieën om capaciteitsverlies tijdens safety training te minimaliseren.

alignmentsafety-trainingcapabilitiestradeoffsalignment-tax

Gevorderd

Capability-gebaseerde toegangscontrole

Step-by-step walkthrough for implementing fine-grained capability controls for LLM features, covering capability token design, permission scoping, dynamic capability grants, and audit trails.

access-controlcapabilitiespermissionsauthorizationdefensewalkthrough

Gemiddeld