# capabilities
6 artikelengetagd met “capabilities”
Schaalwetten, emergentie en capaciteitssprongen
Hoe schaalwetten de prestaties van modellen voorspellen, waarom emergente capaciteiten onvoorspelbare beveiligingseigenschappen creëren, en wat slapende capaciteiten en emergente misalignment betekenen voor red teaming.
Beveiligingsimplicaties van emergente capaciteiten
Hoe emergente capaciteiten in frontier-modellen nieuwe en onvoorspelbare beveiligingsrisico's creëren.
Risico's van tool-augmented modellen
Beveiligingsrisico's die ontstaan wanneer modellen toegang krijgen tot externe tools, API's en code-uitvoering.
Enumeratie van LLM-API's
Geavanceerde technieken om de mogelijkheden, beperkingen, verborgen parameters en ongedocumenteerde features van LLM-API's te enumereren, zodat je een volledig beeld van het aanvalsoppervlak opbouwt.
De alignment tax
Hoe safety training de modelcapaciteiten beïnvloedt: afwegingen tussen capaciteit en veiligheid, de kosten van alignment, het meten van de alignment tax, en strategieën om capaciteitsverlies tijdens safety training te minimaliseren.
Capability-gebaseerde toegangscontrole
Step-by-step walkthrough for implementing fine-grained capability controls for LLM features, covering capability token design, permission scoping, dynamic capability grants, and audit trails.