# scaling

6 artikelengetagd met “scaling”

Schaalwetten, emergentie en capaciteitssprongen

Hoe schaalwetten de prestaties van modellen voorspellen, waarom emergente capaciteiten onvoorspelbare beveiligingseigenschappen creëren, en wat slapende capaciteiten en emergente misalignment betekenen voor red teaming.

scalingemergencecapabilitiesadvanced

Gevorderd

Schaalwetten voor injection

Onderzoek naar hoe de effectiviteit van injection schaalt met modelgrootte, training-compute en investering in veiligheidstraining.

researchscalinglawsmodel-size

Gevorderd

Strategie voor red team-automatisering

When and how to automate AI red teaming: tool selection, CI/CD integration, continuous automated red teaming (CART), human-in-the-loop design, and scaling assessment coverage through automation.

automationcartci-cdtoolingscalinghuman-in-the-loop

Gevorderd

Red team-programma's opschalen

Growing AI red team programs from solo practitioner to full team: hiring strategies, process standardization, automation balance, and budget justification.

scalingprogrammanagementgrowth

Gevorderd

Uitbuiting van emergentie en capaciteitssprongen

Hoe emergente capaciteiten onvoorspelbare beveiligingseigenschappen creëren: testen op verborgen capaciteiten, sleeper agent-scenario's, zorgen over deceptive alignment en capaciteitselicitatie.

emergencecapabilitydeceptive-alignmentsleeper-agenthidden-capabilityscaling

Expert

Analyse van schaalbaarheid van few-shot-aanvallen

Detailed analysis of how few-shot examples scale to influence model behavior, from 2-shot to many-shot regime.

walkthroughsfew-shotscalingjailbreaking

Gevorderd