# scaling
6 artikelengetagd met “scaling”
Schaalwetten, emergentie en capaciteitssprongen
Hoe schaalwetten de prestaties van modellen voorspellen, waarom emergente capaciteiten onvoorspelbare beveiligingseigenschappen creëren, en wat slapende capaciteiten en emergente misalignment betekenen voor red teaming.
Schaalwetten voor injection
Onderzoek naar hoe de effectiviteit van injection schaalt met modelgrootte, training-compute en investering in veiligheidstraining.
Strategie voor red team-automatisering
When and how to automate AI red teaming: tool selection, CI/CD integration, continuous automated red teaming (CART), human-in-the-loop design, and scaling assessment coverage through automation.
Red team-programma's opschalen
Growing AI red team programs from solo practitioner to full team: hiring strategies, process standardization, automation balance, and budget justification.
Uitbuiting van emergentie en capaciteitssprongen
Hoe emergente capaciteiten onvoorspelbare beveiligingseigenschappen creëren: testen op verborgen capaciteiten, sleeper agent-scenario's, zorgen over deceptive alignment en capaciteitselicitatie.
Analyse van schaalbaarheid van few-shot-aanvallen
Detailed analysis of how few-shot examples scale to influence model behavior, from 2-shot to many-shot regime.