# model
19 artikelengetagd met “model”
Beveiliging van GCP Model Garden
Security assessment of GCP Model Garden including model deployment, versioning, and access control.
Model collapse bij recursieve training
Beveiligingsimplicaties van model collapse wanneer modellen worden getraind op door AI gegenereerde data van eerdere generaties.
Integriteitsverificatie van modelartefacten
Het implementeren van integriteitsverificatie voor modelartefacten via checksums, handtekeningen en provenance-tracking.
Lab: beveiliging van modeldistillatie
Extract model capabilities through distillation techniques using only black-box API access.
Lab voor analyse van reward-modellen
Analyze and exploit reward model biases to craft responses that score high on safety while embedding harmful content.
Lab voor modelbeveiligingsvergelijking
Compare the security posture of different LLM models by running identical test suites across providers.
Model Whisperer-uitdaging
Extract the exact system prompt from 8 progressively harder LLM applications using creative extraction techniques.
Praktisch lab voor model-fingerprinting
Fingerprint the underlying model behind an API endpoint to identify its type, version, and configuration.
Lab voor aanvallen op multi-modelpijplijnen
Attack a pipeline where multiple models process data sequentially, exploiting trust between pipeline stages.
Beveiligingspatronen voor de modelgateway
Security patterns for centralized model gateway deployments including authentication, authorization, and auditing.
Beveiliging van model-rollback
Security implications of model rollback procedures including exposure windows and state consistency.
Veiligheidsvergelijking van open source-modellen
Comparative safety analysis across open-source model families including Llama, Mistral, Qwen, and Phi.
Beveiligingsanalyse van Phi-modellen
Security analysis of Microsoft's Phi small language model family including safety vs capability tradeoffs.
Impact van kwantisatie op modelveiligheid
How quantization affects safety alignment including GPTQ, AWQ, and GGUF format implications.
Beveiligingsanalyse van Qwen-modellen
Security analysis of Alibaba's Qwen model family including multilingual safety considerations.
Beveiligingsanalyse van model merging (trainingspipeline)
Beveiligingsanalyse van model-merging-technieken en de voortplanting van kwetsbaarheden via samengevoegde modellen.
Aanvallen op de model-supply-chain
Uitgebreide analyse van aanvalsvectoren op de model-supply-chain, van trainingsdata tot en met deployment.
Walkthrough van een aanval op een vision-model (aanval-walkthrough)
Step-by-step walkthrough of visual prompt injection, adversarial images, and OCR exploitation in vision-language models.
Opzet voor het monitoren van modelgedrag
Set up comprehensive model behavior monitoring to detect drift, anomalies, and potential compromise.