# hands-on

68 artikelengetagd met “hands-on”

Overzicht van vaardigheidsverificatie

Overview of timed skill verification labs for AI red teaming, including format, pass/fail criteria, and preparation guidance.

skill-verificationlabshands-onassessment

Gemiddeld

Vaardigheidsverificatie: misbruik van agents (beoordeling)

Timed skill verification lab: exploit an agent system to perform unauthorized actions within 25 minutes.

skill-verificationagent-exploitationtool-abusehands-on

Gevorderd

Vaardigheidsverificatie: implementatie van verdediging

Timed skill verification lab: build a working guardrail system that passes automated attack tests within 45 minutes.

skill-verificationdefenseguardrailsimplementationhands-on

Gemiddeld

Vaardigheidsverificatie: jailbreaken

Timed skill verification lab: bypass safety measures on a defended AI system within 30 minutes using jailbreak techniques.

skill-verificationjailbreakingsafety-bypasshands-on

Gevorderd

Vaardigheidsverificatie: prompt injection (beoordeling)

Timed skill verification lab: extract a system prompt from a defended AI system within 15 minutes using prompt injection techniques.

skill-verificationprompt-injectionsystem-prompthands-on

Gemiddeld

Vaardigheidsverificatie: reconnaissance

Timed skill verification lab: profile an unknown AI system in 20 minutes by identifying the model, extracting configuration, and mapping capabilities.

skill-verificationreconnaissanceprofilinghands-on

Gemiddeld

Vaardigheidsverificatie: rapporten schrijven

Timed skill verification lab: write a professional AI red team finding report from provided evidence within 30 minutes.

skill-verificationreportingdocumentationprofessional-skillshands-on

Gemiddeld

Lab: embeddingruimtes verkennen

Praktisch lab met Python om embeddingruimtes te visualiseren, semantische gelijkenis te meten en te demonstreren hoe adversarial documenten kunnen worden gemaakt die matchen met doel-queries.

labembeddingshands-onpythonintermediate

Gemiddeld

Lab: adversarial voorbeelden in audio

Hands-on lab for crafting adversarial audio perturbations that cause speech-to-text models and voice assistants to misinterpret spoken commands, demonstrating attacks on audio AI systems.

labaudioadversarialmultimodaladvancedhands-on

Gevorderd

Lab: beveiligingsbeoordeling van cloud-AI

Conduct an end-to-end security assessment of a cloud-deployed AI service, covering API security, model vulnerabilities, data handling, and infrastructure configuration.

labcloudassessmentend-to-endapi-securityadvancedhands-on

Gevorderd

Lab: eigen test-harness voor specifieke applicaties

Build a tailored testing framework for a specific AI application, with custom attack generators, domain-specific evaluators, and application-aware reporting.

labcustom-harnesstesting-frameworkdomain-specificadvancedhands-on

Gevorderd

Lab: poisoning-aanval op federated learning

Hands-on lab for understanding and simulating poisoning attacks against federated learning systems, where a malicious participant corrupts the shared model through crafted gradient updates.

labfederated-learningpoisoningexperthands-on

Expert

Lab: purple team-oefening

Simultaneously attack and defend an AI application in a structured exercise where red team findings immediately inform blue team defensive improvements.

labpurple-teamattack-defensecollaborativeadvancedhands-on

Gevorderd

Lab: ontwikkeling van transfer-aanvallen (lab voor gevorderden)

Develop adversarial attacks on open-source models that transfer to closed-source models, leveraging weight access for black-box exploitation.

labtransfer-attacksadversarialcross-modeladvancedhands-on

Gevorderd

Lab: bouw je eerste verdediging (beginnerlab)

Create a simple input filter that blocks common prompt injection patterns, then test it against the attack techniques you have learned in previous labs.

# hands-on

Overzicht van vaardigheidsverificatie

Vaardigheidsverificatie: misbruik van agents (beoordeling)

Vaardigheidsverificatie: implementatie van verdediging

Vaardigheidsverificatie: jailbreaken

Vaardigheidsverificatie: prompt injection (beoordeling)

Vaardigheidsverificatie: reconnaissance

Vaardigheidsverificatie: rapporten schrijven

Lab: embeddingruimtes verkennen

Lab: adversarial voorbeelden in audio

Lab: beveiligingsbeoordeling van cloud-AI

Lab: eigen test-harness voor specifieke applicaties

Lab: poisoning-aanval op federated learning

Lab: purple team-oefening

Lab: ontwikkeling van transfer-aanvallen (lab voor gevorderden)

Lab: bouw je eerste verdediging (beginnerlab)

Lab: modelvergelijking

Lab: contextmanipulatie

Lab: grondbeginselen van het omzeilen van verdedigingen

Lab: delimiter escape-aanvallen

Lab: ethisch redteamen

Lab: je eerste prompt injection

Lab: je eerste jailbreak

Lab: garak opzetten en je eerste scan

Lab: tool voor injection-detectie

Lab: overzicht van injection-technieken

Lab: prioriteit bij het volgen van instructies

Lab: meertalige injection

Lab: misbruik van het uitvoerformaat

Lab: uitvoersturing

Lab: payloads maken

Lab: grondbeginselen van prompt leaking

Lab: promptfoo opzetten en je eerste evaluatie

Lab: PyRIT opzetten en je eerste aanval

Lab: rollenspel-aanvallen

Lab: Veiligheidsgrenzen in kaart brengen

Lab: system prompt overschrijven

Lab: optimalisatie van adversarial suffixes

Lab: stresstesten van alignment

Lab: bouw een beveiligingsscanner voor agents

Lab: bouw een AI-fuzzer

Lab: bouw een tool voor gedrags-diffing

Lab: bouw een guardrail-evaluator

Lab: bouw jailbreak-automatisering

Lab: onderzoek van emergente capaciteiten

Lab: full-stack AI-misbruik

Lab: misbruik van computer use-agents

Lab: rol een honeypot-AI uit

Lab: coördinatie van multi-agent-aanvallen

Lab: onderzoek naar nieuwe jailbreaks

Lab: poisoning van de ML-pijplijn

Lab: zwakheden van gekwantiseerde modellen misbruiken

Lab: compromittering van het model registry

Lab: reward hacking bij RLHF

Lab: maak een veiligheidsbenchmark

Lab: detectie en verwijdering van AI-watermerken

Labs en hands-on oefenen

Lab: geautomatiseerd red team-testen

Lab: kanalen voor data-exfiltratie (lab voor gevorderden)

Lab: de effectiviteit van verdedigingen testen

Lab: indirecte prompt injection

Lab: multimodale injection (lab voor gevorderden)

Lab: supply chain-audit

Lab: Adversariële audiovoorbeelden vervaardigen

Lab: Adversariële aanvallen op videomodellen

Lab: Op afbeeldingen gebaseerde injecties vervaardigen

Lab: Federated learning aanvallen

Lab: Gequantiseerde modellen exploiteren

Lab: een trainingsdataset vergiftigen

# hands-on

Overzicht van vaardigheidsverificatie

Vaardigheidsverificatie: misbruik van agents (beoordeling)

Vaardigheidsverificatie: implementatie van verdediging

Vaardigheidsverificatie: jailbreaken

Vaardigheidsverificatie: prompt injection (beoordeling)

Vaardigheidsverificatie: reconnaissance

Vaardigheidsverificatie: rapporten schrijven

Lab: embeddingruimtes verkennen

Lab: adversarial voorbeelden in audio

Lab: beveiligingsbeoordeling van cloud-AI