# content-policy
4 artikelengetagd met “content-policy”
Misbruik van de fine-tuning-API
How fine-tuning APIs are abused to create uncensored models, circumvent content policies, and attempt training data exfiltration -- the gap between acceptable use policies and technical enforcement.
Lab: grenzen van het contentbeleid in kaart brengen
Map the content policy boundaries of LLM applications to identify permitted and restricted topic areas systematically.
AI-guardrails opzetten
Step-by-step walkthrough for implementing AI guardrails: input validation with NVIDIA NeMo Guardrails, prompt injection detection with rebuff, output filtering for PII and sensitive data, and content policy enforcement.
Afdwingen van responsgrenzen
Stapsgewijze walkthrough om LLM-responses binnen gedefinieerde onderwerp-, formaat- en contentgrenzen te houden, met grensdefinitie, detectie van overtredingen, het herschrijven van responses en het monitoren van grensafwijking.