LLM-as-Judge verdedigingssystemen
Hoe LLM-as-judge-architecturen de outputs van andere LLM's evalueren op veiligheid, inclusief sequentiële en parallelle ontwerpen, prompt-engineering voor judges, en technieken om judge-modellen aan te vallen.
llm-judgesafety-evaluationdefense-architectureadversarialjudge-bypass