Risico's van synthetische data
Modelinstorting door trainen op synthetische data, kwaliteitsdegradatie over generaties, distributievernauwing, uitwissing van minderheden, en strategieën voor veilig gebruik van synthetische data in LLM-training.
synthetic-datamodel-collapsequality-degradationdistributiontraining