A mesterséges intelligencia, különösen a természetes nyelvi feldolgozás terén a közelmúltban elért áttörések nagyrészt a méretaránynak, vagyis a hatalmas adathalmazokon képzett nagyobb modelleknek tulajdoníthatók. Egy újonnan megjelenő kutatás azonban azt mutatja, hogy nem csak a mennyiség számít, hanem az MI-rendszerek képzéséhez használt adatok minősége is.