Az adatmodellezésben minden az adatokkal kezdődik. Az egész munka 50-60%-a az adatigény megértését és az ETL-t (Extract, Transform, Load) foglalja magában, ami megköveteli az adatok megszerzését, tisztává és modellbe való bevitelre előkészítését. Az ML-modell csak annyira lehet jó, amennyire a beletáplált adatok.