-
Datenquelle
- Welche Art von Daten werden genutzt?
- Wo und wie wurden die Daten gesammelt?
- Handelt es sich um historische Daten oder werden explizit fürs Projekt zusätzlich Daten erhoben?
- Wie genau geschieht die Erhebung neuer Daten, durch Fragebogen etc.?
-
Zwecke der Datennutzung
Werden die Daten nur für Zwecke genutzt, denen die Betroffenen explizit zugestimmt haben und die den Betroffenen transparent gemacht wurden?
-
Datensparsamkeit & Vollständigkeit
Die Daten müssen in Bezug auf die jeweilige Problemstellung vollständig sein, wobei jedoch nicht mehr Daten als unbedingt nötig verarbeitet werden sollen.
-
Datenqualität
Gibt es Verzerrungen in den Daten, systematische Unvollständigkeit bei der Datenerhebung oder Inkonsistenzen bei der Bewertung der Daten (Labeling)?
-
Sensible Faktoren & Anonymisierung
Wie wird mit sensible Daten umgegangen, die wirklich notwendig sind? Können sie irreversibel anonymisiert werden?
-
Verteilungen in den Merkmalen
Wie ist die Verteilung der Merkmale in den Daten, welche Folgen hat dies und wie wird damit umgegangen?