Guide: Datenqualität
Daten vor der Integration pragmatisch vorbereiten
Ziel
Schnell produktiv werden, ohne auf unsaubere Daten zu bauen.
SharePoint / File Shares bei Large Scale
Wenn große SharePoint-Bestände angebunden werden sollen:
- nicht alles auf einmal: zuerst relevante Sites/Bereiche auswählen
- Duplikate/Altstände reduzieren: weniger Rauschen, bessere Treffer
- klare Metadaten/Namenskonventionen: bessere Auffindbarkeit
Pragmatische Reihenfolge:
- Top-Use-Cases definieren
- passende Datenbereiche mappen
- erst dann schrittweise erweitern
SAP / ERP mit vielen Tabellen
Bei sehr großen Tabellenlandschaften (z. B. SAP) gilt:
- nicht mit Vollabdeckung starten
- Tabellen pro Use Case kuratieren
- fachliche Owner für Datenbereiche festlegen
Empfehlung:
- zuerst kleines Kernset
- Ergebnisqualität prüfen
- Tabellenumfang kontrolliert erweitern
Minimalstandards für strukturierte Daten
- stabile Schlüssel/IDs vorhanden
- Datumsfelder konsistent
- Null-/Leerdaten nachvollziehbar
- Feldbedeutungen dokumentiert
- klare Aktualisierungslogik (z. B. stündlich/täglich)
Minimalstandards für Dokumentdaten
- klare Titel/Dateinamen
- aktuelle Versionen statt Schattenkopien
- unnötige Altarchive nicht im ersten Scope
- konsistente Ordner-/Metadatenstruktur
Go/No-Go Check vor Pilot
- Ist der erste Scope klar abgegrenzt?
- Sind zentrale Datenowner benannt?
- Sind 1-2 hochwertige Use Cases konkret definiert?
- Ist klar, welche Daten absichtlich nicht im ersten Schritt dabei sind?
Wenn diese Punkte sauber sind, steigt die Chance auf einen schnellen, stabilen Pilot massiv.