Czyszczenie baz danych
Czyszczenie zawartości bazy danych polega na zestandaryzowaniu zapisów wartości w bazie tak, by były możliwe jednolite i zgodne ze słownikami.
Tam, gdzie różnice zapisu nie niosą dodatkowych, istotnych informacji, dane powinny być podane identycznie.
Główny proces porządkowania jest zwykle wykonywany automatycznie, w oparciu o zbiór precyzyjnie zdefiniowanych wcześniej reguł. Niejednokrotnie jest to skomplikowany proces, gdyż o ile zwykle względnie łatwo poprawiać w bazie pojedyncze wpisy, o tyle zmiany w całej bazie mogą wymagać złożonej analizy jej zawartości i uwzględnienia wzajemnych powiązań między danymi z różnych rekordów.
Niektóre z tych decyzji wymagają akceptacji operatora, zwłaszcza gdy poprawiane dane mogą być wieloznacznie interpretowane.
Korzyści:
- łatwiejsza kontrola poprawności danych,
- lepsze raportowanie,
- większa wiarygodność danych,
- możliwość skutecznej segmentacji danych,
- zwiększenie efektywności wykonywanej deduplikacji.
Przykłady/Praktyka:



|