ETL, integracja i jakość danych

Proces ETL (ang. Extract Transform Load) jest bardzo ważnym elementem rozwiązań hurtowni danych. To dzięki procesom ETL dane przygotowane w odpowiedni sposób trafiają do hurtowni. Oczywiście dane te mogą pochodzić z wielu różnych źródeł. To dzięki procesom ETL i wspólnej hurtowni danych mamy integracje informacji. Integrować można dane też na inne sposoby, np. na poziomie modelu danych, czy przez rozwiązania klasy Enterprise Information Management. Nie ma jednego prostego scenariusza zarówno na mechanizmy ETL jak i sam proces integracji. Część z nich wymaga również niekiedy bardzo skomplikowanych mechanizmów poprawy jakości danych, potocznie nazywanych czyszczeniem danych. Procesy te mogą opierać się zarówno na systemach regułowych, ale też mogą zawierać w sobie elementy sztucznej inteligencji. Projekt integracji danych, poprawy jakości, jak i procesów ETL musi być bardzo dobrze zaprojektowany i udokumentowany. TIDK mając duże doświadczenie w tym zakresie doradza klientom odpowiednie scenariusze i koncepcje realizacji tych zagadnień.

Comments are closed.