Podstawową rolą podsystemu SPDS jest zapewnienie jednolitego, spójnego i kompletnego sposobu zasilania hurtowni danych systemu SISP (podsystem HDS) danymi źródłowymi pochodzącymi z innych podsystemów SISP, zewnętrznych baz danych oraz plików płaskich. W szczególności podsystem SPDS będzie odpowiedzialny za zarządzanie procesami przetwarzania, takimi jak integracja, autokorekta, imputacja i uogólnienie danych oraz walidacja poprawności i zapewnienie integralności danych.
Podsystem SPDS będzie elementem pośredniczącym pomiędzy danymi mającymi zasilić hurtownię danych a samą hurtownią i stanowił będzie kluczowy element w procesie przygotowania danych statystycznych.
Istotnym zadaniem podsystemu SPDS będzie zasilenie podsystemu HDS danymi z różnych źródeł danych. Dane z tych źródeł będą podlegały odpowiednim transformacjom (w tym w ramach procesów ETL) tak aby ostatecznie zasilić tymi danymi HDS.
Podsystem SPDS będzie zapewniać:
-
wspólny logiczny interfejs umożliwiający przekazywanie danych z Portalu Sprawozdawczego, plików płaskich oraz baz danych będących w posiadaniu JSP, a także możliwość opisania ich za pomocą metadanych zdefiniowanych w Systemie Metadanych Statystycznych (podsystem SMS),
-
możliwość implementacji dodatkowych reguł i wymagań walidacyjnych dotyczących przetwarzanych danych statystycznych,
-
edycja danych jednostkowych,
-
udostępnienie danych na podstawie których generowane będą raporty wstępne,
-
możliwość implementacji reguł dotyczących autokorekty i imputacji danych,
-
możliwość implementacji reguł dotyczących uogólnienia wyników badania statystycznego,
-
edycje informacji o sposobie realizacji obowiązków sprawozdawczych (RA),
-
tworzenie i definiowanie raportów i zestawień roboczych,
-
możliwość przechowywania danych, które oczekują na zatwierdzenie i przekazanie do podsystemu HDS,
-
nadzór nad procesem akceptacji danych przekazywanych do podsystemu HDS.
Wdrożenie tak zaprojektowanego podsystemu umożliwi spójne zarządzanie procesem pozyskiwania i integracji danych statystycznych, czego rezultatem będzie poprawa jakości danych oraz skrócenie czasu potrzebnego na ich przygotowanie do dalszej analizy.
Jednolity sposób definiowania reguł walidacyjnych również wpłynie na zwiększenie jakości danych w podsystemie HDS.