e-ISBN: 978-83-8211-168-2
DOI: 10.18559/978-83-8211-168-2
Edition: I
Publication date: 2023
First publication date: 2023
Pages: 276
Print: paperback
Electronic version: pdf
Format: B5
License : open access
last week: 13
last 3 months: 158
Andrzej Młodak, Michał Pietrzak, Tomasz Klimanek, Tomasz Józefowski, Paweł Lańduch
Poufność a użyteczność informacji statystycznych. Dylematy ochrony udostępnianych danych
Availability and purchase
Electronic version(IBUK)Electronic version
(CEEOL)
*Clicking the button takes you to an external open access or selling platform.
The book is available in library subscriptions: Ibuk Libra and EBSCO.
Młodak, A., Pietrzak, M., Klimanek, T., Józefowski, T. and Lańduch, P. (2023). Poufność a użyteczność informacji statystycznych. Dylematy ochrony udostępnianych danych. Poznań University of Economics and Business Press. https://doi.org/10.18559/978-83-8211-168-2
Monografię otwiera omówienie ogólnych koncepcji kontroli ujawniania danych (ang. Statistical Disclosure Control, SDC) oraz definicji z tym związanych, a także regulacji prawnych dotyczących ochrony danych wrażliwych stosowanych w różnych krajach, również w Polsce. Zaprezentowano tutaj także najważniejsze typy udostępnianych danych wynikowych oraz rolę metadanych, paradanych, a także danych dodatkowych w SDC. Drugim ważnym poruszanym tematem jest istota i ważność ryzyka ujawnienia informacji wrażliwych oraz ocena jego poziomu. Ukazano tutaj także odmienności występujące w tym zakresie między mikrodanymi a danymi zagregowanymi w postaci tablic częstości i wielkości czy wyników analiz. Szczególną uwagę poświęcono z kolei szczegółowej charakterystyce metod i technik kontroli ujawniania danych wynikowych w przedstawionych powyżej trzech typach. Wskazano ponadto na zagrożenia dla poufności danych, mogące wystąpić w publikowaniu statystyk opisowych, ilustracji i wyników analiz w opracowaniach statystycznych oraz sposoby przeciwdziałania możliwościom odtworzenia danych wrażliwych.
W toku dalszych rozważań autorzy scharakteryzowali istotę problemu straty informacji oraz najistotniejsze rodzaje miar oceny owej straty, z pewnymi oryginalnymi propozycjami, a także wpływ straty informacji na jakość estymacji dokonywanej w oparciu o dane poddane SDC. Czytelnik znajdzie w monografii szczegółowe omówienie – wraz ze stosowną egzemplifikacją – narzędzi informatycznych stosowanych w SDC, przede wszystkim programów T–Argus i µ–Argus oraz pakietów środowiska R: sdcTable i sdcMicro. Następnie uwaga została skoncentrowana na organizacji kontroli dostępu do danych i zasadach jej realizacji. W szczególności scharakteryzowano typy udostępnianych mikrodanych, sposobu organizacji funkcjonowania punktów dostępu oraz stosownych zabezpieczeń, przebieg efektywnej kontroli dostępu i zakres odpowiednich uprawnień. Całość wieńczy podsumowanie, w którym wskazano najistotniejsze konkluzje oraz postulaty dotyczące stosowania SDC. Dla wygody czytelnika na końcu opracowania zamieszczono słownik występujących w nim pojęć.
Z uwagi na uniwersalność zagadnienia publikacja została opracowana tak, aby mogła służyć metodologom projektującym badania statystyczne oraz osobom odpowiedzialnym za jakość i bezpieczeństwo zgromadzonych w ich wyniku informacji. Stąd duży wybór przykładów i praktycznych omówień przedstawianych zagadnień, które pozwalają lepiej zrozumieć przekazywane treści.
Wydanie dofinansowane ze środków Ministerstwa Edukacji i Nauki w ramach programu Doskonała nauka.
Wykaz skrótów
Wprowadzenie
1. Koncepcja ochrony danych i definicje podstawowych pojęć
1.1. Kontrola ujawniania danych statystycznych
1.1.1. Ujawnienie i ryzyko ujawnienia
1.1.2. Strata informacji
1.1.3. Kontrola ujawniania danych a użytkownik danych
1.2. Typy danych wynikowych
1.2.1. Tablice statystyczne
1.2.2. Mikrodane
1.2.3. Metadane, paradane i dane dodatkowe
1.2.4. Wyniki analiz
1.3. Ryzyko ujawnienia a użyteczność – istota zapewnienia balansu
1.4. Inne problemy związane z poufnością danych
1.5. Rozwiązania prawne i zasady stosowane w praktyce międzynarodowej
1.5.1. Regulacje prawne
1.5.2. Opracowania, wytyczne i rekomendacje organizacji międzynarodowych
2. Pomiar i ocena ryzyka ujawnienia informacji poufnych
2.1. Mikrodane
2.2. Dane tabelaryczne
2.3. Wyniki analiz
3. Metody i techniki kontroli ujawniania danych wynikowych
3.1. Metody niezakłóceniowe
3.2. Metody zakłóceniowe
3.3. Porównanie rozpatrywanych metod kontroli ujawniania dla mikrodanych i tablic statystycznych
3.4. Ochrona wyników analiz
3.5. Dane syntetyczne
4. Strata informacji
4.1. Istota straty informacji
4.2. Miary zakłócenia rozkładu
4.3. Miary wpływu na wariancję szacunków
4.4. Miary wpływu na siłę związku
4.5. Strata informacji w estymacji
5. Przegląd wybranych narzędzi informatycznych
5.1. Program τ-Argus
5.2. Program μ-Argus
5.3. Narzędzia środowiska R
5.4. Aplikacja sdcApp()
5.5. Inne możliwości informatyczne
6. Rozwiązania organizacyjne kontroli dostępu do danych
6.1. Specyfika podejścia do udostępniania danych osobom ze środowiska naukowego
6.2. Typy udostępnianych mikrodanych
6.3. Formy udostępniania
Podsumowanie
Słownik pojęć
Bibliografia
Spis rysunków
Spis tablic
Confidentiality vs. utility of statistical information. Dilemmas of statistical disclosure control (Summary)
Informacja o autorach
Konieczność ochrony poufności danych jednostkowych oraz niektórych danych wynikowych (najczęściej tzw. mikroagregatów), pociągająca za sobą straty informacji i zakaz publikowania niektórych danych wynikowych, często jest postrzegana przez część naukowców i innych użytkowników danych pozyskiwanych w ramach badań statystycznych jako zbędne ograniczenie dostępu do potrzebnych lub ciekawych informacji. Statystykom, którzy świadomi są znaczenia przestrzegania tajemnicy statystycznej i poufności danych we wszystkich fazach procesów statystycznych, zarzucana bywa postawa „psa ogrodnika” […]
Recenzowana monografia zawiera aktualną wiedzę niezbędną do tego, by podmiot prowadzący badania statystyczne przestrzegał naukowych i prawnych zasad ochrony danych oraz by respondent uczestniczący w badaniach wiedział, że informacje, które przekazuje, zostaną wykorzystane wyłącznie do celów określonych w badaniu statystycznym, a jego tożsamość nie będzie w żaden sposób ujawniona. […] Monografia – dzięki kompleksowemu ujęciu problemu zarówno od strony metodologicznej, jak i informatycznej – nie tylko dostarczy szerokiej wiedzy na temat poufności informacji w badaniach statystycznych potencjalnym zainteresowanym, lecz będzie także pomocna naukowcom i praktykom w organach statystyki publicznej i w instytucjach naukowych w ochronie danych źródłowych i danych wynikowych […] przed skłonnościami niektórych urzędów i biznesu do sięgania, nie zawsze etycznymi sposobami, po dane wymagające ochrony poufności […]
Wiedza na temat tajemnicy statystycznej, znaczenia jej przestrzegania i ochrony danych poufnych powinna wejść do podstawowego kanonu wiedzy o badaniach statystycznych jako część programów nauczania statystyki na wszystkich kierunkach studiów.
(z recenzji wydawniczej prof. dra hab. Józefa Oleńskiego)