Zasady otwartości danych powstałych ze środków publicznych określa Ustawa z dnia 11 sierpnia 2021 r. o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego.
Artykuł 22 Ustawy brzmi:
"Dane badawcze, będące w posiadaniu podmiotów o których mowa w art . ust. 1 ustawy z dnia 20 lipca 2018 r. - Prawo o szkolnictwie wyższym i nauce, podlegają bezpłatnie ponownemu wykorzystywaniu, jeżeli zostały wytworzone lub zgromadzone w ramach działalności naukowej finansowanej ze środków publicznych oraz są już publicznie udostępniane w systemie teleinformatycznym podmiotu zobowiązanego, w szczególności w repozytorium instytucjonalnym lub tematycznym. Podmiot zobowiązany, udostępniając te dane, wraz z ich udostępnieniem informuje o braku warunków ponownego wykorzystywania albo określa te warunki."
W Wyższej Szkole Policji zasady udostępniania danych badawczych określa §3 Polityki otwartego dostępu do publikacji naukowych i danych badawczych pracowników Wyższej Szkoły Policji w Szczytnie:
1. Prowadzący prace naukowo-badawcze dokładają wszelkich starań w celu zapewnienia otwartego dostępu do danych badawczych wraz z powiązanymi metadanymi, w szczególności poprzez:
1) opracowanie planu zarządzania danymi badawczymi ustalającego zasady:
a) zarządzania danymi w trakcie i po zakończeniu badań,
b) precyzującego rodzaje danych zbieranych, przetwarzanych lub wytwarzanych w trakcie badań,
c) określającego stosowane w odniesieniu do danych metodologie i standardy,
d) zasady udostępniania danych i ich długoterminową archiwizację,
e) aktualizację planu zarządzania danymi badawczymi w trakcie trwania badań, o ile zachodzi taka konieczność;
2) o ile nie istnieją przeszkody formalno-prawne, publiczne udostępnienie danych badawczych tak, by każdy miał do nich dostęp w czasie i miejscu przez siebie wybranym bez ograniczeń prawnych, np. wraz z udzieleniem wolnej licencji w repozytorium wskazanym przez Pełnomocnika do Spraw Otwartego Dostępu;
3) zapewnienie, aby dane były: identyfikowalne, dostępne, zdatne do ponownego wykorzystania, użyteczne poza pierwotnym celem (dla którego zostały zebrane) oraz interoperacyjne.
2. Dopuszcza się ograniczenie przez prowadzących prace naukowo-badawcze zakresu korzystania z danych badawczych poprzez wskazanie wybranych kategorii zakresów danych i osób uprawnionych do korzystania.
Dokument Narodowego Centrum Nauki pt.: "Wytyczne dla wnioskodawców do uzupełnienia planu zarządzania danymi w projekcie badawczym" określa je w następujących sposób:
"(...) pod pojęciem "Dane" NCN rozumie zarówno dane zebrane i dotąd nieprzetworzone, jak i dane wytworzone i poddane analizie, inne niż publikacje naukowe. Definicja ta obejmuje wszystkie możliwe formaty, zarówno cyfrowe jak i niecyfrowe (np. próbki, wypełnione kwestionariusze, nagrania dźwiękowe, itd.)."
- surowe - zebrane, ale nie przeanalizowane,
- obserwacyjne - przechwytywane w czasie rzeczywistym (np. odczyty czujników, dane telemetryczne, wyniki anonimowych ankiet), często unikalne, ponieważ nie można ich "odzyskać",
- eksperymentalne - uzyskane ze sprzętu laboratyjnego w kontrolowanych warunkach, powtarzalne, ale często bardzo kosztowne,
- dane z symulacji - zebrane podczas testów badających rzeczywiste lub teoretyczne systemy (np. modele ekonomiczne),
- dane pochodne / skompilowane - wyniki analiz danych albo dane agregowane z różnych źródeł,
- dane referencyjne - poprawione lub organiczne zbiory danych, zwykle recenzowane, publikowane i selekcjonowane (dane GUS).
Zarządzanie danymi obejmuje wszystkie aspekty związane z gromadzeniem, przetwarzaniem, organizowaniem i dokumentowaniem danych badawczych, a także sposobu ich przechowywania, ochrony i udostępniania.
We wszystkich planach zarządzania danymi badawczymi można znaleźć pewne wspólne elementy:
- zagadnienia związane z wytworzeniem / pozyskaniem danych,
- formaty plików i ich nazewnictwo, przechowywanie danych,
- opis sposobu dostępu do danych i informacje o ich ponownym wykorzystaniu,
- aspekty prawne i etyczne,
- kwestie finansowe, infrastrukturalne i kompetencyjne.
Dane podstawowe, opis projektu:
- Tytuł projektu,
- Nazwisko i imię kierownika projektu / autora planu,
- Dane kontaktowe,
- Numer projektu / grantu / ID,
- Podsumowanie projektu opisujące cel zbierania danych,
- Opis instytucjonalnej polityki zarządzania danymi badawczymi.
Gromadzenie danych:
- Jakie dane będą zbierane podczas badań?
- Jak będą gromadzone?
- Czy istnieją już dane, które można ponownie wykorzystać?
- Jakich standardów lub metodologii trzeba użyć, aby wytworzyć dane?
- Czy wybrane formaty i oprogramowania umożliwiają udostępnianie i długotrwałe przechowywanie danych?
- Strukturyzacja oraz nazewnictwo folderów i plików, w których przechowywane będą dane?
- Jakie procesy będą zastosowane, aby zapewnić odpowiednią jakość danych?
Dokumentacja i metadane:
- Jakie informacje są niezbędne, aby dane mogły być odczytane i zinterpretowane w przyszłości?
- Ile czasu i wysiłku będzie potrzeba na stworzenie dokumentacji pomocniczej, czy jest odpowiedni ich zasób (czasu i wysiłku).
- Jaka dokumentacja i metadane będą opisywać dane?
- W jaki sposób powstanie ta dokumentacja i metadane?
- Które standardy metadanych będą użyte i dlaczego te?
Zagadnienia prawne i etyczne:
- Czy są wymagane zgody na udostępnianie i przechowywanie danych?
- Jak będzie chroniona tożsamość uczestników badań? (np. czy będzie zastosowana anonimizacja?)
- Czy udostępnianie danych zostanie obłożone embargiem lub ograniczone (np. z powodu publikacji lub ubiegania się o patent)?
- Jaka będzie zastosowana licencja na wykorzystywanie danych?
Przechowywanie danych i tworzenie kopii zapasowych:
- Gdzie będą przechowywane dane, jaki ma to wpływ na tworzenie kopii zapasowych, dostęp do danych i ich bezpieczeństwo?
- Czy jest miejsce na przechowywanie danych, czy potrzebne są fundusze na pokrycie kosztów przechowywania danych?
- Kto będzie odpowiedzialny za tworzenie backupów i odzyskiwanie danych?
- Jakie są zagrożenia dla bezpieczeństwa danych i jak nimi zarządzać?
- W jaki sposób będzie zapewniony bezpieczny dostęp do danych dla wszystkich współpracowników?
Seleckja danych i ich ochrona:
- Jaki będzie najlepszy sposób przechowywania danych (wybór repozytorium)?
- Które dane należy zachować, a które zniszczyć z powodów wynikających z umów i regulacji prawnych?
- Jakie jest możliwe do przewidzenia inne zastosowanie badawcze dla zgromadzonych danych?
- Jaki jest plan długoterminowego przechowywania bazy danych?
- Jaki jest koszt przygotowania, przechowywania i udostępniania danych?
Udostępnianie danych:
- Z kim będą współdzielone dane i na jakich warunkach?
- Kiedy będzie otwarty dostęp do danych?
- Czy wymagane są jakieś ograniczenia dotyczące udostępniania danych?
- Jakie działania będą podejmowane, aby pokonać lub zminimalizować ograniczenia w dostępie?
Obowiązki i zasoby danych:
- Kto jest odpowiedzialny za zrealizowanie Planu, oraz za jego sprawdzenie i poprawienie?
- Jak zostaną rozdzielone obowiązki między partnerami w projekcie badawczym?
- Jakie zasoby są potrzebne, aby zrealizować plan?
- Czy dane wtórne wytworzone w trakcie realizacji projektu mogą być przechowywane po zakończeniu projektu w repozytorium Wyższej Szkoły Policji?
Odp. Będą deponowane w kolekcji instytucjonalnej WSPol w repozytorium RepOD, prowadzonym przez ICM Uniwersytetu Warszawskiego. - Czy dane wtórne mogą być przechowywane w repozytorium Wyższej Szkoły Policji w Szczytnie przez 10 lat?
Odp. Będą przechowywane bezterminowo. - Jaki jest adres internetowy repozytorium Wyższej Szkoły Policji w Szczytnie?
Odp. https://repod.icm.edu.pl/ - Czy repozytorium danych Wyższej Szkoły Policji w Szczytnie przestrzega zasad FAIR Data?
Odp. RepOD przestrzega zasad FAIR. - Czy Wyższa Szkoła Policji tworzy regularne kopie zapasowe danych zgromadzonych w repozytorium danych?
Odp. RepOD tworzy takie kopie. - Jakie unikalne identyfikatory można zastosować do danych wtórnych i kto powinien je wytworzyć (uzyskać) i przydzielić do poszczególnych zbiorów?
Odp. DOI, otrzymuje się od administratora RepOD. - Czy w Wyższej Szkole Policji funkcjonuje specjalista ds. jakości danych odpowiedzialny za ocenę zgormadzonych zbiorów?
Odp. Nie, propagatorzy otwartego dostępu zgłaszają postulat stworzenia nowego zawodu tzw. „data steward” ale u nas nie ma kogoś takiego. - Kto odpowiada za zarządzanie danymi po umieszczeniu ich w repozytorium Wyższej Szkoły Policji, a więc kto będzie opiekunem danych w rozumieniu zapisów Narodowego Centrum Nauki?
Odp. Po zamieszczeniu danych w RepOD za ich bezpieczeństwo odpowiada administrator ale dysponentem jest autor za pośrednictwem osoby wprowadzającej dane – pracownika IKB. - Czy udostępnienie danych w repozytorium Wyższej Szkoły Policji w Szczytnie będzie wiązało się z kosztami? Jeżeli tak, jakie to będą koszty i w jaki sposób będą uregulowane?
Odp. Udostępnienie danych odbywa się bezkosztowo. - Jakie standardy metadanych wykorzystywane są do opisu danych przechowywanych w repozytorium Wyższej Szkoły Policji w Szczytnie? Przykłady: DDI - Data Documentation Initiative, Encoded Archival Description (EAD).
Odp. W kolekcji WSPol będzie możliwość skonfigurowania tego, jakie schematy metadanych będą wykorzystywane przy wprowadzaniu danych. Aktualnie w repozytorium dostępne są: schemat metadanych cytowania zawierający minimalny zestaw metadanych konieczny do nadania numeru ODI, schemat metadanych geoprzestrzennych, schemat metadanych dla nauk społecznych i humanistycznych, astronomii i astrofizyki oraz nauk o życiu. Eksport wprowadzonych metadanych możliwy jest natomiast w formatach: DDI, JSON-LD, OAI_ORE, JSON, DataCite, OpenAIRE oraz Dublin Core. Biorąc pod uwagę specyfikę dziedzinową WSPol, prawdopodobnie najważniejsze będą schematy DataCite (ważny dla wszystkich bez wyjątku) oraz DDI (dla nauk społecznych), a także OpenAIRE ze względu na wymogi NCN (odp. Wojciech Fenrich, ICM UW). - Jak przedstawia się procedura przeniesienia danych zgormadzonych i wytworzonych w projekcie do repozytorium Wyższej Szkoły Policji w Szczytnie.
Odp. Wszystko zostało opisane w Zarządzeniu nr 79/2022 Komendanta-Rektora Wyższej Szkoły Policji w Szczytnie z dnia 10 czerwca 2022 r. w sprawie zasad, trybu przekazywania oraz zamieszczania w otwartym repozytorium danych badawczych.