Skip to content ↓

Wytyczne NCN do PZD

Wytyczne Narodowego Centrum Nauki do Planu Zarządzania Danymi

„Dane” w rozumieniu Narodowego Centrum Nauki to wszelkiego rodzaju informacje (ilościowe i jakościowe) wytwarzane, zbierane, przetwarzane, poddawane analizie w ramach projektu badawczego, obejmujące wszystkie możliwe formy – zarówno cyfrowe, jak i niecyfrowe – m.in. dokumenty tekstowe, dane liczbowe, wynik ankiet lub kwestionariuszy, materiały audiowizualne, zawartość bazy danych (wideo, audio, teksty, obrazy), modele matematyczne, algorytmy, oprogramowanie (skrypty, pliki wejściowe), wyniki symulacji komputerowych, raporty laboratoryjne, próbki, artefakty, przedmioty.

1.1. W jaki sposób będą pozyskiwane lub wytwarzane nowe dane lub ponownie wykorzystywane dane już istniejące?

  • Jak będą zbierane nowe dane (pierwotne)? Standardy, metody, oprogramowanie.
  • Jakie dane badawcze (wtórne) już istniejące będą wykorzystywane w badaniach? Własne, w posiadaniu strony trzeciej?
  • Jakie zostaną wdrożone procesy kontroli jakości?
  • Jak wyglądać będzie organizacja plików i zarządzanie ich różnymi wersjami?
  • W punkcie tym powinien być zawarty opis kontekstu badania.

1.2. Jakie dane (tj. rodzaje, formaty, objętości) będą pozyskiwane lub wytwarzane w projekcie?

  • Jakie będą rodzaje pozyskanych danych?
  • W jakich formatach zostaną zapisane pliki z danymi?
  • Jaki będzie szacunkowy rozmiar wytworzonych danych? 

Jeżeli w trakcie realizacji projektu zostaną wprowadzone jakieś zmiany w zakresie rodzajów pozyskanych danych, ich objętości to informacje te należy zaktualizować w kolejnych wersjach planu, a także ująć w raporcie końcowym projektu.

2.1. Jakie metadane i dokumentacja (np. metodologia oraz sposoby pozyskiwania i organizacji danych) będą towarzyszyć danym w projekcie?

  • Jakimi metadanymi dane zostaną opisane?

Metadane opisujące zbiór danych to m.in.: tytuł projektu, autor (wraz z numerem ORCID), rok utworzenia, słowa kluczowe, krótki opis, dyscyplina, instytucja finansująca, licencja, powiązane publikacje.

  • Jaki międzynarodowy standard zapisu metadanych jest stosowany w repozytorium, w którym dane zostaną zdeponowane (Dublin Core, Data Documentation Initiative DDI)?
  • Jakie informacje będą podawane, aby potencjalni użytkownicy byli w stanie w przyszłości odczytać i zinterpretować zebrane dane?

Pliki i foldery z danymi badawczymi powinny być nazwane i uporządkowane w taki sposób, aby były identyfikowalne i dostępne dla obecnych i przyszłych użytkowników. W opisie tego punktu należy wskazać sposób organizacji danych w projekcie poprzez podanie np. przyjętej konwencji, wersji, i struktury folderów. 

2.2. Jakie będą zastosowane środki kontroli jakości?

  • W jaki sposób będzie kontrolowana jakość gromadzonych danych?
  • Jaka zostanie zastosowana metodologia kontroli, np. kalibracja urządzeń, wzajemna ocena, ponowne pomiary itp.
  • W jaki sposób gromadzone dane zostaną zabezpieczone przed działaniem osób nieuprawnionych?
  • Jak będą eliminowane błędy pomiarowe i problem stronniczości?
  • W jaki sposób metody pozyskiwania, analizy i przetwarzania danych mogą wpływać na ich jakość?
  • Czy dane ilościowe będą wymagać oczyszczenia?

3.1. W jaki sposób w trakcie projektu będą przechowywane dane i metadane? W jaki sposób będą tworzone ich kopie zapasowe?

  • Jaki będzie sposób i procedury tworzenia kopii zapasowych i kto będzie za nie odpowiadał?

Opisanie procedury tworzenia kopii zapasowych (częstotliwość aktualizacji, podział obowiązków, proces automatyczny/ręcznie kontrolowany, środki bezpieczeństwa, itd. Zobacz usługa Nextcloud AGH)

np. zasada 3-2-1: 3 kopie, na 2 różnych nośnikach, 1 kopia przechowywana w miejscu innym niż pozostałe

  • Jak zostaną odzyskane dane w przypadku utraty/uszkodzenia?
  • Jak zostanie zapewnione bezpieczeństwo przepływu danych między członkami zespołu?

np. autoryzowany dostęp, dedykowane przestrzenie dyskowe, log-book

  • Jak zostaną zabezpieczone dane?

np. przez zastosowanie programów antywirusowych i haseł dostępu do plików/folderów/komputera/chmury

  • Jak będą przenoszone dane z urządzeń mobilnych, stanowisk terenowych lub sprzętu domowego na główny serwer w miejscu pracy?

3.2. W jaki sposób zostanie zapewnione bezpieczeństwo i ochrona danych wrażliwych w okresie trwania projektu?

  • Gdzie dane wrażliwe będą przechowywane? 
  • Jaki będzie sposób odzyskiwania danych utraconych w wyniku incydentu?
  • Kto będzie miał dostęp do danych w czasie trwania projektu i jak wyglądać będzie kontrola dostępu do danych, zwłaszcza w przypadku współpracy kilku instytucji?
  • Jaka politykę ochrony danych wdrożono w instytucji?

W Akademii Górniczo-Hutniczej im. Stanisława Staszica w Krakowie wdrożono System Zarządzania Bezpieczeństwem Informacji (SZBI), którego celem jest ochrona danych i informacji. Struktura zarządzania bezpieczeństwem informacji obejmuje m.in. IODO (Inspektor Ochrony Danych Osobowych) oraz Administratora Systemu Informatycznego (Funkcjonariusze Centralni i Lokalni). Inspektor Ochrony Danych Osobowych został powołany w 2018 r. SZBI opiera się na następujących dokumentach: Polityka Bezpieczeństwa Informacji w AGH (Zarządzenie Rektora nr 9/2017), zarządzenie w sprawie wdrożenia i funkcjonowania w AGH kontroli zarządczej (Zarządzenie Rektora nr 40/2012) oraz Polityki Ochrony Danych Osobowych w AGH (Zarządzenie Rektora nr 26/2019). 

  • Jeśli w projekcie nie ma do czynienia z danymi wrażliwymi (nie przewiduje się badań z udziałem ludzi) powinno się zamieścić następujący wpis: „Projekt nie przewiduje tworzenia, przechowywania i przetwarzania danych wrażliwych”.

4.1. Jeżeli będzie miało miejsce przetwarzanie danych osobowych, w jaki sposób zostanie zapewniona zgodność z przepisami dotyczącymi danych osobowych oraz ich ochrony?

  • Czy w projekcie będą gromadzone i przetwarzane dane osobowe? Jeśli tak, to w jaki sposób zostanie zapewniona ochrona tych danych?
  • Czy w procesie pozyskiwania danych niezbędna będzie ich anonimizacja lub pseudonimizacja? Szyfrowanie danych?

Klucz do szyfru musi być przechowywany w innym miejscu, niż same dane. Trzeba pamiętać, aby wyraźnie odróżnić dane osobowe, które będą przechowywane w tajemnicy i ostatecznie zniszczone, od zanonimizowanych danych badawczych, które będą przechowywane przez czas nieokreślony i udostępniane innym.

  • Czy określono procedurę dostępu dla uprawnionych użytkowników danych osobowych?

Na dokumentację przetwarzania danych osobowych składają się:

  1. Rejestr czynności przetwarzania danych osobowych,
  2. Rejestr kategorii czynności przetwarzania danych osobowych,
  3. Rejestr naruszeń danych osobowych,
  4. Zgłoszenie naruszenia danych osobowych,
  5. Umowa powierzenia przetwarzania danych osobowych.

Tryb zarządzania dostępem do danych osobowych określa Polityka Ochrony Danych Osobowych AGH (Zarządzenie Rektora nr 26/2019).

Warto kwestie zarządzania danymi wrażliwymi i osobowymi w projekcie (jeśli przewiduje się badania z udziałem ludzi) skonsultować z inspektorem ochrony danych osobowych AGH.

  • Jeśli w projekcie nie ma do czynienia z przetwarzaniem danych osobowych (nie przewiduje się badań z udziałem ludzi) powinno się zamieścić następujący wpis: „Projekt nie przewiduje przetwarzania danych osobowych”.

4.2. W jaki sposób planują Państwo zapewnić zgodność z innymi przepisami, takimi jak prawa własności intelektualnej i prawa własności? Jakie przepisy znajdują w tym przypadku zastosowanie?

  • Kto będzie właścicielem wytwarzanych danych (należy wskazać wszystkich właścicieli)?
  • Czy istnieją jakiekolwiek ograniczenia prawne dotyczące ponownego wykorzystania danych pochodzących od osób trzecich?
  • Jakie zostaną zastosowane licencje?

NCN zaleca, aby dane były udostępniane na licencji CC0 lub CC BY.

  • Czy przed udostępnieniem danych konieczne będzie uzyskanie odpowiedniego zezwolenia w zakresie praw autorskich?

W przypadku projektów dofinansowywanych przez Narodowe Centrum Nauki i UE własność danych należy do Instytucji, nie do indywidualnego badacza. 

W zakresie praw własności intelektualnej stosowane będą: Ustawa o prawie autorskim i prawach pokrewnych oraz Ustawa Prawo własności przemysłowej, Regulamin zarządzania prawami autorskimi i prawami pokrewnymi oraz prawami własności przemysłowej, oraz zasadami komercjalizacji w AGH (Zarządzenie Rektora nr 18/2015) lub zasadami określonymi przez podmiot finansujący oraz Regulamin Repozytorium Otwartych Danych Badawczych Uczelni Krakowskich RODBUK (w przypadku, jeśli tam dane zostaną zdeponowane).

Jeśli efektem projektu będzie wynalazek, patent czy komercjalizacja warto skonsultować plan z rzecznikiem patentowym AGH.

5.1. Kiedy i w jaki sposób będą udostępniane dane z projektu? Czy istnieją ewentualne ograniczenia i zakazy dotyczące ich udostępniania?

  • Kiedy dane zostaną udostępnione: w trakcie, czy po zakończeniu badań? W jaki sposób dowiedzą się o nich potencjalni użytkownicy?

Zgodnie z wytycznymi instytucji finansujących badania, dane badawcze należy udostępnić możliwie szybko – najpóźniej w momencie publikacji wyników badań np. artykuł naukowy, monografia, baza danych, na podstawie których powstały. 

  • Jak długo będą przechowywane w repozytorium?

Narodowe Centrum Nauki wymaga, aby dane badawcze były przechowywane minimum 10 lat, natomiast metadane je opisujące – bezterminowo.

  • Czy istnieją jakieś ograniczenia i przeszkody uniemożliwiające ich pełne lub częściowe udostępnienie?

Jeśli otwarcie danych zostanie opóźnione lub ograniczone w czasie np. w celu publikacji, ochrony własności intelektualnej czy ubiegania się o patenty, należy wskazać oczekiwaną datę ich udostępnienia.

  • Czy wydawcy czasopism będą wymagać składowania danych na poparcie ustaleń publikacji?
  • Czy udostępnianie danych wymaga zgody uczestników badania?

5.2. Jak będzie wyglądać selekcja danych przeznaczonych do utrwalenia i gdzie będą one długoterminowo przechowywane (np. w repozytorium danych, archiwum)?

  • Które dane trzeba zachować, a które zniszczyć z przyczyn wynikających z umów, przepisów prawnych lub regulacji?
  • W jaki sposób zostanie podjęta decyzja o tym, które dane zachować?
  • Jaka będzie procedura selekcji przeznaczonych do utrwalenia danych?

Nie trzeba udostępniać wszystkiego – jednak trzeba uzasadnić, na jakiej podstawie dokonano selekcji danych do udostępniania, według jakich kryteriów była przeprowadzona.

  • Czy repozytorium, w którym dane zostaną długoterminowo przechowywane, przestrzega zasad FAIR data?

W przypadku zdeponowania danych w Repozytorium Otwartych Danych Badawczych Uczelni Krakowskich RODBUK będą udostępniane zgodnie z zasadami FAIR przez minimum 10 lat, a opisujące je metadane bezterminowo.

5.3. Jakie metody lub oprogramowanie umożliwiają dostęp do danych i korzystanie z danych?

  • Czy aby dane mogły być przechowywane przez dłuższy okres i zachowały długi okres ważności, należy je przekształcić do formatu standardowego lub otwartego?

Jeżeli specjalistyczne dane, ze względu na zachowanie ich jakości, nie będą mogły zostać przekonwertowane do powszechnie dostępnych programów, należy wskazać, jakie oprogramowanie będzie niezbędne do ich otwarcia. Wówczas użytkownicy powinni mieć informację, czy będą potrzebować określonych narzędzi, aby uzyskać dostęp do tych danych i (ponownie) je wykorzystać.

  • Jaki mechanizm posłuży do udostępniania danych?

np. odpowiedzi na żądanie, repozytorium

5.4. W jaki sposób zagwarantują Państwo stosowanie unikalnego i trwale przypisanego identyfikatora (takiego jak cyfrowy identyfikator dokumentu elektronicznego (DOI)) dla każdego zbioru danych?

  • Czy trwale przypisany identyfikator zostanie uzyskany?
  • Jakie istniejące trwałe identyfikatory pozostaną w użyciu (np. cyfrowe identyfikatory dokumentu elektronicznego, numery dostępowe)?

W przypadku zdeponowania w Repozytorium Otwartych Danych Badawczych Uczelni Krakowskich RODBUK dane będą miały przypisany trwale cyfrowy identyfikator dokumentu elektronicznego DOI (Digital Object Identifier).

6.1. Kto będzie odpowiadał za zarządzanie danymi (tj. kto będzie ich opiekunem)?

  • Kto w trakcie badań będzie odpowiadał za zarządzanie danymi?
  • Kto po zakończeniu badań będzie odpowiadał za zarządzanie danymi? Czy będzie to osoba z projektu, czy repozytorium, w którym dane zostaną zdeponowane?

Trzeba opisać podział ról w zakresie zarządzania danymi badawczymi: kto wytwarza dane, kto odpowiada za ich jakość, kto za archiwizację i długoterminowe zarządzanie, kto będzie odpowiedzialny za wdrożenie i aktualizację PZD.

Osobą odpowiedzialną za zarządzanie danymi badawczymi w trakcie projektu będzie osoba realizująca działanie naukowe – kierownik projektu (imię i nazwisko, stanowisko, pełniona funkcja, wydział) lub wyznaczona przez niego osoba. Po zdeponowaniu Repozytorium Otwartych Danych Badawczych Uczelni Krakowskich RODBUK, za dalsze zarządzanie danymi odpowiedzialni będą administratorzy RODBUK AGH.

6.2. Jakie zasoby zostaną przeznaczone na cele zarządzania danymi i zagwarantowanie przestrzegania zasad FAIR? (Jakie koszty związane będą z zapewnieniem standardów FAIR w projekcie? W jaki sposób zostaną opłacone?).

  • W jaki sposób zostaną oszacowane i opłacone koszty niezbędne do przygotowania, udostępniania i przechowywania danych?
  • Czy potrzebne są dodatkowe zasoby do zarządzania danymi, takie jak osoby, czas, sprzęt lub oprogramowanie?

Trzeba określić czy będą potrzebne dodatkowe zasoby potrzebne do archiwizacji, przechowywania danych (czas, dyski zewnętrzne, dodatkowa przestrzeń dyskowa, płatne repozytorium) i w jaki sposób zostaną opłacone? Czy przewiduje się zatrudnienie osoby zarządzającej danymi badawczymi? Jeżeli tak, to należy napisać jak wysokie będą to koszty i w jaki sposób zostaną opłacone.

Koszty zarządzania danymi badawczymi można pokryć z 2% kosztów pośrednich Open Access rozliczanych ryczałtem.

W przypadku zdeponowania danych w Repozytorium Otwartych Danych Badawczych Uczelni Krakowskich RODBUK należy wpisać: koszty zarządzania danymi badawczymi po projekcie ponosi Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie.

Stopka