Skip to content ↓

Otwarte dane badawcze

Open Research Data

To wszystkie dane zebrane, zaobserwowane lub wytworzone podczas procesu badawczego w celu uzyskania oryginalnych wyników naukowych. Każda dyscyplina nauki tworzy swoje dane badawcze charakterystyczne dla niej.

Aby dane badawcze mogły zostać określone jako otwarte, należy je udostępnić w taki sposób, aby każdy miał do nich nieograniczony dostęp oraz mógł je dowolnie wykorzystywać, modyfikować i upowszechniać.

Otwarte Dane Badawcze stanowią część szerszej idei, jaką jest Otwarta Nauka. Dobrze zorganizowane, udokumentowane, zarchiwizowane i udostępnione są nieocenione dla rozwoju nauki i przyspieszenia badań.

W zależności od tego, jak lub w jakim celu zostały wytworzone, możemy wyróżnić m.in.

przechwytywane w czasie rzeczywistym, których nie da się „odzyskać” (ang. unique data) np. odczyty czujników, dane telemetryczne, wyniki ankiet, obserwacje, obrazy.

poprawione zbiory danych, często recenzowane, publikowane i selekcjonowane np. bazy danych sekwencji genów, dane ze spisu powszechnego, dane GUS, struktury chemiczne.

pochodzące ze sprzętu laboratoryjnego np. sekwencje genów, chromatogramy, odczyty pola magnetycznego, spektroskopia.

wyniki analiz danych lub agregowane z różnych źródeł np. bazy danych, modele 3D, eksploracje tekstu oraz danych.

generowane modele testowych badających rzeczywiste lub teoretyczne systemy np. modele klimatyczne, modele ekonomiczne, systemy inżynieryjne.

5-star Open Data

5-gwiazdkowy schemat wdrażania Otwartych Danych, opracowany przez Tima Berners-Lee, który był jednym z pionierów usługi WWW oraz Linked Data.
  1. * Dane powinny być dostępne w sieci niezależnie od formatu, na dowolnie wybranej otwartej licencji.
  2. ** Dane powinny znajdować się w ustrukturyzowanej formie nadającej się do odczytu maszynowego np. plik Excel zamiast zdjęcia tabeli.
  3. *** Dane powinny być udostępnione w otwartym formacie np. plik CSV zamiast .XLS.
  4. **** Do oznaczenia danych powinny być użyte identyfikatory URI, aby mogły być jednoznacznie identyfikowalne.
  5. ***** Dane powinny być powiązane z innymi danymi, aby był zapewniony kontekst.

Więcej informacji o 5-star Open Data.

Stopka