Dane badawcze

Dane badawcze (ang. Research Data) to dane zebrane lub wytworzone jako materiał do analizy w badaniach naukowych oraz pracach rozwojowych, gromadzone w celu uzyskania oryginalnych wyników, konieczne do weryfikacji wyników tych badań.

Obejmują one wszystko co zostało wytworzone w ramach prowadzonych badań:
- dane surowe (uzyskane bezpośrednio w wyniku zastosowania narzędza badawczego),
- dane opracowane.

Danymi badawczymi mogą być:
- dane liczbowe,
- dokumenty tekstowe,
- notatki,
- kwestionariusze, 
- protokoły laboratoryjne, itd.

Otwarte dane badawcze (ang. Open Research Data), to zebrane lub wytworzone zbiory danych, które powstały jako rezultat pracy naukowej i zostały udostępnione do bezpłatnego, powtórnego użycia bez barier prawnych i technicznych co najmniej w zakresie wymaganych do weryfikacji wyników badań zaprezentowanych w publikacjach naukowych. 

Otwarte dane badawcze można:
- wykorzystywać w swoich pracach (powtórne wykorzystanie),
- modyfikować,
- udostępniać z poszanowaniem prawa.

Zgodnie z Dyrektywą Parlamentu Europejskiego i Rady (UE) 2019/1024 z dnia 20 czerwca 2019 r. w sprawie otwartych danych i ponownego wykorzystania informacji sektora publicznego, wyniki badań naukowych finansowanych ze środków publicznych powinny być opublikowane w otwartym dostępie.

Zalecenia dotyczące otwierania danych badawczych znalazły się m.in. w:

W Polsce powyższą dyrektywę wdraża Ustawa z dnia 11 sierpnia 2021 r. o otwartych danych i ponownym wykorzystywaniu informacji sektora publicznego.

Udostępnianie danych badawczych

Zasady FAIR Data odnoszą się do standardu przechowywania i publikowania danych badawczych. Służą one jako wytyczne do umożliwienia ich ponownego wykorzystania w określonych warunkach przez ludzi i maszyny:

  • Findable - powinny być możliwe do znalezienia, opatrzone metadanymi, trwałymi identyfikatorami,
  • Accessible - powinny być dostępne (określone warunki dostępu, wymagane oprogramowanie, dostępność metadanych),
  • Interoperable - powinny być interoperacyjne (możliwość przetwarzania danych, wymiany i połączenia z innymi zbiorami danych, otwartość wykorzystanego oprogramowania, wykorzystanie standardowych metodologii i słowników),
  • Reusable - powinny nadawać się do ponownego użycia (zarchiwizowane na odpowiedniej licencji, uwzględnienie okresu embarga lub karencji).

Korzyści płynące z udostępniania danych:

  • transparentność danych badawczych, stanowiących podstawę publikacji naukowej,
  • możliwość wykrycia badań nierzetelnych,
  • zwiększenie wiarygodności naukowej badacza,
  • możliwość łatwiejszego wykrywania plagiatów,
  • zwiększenie widoczności badacza w międzynarodowej społeczności naukowej,
  • cytowanie danych może pozytywnie wpłynąć na liczbę cytowań danej publikacji.