Blogbeiträge

Online-Seminar zu PIDs für Forschungsdaten

Donnerstag, 15. Februar 2024, von 13:00 bis 16:30 Uhr

Impulsvorträge und Diskussionen zu Best Practices, Bedarfen und Herausforderungen zur Anwendung von PIDs für Forschungsdaten.

 

Die Forschung mit komplexen wissenschaftlich-technischen Infrastrukturen, wie z. B. Teilchenbeschleunigern, Satelliten oder Forschungsschiffen, sorgt für ein hohes Aufkommen von digitalen Forschungsdaten. Diese Daten sind von zentraler Bedeutung für die Reproduzierbarkeit und Nachvollziehbarkeit von wissenschaftlichen Ergebnissen. Persistente Identifikatoren (PID) weisen diesen digitalen Ressourcen eine eindeutige und dauerhafte Referenzierung zu. Dadurch können die Daten langfristig identifiziert, gefunden und zitiert werden, unabhängig von Änderungen in Speicherorten oder anderen Metadaten.

Das Online-Seminar "PIDs für Forschungsdaten", organisiert vom Projekt PID Network Deutschland, widmete sich der Bedeutung von PID für Forschungsdaten. Anlässlich der Aktionswoche "Love Data Week 2024" bot das Seminar einen Einblick über Anwendungsbereiche sowie in bewährte Verfahren. Zur Veranstaltung meldeten sich mehr als 260 Personen an. Es wurde der Umgang mit Forschungsdaten beispielhaft an der Ludwig-Maximilians-Universität München und in der Gemeinsamen Normdatei (GND) skizziert. Darüber hinaus wurde die Bedeutung von PID in der Nationalen Forschungsdateninfrastruktur (NFDI) im Rahmen des Projekts PID4NFDI vorgestellt. Die Helmholtz Metadata Collaboration (HMC) präsentierte zudem als ein konkretes Anwendungsbeispiel die Verwendung von PIDs in einem Wissensgraph. Die Folien der Vortragenden sind in der unten stehenden Tabelle verlinkt und können auch auf Zenodo eingesehen werden.

Im Anschluss an die Präsentationen wurden gemeinsam mit den Teilnehmenden die Bedürfnisse in Bezug auf persistente und eindeutige Identifikation von Forschungsdaten ermittelt. Es wurden Lösungen diskutiert, um Hindernisse bei der Anwendung, Umsetzung und Verbreitung von Identifikatoren in wissenschaftlichen und kulturellen Einrichtungen in Deutschland zu überwinden. In Kleingruppen tauschten sich ca. 30 Teilnehmende aus. Die Ergebnisse wurden auf einem Miro-Board festgehalten und werden im Folgenden zusammengefasst.

 

Zusammenfassung des interaktiven Teils

 

In den Gruppenaustausch wurden zwei Hauptthemen aufgeteilt. Zunächst diskutierten die Teilnehmer die Frage, wie sie PIDs im Bereich der Forschungsdaten nutzen und warum. Anschließend wurde erörtert, welche Aspekte ihnen bei der aktuellen Nutzung von PID für Forschungsdaten fehlen. Die Diskussion basierte auf den vielfältigen Erfahrungen und Handlungsfeldern innerhalb der Wissenschaft, um den Umgang mit PIDs für Forschungsdaten zu beleuchten. 

Hervorgehoben wurde der Nutzen bei der Anwendung und Implementierung von PID für Forschungsdaten. Insbesondere eine gesteigerte Sichtbarkeit in Verbindung mit dem Wunsch nach Anerkennung der Forschungsleistung spielt eine große Rolle. Es wurden außerdem die Vorteile einer Auffindbarkeit, Zitierbarkeit und eindeutige Identifizierung hervorgehoben. Thematisiert wurden auch in Bezug auf die  FAIR-Kriterien der Aspekt der Interoperabilität bzw. Vernetzung. Die Verknüpfung von Forschungsdaten mit Publikationen und darüber hinaus auch die eindeutige Verknüpfung zu Informationen zu Forschungsinstrumenten sowie Proben wurde diskutiert. Der Austausch über den Einsatz von PIDs für Forschungsdaten zeigte, dass ein breites Spektrum besteht: von nicht vorhandenen Einsatzfeldern über reine Awareness-Arbeit und passive Nutzung (Abruf/Nachnutzung von Metadaten) bis hin zur aktiven Vergabe für Forschungsdatensätze in eigenen Repositorien.

Im zweiten Teil des Austauschs sprachen die Teilnehmenden über Hindernisse und mögliche Lösungsansätze bei der Implementierung von PID für Forschungsdaten. Die Teilnehmenden identifizierten folgende Aspekte: fehlendes Bewusstsein unter den Forschenden, fehlende (zentrale) Beratungsstellen bzw. Bildungsangebote, einhergehend mit dem Wunsch nach klaren Regelungen und Richtlinien. Es wurde der Wunsch nach Abstimmung und Einigkeit innerhalb der wissenschaftlichen Communities bzw. Einrichtungen geäußert, insbesondere im Hinblick auf die Nutzung von Metadatenschemata. Darüber hinaus wurde der Nutzen von etablierten Workflows, die Integration von Infrastrukturen in lokale Workflows sowie Möglichkeiten zur automatisierten Verknüpfung als zukünftige Aufgabe diskutiert. Als zusätzliche Hindernisse wurden die Mehrfachzuweisung von PID und fehlende institutionelle Ressourcen genannt. Der Umgang mit sensiblen Daten, ethischen Rahmenbedingungen und die Berücksichtigung der CARE-Prinzipien wurde ebenfalls als nicht ausreichend angesehen. Das Online-Seminar wurde mit Zoom durchgeführt und die Veranstaltungssprache war Deutsch.

 

Programm:

 

Zeit

Programmpunkt

Sprecher:in

Dokumentation

13:00-13:05

Begrüßung, Programm und Methode

Antonia Schrader (Helmholtz-Gemeinschaft) 

Folien

13:05-13:20

Überblicksvortrag: Was leisten PIDs für das Forschungsdaten-Ökosystem.

Paul Vierkant (DataCite)

https://doi.org/10.5281/zenodo.10665361

13:20-13:35

Umgang mit Forschungsdaten-PIDs an der Ludwig-Maximilians-Universität München

Vanessa Gabriel (LMU)

https://zenodo.org/records/10671033

13:35-13:50

Appealing authority: Die GND für Forschende

Barbara Fischer (DNB)

https://zenodo.org/records/10631161
13:50-14:00 Pause

14:00-14:15

PID4NFDI

Tibor Kalman (GWDG)

 

14:15-14:30

Die Verwendung von PIDs zur 'entity resolution' innerhalb des Helmholtz Knowledge Graph

Volker Hofmann (Forschungszentrum Jülich / Helmholtz Metadata Collaboration (HMC))

https://zenodo.org/records/10723293

14:30-14:40

Einführung interaktiver Teil des Seminars Antonia Schrader (Helmholtz-Gemeinschaft) s.o.

14:40-15:25

1. Teil Gruppenarbeit

Alle Teilnehmenden  

15:25-15:30

Pause

15:30-16:15

2. Teil Gruppenarbeit Alle Teilnehmenden

Miro-Board Export (im Nachgang durch das Projekt thematisch geordnet)

16:15-16:30

Wrap-Up & Verabschiedung Antonia Schrader (Helmholtz-Gemeinschaft) s.o.

Bei Fragen und Anregungen können Sie uns jederzeit unter info.pidnetwork@listserv.dfn.de kontaktieren.

Vielen Dank für Ihre Teilnahme!

Projektpartner von PID Network Deutschland sind DataCite, die Deutsche Nationalbibliothek, das Helmholtz Open Science Office, die Technische Informationsbibliothek (TIB) und die Universitätsbibliothek Bielefeld. Das Projekt wird von der Deutschen Forschungsgemeinschaft gefördert.