Veranstaltungen

Workshop zu PIDs für physische Objekte

20.02.2025 | Rückblick und Zusammenfassung

Die Verwendung von Persistenten Identifikatoren (PIDs) sind ein wesentlicher Bestandteil einer offenen Wissenschaftslandschaft im digitalen Zeitalter. Sie verbessern die Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit (FAIR) verschiedener forschungsbezogener Objekte und ermöglichen den wissenschaftlichen Forschungsprozess transparenter und vernetzter zu gestalten.

Die Nutzung von PIDs für physische Objekte wie unterschiedliche Arten von Proben oder Artefakte ist bisher vor allem in den Erd- und Biowissenschaften verbreitet. Eine breitere Anwendung könnte die Auffindbarkeit und Zugänglichkeit dieser Ressourcen verbessern, indem sie Daten in einen umfassenderen Kontext stellt. Interoperable Metadatenstandards und einheitliche Dokumentationsformen können die Zusammenarbeit zwischen Disziplinen fördern und erhöhen die Wiederverwendbarkeit der Daten.

Das Projekt "PID Network Deutschland" veranstaltete am 20. Februar 2025 einen Workshop zum Thema "PIDs für physische Objekte" am Helmholtz Zentrum für Geoforschung. Eine hybride Übertragung der Vorträge war möglich. 30 Teilnehmende fanden sich (trotz Bahnstreik) auf dem Telegrafenberg in Potsdam ein und 70 weitere nahmen online teil.

Der Workshop, der im Anschluss an die RDA DE 2025 Konferenz stattfand, bot eine Plattform für den Austausch über Anwendungsbereiche, Herausforderungen und Lösungsansätze bei der Einführung von PIDs. Ziel der Veranstaltung war es, einen regen Austausch über bewährte Verfahren, Herausforderungen und mögliche Lösungsansätze zu fördern. Ein besonderer Schwerpunkt lag auf dem Ideenaustausch zu einer nationalen PID-Roadmap. Dabei stand die aktive Beteiligung der wissenschaftlichen Gemeinschaft im Mittelpunkt.

Im Folgenden werden die Präsentationen (sie unten) dokumentiert und die Ergebnisse der Austauschformate zusammengefasst.

Austausch mit den Teilnehmenden

Nach den Präsentationen folgten zwei verschiedene Austauschformate. Zum einen fand ein World Café statt mit den Themen: (1) Herausforderung bei der Implementierung von PIDs, (2) Erfolgsgeschichten und Best Practices und (3) Metadatenstandards. Im Anschluss daran folgte ein Gruppenaustausch mit dem Thema PID Roadmap.

Herausforderungen bei der Einführung von PIDs 


In diesem World Café als Austauschformat wurden zahlreiche Herausforderungen und Möglichkeiten im Zusammenhang mit der Einführung von PIDs im Allgemeinen und PIDs für physische Objekte im Besonderen betrachtet. Die Diskussion umfasste sowohl technische Hürden als auch die Notwendigkeit eines kulturellen Wandels innerhalb der Forschungsgemeinschaft.

Aspekte, welche diskutiert wurden:

  • Infrastruktur und Interoperabilität: Ein zentrales Anliegen war die Schwierigkeit, verschiedene Forschungsinfrastrukturen und -systeme zu koordinieren. Die Teilnehmer betonten die Notwendigkeit einer automatischen PID-Zuweisung, wiesen aber auch auf die damit verbundenen Kosten und die Bedeutung der Interoperabilität zwischen verschiedenen PID-Systemen hin.
  • Qualität der Daten und Metadaten: Die Aufrechterhaltung sauberer, genauer und aktueller Daten und Metadaten wurde wiederholt als entscheidend genannt. Dazu gehören Fragen der Granularität (z. B. Geolokalisierung) und die Sicherstellung, dass die Metadaten Änderungen des Probenortes oder der Datenversionierung widerspiegeln.
  • Kultureller Wandel und Akzeptanz durch die Forschenden: Eine große Herausforderung besteht darin, Forschende davon zu überzeugen, PID-Verfahren zu übernehmen. Die Teilnehmenden erörterten die Notwendigkeit, das Bewusstsein zu schärfen, Schulungen anzubieten und die Vorteile von PIDs über den einfachen Datenzugang hinaus aufzuzeigen. Viele Wissenschaftler:innen räumen derzeit den Daten selbst Vorrang ein und betrachten PIDs als zusätzliche Belastung.
  • Nachhaltigkeit und Finanzierung: Die langfristige Nachhaltigkeit von PID-Systemen erfordert die Bereitstellung von Mitteln für die IT-Infrastruktur, die Wartung und die laufende Pflege von Metadaten. Die Skalierbarkeit dieser Bemühungen ist ein zentrales Anliegen.
  • Zugangs- und Registrierungshindernisse: Begrenzter Zugang zu Registerdiensten (wie z.B. die Archäologie)

     

Erfolgsgeschichten und bewährte Praktiken


Es wurde deutlich, dass die IGSN ein Standard-PID für viele physische Objekte ist. In Fällen, in denen keine externe PID verwendet wird, sind häufig zumindest interne IDs vorhanden. Die Teilnehmenden waren sich einig, dass das Vorhandensein interner IDs das Minimum an guter Praxis ist, die Verwendung von PIDs jedoch die beste Praxis darstellt. Als Beispiele wurden Bohrkerne (die wiederholt genannt wurden und für die üblicherweise IGSN verwendet werden), Sammlungsstücke des Naturkundemuseums Berlin (unter Verwendung interner IDs) und geologische Proben (wie Boden und Pflanzen, in der Regel unter Verwendung von IGSN) genannt. Ein weiteres Beispiel war die GenBank, die Gensequenzdatenbank der National Institutes of Health, die interne IDs verwendet. Die anschließende Diskussion konzentrierte sich auf die Verbesserung der Implementierung und des Nutzens von PIDs für physische Objekte, und zwar unter drei Aspekten.

Zentrale Themen waren:

  • Zeitpunkt der PID-Zuweisung: PIDs sollten sofort bei der Proben-/Objektentnahme zugewiesen werden, nicht erst später im Prozess.
  • Arbeitsabläufe: Eine erfolgreiche PID-Implementierung erfordert sinnvolle Arbeitsabläufe für die Zuweisung, Erstellung von Metadaten und Verteilung.
  • Metadaten werden unterbewertet: Die Priorisierung von Metadaten in Verbindung mit PIDs ist für die Maximierung des Nutzens unerlässlich.
  • Fehlende Verbindungen: Forschende fehlt oft der Zugang zu PID-Expert:innen


Schritte zur Verbesserung:

  • Schulung und Ausbildung: Intensive Schulungen zu PID-Workflows sind erforderlich, um Begeisterung und Akzeptanz zu fördern.
  • Nahtlose Integration: PIDs müssen leicht in bestehende Sammlungsdatenbanken und Forschungssysteme integriert werden können.
  • Leitlinien für bewährte Verfahren: Die Entwicklung und Förderung klarer Leitlinien für bewährte Verfahren ist von entscheidender Bedeutung.
  • Frühzeitige Zuweisung/Reservierung: PIDs sollten so früh wie möglich zugewiesen oder reserviert werden (sogar vor der Veröffentlichung), um Zeit zu sparen und Embargos zu berücksichtigen.


Den Wert kommunizieren:

  • Nutzen für Wissenschaftler:innen: Wie können PIDs einen Mehrwert für die Forschung darstellen (z. B. ein besseres Verständnis der Daten).
  • Bedeutung von Metadaten: Betonung der Rolle von Metadaten bei der Erschließung des vollen Potenzials von PIDs.
  • Zugänglichkeit und Sichtbarkeit: Der Schwerpunkt liegt auf der Verbesserung des Auffindens und des Zugriffs auf PID-registrierte Objekte.


Im Wesentlichen wird in der Diskussion betont, dass PIDs am effektivsten sind, wenn sie in einen gut konzipierten Arbeitsablauf integriert sind, durch Schulungen unterstützt werden und allen Beteiligten effektiv vermittelt werden.

 

Metadaten


In diesem Austausch ging es um die Verbesserung der Metadatenpraxis zur Beschreibung physischer Objekte. Die Teilnehmenden ermittelten die wichtigsten Metadatenelemente und diskutierten Wege zu einer besseren Standardisierung und Zusammenarbeit.

Wichtigste Erkenntnisse:

  • Relevante Metadaten für physische Objekte: Zu den wichtigsten Metadaten für die Beschreibung physischer Objekte gehören Material, Probentyp, Maße (Größe/Volumen), Datum, Herkunft/Herkunft und die Rolle der Mitwirkenden. Der Schwerpunkt lag auf detaillierten Herkunftsinformationen (einschließlich Untertypen - Instrumente, lebende Organismen usw.) und der Verfolgung des Herkunftsverlaufs. Es wurde wiederholt betont, wie wichtig es ist, den Standort einer Probe eindeutig zu dokumentieren.
  • Anpassung von Standards: Die Gruppe sprach sich für die Nutzung von Ontologien und bestehenden Vokabularen aus (Beispiel SKOS, Simple Knowledge Organization System). Als Schlüsselprozess wurde ein zyklischer Ansatz identifiziert: Beginnend mit den ermittelten Bedürfnissen, Aufbau eines gemeinschaftlichen Konsens mit Expert:innen, Anwendung und Genehmigung von Standards in einer agilen Art und Weise und dann Überprüfung der Bedürfnisse auf der Grundlage der Implementierung.
  • Förderung der Zusammenarbeit: In der Diskussion wurde die Notwendigkeit der Zusammenarbeit zwischen Forschungseinrichtungen, Museen und anderen Organisationen hervorgehoben. Zu den Prioritäten gehören die Einrichtung eines PID-Systems für physische Objekte und die Anerkennung der Vielfalt der Bedürfnisse und der zu beschreibenden Objekte. Die Zugänglichkeit sowohl für Maschinen als auch für Menschen wurde ebenfalls als entscheidend bezeichnet.

Insgesamt wurde in der Sitzung der Wunsch nach robusteren, standardisierten und kollaborativen Metadatenverfahren deutlich, um die Zugänglichkeit, Sichtbarkeit und langfristige Bewahrung physischer Objekte zu verbessern.

Gruppenaustausch: PID Roadmap

Im Mittelpunkt der Gruppenarbeit stand die Entwicklung einer PID Roadmap für Deutschland. Das primäre Ziel ist es, die Grundlagen für eine zukünftige nationale PID-Strategie zu schaffen. Während Länder wie Australien, Irland und Tschechien mit nationalen PID-Strategien bereits Fortschritte gemacht haben, muss Deutschland aufgrund der Komplexität seiner föderalen Struktur und der Notwendigkeit, zahlreiche Interessengruppen einzubeziehen, zunächst einen Fahrplan erstellen. Das Einholen und Einbeziehen von Rückmeldungen aus der wissenschaftlichen Gemeinschaft ist von entscheidender Bedeutung, um sicherzustellen, dass die Roadmap die unterschiedlichen Bedürfnisse widerspiegelt und eine breite Akzeptanz fördert.

In der Anfangsphase geht es vor allem darum, das Bewusstsein für die Vorteile der PID zu schärfen und die damit verbundenen Herausforderungen offen anzusprechen. Der Fahrplan wird als vorläufiger Schritt betrachtet, wobei die vollständige Umsetzung der Strategie einen breiteren Konsens und die Überwindung struktureller Hürden erfordert.

Die übergreifende Botschaft aus den Gruppendiskussionen ist, dass eine erfolgreiche PID-Roadmap für Deutschland ganzheitlich und gemeinschaftsorientiert sein muss. Andererseits ist klar, dass die Roadmap nicht für alle Anwendungen ausreicht und die Adressaten im Vorfeld genau definiert werden müssen. Es geht nicht nur darum, PIDs zu haben, sondern ein nachhaltiges Ökosystem zu schaffen, das ihre breite Einführung und effektive Nutzung, insbesondere für physische Objekte, unterstützt.

Hier eine Zusammenfassung der verschiedenen Aspekte, die im Hinblick auf die Bedeutung eines Fahrplans diskutiert wurden.

Strategischer & Bottom-Up-Ansatz: Die Empfehlungen sollten aus der Gemeinschaft kommen, sich aber an strategische Entscheidungsträger richten.
Adressat: Wer ist der beabsichtigte Empfänger bzw. Empfängerinnen? Berücksichtigt werden sollte die Heterogenität der Gemeinschaften. 
Nachhaltigkeit ist entscheidend: Langfristige Finanzierung von Infrastruktur (Repositorien, Minting services) und Personal (Data Stewards, Repositorienmanager:innen) sind entscheidend. Eine projektbezogene Finanzierung ist unzureichend.
Interoperabilität und Standardisierung: Schwerpunkt auf der Ermöglichung internationaler Zusammenarbeit durch standardisierte PIDs (ORCID, ROR, IGSN) und Metadatenschemata. Harmonisierung von Metadatenschemata.
Community Building & Bildung: Hinweis auf Kosten bei der Ausbildung von Entwickler:innen, Forschenden und Data Stewards. Förderung des Bewusstseins und Aufbau eines Kompetenznetzes.
Incentivierung & Mandate: Schaffung von Anreizen für die Einführung von PID (z. B. ORCID-Profile) und ziehen Sie gegebenenfalls Mandate (wie einen „Zeitschriftenstandard“) in Betracht.
Praktische Tools & Unterstützung: Verweis auf barrierearme Tools zur Erstellung von PIDs und Unterstützungsdienste für Nutzende. Ausarbeitung der Rolle von Repositorien.
Vorteile: Hervorhebung der Vorteile von PIDs durch Fallstudien und Beispiele.
Risiken und Schwachstellen ansprechen: Mögliche Schwachstellen (Cyberangriffe) erkennen und dezentrale Lösungen erkunden.
Zukunftssicher machen: Überlegen Sie, wie PIDs die Automatisierung, die Maschine-zu-Maschine-Kommunikation und die langfristige Bewahrung von Forschungsdaten unterstützen können.

 

Präsentationen

PresentationAbstractSpeaker
Distribution of PIDs for physical objects in GermanyThe presentation focuses on the dissemination of PIDs for physical objects. The PID Network project conducted an extensive survey in science and culture in 2024. These results will be examined in more detail, supplemented by a temporal visualisation.Andreas Czerniak (Bielefeld University Library)
PID4Cat: Persistent Identifiers for Catalysis ResearchThis talk introduces PID4Cat, a new solution for handle-based persistent identifiers (PIDs) that stores PID-related metadata in the handle record. Its generic metadata model is described as a LinkML model. The first application is in catalysis research. We will discuss the importance of PIDs in ensuring FAIR data principles and how PID4Cat facilitates early-stage data sharing and collaboration within the NFDI4Cat community. Additionally, we will cover the technical implementation of PID4Cat and its integration with services benefiting from automatic code generation from the PID4Cat-model.David Linke (Leibniz Institute for Catalysis. e.V.)
Preston Rodrigues (High-Performance Computing Center Stuttgart (HLRS), University of Stuttgart)
IGSN – International Generic Sample Numbers: Uniquely identifying your samplesThis presentation will provide an overview of International Generic Sample Numbers (IGSNs) and their significance, with a focus on the services available in Germany and at the Helmholtz Centre for Geoscience (GFZ). In addition, the latest results of the HMC project FAIR WISH, which is carried out in cooperation with the GFZ, the Alfred Wegener Institute (AWI) and Hereon, will be presented. This talk emphasises the importance of IGSNs for the scientific community and illustrates their application in improving data availability and usability.Kirsten Elger (Helmholtz Center for Geosciences, GFZ)
The persistent identification of archaeological object data in iDAI.world

iDAI.world is the digital research infrastructure of the German Archaeological Institute. It comprises systems for recording, documenting, analysing, storing, visualising and publishing research data. In addition to information on objects, buildings and geodata, it also includes contextual information on field research and scientific data.

To date, the DAI has primarily used its own unique identifiers to address the object data. PIDs are used in the context of publications and in some cases for sample identification, and a technical concept that enables PID-supported citation is now being implemented as part of the DFG project ‘CiVers’. Concepts and issues relating to the modelling, publication and citation of object data are also being discussed together with the community.

Fabian Riebschläger 
Marcel Riedel (German Archaeological Institute, DAI)
Application of PIDs and digital twins of plant genetic resources at IPK Gatersleben

The Leibniz Institute of Plant Genetics and Crop Plant Research (IPK) is a leading international plant science institute with a research focus on biodiversity and crop performance. In order to implement a sustainable data and material management infrastructure three pillars has been built in the last 15 years. An institutional policy for research data management, defined processes and a technical infrastructure. The technical backbone is a Research and Laboratory Information Management System (RALIMS) which was established 2011 and is operated as general-purpose data management system across all research groups and departments.

This RALIMS based ecosystem of databases, file storage, desktop clients, web applications and APIs serves two major classes of data management processes. The first class are service processes for centrally managed instruments, facilities and service units. They follow institutional agreed processes and operated by permanent staff. Examples are the high-throughput sequencing, chemicals management or phenotyping service processes. Service processes comprises (a) defined personnel and organizational responsibilities including defined transition points between the laboratories, the scientist and the LIMS project team, (b) defined standard-compliant and machine-processable data formats, (c) mandatory metadata standards and d) defined data publication processes, i.e. the minting of PUIDs, like DOIs, and data upload into international data repositories.

The second class of process are data flows in research projects. Here a more agile and are less rigidly structured processes are in place that reflecting the nature of innovation-driven science. Nevertheless, they are dovetailed with the core service processes and support immersive analytics driven knowledge generation in research projects. For example, research project for the genotypic and phenotypic characterization handle of thousands of plant samples and connect them with millions of data points. Scientist and technician work hand in and to interweave scientific data analysis and visualization pipelines and tools. This data servant approach, which is operated over more than 15 years, enabled the preservation of more than 6 million samples and terabytes of data files in a FAIR manner. The interplay of policies, processes and IT is a central backbone to support research data and material management at IPK and contributes data services to networks such as the European life-sciences infrastructure for biological information (ELIXIR), the German Bioinformatics Network (de.NBI) or the National Research Data Infrastructure (NFDI) in the consortia, FAIRAgro, DataPLANT and NFDI4Biodiversity.

This talk provided an overview to the policies, technology and processes at the IPK to implement FAIR data and material management and show cased the application of digital twins in recent research projects.

Matthias Lange (IPK Gatersleben)