Kerndatensatz-Spezifikation

Version 1.0 der Kerndatensatz-Spezifikation wurde im Januar 2016 durch den Wissenschaftsrat zur Implementierung im deutschen Wissenschaftssystem empfohlen (siehe Empfehlungen zur Spezifikation des Kerndatensatz Forschung). Die Spezifikation umfasst ein „Spezifikationsdokument”, das die wesentlichen Konzepte und den Aufbau des Standards erläutert, sogenannte „Spezifikationstabellen” sowie ein technisches Datenmodell, welches aus einem konzeptuellen Datenmodell zur Beschreibung der Konzepte, Eigenschaften und Beziehungen und einem XML-Schema als formaler Spezifikation eines Datenaustauschformats besteht.

Diese sowie alle weiteren wichtigen Dokumente zur aktuellen Kerndatensatzspezifikation finden Sie hier.

Weitere Informationen zur Struktur des Kerndatensatz Forschung und seiner Spezifikation

Der Kerndatensatz Forschung besteht aus aggregierten oder gruppierten Daten (sogenannten Kerndaten) aus unterschiedlichen thematischen Bereichen (Beschäftigte, Nachwuchsförderung, Drittmittel und Finanzen, Patente und Ausgründungen, Publikationen sowie Forschungsinfrastrukturen). Beispiele für Kerndaten des Bereichs Beschäftigte sind Vollzeitäquivalente und Anzahl Personen. Diese und weitere Kerndaten sollten Forschungseinrichtungen nach Implementierung der Kerndatensatzspezifikation zukünftig auf Anfrage an Datennutzer*innen weitergeben können. Kerndaten werden in der Regel – je nach Anforderungen des Berichts – gemäß spezifischen Ausdifferenzierungen und Aggregationsniveaus übermittelt. Beispiele für Ausdifferenzierungen zu den genannten Kerndaten sind Geschlecht und/oder Personalkategorie. Aggregationsniveaus beziehen sich – je nach Berichtsanforderung – auf die Aufschlüsselung der Kerndaten gemäß Fach oder Organisationseinheit. Es gibt verschiedene Kategorien von Kerndaten, Ausdifferenzierungen und Aggregationsniveaus: Der Kern umfasst die Bereiche und Elemente, die der Wissenschaftsrat für alle Forschungseinrichtungen im Wissenschaftssystem als relevant erachtet. Solche, die nur für spezifische Forschungseinrichtungen berichtsrelevant sind, werden als Elemente der sogenannten Schale gekennzeichnet. Bereiche und Elemente, die in einem zukünftigen Prozess zur Weiterentwicklung behandelt und ausdefiniert werden sollten, werden ebenfalls als solche benannt. Schließlich ist ersichtlich, welche Elemente nicht für den Kerndatensatz empfohlen werden.

Um den Forschungseinrichtungen eine Abschätzung in Hinblick auf den mit den aggregierten Daten einhergehenden Verarbeitungs- und Erhebungsaufwand zu erleichtern, wurde im abgeschlossenen Spezifikationsprojekt auch eine aus dem Kerndatensatz Forschung abgeleitete Basisdatenübersicht entwickelt. Diese Basisdaten sind allerdings nicht für die Weitergabe vorgesehen. Die Aggregat- und Basisdaten werden darüber hinaus in einem technischen Datenmodell dargestellt, dessen Elemente auf den europäischen CERIF-Standard (kurz für Common European Research Information Format) und damit z. B. gängigen Forschungsinformationssystemen abgebildet werden können. Die Architektur des Kerndatensatz Forschung sowie seine wesentlichen Inhalte (Aggregat- und Basisdaten, technisches Datenmodell) werden im Spezifikationsdokument (Spezifikation des Kerndatensatz Forschung – Version 1.0) dargestellt und erläutert.

Eine Übersicht der Kerndaten und anderer Elemente der Spezifikation (Ausdifferenzierungen und Aggregationsniveaus), ihre Definitionen und die Argumente für und gegen ihre Aufnahme in den Kerndatensatz finden sich in den Spezifikationstabellen. Die reduzierte Spezifikationstabelle umfasst die Aggregatdaten aus den Kategorien Kern und Schale, welche in unterschiedlicher Priorisierung für die Einführung empfohlen werden. Die ausführliche Spezifikationstabelle führt die Aggregatdaten aus den Kategorien Kern, Schale, Empfohlen für Weiterentwicklung sowie Nicht empfohlen auf.

Schließlich werden die Aggregat- und Basisdaten ebenfalls in einem technischen Datenmodell dargestellt, um die Implementierung der aktuellen Kerndatensatzspezifikation in institutionellen Forschungsinformationssystemen zu erleichtern.