Datum des Workshops: 28.06.2023
📋 Themen und Ablauf
Im Rahmen des Workshops wurden zunächst einige grundsätzliche Informationen zur Initiative “Stärkung von CRIS” wiederholt.
Anschließend wurden Erfahrungen und Fragen zu Schnittstellen und zu Datenimporten und -exporten bei der Verwendung von CRIS vorgestellt und diskutiert. Grundlage waren drei Präsentationen und eine Live-Demonstration der Schnittstelle zwischen GRIS und IDA.
Außerdem wurde eine Mentimeter-Umfrage zum fachlichen Hintergrund der Teilnehmenden, zu Erfahrungen der Einrichtungen mit dem (teil-) automatisierten Datenaustausch zwischen verschiedenen Systemen und zu existierenden bzw. für die Zukunft gewünschten Schnittstellen durchgeführt.
📚 Präsentationen und Dokumente
Die im Rahmen des Workshops präsentierten Folien finden Sie hier in einem PDF-Dokument:
Zum Workshop gab es vier Beiträge zum Thema “Schnittstellen: Datenimporte und -exporte”.
Nico Wende vom Leibniz-Zentrum für Archäologie (LEIZA) präsentierte in einer Live-Demonstration die Funktionsweise der Schnittstelle zwischen GRIS und IDA. Die gezeigte Schnittstelle zu IDA finden Sie in unserem Wiki dokumentiert:
Holger Heuser vom GESIS – Leibniz-Institut für Sozialwissenschaften lieferte ergänzend generelle Informationen zu den Möglichkeiten und Fallstricken bei Export- und Importvorgängen in ein bzw. aus einem CRIS.
Christoph Schweickhardt vom IfW - Kiel Institut für Weltwirtschaft berichtete zum Thema Schnittstellen und stellte den Fahrplan für die Implementierung eines integrierten CRIS am IfW vor.
Alisher Karabaev vom ZMO - Leibniz-Zentrum Moderner Orient hielt einen Vortrag zu Fragen der Integration von Repositorien mit CRIS.
Die Fragen und Ergebnisse der im Rahmen des Workshops durchgeführten Mentimeter-Umfrage finden Sie hier:
💡 Fragen und Antworten
Hier finden Sie einige im Verlauf des Workshops aufgeworfene Fragen und Antworten zum Thema “Schnittstellen: Datenimporte und -exporte bei CRIS”. Klicken Sie auf die Pfeilsymbole neben den Fragen, um die jeweiligen Antworten anzuzeigen.
❗ Über eine Schnittstelle (oder API = Application Programming Interface) kommunizieren unterschiedliche Arten von Software miteinander. So können Daten von einem Programm oder einer Datenbank in ein anderes Programm oder eine andere Datenbank übertragen werden. Je nach Konfiguration kann diese Datenübertragung vollautomatisiert (etwa zu festgelegten Zeitpunkten) oder teilautomatisiert erfolgen. Wenn verschiedene Programme über Schnittstellen miteinander kommunizieren und Daten austauschen, sind diese Programme „miteinander integriert“.
❗ Bei der Verwendung von CRIS sind automatische Datenübertragungen aus anderen oder in andere Programme in vielerlei Hinsicht möglich. Mögliche Datenübertragungen mittels Schnittstellen sind zum Beispiel:
- CRIS können Daten an die Website der Einrichtung übermitteln, damit z. B. Informationen zu Publikationen, Personen oder Projekten dort für die Öffentlichkeit verfügbar sind.
- CRIS können Daten aus der Personalsoftware der Einrichtung erhalten, um die jeweiligen Personen direkt im CRIS abzubilden und/oder als Nutzer/innen dort anzulegen. Nutzer/innen können auch über das Active Directory übernommen und in ein CRIS eingebunden werden.
- CRIS können Daten aus der Publikationssoftware oder der Literaturverwaltung der Einrichtung erhalten oder Daten an die Publikationssoftware übermitteln. Die Daten müssen dann nur in einer Software erfasst werden, sind aber in beiden verfügbar.
- CRIS können Daten aus der Finanzsoftware oder der Projektverwaltungssoftware der Einrichtung aufnehmen, um die jeweiligen Projekte ohne erneute manuelle Eingabe inklusive Informationen z. B. zum Budget oder zu Projektbeteiligten im CRIS anzulegen und auf dem jeweils aktuellsten Stand darzustellen.
- CRIS können Daten aus Online-Datenbanken (z. B. Publikationsdatenbanken oder die freie Datenbank OpenAlex) erhalten, um die im CRIS enthaltenen Datensätze anzureichern und zu ergänzen oder Datensätze zu neu veröffentlichten Publikationen im CRIS anzulegen.
- CRIS können Daten zu Forschenden von ORCID erhalten, um die im CRIS enthaltenen Datensätze anzureichern und zu ergänzen oder zusätzliche Leistungsdaten von Forschenden aus vergangenen Zeitabschnitten zu übernehmen.
- CRIS können Daten aus dem Repositorium der Einrichtung erhalten oder Daten an ein Repositorium übermitteln. Diese Daten müssen dann nur in einer Software erfasst werden, sind aber in beiden verfügbar.
- CRIS können im Rahmen der Paktabfrage Daten an das IDA-System der Geschäftsstelle übermitteln. Aktuell ist eine solche Datenübertragung aus dem Forschungsinformationssystem GRIS heraus möglich. Weitere Informationen zu diesem Thema finden Sie hier.
❗ Die Integration von CRIS mit anderer Software führt zu höherer Effizienz, da hierdurch Daten, die bereits an anderer Stelle in der Einrichtung (oder online) vorliegen und dort gepflegt werden, nicht erneut manuell in das CRIS oder in andere Software aufgenommen werden müssen. Solange die Daten in einem standardisierten Format vorliegen und die Schnittstelle entsprechend konfiguriert ist, kann auch eine sehr große Zahl von Datensätzen innerhalb sehr kurzer Zeit in ein CRIS aufgenommen oder von einem CRIS an andere Software übergeben werden. Die Datenübertragung ist auf diese Weise nicht nur schnell, sondern in der Regel auch fehlerfrei, da z. B. Tipp- oder Übertragungsfehler ausgeschlossen sind.
Schnittstellen haben auch organisatorische Vorteile, da mit ihrer Hilfe komplexere Abläufe konsolidiert, vereinfacht und standardisiert werden können, was zu mehr Klarheit und Stringenz in Arbeitsprozessen führt. Insgesamt sind Schnittstellen ein sehr wichtiges Werkzeug der Digitalisierung, da nur hierüber die Möglichkeiten einer digitalen Datenhaltung, -auswertung und -nutzung vollständig ausgeschöpft werden und Synergien erzeugt werden können. In erster Linie tragen Schnittstellen somit zur Arbeitserleichterung, -organisation und Effizienzsteigerung bei.
❗ Prinzipiell sind Standards für Datenimporte und -exporte sehr wichtig. Schwierigkeiten können insbesondere entstehen, wenn:
- Daten nicht in standardisierten Strukturen vorliegen oder z. B. nur als unstrukturierte Daten (Fließtext) verfügbar sind
- Keine kontrollierten Vokabulare verwendet werden (z. B. bei Ländernamen, wenn in verschiedenen Datenbanken das gleiche Land einmal als „Vereinigte Staaten“ und einmal als „USA“ bezeichnet wird)
- Numerische Konventionen bei Datums- oder Währungsangaben fehlen
- Personen aufgrund von Namensgleichheit, uneinheitlich verwendeten Zweitnamen oder aufgrund eines Namenswechsels nicht eindeutig identifizierbar sind (hier kann die Nutzung eindeutiger persistenter Identifikatoren wie ORCID sehr hilfreich sein)
- Sonderzeichen und Umlaute von den beteiligten Systemen nicht korrekt interpretiert werden, da sie unterschiedliche Zeichenkodierungen verwenden
Während Standardisierung allgemein sehr hilfreich ist, können sich dennoch Herausforderungen ergeben, wenn verschiedene Systeme verschiedene Standards verwenden. Daher muss die Konvertierung von Daten aus einem Standard in einen anderen Standard, der für den Import in das Zielsystem benötigt wird, möglich sein. Verschiedene Standards sollten somit stets auf einen „neutralen“ Standard gemappt (abgebildet) sein, um solche Konvertierungen zu erlauben.
❗ Das Mapping von Daten spielt bei der Übergabe von Informationen zwischen Programmen über eine Schnittstelle eine wesentliche Rolle. Damit verschiedene Programme ihre Daten über eine (gemeinsame) Schnittstellen austauschen können, müssen die jeweiligen Standards der Datenverwaltung aufeinander abgebildet (gemappt) werden. Dabei werden die Systematiken beider Programme bzw. Systeme kontrolliert ineinander übersetzt. Oft bieten Quellsysteme bestimmte Standards des Exports (in weit verbreiteten Dateiformaten wie z. B. CSV oder XML), über die man zunächst einen Report erzeugen kann. So können Aufgaben der Konvertierung (Datenumwandlung beim Export aus dem einen Programm) von Fragen des Imports in das nächste Programm getrennt werden. Der Import muss dann nicht verschiedene Sprachen beherrschen, sondern der Vorgang kann sich auf einen etablierten Standard konzentrieren. Für den Datenaustausch zwischen zwei Systemen ist es somit eine Voraussetzung, dass der Export aus dem Quellsystem und der Import in das Zielsystem auf den gleichen Standard gemappt sind.
❗ Schnittstellen können nur ihr volles Potential entfalten, wenn sie sorgfältig programmiert und konfiguriert werden, und wenn insgesamt planmäßig und durchdacht vorgegangen wird. Besonders beachtet werden sollte bei der Einführung und Nutzung von Schnittstellen z. B.:
- Import von Altdaten: Wenn neue Systeme eingeführt werden, sollen häufig bereits vorliegende Daten aufgenommen werden. Solche Daten können viele Jahre alt sein, an verschiedenen Stellen in verschiedenen Dateien und in uneinheitlichen Strukturen vorliegen. Ein automatischer Import solcher Altdaten ist nur möglich, wenn sie zuvor in ein einheitliches Format konvertiert werden, was – abhängig von der jeweiligen Datenlage – sehr großen Aufwand bedeuten kann. In diesem Fall ist abzuwägen, ob die Kosten für die Programmierung der erforderlichen Importskripte möglicherweise höher wären als die Personalkosten für eine manuelle Aufnahme der Daten (oder Teilen von diesen).
- Insbesondere wenn ein neues “leeres” CRIS per Import erstmalig mit Daten bestückt werden soll, ist ein Migrationsplan zentral, der Prioritäten festlegt: Welche der Altdaten sind (z. B. vom Typus, von der Chronologie / dem Alter her) am wichtigsten bzw. müssen eine besondere Qualitätssicherung erfahren? An welchen Stellen kann ein Abbruchkriterium festgelegt werden? Dieses Kriterium besagt, bei welcher Abdeckung (Qualität des Imports) darauf verzichtet wird, den automatisierten Import weiter zu verbessern. Stattdessen sollte man sich dann darauf konzentrieren, die wichtigsten Daten manuell weiter zu ergänzen und sie zu streamlinen. Grundsätzlich kann die Datenqualität im Zielsystem nicht höher sein als sie im Quellsystem war. Die fragwürdige Datenqualität und ein schwankender Standard von Altdaten wird in der Regel erst auffällig, wenn diese Daten in ein System übernommen werden sollen, das hier höhere Anforderungen an die Erfassung stellt.
- Um die doppelte Aufnahme gleicher Daten zu vermeiden, sollte eine automatische Duplikaterkennung erfolgen. Eine solche Duplikaterkennung kann nur dann vollständig automatisiert werden, wenn die Prüfung anhand vollkommen eindeutiger Merkmale erfolgt (bei Personen z. B. anhand von ORCID-IDs anstelle von Vor- und Nachnamen). Wenn dies nicht möglich ist, sollten mögliche Duplikate zwar automatisch identifiziert, aber immer auch manuell bestätigt werden müssen, um Fehler bzw. Datenverluste zu vermeiden.
- Bei Export- und Importvorgängen kann es je nach Konfiguration prinzipiell zu gewissen Datenverlusten kommen. Daher sollten Qualitätsmanagementworkflows definiert und zeitnah umgesetzt werden. Beim Import von Altdaten können die importierten Daten manuell manchmal besser an einen festgelegten Qualitätsstandard herangeführt werden, insbesondere solange die Altsysteme noch verfügbar sind.
- Der automatische Import von personenbezogenen Daten in ein CRIS kann je nach Einrichtung möglicherweise kritisch gesehen werden. Hierzu sollte auf jeden Fall eine frühzeitige Kommunikation mit der Personalvertretung und dem/der Datenschutzbeauftragten stattfinden.
- Wenn Daten über Schnittstellen in mehreren verschiedenen Systemen enthalten sind, muss festgelegt werden, welches System für welchen Datentyp jeweils „führend“ ist. Im führenden System erfolgt die Dateneingabe, -aktualisierung und -pflege. Sollten sich Einträge zwischen verschiedenen Systemen widersprechen, ist der Eintrag im jeweils führenden System maßgeblich.
- Nachträgliche Änderungen von Prozessen und Standards können bei der Nutzung von Schnittstellen komplexer werden, da die Kompatibilität mit den Schnittstellen erhalten bleiben muss bzw. Aktualisierungen erforderlich sind.
- Schnittstellen sollten bei der Einführung neuer Systeme möglichst frühzeitig mitgedacht werden, um sicherzustellen, dass die jeweilige Systemarchitektur der späteren Einrichtung von Schnittstellen nicht entgegensteht. Auf die Unterstützung bereits existierender und verbreiteter Standards des Exports sollte deshalb geachtet werden.
Falls Sie noch Fragen haben, zu denen Sie die Antwort hier nicht finden konnten, schreiben Sie uns gerne eine Nachricht an cris@leibniz-gemeinschaft.de.