Möglichkeiten der Recherche und Auswertung am Beispiel der bibliometrischen Datenbank “Dimensions”
Datum des Workshops: 07.11.2023
đź“‹ Themen und Ablauf
Im Rahmen des Workshops wurden zunächst einige grundsätzliche Informationen zur Initiative “Stärkung von CRIS” wiederholt.
Anschließend wurden anhand von drei Präsentationen und Live-Demos die Inhalte, Funktionsweise und Möglichkeiten der Nutzung für die wissenschaftliche und wissenschaftsunterstützende Arbeit der bibliometrischen Datenbank “Dimensions” vorgestellt und diskutiert.
AuĂźerdem wurde eine Mentimeter-Umfrage zum fachlichen Hintergrund der Teilnehmenden und zu Erfahrungen mit und Erwartungen an bibliometrische Datenbanken und digitale Forschungsinformationen durchgefĂĽhrt.
📚 Präsentationen und Dokumente
Die im Rahmen des Workshops präsentierten Folien finden Sie hier in einem PDF-Dokument:
Zum Workshop gab es drei Beiträge zur bibliometrischen Datenbank “Dimensions”.
Jekaterina Zotz-Wilson und Ben McLeish von Digital Science & Research Solutions Ltd. gaben allgemeine, übergreifende Informationen zu “Dimensions” und zu möglichen Nutzungsszenarien.
Dr. Anja Görnitz und Dr. Gabriel Sollberger aus der Geschäftsstelle der Leibniz-Gemeinschaft informierten über die Nutzung von “Dimensions” in der Geschäftsstelle.
Ralf Toepfer von der ZBW – Leibniz-Informationszentrum Wirtschaft berichtete über die Nutzung von “Dimensions” im Rahmen des Sondertatbestands “Neuartige Wege für die digitale Literaturversorgung - Strategische Transformation der ZBW im Rahmen der Digitalisierung der Wissenschaft”
Die Fragen und Ergebnisse der im Rahmen des Workshops durchgefĂĽhrten Mentimeter-Umfrage finden Sie hier:
đź“— Literaturhinweise
- Stephan Stahlschmidt, Mitarbeiter des Kompetenznetzwerkes Bibliometrie (an dem auch fünf! Leibniz-Einrichtungen beteiligt sind), und Dimity Stephen vergleichen in ihrem Aufsatz “Comparison of Web of Science, Scopus and Dimensions databases” die Datenbasis und unterschiedliche Abdeckung der Forschungsdisziplinen der großen kommerziellen bibliometrischen Datenbanken. Obwohl der Artikel bereits Oktober 2020 erschienen ist (und damit nicht den aktuellen Stand beschreibt), zeigt er doch die entscheidenden Fragestellungen auf.
đź’ˇ Fragen und Antworten
Hier finden Sie einige im Verlauf des Workshops aufgeworfene Fragen und Antworten zu den Themen “Potentiale vernetzter digitaler Forschungsinformationen” und “bibliometrische Datenbanken”. Klicken Sie auf die Pfeilsymbole neben den Fragen, um die jeweiligen Antworten anzuzeigen.
❗ Durch die Vernetzung digitaler Forschungsinformationen ergeben sich vielfältige Möglichkeiten zur Darstellung und Auswertung. Mit „Vernetzung“ ist hier gemeint, dass z. B. Verknüpfungen zwischen Informationen zu Forscher*innen und ihren Publikationen und Projekten bestehen bzw. hergestellt werden, oder zwischen Projekten und den daraus hervorgegangenen Publikationen, den jeweiligen Förderinstitutionen, den federführenden und den jeweils kooperierenden Institutionen usw. Durch diese Verknüpfungen lassen sich Netzwerke und Beziehungen zwischen Personen, Werken, Institutionen, Projekten usw. abbilden und sowohl maschinell als auch manuell nachverfolgen.
Außerdem kann zusätzlich auch eine (automatisierte oder manuelle) Verknüfung bzw. Anreicherung der Daten nach übergreifenden Themen oder Konzepten erfolgen, z.B. eine Verschlagwortung nach Forschungsfeldern oder nach den Sustainable Development Goals (SDGs).
Auf diese Weise kann z. B. schneller ein Überblick über die Aktivitäten in bestimmten Forschungsfeldern oder über die Beteiligungen von Institutionen und Forscher*innen an bestimmten Publikationen oder Projekten gewonnen werden. So ergeben sich auch Auswertungsmöglichkeiten, die ohne diese Verknüpfungen nicht bestünden. Insgesamt macht die Vernetzung digitaler Forschungsinformationen es leichter, Fragen zu beantworten, die aus systematischer Sicht an Forschungsinformationen gestellt werden können.
❗ Forschungsinformationen müssen gesammelt und dargestellt und Vernetzungen müssen erzeugt und gepflegt werden. Dies ist z. B. mittels weitestgehender Automatisierung möglich. Hierfür eignen sich bibliometrische Datenbanken, die Forschungsinformationen automatisch aus verschiedenen Quellen abrufen (z. B. von Verlagen, von CrossRef, von Förderinstitutionen, von Patentdatenbanken usw.), diese Forschungsinformationen aufbereiten und anreichern und die dazwischen bestehenden Beziehungen herausstellen.
Insgesamt ist zu beachten:
- FĂĽr die einfache Auffindbarkeit und Interpretation von Forschungsinformationen sind Standardisierungen erforderlich (z. B. die Kategorisierung von Publikationen nach Publikationstypen sowie nach wissenschaftlichen Fachbereichen).
- Verknüpfungen auf Datensätze können unzuverlässig sein oder veralten, wenn bei der Ablage der Datensätze keine persistenten Identifikatoren (PIDs) verwendet wurden. PIDs helfen, Datensätze eindeutig zu kennzeichnen und ontologisch korrekt zu kategorisieren. Weitere Informationen zu persistenten Identifikatoren finden Sie auf der Website des PID Network Deutschland.
- Bei der Arbeit mit digitalen vernetzten Forschungsinformationen ist es in der Regel wichtig, sich auf die Daten verlassen zu können. Sie müssen also möglichst korrekt, aktuell und vollständig sein.
- Da vernetzte digitale Forschungsinformationen sehr vielfältige Möglichkeiten bieten und sehr umfangreich sind, kann die Fülle an Daten, Filtermöglichkeiten und Verknüpfungen auf den ersten Blick verwirrend sein. Hier hilft es, sich auf eine konkrete Fragestellung zu konzentrieren und strukturiert vorzugehen.
❗ Die Nutzung bibliometrischer Datenbanken bietet eine Vielzahl von Möglichkeiten, Informationen schnell und (teil-)automatisiert zu erhalten und darzustellen. Beispiele sind:
- Über die Forschungsleistungen der eigenen Institution lässt sich schnell ein Überblick gewinnen.
- Die Publikationslage zu bestimmten Themen kann schnell überschaubar dargestellt werden. Dabei lässt sich auch nach Publikationsarten filtern (Green Open Access, Gold Open Access, andere Arten von Open Access, Closed Access…)
- Über erweiterte Suchfunktionen können Ergebnisse für die Beantwortung ganz konkreter Fragestellungen weiter eingeschränkt werden (z. B. die bei bestimmten Verlagen erschienenen Publikationen zu bestimmten Forschungsthemen zur Vorbereitung von Preis- und Konditionsverhandlungen mit diesen Verlagen)
- Fachliteratur kann schnell gefunden werden.
- Institutionen können identifiziert und anhand verschiedener Parameter miteinander verglichen werden (Benchmarking).
- Einträge verweisen auf ähnliche Einträge (zum Beispiel kann Grant A auf Grant B verweisen, wenn in den Projekten ähnliche Themen bearbeitet werden), sodass auch zuvor unbekannte Forschungsleistungen schnell gefunden werden können.
- Durch die vielfältigen Suchmöglichkeiten in bibliometrischen Datenbanken lassen sich schnell mögliche, fachlich geeignete Kandidat*innen für die Begutachtung von Anträgen oder für Mitgliedschaften in Gremien mit spezialisierten Aufgabenstellungen finden.
- Bibliometrische Datenbanken können ihrerseits als automatisierte Datenquellen dienen; über entsprechende Schnittstellen können Daten z. B. in institutionseigene Forschungsinformationssysteme übertragen werden.
❗ Je nach Datenbank können die Möglichkeiten der Datenausgabe im Detail unterschiedlich sein. Insgesamt gibt es aber einige übliche Wege.
- Nutzung der Weboberfläche: Wenn über einen Browser auf eine bibliometrische Datenbank zugegriffen wird, werden die Daten meist direkt im Browser angezeigt und dargestellt.
- Datenexport: Normalerweise bieten bibliometrische Datenbanken Möglichkeiten, über die Weboberfläche angezeigte Daten in herunterladbare Dateien zu exportieren, z. B. im Excel- oder im csv-Format.
- Schnittstellen (API): Wenn eine bibliometrische Datenbank eine Schnittstelle zur Datenausgabe anbietet, können Daten auch direkt unter Verwendung einer Abfragesprache über die Schnittstelle ausgegeben werden. Diese Daten können dann z. B. automatisiert in Dateien oder auch in andere Programme übertragen werden, die solche Abläufe unterstützen (z. B. Forschungsinformationssysteme).
❗ Während bibliometrische Datenbanken vielfältige Funktionen bieten und in vielerlei Hinsicht die Arbeit erleichtern können, sollten einige Dinge beachtet werden:
- Abdeckung: Es kann nicht davon ausgegangen werden, dass bibliometrische Datenbanken ausnahmslos sämtliche Forschende, Institutionen, Projekte und Forschungsleistungen erfassen. Bibliometrische Datenbanken erhalten ihre Daten aus unterschiedlichen Quellen, wobei keine Datenquelle absolut vollständig und verlässlich ist. Wenn Forschungsinformationen online in den einschlägigen Datenquellen nicht vorliegen, können sie auch nicht in bibliometrische Datenbanken übertragen und dort dargestellt werden. Dabei kann es verschieden Gründe für unvollständige Datenquellen geben. Ein Grund können z. B. unterschiedliche Publikationskulturen in den Wissenschaftsbereichen sein. So besteht die Tendenz, dass Publikationsleistungen aus den Geistes- und Sozialwissenschaften in bibliometrischen Datenbanken eher weniger vollständig als Lebens-, Natur- und Ingenieurwissenschaften abgebildet werden. Dieser Umstand ist seit längerer Zeit bekannt, weshalb die DFG in einem Positionspapier auch hierzu Stellung genommen hat: https://www.dfg.de/service/presse/pressemitteilungen/2022/pressemitteilung_nr_15/ Generell ist es sehr schwierig, den Grad der Abdeckung bestimmter Wissenschaftsbereiche zuverlässig festzustellen, da die Grundgesamtheit sämtlicher in diesen Bereichen erbrachten Forschungsleistungen in der Regel nicht bekannt ist. Je nach Verwendungszweck der gesuchten Daten ist zu entscheiden, wie wichtig Korrektheit und Vollständigkeit sind.
- Lizenzen: Kostenpflichtige bibliometrische Datenbanken bieten meist verschiedene Lizenzmodelle an, über die unterschiedliche Funktionen genutzt werden können. Vor dem Kauf einer Lizenz sollte man sich darüber bewusst sein, welche Funktionen darin enthalten und welche nicht enthalten sind, damit man genau das Produkt einkauft, welches man tatsächlich benötigt. Im Vorfeld sollten daher in Zusammenarbeit mit dem Anbieter möglichst viele Informationen über die Datenbank und die verfügbaren Lizenzen gewonnen werden. Zu diesem Zweck können in der Regel vom Anbieter auch kostenlose Testzugänge bereitgestellt werden, die nach einer gewissen Zeit ablaufen.
- Kategorisierung: Wenn die Kategorisierung von Forschungsleistungen in bibliometrischen Datenbanken automatisiert erfolgt (z. B. nach Publikationstypen und nach Wissenschaftsbereichen), muss davon ausgegangen werden, dass die Zuordnung nicht in absolut allen Fällen korrekt erfolgt. So kann es z. B. vorkommen, dass Forschungsleistungen, bei denen es sich eigentlich um Conference Papers oder Preprints handelt, als Journal Articles klassifiziert werden. Auch bei insgesamt hoher Datenqualität sind Fehlzuordnungen nicht zu vermeiden.
- Bedienbarkeit: Für die effiziente Arbeit mit bibliometrischen Datenbanken sind Kenntnisse darüber erforderlich, welche Möglichkeiten die Datenbank für den Abruf und die Darstellung von Daten bietet. Während Weboberflächen in der Regel relativ einfach und intuitiv bedienbar sind, kann die Nutzung von Schnittstellen oder erweiterten Funktionen etwas mehr Einarbeitungszeit erfordern.
❗ Aktuell ist noch nicht geklärt, wie viele Leibniz-Einrichtungen für eine solche Lizenz tatsächlich Verwendung hätten und ob sich ein solches Vorhaben lohnen würde. In der Leibniz-Geschäftsstelle wird die Datenbank Dimensions eingesetzt. Wenn Sie Interesse an der Nutzung von Dimensions in Ihrer Leibniz-Einrichtung haben, melden Sie sich bitte bei der Geschäftsstelle unter cris@leibniz-gemeinschaft.de.
âť— Zu diesem Thema wurde Einiges publiziert. Einige Beispiele (insbesondere solche, die Dimensions betreffen), finden Sie hier:
- Vergleich der Abdeckung von OA-Publikationen in Dimensions und Web of Science: https://doi.org/10.1371/journal.pone.0265545
- Vergleich der Fächerabdeckung in Dimensions, Scopus und Web of Science: https://www.bibliometrie.info/downloads/Dimensions_Forschungspool_FZJ_Update20210329.pdf
- Trainingsdatensets fĂĽr die automatische Zuordnung von SDG-Kategorien: https://figshare.com/articles/dataset/Keywords_and_search_strings_for_generating_SDG_training_sets/17294255
- Liste der in Dimensions erfassten Förderer (benötigt einen Dimensions-Zugang): https://app.dimensions.ai/datasources
Falls Sie noch Fragen haben, zu denen Sie die Antwort hier nicht finden konnten, schreiben Sie uns gerne eine Nachricht an cris@leibniz-gemeinschaft.de.