Skip to main content

Frequently Asked Questions

Forschungsdaten allgemein
Sekundärnutzung oder Sekundäranalyse von Forschungsdaten ist eine aus der Marktforschung stammende Forschungsstrategie, bei der die vom Primärforscher erhobenen,  der Öffentlichkeit zur Verfügung gestellten Daten für eine erneute Analyse wiederverwendet werden.

Dabei können die Daten für die Beantwortung der neuen Fragestellung komplett oder ergänzend zur eigenenen Datenerhebung benutzt werden. Die benutzten Daten werden in den meisten Fällen für abgewandelte Fragerstellungen in einem neuen Forschungskontext ausgewertet und dann neu interpretiert.

Maßgebliche nationale und internationale Drittmittelgeber (z.B. DFG, JISC, NSF) fordern von den Forschenden verbindliche Aussagen über den Umgang mit Forschungsdaten im Projektverlauf. Konkret bedeutet es für den einzelnen Forschenden, dass bereits beim Einwerben von Dritt- und Fördermitteln eine Darlegung, wie mit den im Projekt zu erwartenden Forschungsdaten umgegangen wird, notwendig ist.

Ein „Data Management Plan“ (DMP), der seit 2010 einen verpflichtenden Charakter hat und jedem Antrag auf Fördermittel vorgelegt werden muss, ist ein Dokument welches Aspekte des Datenmanagements bereits zu Beginn der Forschungsarbeit formal definiert.


Weitere Links zu den Richtlinien der Forschungsförderer:

Die Universität Bielefeld ist auf diese neuen Rahmenbedingungen seitens der Forschungsförderer vorbereitet, indem sie unter anderem Richtlinien für den Umgang mit Forschungsdaten verbreitet und Empfehlungen für die Erstellung eines Data Management Plans gibt.

Weitere Informationen zum DMP: Data Management Planning
Ein optimales Forschungsdatenmanagement sollte nicht nur Konzepte und Lösungen für auf eine einzige Momentaufnahme der in der Forschungsarbeit generierten Daten zugeschnitten sind (z.B. den Zeitpunkt, an dem ein Datensatz zur Archivierung übergeben wird) sondern über alle Phasen des Forschungsprojektes und über diese Zeit hinaus greifen.
 
Der Datenlebenszyklus ist für jede Fachdisziplin abhängig von der jeweiligen gültigen Forschungspraxis gesondert zu definieren.

Im Allgemeinem kann man jedoch sagen, dass die folgenden Phasen in jeder Fachdisziplin wiederauffindbar sind:

  • Antragstellung
  • Vorbereitung/Datenerhebung/Dokumentation
  • Datenanalyse/Auswertung
  • Aufbereitung und Dokumentation für Weitergabe
  • Archivierung
  • Data Curation
Forschungsdatenmanagement (FDM) ist ein sehr junges innovatives Arbeitsfeld an der Hochschule, an dem die Universität, die Bibliothek und weitere zentrale Dienstleistungseinrichtungen involviert sind.

Hierbei werden Services und Dienstleistungskonzepte zum Management von Forschungsdaten entwickelt und in bestehende Infrastrukturen integriert.


Dazu sind spezialisierte Pilotprojekte notwendig, in denen die Arbeitsweisen der Wissenschaftlerinnen und Wissenschaftler analysiert und aus denen generalisierte Anforderungen abgeleitet werden können.

 
  • So hat die Universitätsbibliothek im Rahmen des SFB882-INF Projektes mit dem Aufbau einer Kollaborations- und Forschungsumgebung für den gesamten SFB begonnen.
  • In Kooperation mit zentralen Diensten der Universität, wie dem BIS und dem Rechenzentrum, aber auch mit wissenschaftlichen Einrichtungen wie dem CITEC, werden Konzepte der Datenarchivierung und Dokumentation umgesetzt und in die vernetzte Informationsinfrastruktur der Hochschule eingebunden.
  • Zu weiteren Angeboten für das Forschungsdatenmanagement zählt die Beratung bei der Verarbeitung geeigneter Daten- und Metadatenformate, Publikation von Datensätzen und Unterstützung bei der Erstellung von "Data Management Plänen" für zukünftige Forschungsvorhaben.
Forschungsdaten im weitesten Sinne Primärdaten, Sekundäranalysen, Visualisierungen, Modelle, Analysewerkzeuge, Objektsammlungen oder Produkte, die während des wissenschaftlichen Arbeitsprozesses erzeugt und benutzt werden.
Forschungsdatenregistrierung

Research data is registered and published as a special publication type "Research Data" in the institutional repository PUB.
 

Create a data publication

After login into PUB, you can choose the option "Add new Publication". As one of several publication types, you'll find the "Research Data" option in the list.
 

Anlegen eines Datensatzes mit vorhandenem DOI (DOI-Fetch)

Wenn Sie bereits eine DOI (Digital Object Identifier) für Ihren Datensatz haben, geben Sie diesen im DOI Feld ein und wir holen alle zugehörigen Daten von DataCite und füllen das Eingabeformular für Sie aus. Sie können dann noch Ergänzungen machen, Dateien hinzu fügen oder Änderungen durchführen, bevor Sie Ihren Datensatz abspeichern oder freigeben.


 

Anlegen eines Datensatzes ohne DOI

Wenn sie keine DOI haben, gelangen Sie über den Button "fill out the empty form yourself" direkt zu einem leeren Eingabeformular. In diesem Fall wird bei Veröffentlichung im PUB-System automatisch eine DOI vergeben und Ihre Daten bei DataCite registriert.


Dateien anhängen

Sie können Ihren Metadatensatz per Drag & Drop mit Forschungsdaten anreichern, die direkt bei uns auf dem PUB-Server gespeichert werden. Angehängte Dateien werden nach Veröffentlichung des Metadatensatzes auf der Frontdoor verlinkt und in einem eigenen Reiter näher beschrieben.

 

Verlinkung zu Publikationen

Wenn Ihr Forschungsdatensatz in einer Publikation referenziert wurde, können Sie die beiden Datensätze miteinander verknüpfen. Nach Veröffentlichung wird auf der Frontdoor des Forschungsdatensatzes dann ein Reiter mit Link und Informationen zu zitierenden Publikationen angezeigt und auf der Frontdoor der Publikation ein jeweiliger Reiter mit Link zum Forschungsdatensatz.


 

Speichern und Veröffentlichen

Nach Eintragung bzw. Ergänzung und Korrektur aller Daten im Eingabeformular können Sie den Datensatz entweder abspeichern, ohne ihn zu veröffentlichen (z.B. für späteres Bearbeiten), dies geschieht über den Button "Save".

Oder Sie können den Datensatz direkt zur Veröffentlichung freigeben (über den Button "Publish"). Bei Klick auf "Publish" wird der Datensatz gespeichert und als "submitted" gekennzeichnet. Nach einer Qualitätsüberprüfung durch die Universitätsbibliothek wird er veröffentlicht. Sie erhalten dann eine Email-Bestätigung.


Die in PUB zu archivierenden Daten können zum Zeitpunkt der Registrierung mit einer Embargo Frist versehen werden. Diese ermöglicht die Publikation der Daten mit zeitlich verzögerten Zugriffsrechten für Dritte. Das räumt wiederrum Ihnen als Primärproduzent der Daten das Recht ein, die Daten als Erster auszuwerten und zusätzliche Publikationen mit Hilfe dieser Daten anzufertigen.

Die Embargo Frist kann maximal 2 Jahre betragen.
Bevor Sie Ihre Forschungsdaten der Öffentlichkeit zur Verfügung stellen, sollten Sie eine Entscheidung über die zu vergebene Lizenz treffen. Die Lizenz definiert u.a. was andere Wisseschaftler mit Ihren Forschungsdaten tun dürfen und was nicht.

Für Daten gibt es die folgenden Lizenzarten:

 

Im August 2012 hat die Universität Bielefeld die Rolle des „Publication Agent“ gegenüber DataCite eingenommen und ermöglicht die institutionelle, disziplinübergreifende Registrierung von Forschungsdaten. Die dabei vergebenen DOIs ermöglichen die Persistierung, Zitierfähigkeit und Wiederverwendung von Forschungsdaten.
 
Dieser Dienst komplementiert bestehende disziplinspezifische Angebote und verbessert die Transparenz des Forschungsoutputs der gesamten Universität.

DataCite ist ein internationales Konsortium, das sich zum Ziel gemacht hat, einen einfachen Zugang zu wissenschaftlichen Forschungsdaten zu ermöglichen, die Akzeptanz von Forschungsdaten als legitime und zitierfähige Beiträge der wissenschaftlichen Forschung zu erhöhen und die Archivierung von Forschungsdaten zu unterstützen, um Transparenz und nachhaltige Nutzung für die Forschung zu gewährleisten.[1][2]

[1] DOI-Registrierungsagentur: Kooperation mit der DOI-Registrierungsagentur.

[2] Working Paper Series of the German Data Forum (RatSWD): Working Paper No. 149, Rat für Sozial- und Wirtschaftsdaten (RatSWD).

 

Die Auswahl der Daten, die aufgehoben, archiviert und registriert werden und welche nicht, sollte in einer nachvollziehbarer Weise und nach Regeln erfolgen, die von den im Forschungsprozess involvierten Forschenden aufgestellt werden.

Bei der Selektion wird darüber entschieden, ob die zur Registrierung vorgeschlagenen Daten "registrierwürdig" und "registrierfähig" sind. Diese beiden Eigenschaften treffen auf den Datensatz zu, wenn die Relevanzkriterien in einem angemessenden Umfang erfüllt sind.

Registrierwürdigkeit:

  • Nachweis der guten wissenschaftlichen Praxis, wenn z.B. die Daten Grundlage einer Publikation sind,
  • Nachnutzung: Die Daten sind wichtig für spätere Forschung,
  • Auflagen (von Forschungsförderern) und Selbstverpflichtung,
  • Dokumentation: Die Daten sind gesellschaftlich relevant, z.B Grundlage einer politischen Entscheidung,
  • Weitere formale Qualitätskriterien, wie z.B. Rohdaten.

Registrierfähigkeit:

Registrierfähig sind Daten, wenn die technischen Voraussetzungen für ihre Publikation und Archivierung erfüllt sind. Hierzu sollte man sich z.B. für ein geeignetes Datenformat (gemäß der Richtlinien für Langzeitarchivierung) entscheiden und eine Dokumentation in dem jeweils in der Fachdisziplin gängigem Metadatenformat vorhemen.

Durch die Veröffentlichung und Bereitstellung von Forschungsdaten haben Sie als Forschender eine Reihe von Vorteilen:

  • Verfügbarkeit und Interpretierbarkeit der Daten. Dadurch wird die eigene Forschung sichtbarer und transparenter. Die langfristige Verfügbarkeit der Forschungsdaten ist im Sinne aktueller Anforderungen der Förderer.
  • Eine Datenpublikation (d.h. Veröffentlichung von Forschungsdaten) zählt in den meisten wissenschaftlichen Disziplinen als eigenständige Publikation. Die Forschungsdaten selbst und ihre Metadaten werden ebenfalls in PUB als eigenständige Veröffentlichung anerkannt und können analog zu klassischen Publikationen in die eigene Publikationsliste aufgenommen werden.
  • Möglichkeit der Verlinkung von Publikationen mir der Datenpublikation. In Publikationen enthaltene DOI-Namen ermöglichen eine elegante Verlinkung zwischen einem wissenschaftlichen Artikel und den dort analysierten Forschungsdaten.

Persistent Identifier (wie z.B. DOI) sind eindeutige Bezeichner für digitale Objekte. Sie bleiben über den gesamten Daten-Lebenszyklus hinweg mit den Objekten verbunden und haben die Funktion, die Objekte auf Dauer und unabhängig vom Ort der Speicherung zu identifizieren.

In der Praxis bedeutet dies, dass
 
  • die Referenzierung und ein Wiederauffinden der Daten,
  • ihre Verknüpfung sowohl mit Datenproduzenten und als auch
  • mit wissenschaftlichen Publikationen
dauerhaft und verlässlich möglich ist.
 

Weitere interessante Links:

[1] DataCite | International Consortium for data citation

How can I register my research data using PUB?

The cases, data can be registered, published, or made visible with PUB are:

  • your data has not been published or registered yet,
  • your data has been already registered and published with other external repositories (e.g. in one repository listed on re3data.org), so you can make this data visible by entering the DOI of your data. The metadata is fetched and imported automatically into PUB.

PUB repository registers data with DataCite registry (datacite.org) using the DataCite XML. Thus, at a minimum, the mandatory properties of the DataCite metadata schema must be provided (and in case data is uploaded: licensing information) at the time of research data registration, otherwise data is not accepted by the system. To promote data discovery, submitters may also choose to use several optional properties to identify their data more clearly. For example:

- properties allowing for flexible description of the resource (abstract),
- relationships to other resources (or versions),
- license information,
- keywords, etc.

In addition, the data package can be linked to persons, projects, working fields and publications.

Screenshot of metadata entry during the data submission process:

Metadaten Standards
Metadaten sind Daten, welche Daten beschreiben. Eine umfangreiche Datendokumentation ist für die Nachnutzung und Verständnis der Forschungsdaten nötig. Es gibt zahlreiche fachdisziplinspezifische Metadatenstandards die der standardisierten (und maschinen-lersbaren) Beschreibung der Daten dienen und dadurch

  • Data Discovery
  • Identifikation der Daten
  • Verknüpfung der Daten (z.B. mit Publikationen)
  • Qualitätssicherung und Datenvalidierung

ermöglichen.

Hier finden Sie einige Beispiele von Metadaten-Standards zur Beschreibung von Forschungsdaten, bzw. des Datenlebenszyklus:

Disziplin

Metadaten-Standard

Humanities

Geospatial Data

Sozialwissenschaften

Scientific Data

  • CCLRC Scientific Data Model

Multimediale Inhalte

Registration of Research Data

The mission of PUB is to promote data sharing and re-use of data and to keep data carried out by the University's research available to the public. Thus, we encourage our researchers to publish data with the Open Database Licenses:

For instructions on how to apply the licenses to your material please see each license’s home page.

Other licenses:

Please contact the the RDM contact person to assign special licenses, like Creative Commons or GPL to your data.

PUB will accept any file formats, but we encourage you to submit your data in open file formats. Open file formats are less likely to become obsolete in the future and make your data more accessible to others, who might not have the proprietary software needed to open or interpret the files.

We highly encourage you to consider the following recommendations:

  • if possible, submit your data in nonproprietary formats (open file formats),
  • data and descriptions (e.g. abstract) should not be linked to any externally available data, templates, or tools. Is highly recommended to co-archive these objects into the archival package. If it is not possible, the dependency (e.g. information about the software that is needed to read and process the data) to external data, should be documented in a README file.
  • since your data might be viewed by numerous users who use a wide variety of operating systems (Mac, PC, and Linux for instance) and devices (desktops, tablets, and smartphones are some examples), it is essential to avoid common illegal directory and filename characters.
  • for file names, use letters, numbers, "_", and "-".
    Avoid using blanks, special characters, or "umlauts" when naming files, folders, and objects.
  • keep your filenames to a reasonable length and be sure they are under 31 characters.
  • file extensions (e.g. .txt, .xml, .docx) should be consistent with the actual file format.

If you have any questions regarding file formats, conversions and other technical requirements for your data, please contact us.

With the acceptation of the Open Data Release Form, which is an integral part of the data publication workflow in PUB, data submitters have to declare that:

  • they are allowed to publish and to release the data under an Open Data License,
  • rights of third parties are not violated,
  • any joint author has given his consent to publish and to release the data under an Open Data License,
  • the data submitter is aware, that I she/he is only allowed to publish anonymous data or other data without personal reference. For publishing person-related agreements of the affected persons are needed,
  • the data submitter have to declare, that she/he do not violate these rules and that she/he is aware that this release might limit exploitation potential in terms of vending the data or achieving patents.

Download the Open Data Release Form here (PDF).

Screenshot of the data deposit form in PUB with the need to accept the Open Data Release Form.

Research Data - General (EN)

According to data deposit, it is in the responsibility of PUB users, who are uploading and publishing data to make sure that they have the necessary rights and permissions to upload and distribute it (see Open Data Declaration Form).

Persons who re-use data deposited in PUB are require to respect any copyright or license related to the data when re-using or re-distributing it (see FAQ “Data Usage”).

Vorgehen bei der Forschungsdatenregistrierung

Die Eingabe Ihrer Forschungsdaten in PUB können Sie bei diesen vorliegenden Voraussetzungen vornehmen:

  1. Daten sind noch nicht veröffentlicht und werden neu registriert.
  2. Daten sind bei externen Datenanbietern veröffentlicht und bereits registriert. Die können die Daten unter Angabe der DOI in PUB einpflegen.