Diese Seite gibt einen kurzen Überblick und einige wichtige Tipps zum Thema Datenpflege im Data Hub NRW. Zunächst wird näher erläutert, was genau ein Datensatz ist und welche Arten von Datentypen es gibt. Je Datentyp wird die entsprechende Kategorieliste des Datentyps dargestellt. Grundlagen und Tipps zur Einordnung in die richtige Kategorie werden am Ende dieser Seite unter dem Punkt Pflege von Kategorien gegeben.

Des Weiteren werden Attribute zum messen der Datenqualität vorgestellt. Eine gute und einheitliche Qualität der Daten im Data Hub NRW ist die Grundlage für die Nutzbarkeit und Attraktivität der Datensätze und damit auch für Reichweite und Sichtbarkeit. 

Zudem werden die Datenqualitätskriterien des Data Hub NRW dargestellt. Jeder Datensatz wird anhand festgesetzter Kriterien eingeteilt: Erfüllt die Basisanforderungen, gute Datenqualität oder sehr gute Datenqualität. Dabei unterscheiden sich die Datenqualitätskriterien je Datentyp.

Um die Datenpflege so einfach wie möglich zu gestalten, wurden Do's und Don'ts für die Erstellung der Textfelder erstellt, welche in der Leitlinie für die inhaltliche Pflege zu finden sind.

Datensatz

Ein Datensatz besteht aus einer Sammlung von miteinander verknüpften, aber eigenständigen Informationen, die in unterschiedliche Datentypen kategorisiert werden können. Die unterschiedlichen Datentypen eines Datensatzes können entweder einzeln oder auch gemeinsam aufgerufen und weiterverarbeitet werden. Jeder Datensatz ist in einer bestimmten Datenstruktur organisiert. Die Deutsche Zentrale für Tourismus e.V. befindet für den Tourismus vor allem drei Arten als belangvoll: 

Bei sogenannten statischen Daten handelt es sich um dauerhaft bestehende Daten. Änderungen dieses Datentyps fallen vergleichsweise selten an. Beispiele für statische Daten sind unter anderem Geo- oder Adressdaten.

 Die zweite Art der Daten stellen dynamische Daten dar. Im Gegensatz zu statischen Daten ändern sich diese häufig. Beispiele für dynamische Daten sind Auslastungskennzahlen wie ein Besucher- oder Verkehrsaufkommen. Oftmals handelt es sich bei dynamischen Daten um Echtzeitdaten. 

Die dritte Datenart bilden die redaktionellen Daten. Hierbei handelt es sich um schützenswerte Daten, welche zu einem bestimmten Datensatz erstellt wurden. Beispiele sind unter anderem Beschreibungstexte oder Bild- und Video-Content.

Datentypen

Im Data Hub NRW unterscheiden wir folgende Datentypen:

Attribute zum messen der Datenqualität

Durch die zentrale Steuerung und einheitliche Qualitätskriterien werden die Datenqualität und die Nutzbarkeit der Daten in Nordrhein-Westfalen stark erhöht. Datenabnehmer bekommen damit ein verlässliches und vergleichbares digitales Abbild von ganz NRW. Der Tourismus NRW e.V. sowie seine Partner achten dabei insbesondere auf folgende Kriterien. 

  1. Aktualität
  2. Vollständigkeit
  3. Korrektheit
  4. Zuverlässigkeit
  5. Einheitlichkeit

Eine hohe Datenqualität schafft Vertrauen in die Daten – für Datenabnehmer und nicht zuletzt für den Nutzer der digitalen Services. Gleichzeitig wird eine Grundlage für zukünftige Analysen (z.B. für die Verbesserung des digitalen Angebotes in Nordrhein-Westfalen) geschaffen. Qualitativ hochwertige Daten machen die Abnahme von Daten aus dem Data Hub gegenüber externen Kooperationspartnern noch attraktiver und sorgen somit für mehr Reichweite und Relevanz. So wird das Reiseland Nordrhein-Westfalen fit für die Zukunft gemacht.

Datenqualitätskriterien

Die Datenqualität eines Datensatzes wird erst bei einer erneuten Speicherung oder einem erneuten Import aktualisiert.

 Die Basisanforderungen sind – gemeinsam mit mindestens einer CC-BY-SA Lizenzierung des gesamten Datensatzes (nicht der Mediendatei) – die Basishürde, um in den Hub zu gelangen. Sind diese erfüllt, werden die Daten mit einem roten Daumen (DQ-Wert bis 25%) ausgezeichnet. Datensätze mit guter Qualität (DQ-Wert zwischen 25% und 75%) erhalten einen gelben Daumen, solche mit sehr guter Qualität (DQ-Wert ab 75%) einen grünen Daumen. Die Kriterien unterscheiden sich je nach Datentyp. 

Datensätze in destination.data, die rot markiert sind, erfüllen nicht die Kriterien des Importfilters. Bei ihnen sind nicht alle Pflichtfelder befüllt, z.B. keine Kategorie vorhanden. Sie werden aktuell in destination.data zur Info angezeigt, um zu sehen, was im Hub landen könnte und um die Datenanalyse zu erleichtern. Sie werden aber NIE ausgespielt - auch wenn sie in der NRW-Experience enthalten sein können und eine offene-Lizenz haben.

Sehenswürdigkeiten

Touren & Wege

Gastronomie

Gastgeber

Veranstaltungen

Mediendaten

Leitlinien für die inhaltliche Pflege 

Um ein einheitliches Bild und auch inhaltlich eine landesweite Qualität gewährleisten zu können gibt es einige Do’s and Dont’s für Beschreibungstexte, Bildunterschriften und weitere Textfelder. Letztendlich werden die Texte nicht nur für die eigene Webseite genutzt, sondern dienen unzähligen Ausspielungskanälen als Input. Je universeller die Texte somit formuliert werden, desto mehr Datenabnehmer finden sich am Ende.

Pflege von Kategorien

Die Kategorie ist ein wichtiger Indikator für die Ausspielung von Datensätzen in aller Art von digitalen Anwendungen. Durch die Auswahl einer oder mehrerer Kategorien wird ein Datensatz in den Kategoriebaum des Data Hub NRW eingruppiert. Bei der Vergabe von Kategorien ist auf die sogenannte „IST-HAT-Regel“ zu achten. 

Diese kann am besten an einem Beispiel erläutert werden: 

Beispieldatensatz „Kunstmuseum“ 
Das „Kunstmuseum“ IST ein Museum. Aus diesem Grund wird die Kategorie „Museum/Ausstellung“ vergeben. Das „Kunstmuseum“ HAT einen Parkplatz und HAT einen Spielplatz. Dies sind jedoch keine Kategorien, sondern Merkmale, die gesondert gepflegt werden können. Folglich kann mit der „IST-HAT-Regel“ einfach bestimmt werden, ob eine vermeintliche Kategorie wirklich eine Kategorie ist oder es sich um ein Merkmal des Datensatzes handelt. 

Es handelt sich um eine Informationsdarstellung. Tourismus NRW e.V. übernimmt für die Inhalte keine Gewähr.

IHRE ANSPRECHPERSONEN

Weitere Themen Entdecken

Ein Roboter steht im Deutschen Museum in Bonn.
© Tourismus NRW e.V.
Förderprojekte

TOURISMUS DATA INTELLIGENCE INITIATIVE NRW

Der Deutschlandtourismus durchläuft einen Umbruch, insbesondere bedingt durch aktuelle Krisen und Fortschritte in der Künstlichen Intelligenz. KI wird nicht nur die Internetsuche revolutionieren, sondern auch die Nutzung von Echtzeitdaten für Gästeinformationen ermöglichen.
Mehr erfahren
Dingdener Heide Person fotografiert See aus Schwebezelt heraus
© Johannes Höhn, Tourismus NRW e.V.
Strategie

Smart Destination

Werkzeuge mit Bezug auf die Digitalisierung beschränken sich oftmals auf den Aspekt des Marketings. Die digitale Transformation findet jedoch aktuell am Urlaubsort selbst statt und das mehr denn je. Aus diesem Grund wurde das ganzheitliche Reifegradmodell "Smart Destination" entwickelt.
Mehr erfahren
Stimmungsvolle Aufnahme der beleuchteten Skulptur "Tiger and Turtle" in Duisburg  von Heike Mutter und Ulrich Genth in der Dämmerung.
© Foto: Jochen Schlutius/Künstler:innen: Heike Mutter und Ulrich Genth
Strategie

Landestourismusstrategie

Vernetzt, digital, innovativ – so fasst die Landestourismusstrategie die Ziele für den Tourismus in Nordrhein-Westfalen kurz und prägnant zusammen.
Mehr erfahren