Automatisierung ist das Leitthema der Gegenwart. Die Flut an zu verwaltenden Informationen macht es unmöglich, jede Datei und jeden Datensatz einzeln oder gar händisch zu pflegen. Metadaten sind der Schlüssel zur Lösung dieses Problems. Sie ermöglichen es, die Informationen anhand von festgelegten Eigenschaften zu gruppieren und stapelweise zu verarbeiten. Für den reibungslosen Ablauf solcher Prozesse sollten Metadaten in strukturierter Form erfasst werden. Warum die Verwendung einer Struktur, eines Metadatenschemas, wichtig ist und was bei der Entwicklung eines Schemas zu beachten ist, verraten wir Ihnen in diesem Artikel.

 

Weshalb brauche ich ein Metadatenschema?

Maschinen – ob nun simple kleine Skripte oder KIs – sind nicht gut darin, unstrukturierte Daten zu verarbeiten, weil ihnen die Fähigkeit zur Interpretation fehlt. Erst eine feste Struktur ermöglicht ihren Einsatz. Je mehr Kontext zu einer Information vorhanden ist und je präziser ihr Aufbau und ihre Bedeutung definiert sind, umso geringer ist der Aufwand bei der automatisierten Verarbeitung und umso fehlerfreier und nützlicher sind die Ergebnisse. Ein Metadatenschema ist im Grunde nichts anderes als eine Definition mit dem Zweck, genau solche Kontexte für die Maschinen bereitzustellen.

Aber nicht nur die Verwendung der Metadaten wird unterstützt – auch die Erfassung profitiert. Da ein Metadatenschema festlegt, wie die Daten aussehen müssen, können mit dessen Hilfe viele Fehler schon bei der Eingabe erkannt werden, egal ob diese manuell oder (teil-) automatisiert geschieht. Neben der Fehlervermeidung wirkt sich ein gutes Schema auch positiv auf den Arbeitsaufwand aus, denn wenn Bedeutung und Beziehungen der Metadaten klar definiert sind, können viele von ihnen automatisch erfasst oder aus anderen (Meta-) Daten generiert werden.

Zusammengefasst heißt das: Ein Metadatenschema…

  • …ermöglicht effektive automatisierte Datenverarbeitung und -verwaltung;
  • …erhöht die Qualität der Metadaten und damit deren Wert;
  • …verringert den Aufwand bei der Metadatenerfassung.

 

Was macht ein gutes Metadatenschema aus?

Das beste Schema ist jenes, welches die Dateneingabe und -verarbeitung am besten unterstützt und am meisten vereinfacht. Ein paar Grundregeln helfen Ihnen, ein Schema zu entwickeln, dass optimal zu Ihren Daten und deren Verwendungszweck passt.

 

1.      Den Anwendungsbereich bestimmen

Auf welche Daten soll das Metadatenschema angewendet werden? Ein Schema, dass auf alle vorhandenen Daten passt, ermöglicht es auch, alle Daten mit denselben Automatismen auf einmal zu bearbeiten. Allerdings haben sehr verschiedene Daten häufig auch wenig gemeinsame Eigenschaften. Machen Sie sich Gedanken darüber, welche Daten gemeinsam verarbeitet (verwaltet, gesucht) werden. Diese sollten sich ein Schema teilen. Andere Daten und Formate braucht das Schema nicht zu berücksichtigen. Es spricht natürlich nichts dagegen, Teile des Schemas für andere Daten wiederzuverwenden.

 

2.      Die richtige Auswahl der Felder

Ein Metadatenschema besteht aus sogenannten Feldern, wobei jedes Feld genau eine festgelegte Information enthält. Es lohnt sich, etwas Zeit in die Überlegung zu investieren, welche Felder gebraucht werden und woher die Daten kommen sollen. Die Leitfrage lautet: Wozu sollen die Metadaten verwendet werden? Es ist Zeitverschwendung, ein Feld zu definieren, das gar nicht benötigt wird. Selbiges gilt für Felder, die für einen großen Teil der Datensätze nicht ausgefüllt werden können, weil die Erschließung der Information entweder zu aufwändig oder überhaupt nicht möglich ist.

Die Informationen sollten in möglichst kleine Bestandteile aufgespalten werden, denn zwei klar definierte Felder zusammenzuführen ist leichter und weniger fehleranfällig, als den Inhalt eines Feldes zu zerlegen. Prüfen Sie also jedes Feld, das Sie nutzen wollen, darauf, ob es nicht zwei oder mehr unabhängige Informationen vereint. Bei einer Kombination von Informationen, die häufig in dieser Form benötigt wird, spricht nichts dagegen, sie in einem zusätzlichen Feld zu speichern – dieses sollte dann aber unbedingt automatisch ausgefüllt werden, damit keine Widersprüche entstehen.

 

3.      Das Rad nicht neu erfinden

In vielen Bereichen wird bereits seit langem mit Metadaten gearbeitet. Die Notwendigkeit, Daten auszutauschen, hat dabei zur Entwicklung robuster, gut dokumentierter Metadatenschemata und ‑austauschformate geführt, welche die meisten Bedürfnisse einer Sparte abdecken. Die Verwendung eines Standards bringt eine ganze Reihe von Vorteilen mit sich. Daten, die Ihnen von anderen zur Verfügung gestellt werden, können Sie sofort und ohne Anpassung verwenden, wenn dasselbe Standardschema verwendet wird. Für verbreitete Schemata gibt es Tools und Masken, welche die Datenpflege noch weiter erleichtern. Und natürlich sparen Sie sich den Aufwand, selbst ein Schema zu definieren. Wenn also iiRDS, Dublin Core oder MODS alles bietet, was Sie brauchen, fahren Sie damit vermutlich besser als mit einem eigenen, allein auf Ihre Daten optimierten Schema.

 

4.      So eng und exakt wie möglich

Je weniger Auswahlmöglichkeiten und Freiräume ein Schema bietet, umso besser. Jede Alternative ist eine Gelegenheit, die falsche Wahl zu treffen. Legen Sie genau fest, welche Information in welcher Form in ein bestimmtes Feld eingetragen werden kann. Datentypen, Auswahllisten und Reguläre Ausdrücke (eine Sprache zur Beschreibung von Zeichenketten) sind hier großartige Helfer. Sie vermeiden Tippfehler und sorgen dafür, dass dieselbe Information immer in der gleichen Form gegeben ist. Aber auch einfachere Mittel bringen schon einen großen Nutzen. Erlauben Sie für ein Feld „Bewertung“ im Schulnotensystem nur die Zahlen eins bis sechs. Sogar eine kurze Erklärung, für welche Information genau das Feld gedacht ist, kann schon helfen.

 

5.      Optional vs. obligatorisch

Wenn Sie planen, Metadaten automatisch oder durch Experten zu erfassen, sollte das Ausfüllen aller Felder verpflichtend sein, von denen Sie wissen, dass sie auf alle Instanzen zutreffen. Jede Person hat einen Namen, jede Datei ein Format, jeder digitale Text eine Kodierung. Bleibt ein Feld leer, kann der Datensatz bei allen Prozessen, die darauf zugreifen, nicht mehr verarbeitet werden oder benötigt zumindest eine Sonderbehandlung. Dadurch sinkt der Nutzen des Schemas erheblich.

Es gibt jedoch eine Ausnahme, bei der die Einengung des Schemas durch einen möglichst hohen Anteil obligatorischer Felder ein Nachteil sein kann; nämlich dann, wenn die Metadaten manuell von Leuten eingegeben werden, deren Hauptaufgabe nicht die Verwaltung dieser Daten ist. Zu viele verpflichtende Angaben bedeuten einen gewissen Zeitaufwand, was wiederum zu geringer Motivation führen kann und damit zu unüberlegten, fehlerhaften oder gar zufälligen Eingaben. In solchen Fällen ist also ein Abwiegen zwischen zumutbarem Aufwand und optimaler Datenqualität notwendig.

Optionale Felder sind natürlich trotzdem auch bei automatischer Erfassung nützlich. Ein Feld „Letzte Renovierung“ im Metadatensatz zu einem Haus ist eine gute Idee – aber bei einem Neubau nicht zutreffend. Optionale Felder haben überall dort einen Wert, wo auch das Fehlen der Angabe eine Aussage darstellt.

 

Neben diesen Grundregeln gilt natürlich noch die Regel der Umsetzbarkeit. Wenn der Aufwand, eine Auswahlliste zu erstellen oder zu pflegen, nicht zu stemmen ist, oder wenn die technische Umsetzung des optimalen Schemas zu lange dauern würde, lassen sich Abstriche bei der Genauigkeit nicht vermeiden. Wer aber von vorneherein nicht weiß, was das optimale Metadatenschema wäre, wird auch Schwierigkeiten haben, das bestmögliche Schema umzusetzen.

Metadatenschema fertig? Dann auf zum nächsten Schritt – dem Capturing! Oder vielleicht doch lieber Create?

5 Grundregeln für ein gutes Metadatenschema

Haben Sie weitere Fragen? Wir beraten Sie gerne: marketing@avato.net

Impressum 
Datum: Juni 2019
Autor: Isabell Bachmann
Kontakt: marketing@avato.net
www.avato-consulting.com
© avato consulting ag – Copyright 2019.
All Rights Reserved.