10 Prinzipien offener Regierungsinformationen (2010)

Übersetzung der Ten Principles for Opening Up Government Information

http://sunlightfoundation.com/policy/documents/ten-open-data-principles/

Im Oktober 2007 trafen sich 30 Open Government-Fürsprecher in Sebstopol in Kalifornien, um zu diskutieren, wie die Regierung elektronisch gespeicherte Regierungsdaten für die öffentliche Nutzung zugänglich machen könnte. Bis dahin hatten die US-Bundesregierung und die Bundesstaaten bestimmte Daten zugänglich gemacht, meist unstimmig und unvollständig, die damit nur den Appetit der Fürsprecher auf mehr und bessere Daten anregten. Die Konferenz, die von Carl Malamud and Tim O'Reilly geleitet wurde und von einer Spende der Sunlight Foundation finanziert wurde, brachte acht Prinzipien hervor. Korrekt umgesetzt würden sie die Öffentlichkeit im Umgang mit Regierungsdaten befördern.

Wir haben die Sebastopol-Liste aktualisiert und erweitert und zehn Prinzipien herausgearbeitet, die einen Schwerpunkt darauf legen, zu welchem Grad Regierungsdaten offen und der Öffentlichkeit zugänglich sind. Die Liste ist nicht erschöpfend, und jedes Prinzip besteht in einem Kontinuum von Offenheit. Die Prinzipien sind Vollständigkeit, Primärquellen, zeitliche Nähe, Leichter Zugang, Maschinenlesbarkeit, Diskriminierungsfreiheit, Verwendung offener Standards, Lizenzierung, Dauerhaftigkeit, Benutzungskosten

1. Vollständigkeit

Von Regierung und Verwaltung veröffentlichte Datensätze sollten so vollständig wie möglich sein, sie sollten den ganzen Umfang dessen abbilden, was zu einem bestimmten Thema dokumentiert ist. Sämtliche Rohdaten eines Datensatzes sollten der Öffentlichkeit zur Verfügung gestellt werden, mit Ausnahme dessen, was Gesetze zum Schutz der personenbezogener Daten gebieten. Metadaten, die die Rohdaten beschreiben und erklären, sollten zusammen mit Formeln und Erklärungen zur Berechnung der Daten ebenfalls mitgeliefert werden. Dies wird den Benutzern erlauben, die Ausrichtung der verfügbaren Information zu verstehen und jedes Datum mit dem größtmöglichen Detailreichtum zu untersuchen.

2. Primärquellen

Von Regierung und Verwaltung veröffentlichte Datensätze sollten Primärquellen sein. Dies schließt die ursprünglich von der Regierung erhobenen Informationen ein, sowie Details darüber, wie die Daten gesammelt wurden und die ursprünglichen Quelldokumente, die die Erhebung dokumentieren. Die öffentliche Verbreitung ermöglicht es den Benutzern zu überprüfen, dass die Informationen korrekt erhoben und genau aufgezeichnet wurden.

3. Zeitliche Nähe

Von Regierung und Verwaltung veröffentlichte Datensätze sollten der Öffentlichkeit innerhalb eines angemessenen Zeitraums zur Verfügung stehen. Wenn machbar, sollten von der Regierung erhobene Informationen veröffentlicht werden, sobald sie erhoben und zusammengestellt sind. Vorrang sollten solche Daten erhalten, deren Nützlichkeit zeitabhängig ist. Echtzeit-Updates würden den Nutzen maximieren, den die Öffentlichkeit aus diesen Informationen ziehen kann.

4. Leichter Zugang

Von Regierung und Verwaltung veröffentlichte Datensätze sollten so zugänglich wie möglich sein. Zugänglichkeit ist dabei als die Leichtigkeit, mit der Informationen eingeholt werden können, sei es auf dem elektronischen oder auf dem physischen Weg, definiert. Hürden zum physischen Zugang schließen die Notwendigkeit ein, persönlich ein bestimmtes Büro aufzusuchen oder die Anforderung, bestimmte Abläufe zu erfüllen (wie das Ausfüllen von Formularen oder das Einreichen von Informationsfreiheits-Anfragen). Hürden zum automatisierten elektronischen Zugang beinhalten den Zugang zu Daten nur über ausgefüllte Eingabemasken oder Systeme, die browserorientierte Technologien erfordern (z.B. Flash, Javascript, Cookies oder Java Applets). Im Gegensatz dazu macht ein Interface für Benutzer, welches das Herunterladen sämtlicher gespeicherter Daten auf einmal (auch bekannt als "Bulk Access") und Angebote, bestimmte Daten über eine Programmierschnittstelle (API) abzurufen, die Daten viel zugänglicher. (Ein Aspekt dieser Sache ist die Auffindbarkeit, also die Möglichkeit, einfach Inhalte zu finden und herunterzuladen.)

5. Maschinenlesbarkeit

Maschinen können mit bestimmten Arten von Eingaben viel besser umgehen als mit anderen. Zum Beispiel sind handschriftliche Notizen auf Papier sehr schwer für Maschinen zu verarbeiten. Einscannen von Text über Texterkennungsprogramme (Optical Character Recognition, OCR) produziert viele Zuordnungs- und Formatierungsfehler. Auch Informationen, die im bekannten PDF-Format verbreitet werden, sind für Maschinen sehr schwer analysierbar. Deswegen sollten Informationen in etablierten Dateiformaten abgespeichert werden, die leicht maschinenlesbar sind. (Wenn andere Faktoren den Einsatz schwer maschinenlesbarer Formate erfordern, sollten die Daten zusätzlich in maschinenfreundlichen Formaten verfügbar sein.) Dateien sollten von einer Dokumentation begleitet werden, die sich auf das Format bezieht und darauf, wie man es in Bezug auf die Daten verwendet.

6. Diskriminierungsfreiheit

Diskriminierungsfreiheit bezieht sich darauf, wer auf Daten zugreifen kann und wie dieser Zugriff erfolgt. Hürden bei der Datennutzung umfassen Registrierung oder Mitgliedschafts-Voraussetzungen. Eine weitere Hürde ist die Verwendung von "umzäunten Gärten", wenn also nur bestimmte Anwendungen auf die Daten zugreifen dürfen. Im weitesten Sinn bedeutet diskriminierungsfreier Zugang, dass jede Person zu jeder Zeit auf die Daten zugreifen kann, ohne sich identifizieren zu müssen oder eine Rechtfertigung für ihr Handeln abgeben zu müssen.

7. Die Verwendung offener Standards

Die Forderung nach der Nutzung gemeinsam entwickelter ("offener") Standards bezieht sich auf das Eigentum an den verwendeten Formaten. Wenn zum Beispiel nur eine einzige Firma ein Programm herstellt, mit dem man eine Datei lesen kann, in der Daten gespeichert sind, ist der Zugang zu diesen Informationen abhängig von der Nutzung des Verarbeitungsprogramms dieser Firma. Manchmal ist dieses Programm für die Allgemeinheit zu keinem Preis erhältlich, oder es ist erhältlich, kostet aber eine Gebühr. Zum Beispiel ist Microsoft Excel ein recht weit verbreitetes Tabellenkalkulationsprogramm, dessen Benutzung Geld kostet. Häufig existieren kostenlos verfügbare Formate, durch die auf die Daten zugegriffen werden kann, ohne eine Software-Lizenz zu benötigen. Wenn diese Kosten-Hürden beseitigt werden, sind die Daten für eine größere Gruppe potenzieller Nutzer verfügbar.

8. Lizenzierung

Das Auferlegen von "Nutzungsbedingungen", die Pflicht zur Namensnennung, Einschränkungen in der Verbreitung etc. wirken als Hürden für die öffentliche Verwendung von Daten. Maximale Offenheit bedeutet daher auch, dass öffentliche Informationen klar als Werk der Regierung auszuweisen sind und sie ohne Nutzungsbeschränkungen gemeinfrei verfügbar zu machen.

9. Dauerhaftigkeit

Die Möglichkeit, Informationen über lange Zeit hinweg zu finden wird als Dauerhaftigkeit bezeichnet. Von Regierung und Verwaltung online veröffentlichte Informationen sollten beharrlich sein: Sie sollten in Archiven dauerhaft online verfügbar sein. Häufig werden Informationen aktualisiert, verändert oder entfernt, ohne einen Hinweis darauf zu geben, dass sich etwas geändert hat. Oder Informationen werden als Datenstrom verfügbar gemacht, aber nirgends archiviert. Um eine gute Verwendung durch die Öffentlichkeit zu befördern sollten einmal online gestellte Informationen mit angemessener Versionskontrolle und dauerhafter Archivierung online bleiben.

10. Nutzungskosten

Eine der größten Hürden beim Zugriff auf vorgeblich öffentlich verfügbare Informationen sind die Kosten, die der Öffentlichkeit für den Zugriff auferlegt werden - selbst wenn diese minimal sind. Regierungen und Verwaltungen haben zahlreiche Grundlagen, um der Öffentlichkeit den Zugang zu ihren eigenen Dokumenten zu berechnen: Die Kosten für das Erzeugen der Informationen; eine Kostendeckungs-Grundlage (die Kosten für das Produzieren der Informationen geteilt durch die erwartete Zahl der Käufer); die Kosten für das Abrufen der Informationen; eine Pauschale pro Seite oder Anfrage; Bearbeitungsgebühren; die Kosten für die Vervielfältigung etc.

Die meisten Regierungsinformationen werden für Regierungszwecke erhoben. Die Existenz von Benutzungsgebühren hat nur geringe bis gar keine Auswirkungen darauf, ob Regierungen und Verwaltungen die Daten grundsätzlich erheben. Das Berechnen von Gebühren für den Zugang verzerrt die Menge derer, die gewillt (oder fähig) sind, auf Informationen zuzugreifen. Es kann auch weiterverarbeitende Nutzungen der Daten von vornherein ausschließen, die im Gegenzug Wirtschaftswachstum und Steuereinnahmen generieren würden.

Quelle:
Open Data Network

Der Text steht unter einer CC-Lizenez Attribution-Share Alike 3.0 Unported.