Προσφορά και ποιότητα δεδομένων

Αυτή η ενότητα παρέχει καθοδήγηση σχετικά με τη διαχείριση και την αποκατάσταση των δεδομένων για να διασφαλιστεί ότι πληρούν τις βέλτιστες πρακτικές ανοικτών δεδομένων και τα καθιερωμένα πρότυπα των επαγγελματικών κοινοτήτων δεδομένων. Προορίζεται για άτομα και φορείς που εμπλέκονται στην παραγωγή δεδομένων, όπως φορείς του δημόσιου τομέα και στατιστικές υπηρεσίες, αλλά και οι «καταναλωτές» δεδομένων, που θέλουν να κατανοήσουν τον τρόπο με τον οποίο παράγονται τα δημόσια δεδομένα, μπορούν επίσης να βρουν χρήσιμη αυτή την ενότητα.

Γενικά πρότυπα ποιότητας

Ενώ η "ποιότητα" μπορεί να είναι μια διφορούμενη έννοια, η σημασία της στο πλαίσιο των δεδομένων έχει καθοριστεί ξεκάθαρα. Ο ορισμός της στατιστικής ποιότητας από την Ευρωπαϊκή Στατιστική Υπηρεσία (EuroStat) παρέχει ένα σύνολο έξι διαστάσεων ποιότητας, οι οποίες αρχικά καθόρισαν τα στατιστικά στοιχεία, αλλά μπορούν επίσης να εφαρμοστούν σε πολλούς άλλους τύπους δεδομένων:

  1. Συνάφεια: Ο βαθμός στον οποίο οι στατιστικές ανταποκρίνονται στις ανάγκες των σημερινών και των δυνητικών χρηστών.

  2. Αξιοπιστία: Ο βαθμός στον οποίο τα δεδομένα είναι απαλλαγμένα από σφάλματα που προκύπτουν από διάφορους παράγοντες. στο πλαίσιο των στατιστικών, η ακρίβεια σημαίνει την εγγύτητα της εκτιμώμενης τιμής με την τιμή της πραγματικής (άγνωστης) αξίας στον πληθυσμό.

  3. Επικαιροποίηση: Πότε δημοσιεύονται τα δεδομένα σε σχέση με αυτά που μετρούν και πόσο προσεκτικά οι ενημερώσεις των δεδομένων τηρούν το προβλεπόμενο χρονοδιάγραμμα δημοσίευσης.

  4. Προσβασιμότητα και σαφήνεια: Η ευκολία με την οποία οι χρήστες έχουν πρόσβαση στα δεδομένα και ο βαθμός εξήγησής τους μέσω των μεταδεδομένων.

  5. Συγκρισιμότητα: Ο βαθμός στον οποίο τα δεδομένα μπορούν να συγκριθούν σε χρόνο, περιοχές ή άλλους τομείς.

  6. Συνοχή: Ο βαθμός στον οποίο τα δεδομένα συμμορφώνονται με αναγνωρισμένους ορισμούς και μεθοδολογίες.

Ένα παρόμοιο σύνολο διαστάσεων, που δημοσιεύεται στο έγγραφο του Project Open Data[7], μπορεί να χρησιμοποιηθεί για την κατανόηση της ποιότητας, ειδικά στο πλαίσιο των ανοικτών δεδομένων:

  • Δημόσια: Ο βαθμός στον οποίο τα κυβερνητικά δεδομένα αντιμετωπίζονται με τεκμήριο που ευνοεί τη διαφάνεια, όσο αυτό επιτρέπεται από το νόμο και υπόκειται σε προστασία της ιδιωτικής ζωής, εμπιστευτικότητα, ασφάλεια ή άλλους έγκυρους περιορισμούς

  • Προσβασιμότητα: Ο βαθμός στον οποίο διατίθενται τα ανοικτά δεδομένα σε τροποποιήσιμες και ανοικτές μορφές που μπορούν να ανακτηθούν, να μεταφορτωθούν, να ευρετηριαστούν και να αναζητηθούν

  • Περιγραφή: Πόσο πλήρως τα ανοικτά δεδομένα έχουν περιγραφθεί, ώστε οι καταναλωτές των δεδομένων να έχουν επαρκείς πληροφορίες για να κατανοήσουν τα πλεονεκτήματα, τις αδυναμίες τους, τους αναλυτικούς περιορισμούς και τις απαιτήσεις ασφαλείας καθώς και τον τρόπο επεξεργασίας τους

  • Επαναχρησιμοποιήσιμα: Η διαθεσιμότητα των ανοικτών δεδομένων γίνεται με ανοικτή άδεια που δεν θέτει περιορισμούς στη χρήση τους

  • Πλήρη: Εάν τα ανοικτά δεδομένα δημοσιεύονται σε πρωτογενείς μορφές (δηλ. όπως συλλέγονται στην πηγή-raw data), με το καλύτερο δυνατό επίπεδο λεπτομέρειας, που είναι εφικτό και επιτρέπεται από το νόμο

  • Χρονισμός: πόσο σύντομα θα είναι διαθέσιμα τα ανοικτά δεδομένα ώστε να διατηρηθεί η αξία τους

  • Διαχείριση μετά την διάθεση τους: Αν προβλέπεται σημείο επαφής που υποστηρίζει τους καταναλωτές δεδομένων κατά την χρήση δεδομένων και ανταποκρίνεται σε αιτήματα και καταγγελίες σχετικά με την τήρηση των απαιτήσεων για τα ανοικτά δεδομένα

Πρότυπα δεδομένων

Ενώ οι αρχές ποιότητας που περιγράφηκαν προηγουμένως γενικά ισχύουν για όλους τους τύπους δεδομένων, τα πρότυπα και οι λεπτομέρειες βάσει των οποίων παράγονται και αξιολογούνται τα δεδομένα ποικίλλουν ανάλογα με κάθε τύπο δεδομένων. Οι ακόλουθες ενότητες συνοψίζουν τα πρότυπα που αφορούν κάθε τύπο δεδομένων.

Στατιστικές και εθνικοί λογαριασμοί.

Οι εθνικοί λογαριασμοί ορίζουν τις κατηγορίες εσόδων, εξόδων και δαπανών σε μια οικονομία για διάφορες οντότητες, όπως νοικοκυριά, επιχειρήσεις και κυβέρνηση. Αυτά τα στατιστικά στοιχεία παράγονται και/ή συντονίζονται γενικά από τις Εθνικές Στατιστικές Υπηρεσίες (ΕΣΥ-NSOs) σε κάθε χώρα σύμφωνα με λεπτομερή πρότυπα και μεθοδολογίες. Τα στατιστικά δεδομένα βασίζονται αυστηρά σε πρότυπα που καθορίζουν τον τρόπο ταξινόμησης και οργάνωσης τους καθώς και τον τρόπο αξιολόγησης της ποιότητας. Αυτά είναι γενικά πιο χρήσιμα για ΕΣΥ.

  • Κατάλογος των στατιστικών προτύπων των Ηνωμένων Εθνών[8]. Πρόκειται για έναν κατάλογο στατιστικών ταξινομήσεων, ορισμών, εννοιών, μεθοδολογιών και διαδικασιών που παρέχει καθοδήγηση για τη χρήση στατιστικών προϊόντων.

  • Βασικές κατευθυντήριες γραμμές για τη μέτρηση της στατιστικής ποιότητας[9]. Αυτές οι κατευθυντήριες γραμμές για τη μέτρηση της στατιστικής ποιότητας χρησιμοποιούν τις ίδιες γενικές διαστάσεις με τις οδηγίες από το EuroStat (που αναφέρονται παραπάνω στα "Γενικά πρότυπα").

  • Ποιότητα του πίνακα ελέγχου στατιστικής παραγωγής[10]. Πρόκειται για ένα πλαίσιο για την αξιολόγηση της στατιστικής ποιότητας σε 19 χαρακτηριστικά, με στόχο τη δημιουργία ενός πίνακα ελέγχου στατιστικής ποιότητας.

  • Το Διεθνές Νομισματικό Ταμείο διαθέτει δύο συναφή πλαίσια που παρέχουν καθοδήγηση για τα εθνικά στατιστικά στοιχεία: το Σύστημα Γενικής Διάδοσης Δεδομένων[11] (GDDS) και το Ειδικό Σύστημα Διάδοσης Δεδομένων[12] (SDDS). Τόσο το GDDS όσο και το SDDS αποσκοπούν στη βελτίωση της διαθεσιμότητας έγκαιρων και περιεκτικών στατιστικών στοιχείων και ως εκ τούτου συμβάλλουν στην επιδίωξη υγιών μακροοικονομικών πολιτικών.

  • Πλαίσιο αξιολόγησης της ποιότητας δεδομένων[13] (DQAF). Ένα άλλο εργαλείο του ΔΝΤ, το DQAF, χρησιμοποιείται για ολοκληρωμένες αξιολογήσεις της ποιότητας των δεδομένων των χωρών. Αφορά τα θεσμικά περιβάλλοντα, τις στατιστικές διαδικασίες και τα χαρακτηριστικά των στατιστικών προϊόντων.

  • Δείκτης στατιστικής ικανότητας της Παγκόσμιας Τράπεζας[14]. Το εργαλείο αυτό παρέχει μια γενική εικόνα της στατιστικής ικανότητας των αναπτυσσόμενων χωρών, βάσει ενός διαγνωστικού πλαισίου που αξιολογεί την ικανότητα των στατιστικών συστημάτων. Ο ιστότοπος του Δείκτη Στατιστικής Ικανότητας επιτρέπει στους χρήστες να απεικονίζουν τις μεταβολές της στατιστικής ικανότητας μιας χώρας με την πάροδο του χρόνου.

  • Εκθέσεις σχετικά με την τήρηση των προτύπων και κωδίκων[15] (ROSC). Αυτή η συλλογή εκθέσεων σε επίπεδο χώρας συνοψίζει το βαθμό στον οποίο οι χώρες τηρούν ορισμένα διεθνώς αναγνωρισμένα πρότυπα και κώδικες. Οι εκθέσεις οργανώνονται σε 10 θέματα, εκ των οποίων η διάδοση των δεδομένων.

Στοιχεία συμβάσεων

Στον όρο "σύμβαση" αναφέρονται οι διαδικασίες με τις οποίες τα δημόσια όργανα προμηθεύουν και προμηθεύονται αγαθά και υπηρεσίες. Τα δεδομένα συμβάσεων περιλαμβάνουν πληροφορίες σχετικά με τις προσφορές που έχουν εκδοθεί ή τις αιτήσεις υποβολής προτάσεων (RFP), τις συμβάσεις που έχουν ανατεθεί, την αξιολόγηση και ολοκλήρωση των επιδόσεων και άλλα.

Για να ενθαρρυνθούν οι βέλτιστες πρακτικές όσον αφορά τη γνωστοποίηση στον τομέα των δημόσιων συμβάσεων, ο οργανισμός Open Contracting Partnership ανέπτυξε ένα σύνολο αρχών[16] που μπορούν να προσαρμοστούν σε συγκεκριμένα τομεακά πλαίσια. Αυτές οι αρχές έχουν σχεδιαστεί για να καταστήσουν τη σύναψη συμβάσεων πιο ανταγωνιστική και δίκαιη, να υποστηρίξουν την παγκόσμια διαφάνεια και τις ανοικτές κυβερνητικές πολιτικές καθοδηγώντας τις κυβερνήσεις και τους εμπλεκόμενους φορείς στην ανοικτή διάθεση δεδομένων, ώστε να καταστεί δυνατή η κατανόηση, η αποτελεσματική παρακολούθηση, η αποτελεσματικότητα και η λογοδοσία.

Το πρότυπο ανοικτών δεδομένων συμβάσεων 17 δημιουργήθηκε για να δώσει τη δυνατότητα στις κυβερνήσεις να δημοσιεύουν λεπτομέρειες για όλα τα στάδια της διαδικασίας, συμπεριλαμβανομένου του σχεδιασμού, του διαγωνισμού, της ανάθεσης, της σύμβασης και της υλοποίησης. Το πρότυπο παρέχει λεπτομερές σχήμα για την ανάδειξη των δεδομένων των συμβάσεων σε μια σειρά μορφών, καθώς και καθοδήγηση σχετικά με τις επιλογές εφαρμογής. Το Γραφείο Βοήθειας του OCDS είναι διαθέσιμο για να παρέχει συμβουλές σχετικά με την εφαρμογή των προτύπων. Υπάρχει επίσης ένα πρόγραμμα ελέγχου OCDS για να ελέγχεται εάν τα δεδομένα συμμορφώνονται με το πρότυπο OCD.

Στοιχεία προϋπολογισμού

Τα στοιχεία του προϋπολογισμού αφορούν τις δαπάνες του δημόσιου τομέα, κατανεμημένες ανά επίπεδο κυβέρνησης, λειτουργική ή προγραμματική κατηγορία, οικονομικό έτος και πηγή χρηματοδότησης. Το BOOST και το OpenSpending είναι δύο πρωτοβουλίες που παρέχουν καλά παραδείγματα για τον τρόπο παραγωγής των δημοσιονομικών στοιχείων σύμφωνα με τις βέλτιστες πρακτικές των ανοικτών δεδομένων:

  • ΒOOST[18]: Η πρωτοβουλία BOOST είναι μια συλλογική προσπάθεια σε επίπεδο Τραπεζών για τη διευκόλυνση της πρόσβασης στα δεδομένα του προϋπολογισμού και τη βελτίωση των διαδικασιών λήψης αποφάσεων και της διαφάνειας. Το BOOST είναι μια εκτενής βάση δεδομένων δημοσίων δαπανών που εδρεύει σε 57 χώρες και χρησιμοποιεί κυβερνητικά δεδομένα και ένα πρότυπο για την κατανόηση και την προσβασιμότητα μεγάλων δημοσιονομικών συνόλων δεδομένων σε βασικούς χρήστες όπως οι νομοθετικές και ελεγκτικές αρχές και η κοινωνία των πολιτών.
  • OpenSpending[19]: Πρόκειται για μια κεντρική, υψηλής ποιότητας, ανοικτή βάση δεδομένων που περιλαμβάνει δημόσιες οικονομικές πληροφορίες, συμπεριλαμβανομένων των προϋπολογισμών, των δαπανών και των ισολογισμών, μια κοινότητα χρηστών και συντελεστών και ένα σύνολο ανοικτών πόρων που παρέχει την τεχνική, φορολογική και πολιτική πληροφορία που απαιτείται για εργασία με τα οικονομικά δεδομένα.

Δεδομένα μεταφορών

Τα δεδομένα μεταφορών μπορούν να παρέχουν πληροφορίες σχετικά με υποδομή, χρήση και χωρητικότητα υψηλού επιπέδου (π.χ. έκταση δρόμων, αριθμός οχημάτων σε πληθυσμό, κατανάλωση καυσίμου). Σε αυτό το πλαίσιο, ωστόσο, τα στοιχεία για τις μεταφορές σχετίζονται με τις δημόσιες μετακινήσεις, όπως η διαθεσιμότητα τρένων, λεωφορείων, ταξί και χρονοδιαγράμματα.

Οι παραγωγοί δεδομένων μεταφοράς θα πρέπει να γνωρίζουν την Γενική Προδιαγραφή Τροφίμων για τις Μεταφορές (GTFS). Το GTFS είναι ένα μηχαναγνώσιμο πρότυπο δεδομένων για τα δρομολόγια μεταφοράς, τα δεδομένα και τις σχετικές γεωγραφικές πληροφορίες που ενθαρρύνει την επαναχρησιμοποίηση. Το TransitApp είναι ένα παράδειγμα μιας εφαρμογής που εκμεταλλεύεται δεδομένα μορφοποιημένα από το GTFS που έχουν εκδοθεί από διάφορες πόλεις.

Γεωχωρικά δεδομένα

Τα γεωχωρικά δεδομένα προσδιορίζουν τις γεωγραφικές πτυχές μιας ευρείας ποικιλίας πληροφοριών, όπως είναι οι τοποθεσίες κτιρίων ή κέντρων ψηφοφορίας, τα όρια γειτονιών και πόλεων ή τοποθεσίες δασικών εκχωρήσεων, για να αναφέρουμε μόνο μερικές. Στην πολιτική των ανοικτών δεδομένων, τα γεωχωρικά δεδομένα διανέμονται συνήθως σε τουλάχιστον μία από τις ακόλουθες μορφές: Το GeoJSON είναι ένα παράγωγο του JSON, τον δημοφιλή μορφότυπο δεδομένων που βασίζεται σε Javascript, και αυτό το χαρακτηριστικό κάνει τα δεδομένα του GeoJSON εύκολο να ενσωματωθούν με web-based εφαρμογές. Το TopoJSON αποτελεί επέκταση του GeoJSON, αλλά με μια διαφορετική προσέγγιση για την περιγραφή γεωγραφικών χαρακτηριστικών. Ως αποτέλεσμα, τα αρχεία TopoJSON είναι κατά κανόνα 80% μικρότερα από τα αντίστοιχα GeoJSON. Η γλώσσα σήμανσης κλειδιών (KML) είναι μια μορφή δεδομένων που βασίζεται σε XML και έχει εισαχθεί από την Google στους Χάρτες Google και στο Google Earth. Το Shapefile είναι το εγγενές σχήμα της σουίτας λογισμικού ArcGIS από την ESRI, αλλά είναι ιδιαίτερα διαδεδομένο και είναι συμβατό με τα περισσότερα μεγάλα συστήματα GIS. Το Open Geospatial Consortium20 είναι ένας εθελοντικός, διεθνής οργανισμός που αποτελείται από περίπου 500 εταιρείες, κυβερνητικούς οργανισμούς και πανεπιστήμια τα οποία συνεργάζονται για την ανάπτυξη προτύπων για γεωχωρικά δεδομένα. Μέχρι σήμερα, το OGC έχει αναπτύξει πάνω από 30 πρότυπα για διάφορους τύπους γεωχωρικών δεδομένων, συμπεριλαμβανομένου του μορφότυπου KML που έχει αναπτύξει η Google και έχει υποβληθεί στο OGC.

Μικρο-δεδομένα/Microdata

Βασισμένα επί των απαντήσεων ερευνών σε άτομα, νοικοκυριά ή επιχειρήσεις, τα microdata έχουν πολλές εφαρμογές, που είναι να παράξουν συγκεντρωτικά στατιστικά στοιχεία. Επειδή υπάρχει συχνά επίσημη (ή υπονοούμενη) νομική προστασία λόγω εμπιστευτικότητας, τα μικροδεδομένα υπόκεινται σε ιδιαίτερα υψηλά πρότυπα όσον αφορά τη διανομή τους και σχεδόν πάντα υποβάλλονται σε τεχνικές ανωνυμοποίησης των δεδομένων.

Περισσότερες οδηγίες για την ποιότητα και τις τεχνικές Διαχείριση δεδομένων

Η διοίκηση δεδομένων εξετάζει τη διαχείριση των ανοικτών δεδομένων τόσο κατά την αρχική διάθεσή τους όσο και στη συνέχεια. Οι πολιτικές διακυβέρνησης διευκρινίζουν τις αρμοδιότητες της κυβέρνησης και των υπουργείων για τη διαχείριση δεδομένων, περιγράφουν τη διαδικασία και τις απαιτήσεις για την διάθεση και την ενημέρωση των δεδομένων και παρέχουν στους χρήστες δυνατότητες να εμπλέκουν τους παρόχους σχετικά με οποιαδήποτε ζητήματα ή αιτήματα που προκύπτουν.

Η διαχείριση δεδομένων συχνά αντιμετωπίζεται στο πλαίσιο των πολιτικών ανοικτών δεδομένων, με παραδείγματα όπως παρακάτω:

  • Οδηγοί γρήγορης διαμόρφωσης portal ανοικτών δεδομένων από το www.data.gov.uk: Αυτές οι πηγές παρέχουν μια επισκόπηση των κυβερνητικών οδηγιών τόσο σε υψηλό (διοργανικό) επίπεδο όσο και σε τοπικό επίπεδο (δηλ., ένας και μοναδικός κατάλογος δεδομένων), και περιγράφουν τους διαφορετικούς ρόλους στη διαχείριση των συνόλων δεδομένων.

  • Οδηγός υλοποίησης έργου για ανοικτά δεδομένα: Μελέτη εφαρμογής και υλοποίησης έργου ανοικτών δεδομένων. Αποτελεί μέρος του Project Open Data της Κυβέρνησης των ΗΠΑ και παρέχει καθοδήγηση σε οργανισμούς που εφαρμόζουν την πολιτική για τα ανοικτά δεδομένα. Μεταξύ άλλων θεμάτων, παρέχει οδηγίες για:

  • Δημιουργία και διατήρηση ενός αποθετηρίου δεδομένων για όλα τα σύνολα δεδομένων που βρίσκονται στην κατοχή ενός οργανισμού

  • Δημιουργία λίστας δημόσιων δεδομένων (υποσύνολο του ανωτέρω)

  • Ενθάρρυνση των παρόχων να διευκολύνουν και να προτεραιοποιήσουν το άνοιγμα των δεδομένων

  • Τεκμηρίωση δεδομένων που δεν μπορούν να διατεθούν ανοικτά

Ανωνυμοποίηση

Ανωνυμοποίηση είναι η διαδικασία απομάκρυνσης πληροφορίας από ένα σύνολο δεδομένων που θα μπορούσε να χρησιμοποιηθεί για την ταυτοποίηση ατόμων ή επιχειρήσεων, έτσι ώστε να διατηρηθεί και να προστατευθεί η ανωνυμία τους. Η ανωνυμοποίηση και η επιτακτική ανάγκη προστασίας της εμπιστευτικότητας είναι ιδιαίτερα σημαντικές για τις κυβερνήσεις που δημοσιοποιούν δημόσια δεδομένα. Εξίσου σημαντική είναι η ανάγκη οι φορείς να διατυπώνουν με σαφήνεια τις πολιτικές απορρήτου τους όσον αφορά τη διαχείριση δεδομένων, τόσο σε άτομα που παρέχουν δεδομένα όσο και σε άτομα που χρησιμοποιούν τα δεδομένα αυτά. Τούτου λεχθέντος, πολλοί τύποι κυβερνητικών δεδομένων δεν συνεπάγεται εκ των προτέρων ότι περιέχουν εμπιστευτικές πληροφορίες και συνεπώς έχουν ελάχιστη ή και καθόλου ανάγκη για τεχνικές ανωνυμοποίησης. Η σωστή ανωνυμοποίηση είναι ιδιαίτερα εξειδικευμένη ανάλογα με τον τύπο δεδομένων και το σύνολο δεδομένων.

Παρακάτω παρατίθενται επιπλέον πληροφορίες:

Handbook on Statistical Disclosure Control. Αυτή η μελέτη καλύπτει θέματα σχετικά με την ανωνυμοποίηση, συμπεριλαμβανομένων των ρυθμιστικών θεμάτων, των μικροδεδομένων, των πινακοποιημένων δεδομένων και των ζητημάτων που προκύπτουν από την απομακρυσμένη πρόσβαση.

Anonymization Guide from the UK’s Information Commissioner’s Office. Αυτή η μελέτη παρέχει οδηγίες σχετικά με τις τεχνικές ανωνυμοποίησης και την προστασία της ιδιωτικής ζωής για μια σειρά τύπων δεδομένων στο πλαίσιο του νόμου περί προστασίας δεδομένων του Ηνωμένου Βασιλείου.

Rethinking Personal Data: Strengthening Trust (World Economic Forum). Η έκθεση αυτή ενθαρρύνει το διάλογο γύρω από μερικά από τα βασικά ζητήματα που πρέπει να επιλυθούν προκειμένου να διασφαλιστεί η μακροπρόθεσμη και βιώσιμη δημιουργία αξίας. Διάφορες σχετικές εκθέσεις παρακολούθησης διατέθηκαν το 2013 και το 2014.

Μεταδεδομένα

Τα Μεταδεδομένα ορίζονται συχνά ως "δεδομένα σχετικά με τα δεδομένα". Τα μεταδεδομένα παρέχουν τις απαραίτητες πληροφορίες για την αποτελεσματική χρήση μιας συγκεκριμένης πηγής δεδομένων και μπορεί να περιλαμβάνουν πληροφορίες σχετικά με την πηγή, τη δομή, τοπική, γεωγραφική ή/και χρονική κάλυψη, άδεια, πότε ενημερώθηκε για τελευταία φορά και πώς διατηρείται. Ειδικοί τύποι δεδομένων περιλαμβάνουν συχνά πρόσθετα μεταδεδομένα ανάλογα με την περίπτωση: για παράδειγμα, οι ψηφιακές φωτογραφίες μπορεί να περιλαμβάνουν μια χρονική σφραγίδα, πληροφορίες σχετικά με τον εξοπλισμό που χρησιμοποιείται, ρυθμίσεις διαφράγματος και ενδεχομένως την τοποθεσία GPS. Το Dublin Core Metadata Initiative (DCMI) παρέχει ένα πλαίσιο και το βασικό λεξιλόγιο για όρους μεταδεδομένων που μπορούν να εφαρμοστούν στους περισσότερους ηλεκτρονικούς πόρους. Το Dublin Core χρησιμοποιείται σε μεγάλο βαθμό στο DCAT, ένα πρότυπο που έχει σχεδιαστεί για να διευκολύνει τη διαλειτουργικότητα μεταξύ διαδικτυακών καταλόγων δεδομένων. Οι κυβερνήσεις μπορούν να αναπτύξουν τα δικά τους μοντέλα μεταδεδομένων (κατά προτίμηση βασισμένα σε καθιερωμένα πρότυπα όπως το DCAT) για να εξασφαλίσουν περαιτέρω ομοιομορφία σε πρωτοβουλίες ανοικτών δεδομένων σε επίπεδο κυβέρνησης. Ένα παράδειγμα είναι το σχήμα μεταδεδομένων που παρέχεται από το https://www.data.gov/.

Άλλα πρότυπα μεταδεδομένων χρησιμοποιούνται σε μια μεγάλη ποικιλία τύπων δεδομένων. Για τα κυβερνητικά δεδομένα, μερικά από τα πιο σημαντικά περιλαμβάνουν:

  • Data Documentation Initiative (DDI): Χρησιμοποιείται κυρίως στα δεδομένα των κοινωνικών επιστημών, αλλά εφαρμόζεται ευρύτερα.

  • ISO 19115-1:2014: γεωχωρικά δεδομένα

  • Text Encoding Initiative: Κείμενα σε ψηφιακή μορφή, κυρίως στις ανθρωπιστικές επιστήμες, τις κοινωνικές επιστήμες και τη γλωσσολογία

  • Directory Interchange Format (DIF): Σύνολα επιστημονικών δεδομένων