Αυτές είναι οι καλύτερες ελεύθερες ανοικτές πηγές δεδομένων που μπορεί κανείς να χρησιμοποιήσει

PC: Flickr

Τι είναι τα ανοιχτά δεδομένα;

Με απλά λόγια, το Open Data σημαίνει το είδος των δεδομένων που είναι ανοιχτό σε οποιονδήποτε και σε όλους για πρόσβαση, τροποποίηση, επαναχρησιμοποίηση και κοινή χρήση.

Το Open Data βασίζεται σε διάφορες "ανοικτές κινήσεις", όπως η ανοιχτή πηγή, το ανοιχτό υλικό, η ανοιχτή κυβέρνηση, η ανοιχτή επιστήμη κλπ.

Κυβερνήσεις, ανεξάρτητες οργανώσεις και οργανισμοί έχουν προχωρήσει για να ανοίξουν τις πλημμύρες δεδομένων για να δημιουργήσουν όλο και πιο ανοιχτά δεδομένα για δωρεάν και εύκολη πρόσβαση.

Γιατί είναι ανοικτά τα δεδομένα σημαντικά;

Τα ανοιχτά δεδομένα είναι σημαντικά επειδή ο κόσμος έχει αυξηθεί όλο και περισσότερο ως προς τα δεδομένα. Ωστόσο, εάν υπάρχουν περιορισμοί στην πρόσβαση και τη χρήση δεδομένων, η ιδέα των επιχειρήσεων και της διακυβέρνησης που βασίζονται σε δεδομένα δεν θα υλοποιηθεί.

Επομένως, τα ανοιχτά δεδομένα έχουν τη δική τους μοναδική θέση. Μπορεί να επιτρέψει την πληρέστερη κατανόηση των παγκόσμιων προβλημάτων και των καθολικών θεμάτων. Μπορεί να δώσει μεγάλη ώθηση στις επιχειρήσεις. Μπορεί να είναι μια μεγάλη ώθηση για την εκμάθηση μηχανών. Μπορεί να βοηθήσει στην καταπολέμηση παγκόσμιων προβλημάτων όπως η ασθένεια ή το έγκλημα ή η πείνα. Τα ανοιχτά δεδομένα μπορούν να δώσουν στους πολίτες τη δυνατότητα να ενισχύσουν τη δημοκρατία. Μπορεί να εξορθολογίσει τις διαδικασίες και τα συστήματα που έχει οικοδομήσει η κοινωνία και οι κυβερνήσεις. Μπορεί να συμβάλει στον μετασχηματισμό του τρόπου κατανόησης και δέσμευσης του κόσμου.

Έτσι, εδώ είναι ο κατάλογός μου από 15 awesome Open Data πηγές:

1. Ανοικτά στοιχεία της Παγκόσμιας Τράπεζας

Ως αποθήκη των πιο ολοκληρωμένων δεδομένων του κόσμου σχετικά με το τι συμβαίνει σε διάφορες χώρες σε όλο τον κόσμο, τα Παγκόσμια Ανοιχτά Δεδομένα της Παγκόσμιας Τράπεζας αποτελούν ζωτική πηγή των Ανοιχτών Δεδομένων. Παρέχει επίσης πρόσβαση σε άλλα σύνολα δεδομένων που αναφέρονται στον κατάλογο δεδομένων.

Το Open Data της Παγκόσμιας Τράπεζας είναι τεράστιο επειδή διαθέτει 3000 σύνολα δεδομένων και 14000 δείκτες που περιλαμβάνουν μικροδεδομένα, στατιστικά στοιχεία χρονοσειρών και γεωχωρικά δεδομένα.

Η πρόσβαση και η ανακάλυψη των δεδομένων που θέλετε είναι επίσης αρκετά εύκολη. Το μόνο που χρειάζεται να κάνετε είναι να καθορίσετε τα ονόματα των δεικτών, τις χώρες ή τα θέματα και θα ανοίξει το θησαυροφυλάκιο του Open Data για εσάς. Σας επιτρέπει επίσης να κάνετε λήψη δεδομένων σε διαφορετικές μορφές όπως CSV, Excel και XML.

Εάν είστε δημοσιογράφος ή ακαδημαϊκός, θα είστε ενθουσιασμένοι με τη σειρά εργαλείων που έχετε στη διάθεσή σας. Μπορείτε να έχετε πρόσβαση σε εργαλεία ανάλυσης και απεικόνισης που μπορούν να ενισχύσουν την έρευνά σας. Μπορεί να ευχαριστήσει μια βαθύτερη και καλύτερη κατανόηση των παγκόσμιων προβλημάτων.

Μπορείτε να έχετε πρόσβαση στο API, το οποίο μπορεί να σας βοηθήσει να δημιουργήσετε τις οπτικοποιήσεις δεδομένων που χρειάζεστε, ζωντανά συνδυασμούς με άλλες πηγές δεδομένων και πολλά άλλα τέτοια χαρακτηριστικά.

Ως εκ τούτου, δεν αποτελεί έκπληξη το γεγονός ότι τα Παγκόσμια Ανοιχτά Δεδομένα της Παγκόσμιας Τράπεζας αποτελούν κορυφαία λίστα πηγών ανοιχτών δεδομένων!

2. WHO (Παγκόσμιος Οργανισμός Υγείας) - Ανοίξτε το αποθετήριο δεδομένων

Ο χώρος αποθήκευσης δεδομένων Ανοιχτών Δεδομένων της ΠΟΥ είναι ο τρόπος με τον οποίο ο ΠΟΥ παρακολουθεί τα ειδικά για την υγεία στατιστικά στοιχεία των 194 κρατών μελών του.

Το αποθετήριο διατηρεί συστηματικά τα δεδομένα. Μπορεί να είναι προσβάσιμη σύμφωνα με διαφορετικές ανάγκες. Για παράδειγμα, εάν πρόκειται για θνησιμότητα ή επιβάρυνση από ασθένειες, μπορεί κανείς να αποκτήσει πρόσβαση σε δεδομένα ταξινομημένα σε 100 ή περισσότερες κατηγορίες, όπως οι αναπτυξιακοί στόχοι της Χιλιετίας (παιδική διατροφή, υγεία των παιδιών, μητρική και αναπαραγωγική υγεία, ανοσοποίηση, HIV / AIDS, φυματίωση, νερό και αποχέτευση), μη μεταδοτικές ασθένειες και παράγοντες κινδύνου, ασθένειες επιρρεπείς στην επιδημία, συστήματα υγείας, περιβαλλοντική υγεία, βία και τραυματισμοί, δικαιοσύνη κ.λπ.

Για τις συγκεκριμένες ανάγκες σας, μπορείτε να περάσετε από τα σύνολα δεδομένων ανάλογα με τα θέματα, την κατηγορία, τον δείκτη και τη χώρα.

Το καλό είναι ότι μπορείτε να κάνετε λήψη όσων δεδομένων χρειάζεστε σε μορφή Excel. Μπορείτε επίσης να παρακολουθείτε και να αναλύετε τα δεδομένα κάνοντας χρήση της δικτυακής πύλης δεδομένων.

Το API στο περιεχόμενο δεδομένων και στατιστικών στοιχείων της Παγκόσμιας Οργάνωσης Υγείας είναι επίσης διαθέσιμο.

3. Google Public Data Explorer

Το Google Public Data Explorer, το οποίο ξεκίνησε το 2010, μπορεί να σας βοηθήσει να διερευνήσετε τεράστια ποσά δεδομένων δεδομένων δημόσιου ενδιαφέροντος. Μπορείτε να απεικονίσετε και να κοινοποιήσετε τα δεδομένα για τις αντίστοιχες χρήσεις σας.

Κάνει τα δεδομένα από διαφορετικούς οργανισμούς και πηγές διαθέσιμες. Για παράδειγμα, μπορείτε να έχετε πρόσβαση σε δεδομένα από την Παγκόσμια Τράπεζα, το Γραφείο Στατιστικής Εργασίας του Ηνωμένου Βασιλείου και το Γραφείο των ΗΠΑ, τον ΟΟΣΑ, το ΔΝΤ και άλλα.

Διάφοροι ενδιαφερόμενοι έχουν πρόσβαση σε αυτά τα δεδομένα για διάφορους σκοπούς. Είτε είστε φοιτητής ή δημοσιογράφος, είτε είστε διαμορφωτής πολιτικής είτε ακαδημαϊκός, μπορείτε να χρησιμοποιήσετε αυτό το εργαλείο για να δημιουργήσετε οπτικοποιήσεις δημόσιων δεδομένων.

Μπορείτε να αναπτύξετε διάφορους τρόπους αντιπροσώπευσης των δεδομένων, όπως γραφήματα γραμμής, γραμμικές γραφικές παραστάσεις, χάρτες και διαγράμματα φυσαλίδων με τη βοήθεια του Data Explorer.

Το καλύτερο μέρος είναι ότι θα βρείτε αυτές τις απεικονίσεις αρκετά δυναμικές. Αυτό σημαίνει ότι θα τα δείτε να αλλάζουν με την πάροδο του χρόνου. Μπορείτε να αλλάξετε θέματα, να εστιάσετε σε διαφορετικές καταχωρήσεις και να τροποποιήσετε την κλίμακα.

Μπορεί επίσης να μοιραστεί εύκολα. Μόλις έχετε έτοιμο το γράφημα, μπορείτε να το ενσωματώσετε στην ιστοσελίδα σας ή στο blog σας ή απλά να μοιραστείτε έναν σύνδεσμο με τους φίλους σας.

4. Μητρώο Ανοικτών Δεδομένων για το AWS (RODA)

Πρόκειται για ένα αποθετήριο που περιέχει δημόσια σύνολα δεδομένων. Είναι δεδομένα που διατίθενται από τους πόρους του AWS.

Όσον αφορά την RODA, μπορείτε να ανακαλύψετε και να μοιραστείτε τα δεδομένα που είναι διαθέσιμα στο κοινό.

Στο RODA, μπορείτε να χρησιμοποιήσετε λέξεις-κλειδιά και ετικέτες για συνηθισμένους τύπους δεδομένων, όπως γονιδιωματικές, δορυφορικές εικόνες και μεταφορές, προκειμένου να αναζητήσετε τα δεδομένα που αναζητάτε. Όλα αυτά είναι δυνατά σε μια απλή διεπαφή ιστού.

Για κάθε σύνολο δεδομένων, θα ανακαλύψετε τη σελίδα λεπτομερειών, τα παραδείγματα χρήσης, τις πληροφορίες άδειας χρήσης και τα σεμινάρια ή τις εφαρμογές που χρησιμοποιούν αυτά τα δεδομένα.

Χρησιμοποιώντας ένα ευρύ φάσμα προϊόντων υπολογιστών και δεδομένων, μπορείτε να αναλύσετε τα ανοιχτά δεδομένα και να δημιουργήσετε οποιεσδήποτε υπηρεσίες επιθυμείτε.

Ενώ τα δεδομένα στα οποία έχετε πρόσβαση είναι διαθέσιμα μέσω πόρων AWS, πρέπει να έχετε κατά νου ότι δεν παρέχεται από το AWS. Αυτά τα δεδομένα ανήκουν σε διαφορετικούς οργανισμούς, κυβερνητικούς οργανισμούς, ερευνητές, επιχειρήσεις και ιδιώτες.

5. Ανοιχτή πύλη δεδομένων της Ευρωπαϊκής Ένωσης

Μπορείτε να έχετε πρόσβαση σε όποια ανοιχτά δεδομένα δημοσιεύονται από τα θεσμικά όργανα, τους οργανισμούς και άλλους οργανισμούς της ΕΕ σε μια ενιαία πλατφόρμα, συγκεκριμένα την Ευρωπαϊκή Πύλη Δεδομένων Ανοιχτών Δεδομένων

Η διαδικτυακή πύλη δεδομένων για την ΕΕ ανοικτή φιλοξενεί ζωτικά ανοικτά δεδομένα σχετικά με τους τομείς πολιτικής της ΕΕ. Αυτοί οι τομείς πολιτικής περιλαμβάνουν την οικονομία, την απασχόληση, την επιστήμη, το περιβάλλον και την εκπαίδευση.

Περίπου 70 θεσμικά όργανα, οργανισμοί ή υπηρεσίες της ΕΕ, όπως η Eurostat, ο Ευρωπαϊκός Οργανισμός Περιβάλλοντος, το Κοινό Κέντρο Ερευνών και άλλες Γενικές Διευθύνσεις της Ευρωπαϊκής Επιτροπής και οι οργανισμοί της ΕΕ, δημοσιοποίησαν τα δεδομένα τους και επέτρεψαν την πρόσβαση. Αυτά τα σύνολα δεδομένων έχουν περάσει τον αριθμό των 11700 μέχρι σήμερα.

Η πύλη παρέχει εύκολη πρόσβαση. Μπορείτε εύκολα να αναζητήσετε, να εξερευνήσετε, να συνδέσετε, να κατεβάσετε και να επαναχρησιμοποιήσετε τα δεδομένα μέσω ενός καταλόγου κοινών μεταδεδομένων. Μπορείτε να το κάνετε για τους συγκεκριμένους σκοπούς σας. Θα μπορούσε να είναι εμπορικοί ή μη εμπορικοί.

Μπορείτε να αναζητήσετε τον κατάλογο μεταδεδομένων μέσω μιας μηχανής διαδραστικής αναζήτησης (καρτέλα Δεδομένα) και των ερωτημάτων SPARQL (καρτέλα Συνδεδεμένα δεδομένα).

Χρησιμοποιώντας αυτόν τον κατάλογο, μπορείτε να αποκτήσετε πρόσβαση στα δεδομένα που είναι αποθηκευμένα στις διάφορες ιστοσελίδες των θεσμικών οργάνων, οργανισμών και οργανισμών της ΕΕ.

6. FiveThirtyEight

Πρόκειται για μια εξαιρετική τοποθεσία για τη δημοσιογραφική ενημέρωση και την αφήγηση ιστοριών.

Παρέχει τις διάφορες πηγές δεδομένων για διάφορους τομείς όπως η πολιτική, ο αθλητισμός, η επιστήμη, η οικονομία κ.λπ. Μπορείτε επίσης να κατεβάσετε τα δεδομένα.

Όταν έχετε πρόσβαση στα δεδομένα, θα συναντήσετε μια σύντομη εξήγηση σχετικά με κάθε σύνολο δεδομένων σε σχέση με την πηγή της. Θα μάθετε επίσης τι σημαίνει και πώς να το χρησιμοποιήσετε.

Προκειμένου να καταστήσει αυτά τα δεδομένα φιλικά προς το χρήστη, παρέχει σύνολα δεδομένων σε όσο το δυνατόν απλούστερες, μη αποκλειστικές μορφές, όπως αρχεία CSV. Περιττό να πούμε ότι αυτές οι μορφές είναι εύκολα προσβάσιμες και επεξεργασμένες τόσο από ανθρώπους όσο και από μηχανές.

Με τη βοήθεια αυτών των συνόλων δεδομένων, μπορείτε να δημιουργήσετε ιστορίες και απεικονίσεις σύμφωνα με τις δικές σας απαιτήσεις και προτιμήσεις.

7. Γραφείο απογραφής των ΗΠΑ

Το Γραφείο Απογραφής των Η.Π.Α. είναι το μεγαλύτερο στατιστικό γραφείο της ομοσπονδιακής κυβέρνησης. Αποθηκεύει και παρέχει αξιόπιστα δεδομένα και δεδομένα σχετικά με τους ανθρώπους, τους τόπους και την οικονομία της Αμερικής.

Το Γραφείο απογραφής θεωρεί την ευγενή αποστολή του να επεκτείνει τις υπηρεσίες του ως τον πιο αξιόπιστο πάροχο δεδομένων ποιότητας.

Είτε πρόκειται για ομοσπονδιακή, πολιτειακή, τοπική ή φυλετική κυβέρνηση, όλοι κάνουν χρήση δεδομένων απογραφής για διάφορους σκοπούς. Αυτές οι κυβερνήσεις χρησιμοποιούν τα δεδομένα αυτά για να καθορίσουν τη θέση των νέων κατοικιών και των δημόσιων εγκαταστάσεων. Επίσης, κάνουν χρήση της κατά την εξέταση των δημογραφικών χαρακτηριστικών των κοινοτήτων, των κρατών και των ΗΠΑ.

Τα δεδομένα αυτά χρησιμοποιούνται επίσης για τον σχεδιασμό συστημάτων μεταφοράς και οδών. Όταν πρόκειται να αποφασιστούν οι ποσοστώσεις και να δημιουργηθούν αστυνομικοί και πυροσβεστικοί χώροι, τα δεδομένα αυτά είναι χρήσιμα. Όταν οι κυβερνήσεις δημιουργούν τοπικούς τομείς εκλογών, σχολεία, επιχειρήσεις κοινής ωφελείας κ.λπ., κάνουν χρήση αυτών των δεδομένων. Είναι μια πρακτική να συγκεντρώνουμε πληροφορίες για τον πληθυσμό μια δεκαετία και αυτά τα δεδομένα είναι πολύ χρήσιμα για την επίτευξη του ιδίου.

Υπάρχουν διάφορα εργαλεία όπως το American Fact Finder, το DataScan Explorer και τα Γρήγορα Στοιχεία, τα οποία είναι χρήσιμα σε περίπτωση που θέλετε να αναζητήσετε, να προσαρμόσετε και να απεικονίσετε δεδομένα.

Για παράδειγμα, το Quick Facts και μόνο περιέχει στατιστικά στοιχεία για όλα τα κράτη, τις κομητείες, τις πόλεις και ακόμη και τις πόλεις με πληθυσμό 5000 ή περισσότερους.

Ομοίως, το American Finder Finder μπορεί να σας βοηθήσει να ανακαλύψετε δημοφιλή γεγονότα όπως ο πληθυσμός, το εισόδημα κλπ. Παρέχει πληροφορίες που ζητούνται συχνά.

Το καλό είναι ότι μπορείτε να αναζητήσετε, να αλληλεπιδράσετε με τα δεδομένα, να γνωρίσετε τα δημοφιλή στατιστικά στοιχεία και να δείτε τα σχετικά γραφήματα μέσω του Data Explorer. Επιπλέον, μπορείτε επίσης να χρησιμοποιήσετε οπτικό εργαλείο για να προσαρμόσετε δεδομένα σε μια εμπειρία διαδραστικών χαρτών.

8. Data.gov

Το Data.gov είναι το θησαυροφυλάκιο των ανοικτών δεδομένων της αμερικανικής κυβέρνησης. Μόλις πρόσφατα έγινε η απόφαση να διατεθούν δωρεάν όλα τα κυβερνητικά δεδομένα.

Όταν ξεκίνησε, υπήρχαν μόνο 47. Υπάρχουν τώρα 180.000 σύνολα δεδομένων.

Γιατί Data.gov είναι μια μεγάλη πηγή είναι επειδή μπορείτε να βρείτε τα δεδομένα, τα εργαλεία και τους πόρους που μπορείτε να αναπτύξετε για διάφορους σκοπούς. Μπορείτε να διεξάγετε την έρευνά σας, να αναπτύξετε τις εφαρμογές ιστού και κινητής τηλεφωνίας και ακόμη και να σχεδιάσετε οπτικοποιήσεις δεδομένων.

Το μόνο που χρειάζεται να κάνετε είναι να εισαγάγετε λέξεις-κλειδιά στο πλαίσιο αναζήτησης και να περιηγηθείτε σε τύπους, ετικέτες, μορφές, ομάδες, τύπους οργάνωσης, οργανισμούς και κατηγορίες. Αυτό θα διευκολύνει την εύκολη πρόσβαση στα δεδομένα ή τα σύνολα δεδομένων που χρειάζεστε.

Το Data.gov ακολουθεί το Scheme Open Data Project - ένα σύνολο απαιτούμενων πεδίων (Τίτλος, Περιγραφή, Ετικέτες, Τελευταία Ενημέρωση, Εκδότης, Όνομα Επικοινωνίας κ.λπ.) για κάθε σύνολο δεδομένων που εμφανίζεται στο Data.gov.

9. DBpedia

Όπως γνωρίζετε, η Wikipedia είναι μια μεγάλη πηγή πληροφοριών. Το DBpedia στοχεύει στη δημιουργία δομημένου περιεχομένου από τις πολύτιμες πληροφορίες που δημιούργησε η Wikipedia.

Με το DBpedia, μπορείτε να αναζητήσετε σημασιολογικά και να διερευνήσετε τις σχέσεις και τις ιδιότητες του πόρου Wikipedia. Αυτό περιλαμβάνει συνδέσμους με άλλα σχετικά σύνολα δεδομένων.

Υπάρχουν περίπου 4.58 εκατομμύρια οντότητες στο σύνολο δεδομένων DBpedia. 4.22 εκατομμύρια ταξινομούνται στην οντολογία, συμπεριλαμβανομένων 1.445.000 ατόμων, 735.000 θέσεις, 123.000 μουσικά άλμπουμ, 87.000 ταινίες, 19.000 βιντεοπαιχνίδια, 241.000 οργανώσεις, 251.000 είδη και 6.000 ασθένειες.

Υπάρχουν ετικέτες και περιλήψεις για αυτές τις οντότητες σε περίπου 125 γλώσσες. Υπάρχουν 25,2 εκατομμύρια συνδέσεις σε εικόνες. Υπάρχουν 29,8 εκατομμύρια συνδέσεις σε εξωτερικές ιστοσελίδες.

Το μόνο που χρειάζεται να κάνετε για να χρησιμοποιήσετε το DBpedia είναι να γράψετε ερωτήματα SPARQL ενάντια στο τελικό σημείο ή κατεβάζοντας τα χωματερές τους.

Η DBpedia έχει επωφεληθεί από πολλές επιχειρήσεις, όπως η Apple (μέσω της Siri), η Google (μέσω του Freebase και του Google Knowledge Graph) και η IBM (μέσω της Watson) και ιδιαίτερα τα αντίστοιχα έργα τους που συνδέονται με την τεχνητή νοημοσύνη.

10. openCodeCamp Άνοιγμα δεδομένων

Είναι μια κοινότητα ανοιχτού κώδικα. Γιατί αυτό είναι σημαντικό επειδή σας επιτρέπει να κωδικοποιείτε, να χτίζετε έργα pro bono μετά από μη κερδοσκοπικά ιδρύματα και να πάρετε μια δουλειά ως προγραμματιστής.

Για να γίνει αυτό, η κοινότητα freeCodeCamp.org διαθέτει τεράστια ποσά δεδομένων κάθε μήνα. Το έχουν μετατρέψει σε ανοιχτά δεδομένα.

Θα βρείτε μια ποικιλία από πράγματα σε αυτήν την αποθήκη. Μπορείτε να βρείτε σύνολα δεδομένων, ανάλυση των ίδιων και ακόμη και demos έργων με βάση τα δεδομένα freeCodeCamp. Μπορείτε επίσης να βρείτε συνδέσεις με εξωτερικά έργα που αφορούν τα δεδομένα freeCodeCamp.

Μπορεί να σας βοηθήσει με μια ποικιλία έργων και εργασιών που μπορεί να έχετε κατά νου. Είτε πρόκειται για αναλύσεις ιστού, αναλύσεις κοινωνικών μέσων, ανάλυση κοινωνικών δικτύων, ανάλυση της εκπαίδευσης, οπτικοποίηση δεδομένων, ανάπτυξη ιστοτόπων με βάση δεδομένα ή bots, τα δεδομένα που προσφέρει αυτή η κοινότητα μπορούν να είναι εξαιρετικά χρήσιμα και αποτελεσματικά.

11. Ανοίξτε τα αρχεία δεδομένων Yelp

Το σύνολο δεδομένων Yelp είναι βασικά ένα υποσύνολο από τίποτα, αλλά τις δικές μας επιχειρήσεις, κριτικές και δεδομένα χρηστών για χρήση σε προσωπικές, εκπαιδευτικές και ακαδημαϊκές αναζητήσεις.

Υπάρχουν 5,996,996 κριτικές, 188.593 επιχειρήσεις, 280.991 εικόνες και 10 μητροπολιτικές περιοχές που περιλαμβάνονται στα αρχεία δεδομένων Yelp Open Datasets.

Μπορείτε να τα χρησιμοποιήσετε για διαφορετικούς σκοπούς. Δεδομένου ότι είναι διαθέσιμα ως αρχεία JSON, μπορείτε να τα χρησιμοποιήσετε για να διδάξετε στους μαθητές τις βάσεις δεδομένων. Μπορείτε να τα χρησιμοποιήσετε για να μάθετε NLP ή για δεδομένα παραγωγής δειγμάτων, ενώ καταλαβαίνετε πώς να σχεδιάσετε εφαρμογές για κινητά.

Σε αυτό το σύνολο δεδομένων, θα βρείτε κάθε αρχείο που αποτελείται από έναν μόνο τύπο αντικειμένου, ένα αντικείμενο JSON ανά γραμμή.

12. Δέσμη δεδομένων της UNICEF

Δεδομένου ότι η UNICEF ασχολείται με μια μεγάλη ποικιλία κρίσιμων ζητημάτων, έχει συγκεντρώσει σχετικά στοιχεία σχετικά με την παιδεία, την παιδική εργασία, την αναπηρία παιδιών, την παιδική θνησιμότητα, τη μητρική θνησιμότητα, το νερό και την υγιεινή, το χαμηλό βάρος γέννησης, την προγεννητική φροντίδα, την πνευμονία, την ελονοσία, διαταραχή, ακρωτηριασμό / κοπή γυναικείων γεννητικών οργάνων και εφήβους.

Τα ανοιχτά σύνολα δεδομένων της UNICEF που δημοσιεύονται στο Μητρώο IATI: http://www.iatiregistry.org/publisher/unicef ​​έχουν εξαχθεί απευθείας από το λειτουργικό σύστημα της UNICEF (VISION) και άλλα συστήματα δεδομένων και αντικατοπτρίζουν τις εισροές που πραγματοποιούνται από τα γραφεία της UNICEF.

Το καλό είναι ότι υπάρχει τακτική ενημέρωση όσον αφορά αυτά τα σύνολα δεδομένων. Κάθε μήνα, τα δεδομένα ενημερώνονται προκειμένου να καταστούν πιο ολοκληρωμένα, αξιόπιστα και ακριβή.

Μπορείτε να έχετε ελεύθερη και εύκολη πρόσβαση σε αυτά τα δεδομένα. Για να το κάνετε αυτό, μπορείτε να κάνετε λήψη αυτών των δεδομένων σε μορφή CSV. Μπορείτε επίσης να κάνετε προεπισκόπηση των δεδομένων δείγματος πριν τη μεταφόρτωση.

Ενώ κάποιος μπορεί να εξερευνήσει και να απεικονίσει τα σύνολα δεδομένων της UNICEF, υπάρχουν τρεις κύριοι εκδότες:

Το PORTAL ΔΙΑΠΙΣΤΩΣΗΣ ΒΟΗΘΕΙΑΣ ΤΗΣ UNICEF: Μπορείτε να έχετε πολύ πιο εύκολη πρόσβαση στα σύνολα δεδομένων εάν χρησιμοποιείτε αυτήν την πύλη. Περιλαμβάνει επίσης λεπτομέρειες για κάθε χώρα στην οποία εργάζεται η UNICEF.

Εκδότης d-portal: Αυτή τη στιγμή βρίσκεται στη ΒΗΤΑ. Με αυτό, την πύλη, μπορείτε να εξερευνήσετε τα δεδομένα του IATI.

Μπορείτε να αναζητήσετε τις πληροφορίες που σχετίζονται με τις δραστηριότητες ανάπτυξης, τους προϋπολογισμούς κλπ. Μπορείτε να εξερευνήσετε αυτές τις πληροφορίες ανά χώρα.

Πλατφόρμα δεδομένων εκδότη: Σε αυτήν την πλατφόρμα, μπορείτε εύκολα να έχετε πρόσβαση στα στατιστικά στοιχεία, τα διαγράμματα και τις μετρήσεις σχετικά με τα δεδομένα που έχετε πρόσβαση μέσω του μητρώου IATI. Εάν κάνετε κλικ στις κεφαλίδες, μπορείτε επίσης να ταξινομήσετε πολλούς από τους πίνακες που βλέπετε στην πλατφόρμα. Θα βρείτε επίσης πολλά από τα σύνολα δεδομένων στις πλατφόρμες σε μηχανικά αναγνώσιμη μορφή JSON.

13. Kaggle

Το Kaggle είναι υπέροχο επειδή προωθεί τη χρήση διαφορετικών μορφών δημοσίευσης δεδομένων. Ωστόσο, το καλύτερο μέρος είναι ότι συνιστά θερμά ότι οι εκδότες δεδομένων να μοιράζονται τα δεδομένα τους σε προσβάσιμη, μη ιδιόκτητη μορφή.

Η πλατφόρμα υποστηρίζει ανοικτές και προσβάσιμες μορφές δεδομένων. Είναι σημαντικό όχι μόνο για την πρόσβαση αλλά και για ό, τι θέλετε να κάνετε με αυτά τα δεδομένα. Επομένως, το Kaggle Dataset ορίζει σαφώς τις μορφές αρχείων που συνιστώνται κατά την κοινή χρήση δεδομένων.

Το μοναδικό πράγμα για τα σύνολα δεδομένων Kaggle είναι ότι δεν είναι απλά ένα αποθετήριο δεδομένων. Κάθε σύνολο δεδομένων αντιπροσωπεύει μια κοινότητα που σας δίνει τη δυνατότητα να συζητήσετε τα δεδομένα, να ανακαλύψετε δημόσιους κώδικες και τεχνικές και να αντιληφθείτε τα δικά σας έργα στους πυρήνες.

CSV, JSON, SQLite, Archive, Big Query κ.λπ. είναι τύποι αρχείων που υποστηρίζει το Kaggle. Μπορείτε να βρείτε διάφορους πόρους για να αρχίσετε να εργάζεστε στο έργο ανοικτών δεδομένων σας.

Το καλύτερο μέρος είναι ότι το Kaggle σας επιτρέπει να δημοσιεύσετε και να μοιραστείτε σύνολα δεδομένων ιδιωτικά ή δημόσια.

14. LODUM

Πρόκειται για την πρωτοβουλία Open Data του Πανεπιστημίου του Münster. Στο πλαίσιο αυτής της πρωτοβουλίας, είναι δυνατή η πρόσβαση σε οποιονδήποτε δημόσιο πληροφοριακό υλικό σχετικά με το πανεπιστήμιο με μηχανικά αναγνώσιμες μορφές. Μπορείτε εύκολα να το χρησιμοποιήσετε και να το επαναχρησιμοποιήσετε σύμφωνα με τις ανάγκες σας.

Ανοικτά δεδομένα για επιστημονικά αντικείμενα και κωδικοποιημένα ως συνδεδεμένα δεδομένα διατίθενται στο πλαίσιο αυτού του έργου.

Με τη βοήθεια του Linked Data, είναι δυνατή η κοινή χρήση και χρήση δεδομένων, οντολογιών και διαφόρων προτύπων μεταδεδομένων. Στην πραγματικότητα, προβλέπεται ότι θα είναι το αποδεκτό πρότυπο για την παροχή μεταδεδομένων και τα ίδια τα δεδομένα στον Ιστό.

Η ομάδα LODUM έχει ξεκινήσει από κοινού το LinkedUniversities.org και το LinkedScience.org.

Μπορείτε να χρησιμοποιήσετε τον επεξεργαστή SPARQL ή το πακέτο SPARQL του R για την ανάλυση δεδομένων.

Το πακέτο SPARQL επιτρέπει τη σύνδεση με ένα τελικό σημείο SPARQL μέσω HTTP, την εμφάνιση ενός ερωτήματος SELECT ή ενός ερωτήματος ενημέρωσης (LOAD, INSERT, DELETE).

15. UCI Machine Learning Repository

Χρησιμεύει ως πλήρης αποθετήριο βάσεων δεδομένων, θεωριών τομέα και γεννήτριες δεδομένων που χρησιμοποιούνται από την κοινότητα μηχανής μάθησης για την εμπειρική ανάλυση αλγορίθμων μηχανικής μάθησης.

Σε αυτόν τον αποθετήριο, υπάρχουν σήμερα 463 σύνολα δεδομένων ως υπηρεσία στην κοινότητα μάθησης μηχανών.

Το Κέντρο Εκμάθησης Μηχανών και Ευφυών Συστημάτων στο Πανεπιστήμιο της Καλιφόρνιας, η Irvine φιλοξενεί και το διατηρεί. Ο David Aha το ίδρυσε αρχικά ως μεταπτυχιακός φοιτητής στο UC Irvine.

Έκτοτε, οι σπουδαστές, οι εκπαιδευτικοί και οι ερευνητές σε όλο τον κόσμο την χρησιμοποιούν ως αξιόπιστη πηγή δεδομένων.

Πώς λειτουργεί είναι ότι κάθε σύνολο δεδομένων έχει την ξεχωριστή ιστοσελίδα του, η οποία περιλαμβάνει όλες τις γνωστές λεπτομέρειες, συμπεριλαμβανομένων τυχόν σχετικών δημοσιεύσεων που την ερευνούν. Μπορείτε να κάνετε λήψη αυτών των συνόλων δεδομένων ως αρχεία ASCII, συχνά με τη χρήσιμη μορφή CSV.

Οι λεπτομέρειες των συνόλων δεδομένων συνοψίζονται από πτυχές όπως οι τύποι χαρακτηριστικών, ο αριθμός περιπτώσεων, ο αριθμός των χαρακτηριστικών και το έτος που δημοσιεύεται και τα οποία μπορούν να ταξινομηθούν και να αναζητηθούν.

Άνοιγμα πύλων δεδομένων και μηχανών αναζήτησης:

Ενώ υπάρχουν πολλά σύνολα δεδομένων που δημοσιεύονται από πολυάριθμους οργανισμούς κάθε χρόνο, πολύ λίγα σύνολα δεδομένων αναγνωρίζονται και καθιερώνονται.

Ο λόγος για τον οποίο πολύ λίγα τέτοια σύνολα δεδομένων υποστηρίζουν ότι είναι χρήσιμος πόρος είναι ότι αποτελεί πρόκληση να αναπτυχθούν, να διαχειριστούν και να παρέχουν τα δεδομένα με τρόπο που οι άνθρωποι και οι οργανισμοί θεωρούν χρήσιμο και εύκολο στη χρήση.

Ωστόσο, μπορείτε να βρείτε παρακάτω μια λίστα με άλλες σημαντικές ανοιχτές πύλες δεδομένων και πλατφόρμες που επιτρέπουν στους χρήστες να έχουν εύκολη πρόσβαση σε ανοιχτά δεδομένα, να μελετήσουν τον αντίκτυπο και να συλλέξουν πολύτιμες πληροφορίες.

  1. Αναζήτηση στο σύνολο δεδομένων Google
  2. Dataverse
  3. Ανοίξτε το κιτ δεδομένων
  4. Ckan
  5. Ανοίξτε την οθόνη δεδομένων
  6. Plenar.io
  7. Ανοίξτε τον χάρτη επιπτώσεων δεδομένων

συμπέρασμα

Τα ανοιχτά δεδομένα είναι η σειρά της ημέρας. Ο κόσμος έχει αρχίσει σταδιακά να κινείται προς ανοικτά συστήματα και τα ανοιχτά δεδομένα είναι σωστά σε συγχρονισμό με αυτό.

Οι επιχειρήσεις και οι οργανισμοί που εκμεταλλεύονται ανοιχτά δεδομένα θα αποκτήσουν ανταγωνιστικό πλεονέκτημα και θα μπορέσουν να κυριαρχήσουν στο μέλλον.