On Wed, 2014-04-30 at 00:49 +0200, Alexios Zavras wrote: > επί της ουσίας, το πρόβλημα είναι με τις άδειες για δεδομένα. > ο Πρόδρομος έγραψε πολύ σωστά για τις συμβατότητες (α-συμβατότητες, μάλλον) > των διαφόρων αδειών. > > θα ήθελα, όμως, να αναφερθώ και στο θέμα που προκύπτει > στα μαζικά δεδομένα ακόμα και με το απλό attribution. > > στη σελίδα που ανέφερε ο Φαίδωνας, έχουμε ένα καλό παράδειγμα > https://www.mediawiki.org/wiki/Z%C3%BCrich_Hackathon_2014/Geo_Namespace > απεικονίζονται τα επίκεντρα από 350Κ+ σεισμούς στον κόσμο > και η εικόνα κάνει φανερές τις τεκτονικές πλάκες. > για να σκεφτούμε, όμως, από που έρχονται αυτά τα δεδομένα; > > στην ιδανική περίπτωση, όλα θα ήταν από ένα data set, > οπότε με μια απλή αναφορά ("δεδομένα από Χ") καθάρισες. > αλλά αν ερχόντουσαν από πολλά; > αν κάθε χώρα δημοσίευε στοιχεία για τους σεισμούς της; (υπό CC-BY). > τότε η εικόνα θα έπρεπε να συνοδεύεται από καμμιά 100αριά αναφορές. > αν ήθελες να τη βάλεις σε ακαδημαϊκό paper, θα έπρεπε να βάλεις > 100 αναφορές στο τέλος. αν ήθελες να τη δείξεις ως slide > σε παρουσίαση, θα έπρεπε να είχες και μερικά ακόμα slides με τις αναφορές. Αυτό πάντως είναι πρακτικό πρόβλημα και όχι νομικό. Δεν έχει σχέση με το αν οι άδειες είναι ασύμβατες μεταξύ τους ή όχι, αλλά με το γεγονός πως έχουμε χρησιμοποιήσει δεδομένα από πάρα πολλές πηγές. Ακόμα κι αν όλα τα δεδομένα είχαν την ίδια άδεια (πχ. CC-BY) - οπότε και δεν θα υπήρχε θέμα ασυμβατότητας - θα έπρεπε να έχουμε κάποιο attribution. Αλλά δεν βλέπω κάποιο πρόβλημα σ' αυτό. Είναι σαν λες πως καλύτερα να κάνουμε release λογισμικό public domain, γιατί που να κάθεσαι τώρα να αναφέρεις όλους τους contributors. Ε.. προφανώς και μπορείς να τους αναφέρεις (πχ. https://www.mozilla.org/credits/) > το παράδειγμα που είχα υποσχεθεί έχει να κάνει με απεικόνιση βατράχων > σε χάρτη(!). να μην τα γράφω εγώ, ο Peter έκανε καλή δουλειά: > http://peterdesmet.com/posts/illegal-bullfrogs.html > και κάθησε και ανέλυσε τις άδειες από διάφορα datasets: > http://peterdesmet.com/posts/analyzing-gbif-data-licenses.html H σύνθεση δεδομένων που έρχονται με διαφορετικές άδειες προφανώς δεν είναι εύκολα διαχειρίσιμο και μερικές φορές θα βρεθείς αντιμέτωπος με το license proliferation. Αλλά αυτό πάλι δεν έχει σχέση με το θέμα επιλογής της άδειας. Πχ. αν τους είχαμε πείσει όλους αυτούς να χρησιμοποιήσουν CC-BY ή CC-BY-SA δεν θα υπήρχε κανένα πρόβλημα ;) > εν κατακλείδι: προχωράμε ταχύτατα προς ένα μέλλον όπου δεδομένα > θα χρησιμοποιούνται συνεχώς σε μεγάλη κλίμακα, και > οι άδειες θα είναι καθοριστικές για την εξάπλωσή τους. > οι έχοντες φάει χρόνια συζητώντας και αναλύοντας άδειες λογισμικού > παρατηρούν ότι τα ίδια λάθη επαναλαμβάνονται τώρα στις άδειες δεδομένων > και κρούουν τον κώδωνα κινδύνου. Πρέπει να κατανοήσουμε όμως πως μέρος της ταχείας εξάπλωσης των ανοιχτών δεδομένων (και του περιεχομένου) είναι και οι άπειρες εθελοντικές ανθρωποώρες. Οι άδειες που διασφαλίζουν ένα minimum αναγνώρισης και επιστροφής του added value που δημιουργείται απ' την αξιοποίησή τους, προκαλεί μια θετική ανάδραση στην περαιτέρω εξάπλωση τους. Είναι λίγο chicken-egg, αλλά αν δεν υπήρχαν οι copyleft άδειες μάλλον δεν θα είχαμε αυτό τον όγκο ανοιχτών δεδομένων για να συζητάμε τώρα πως θα τα αξιοποιήσουμε πιο εύκολα ;) Όσοι αναζητούν free labor για την γρήγορη οικονομική εκμετάλλευση δεδομένων προφανώς και θα προτιμούσαν να είναι όλα public domain. Εκτός φυσικά απ' το δικό τους προϊόν :) -- Nikos Roussos http://www.roussos.cc
Attachment:
signature.asc
Description: This is a digitally signed message part