Καλημέρα σε όλους και όλες,
Σε συνέχεια των τελευταίων σχολίων του Διομίδη, κάποιες παρατηρήσεις
από τη Βρετανική εμπειρία στο άνοιγμα των δεδομένων/ περιεχομένου στον
ευρύτερο δημόσιο τομέα (οι παρατηρήσεις είναι κυριώς από νομική-
οργανωτική πλευρά):
- υπάρχουν τρεις διαφορετικές αλλά συνδεόμενες πολιτικές ανάλογα με το
είδος του αντικειμένου που θέλουμε να είναι ανοιχτό:
(α) λογισμικό (β) περιεχόμενο (ήχος, κείμενο, εικόνα) (γ) δεδομένα.
Για κάθε είδος υπάρχει συγκεκριμένη άδεια ή κατηγορία αδειών που
χρησιμοποιείται (π.χ. GPL για λογισμικό, CC ή Click Use Licence για
περιεχόμενο, CC-0 ή ODbL [1] για δεδομένα)
Να θυμήσω ότι εάν χρησιμοποιούμε τη CC_BY δεν επιβάλλονται υποχρεώσεις
copyleft. Από ό,τι έχω καταλάβει αυτή είναι η άδεια που έχει επιλέξει
το Ελληνικό Δημόσιο. Στο Ηνωμένο Βασίλειο (Η.Β.) αυτή τη στιγμή
εξετάζεται εάν θα χρησιμοποιηθεί μια copyleft άδεια όπως η ΟDbL ή όχι.
Σε κάθε περίπτωση είναι αναγκαίο (α) να υπάρχει τουλάχιστον μια βασική
κεντρική πολιτική και στρατηγική ως προς το τι θέλει κάποιος να
πετύχει με το άνοιγμα των δεδομένων/ περιεχομένου και (β) οι σχετικές
άδειες να είναι συμβατές μεταξύ τους. Θέλουμε έναν χώρο copyleft ή
απλά να είναι τα δεδομένα/ πληροφορία διαθέσιμα; Πόσο μας ενδιαφέρει η
πιστότητα/ ποιότητα των δεδομένων και η διαφοροποίηση του παραγώγου
από το πρωτότυπο [το πρόβλημα της προέλευσης (provenance)];
- Μιλάμε για "Ελληνικό Δημόσιο", αλλά δεν είναι πάντοτε ξεκάθαρο το τι
εννοούμε. Το λέω αυτό, γιατί βάζουμε την ΕΡΤ στην ίδια κατηγορία με τη
ΓΓΠΣ, αλλά δεν είναι το ίδιο ούτε νομικά, ούτε οργανωτικά. Το πρόβλημα
εντοπίζεται κυρίως σε οργανισμούς όπως Αρχεία, Μουσεία, Βιβλιοθήκες
και Εκπαιδευτικά ιδρύματα που έχουν διαφορετικό νομικό καθεστώς και
είναι πιο δύσκολο να συντονίστουν τις υποδομές τους. Εδώ είναι ανάγκη
να συνδεθεί η χρηματοδότηση - πιστοποίηση με την ύπαρξη, χρήση
ανοιχτών προτύπων, μορφών, περιεχομένου και λογισμικού. Σε κάθε
περίπτωση είναι ανάγκη να υπάρχει μια ενιαία πολιτική σχετικά με το τι
κάνουμε με δεδομένα και περιεχόμενο γιατί αλλιώς δεν είναι δυνατόν να
συνδυαστούν και να επαναχρησιμοποιηθούν. Για παράδειγμα το αρχείο της
ΕΡΤ εξακολουθεί να είναι προβληματικό τόσο τεχνικά όσο και νομικά. Δεν
είναι καθόλου σαφές με ποια άδεια γίνεται διαθέσιμο τόσο το
περιεχόμενο όσο και τα μετα-δεδομένα του οπτικοακουστικού αρχείου. Το
μεγαλύτερο πρόβλημα που έχουμε στο Ηνωμένο Βασίλειο είναι η
διαλειτουργικότητα όχι μόνο προτύπων, αλλά και αδειών. Επειδή στην
Ελλάδα τώρα ξεκινάμε αυτήν την προσπάθεια καλό είναι να φροντίσουμε να
έχουμε όσο το δυνατόν συμβατές μεταξύ τους άδειες (ή τουλάχιστον να
έχουμε σαφείς όρους με τους οποίους διατίθεται το σχετικό υλικό).
- Στο Η.Β. γίνεται πρόσφατα μια προσπάθεια να αποφεύγεται το PDF όσο
το δυνατόν περισσότερο ή τουλάχιστον να συνοδεύεται και από κάποια
ανοιχτή μορφή (format). Το PDF είναι εύκολο για εκτύπωση αλλά,
πιστεύω, δεν βοηθάει ιδιαίτερα όταν θέλεις να προχωρήσεις σε semantic
web εφαρμογές.
- Στις μορφές που παραθέτει ο Διομίδης, θα ήθελα να προσθέσω το RDF/
XML που μας βοηθάει ιδιαίτερα στην περιγραφή των νομικών
χαρακτηριστικών των δεδομένων και το χρησιμοποιούμε και για τις άδειες
CC και το CC+ [2].
- Σε συνέχεια της ιδέας του καταλόγου των ιστοτόπων του Δημοσίου που
προτάθηκε στη λίστα, να προσθέσω ότι ένα από τα προβλήματα που
αντιμετωπίζουμε στο Η.Β. είναι η εύρεση του περιεχομένου και για το
λόγο αυτό γίνεται αυτή τη στιγμή αρκετή προσπάθεια (α) να γίνεται
χρήση persistent identifiers και (β) να δημιουργηθούν καταχωρητήρια με
μετα-δεδομένα σχετικά με την πληροφορία που έχουν οι διάφοροι
οργανισμοί του ευρύτερου δημοσίου τομέα.
Σας ευχαριστώ για το χρόνο σας :)
Πρόδρομος
[1]: http://www.opendatacommons.org/licenses/odbl/
[2]: http://wiki.creativecommons.org/CcREL
On 24 Nov 2009, at 06:32, Diomidis Spinellis wrote:
Nick Kossifidis wrote:
Κάτι τέτοιο πιστεύω είναι αρκετά χρήσιμο σε αυτή τη φάση, ήδη αρκετοί
τοποθετήθηκαν υπέρ των ανοιχτών προτύπων ως πρώτο βήμα καθότι και
δίνει ίσες ευκαιρίες χρήσης ΕΛΛΑΚ και είναι εύκολο να υιοθετηθεί
χωρίς
ιδιαίτερες αλλαγές στο δημόσιο (τουλάχιστον όχι τέτοιας έκτασης όσο
του να το γυρίζαμε τελείως σε ΕΛΛΑΚ πχ.).
Τι λέτε να αρχίσουμε και να μαζέψουμε σε ένα wiki ποιες δημόσιες
υπηρεσίες/sites δεν χρησιμοποιούν ανοιχτά πρότυπα έτσι ώστε σιγά σιγά
να δρομολογηθεί αλλαγή πολιτικής εκειπέρα ? Είχαμε πρόσφατα μια
συζήτηση για την ΕΡΤ πχ. θεωρώ πολύ σημαντικό το αρχείο της ΕΡΤ που
διατίθεται στο Internet να ακολουθεί ανοιχτά πρότυπα και όχι ένα flv
container. Αυτό είναι απ' τις δύσκολες περιπτώσεις και γιατί είναι
μεγάλης έκτασης αλλαγή και τα υπάρχοντα ανοιχτά πρότυπα (html5/theora
κλπ) δεν είναι ακόμα stable (το html5 δεν έχει κλείσει ακόμα).
Μπορούμε όμως να αρχίσουμε να χρησιμοποιούμε παντού PDF για αρχή και
στη συνέχεια ODF παντού με χρήση ελεύθερων γραμματοσειρών.
Σωστά. Για παράδειγμα βρήκα στη ΓΓΠΣ 72 σελίδες σε μορφή Word και
ζήτησα να μετατραπούν σε κάποιο ανοικτό πρότυπο - εμφανίζονται μέσω
του
παρακάτω δεσμού
http://www.google.gr/search?hl=en&as_q=&as_epq=&as_oq=&as_eq=&num=100&lr=&as_filetype=doc&ft=i&as_sitesearch=gsis.gr&as_qdr=all&as_rights=&as_occt=any&cr=&as_nlo=&as_nhi=&safe=off
Για το μέλλον ζήτησα όλο το υλικό της ΓΓΠΣ να το εμφανίζουμε στις
παρακάτω μορφές (με σειρά προτεραιότητας):
HTML (για κείμενο)
PDF (για κείμενο που πρέπει να εκτυπωθεί / εμφανιστεί με πιστότητα)
XML ή CSV (για δεδομένα που θα επεξεργαστούν ειδικοί)
DOCX + ODT (και στις δύο - για κείμενο που χρειάζεται επεξεργασία)
XLSX + ODT (και στις δύο - για δεδομένα που χρειάζονται επεξεργασία)
(Αν βγάλουμε εκπαιδευτικά βίντεο θα επανέλθω για συμβουλές σχετικά με
αντίστοιχα πρότυπα και κωδικοποιήσεις.)
Θα μπορούσε σε πρώτη φάση να φτιαχτεί ένας κατάλογος με ιστοτόπους του
δημοσίου, αριθμό εγγράφων τους που δεν είναι σε κάποιο ανοικτό πρότυπο
και ένα δείκτη βελτίωσης (πόσο έχει ελαττωθεί ο αριθμός αυτός από την
αρχή της έρευνας). Ο κατάλογος φαντάζομαι θα μπορούσε να φιλοξενηθεί
στο http://www.ellak.gr
_______________________________________________
Open-source mailing list
Open-source [ at ] ellak [ dot ] gr
Please access the attached hyperlink for an important electronic communications disclaimer: http://www.lse.ac.uk/collections/secretariat/legal/disclaimer.htm