ΕΕΛ/ΛΑΚ - Λίστες Ταχυδρομείου

Panel Σαββάτου Μέρος 3: Διαύγεια

  • Subject: Panel Σαββάτου Μέρος 3: Διαύγεια
  • From: Pantelis Koukousoulas <pktoss [ at ] gmail [ dot ] com>
  • Date: Tue, 23 Apr 2013 16:23:44 +0300
Ολοκληρώνοντας, ο τρίτος άξονας ήταν σχετικά με τη "διαύγεια":

Καταρχήν, πιστεύω οι περισσότεροι από εμάς παραδεχόμαστε ότι
η "Διαύγεια" είναι ένα μεγάλο βήμα, έχει ήδη "βγάλει τα λεφτά της"
κλπ κλπ. Από ότι ξέρω υπάρχουν αρκετές χώρες που σύστημα
έστω και στα μέτρα της "διαύγειας", ούτε στα όνειρά τους δε
βλέπουν. Από εκεί και πέρα:

---

Γνώριζα ότι υπάρχει αυτή τη στιγμή θέμα με το ότι δεν υπάρχουν
πόροι / για τη συντήρηση και επιπλέον ανάπτυξη της "διαύγειας"
(scaling, features κλπ) αλλά δε γνώριζα για τα θεσμικά προβλήματα
που αναφέρθηκαν και ότι εύκολα θα μπορούσε να καταργηθεί π.χ.,
από μια άλλη κυβέρνηση ή αν ξυπνήσει στραβά κάποιος υπουργός
ή κάτι τέτοιο. Θα ήταν ενδιαφέρον να μάθουμε περισσότερα δηλ
τι ακριβώς συμβαίνει και πώς θα μπορούσε να θωρακιστεί αυτή
η "θεσμική αδυναμία".

---

Ως προς τις ελλείψεις (π.χ., στα μεταδεδομένα που δυσχεραίνουν
τη διασταύρωση και την ταξινόμηση) και τα όποια τεχνικά
προβλήματα αυτά πιστεύω είναι σε όλους γνωστά. Το θέμα είναι
πώς διασφαλίζεται μια υγιής αλληλεπίδραση ανάμεσα στους
φορείς υλοποίησης της νέας "Διαύγειας" και της κοινότητας
ώστε να βοηθηθεί η δημιουργία ενός υγιούς οικοσυστήματος;

http://www.karounos.gr/blog/diavgeia/
http://pgaval.wordpress.com/2009/10/23/tender-ecosystem/

Θα μπορούσαν τουλάχιστον κομμάτια της νέας "Διαύγειας" να
διανέμονται ως "ΕΛ/ΛΑΚ" και να μπορεί να συνεισφέρει κώδικα
η κοινότητα;

Μπορούμε να συμμετέχουμε στον καθορισμό των απαιτήσεων
(θα υπάρχει δηλαδή κάποιο public bugtracker που να το βλέπουν
οι φορείς υλοποίησης;)

---

Κάτι που τέθηκε σωστά από το panel γενικότερα για τα ανοιχτά
δεδομένα του δημόσιου τομέα, ότι δηλαδή πολλές φορές τα
dataset είναι τόσο μεγάλα που δεν μπορεί συνήθως ένας πολίτης
απλά να τα "κατεβάσει" στο σύστημά του και να τα επεξεργαστεί.

Η "Διαύγεια" θα μπορούσε να θεωρηθεί ως τέτοιο dataset μια και
έχει πλέον αρκετά πάνω από 3εκ εγγραφα.

Κάτι που θα μπορούσε να βοηθήσει εδώ θα ήταν να μπει αυτό το
dataset π.χ., στον "Ωκεανό" όπως γίνεται με τα public datasets
του EC2 και να παρέχεται πρόσβαση μέσω των VMs που δίνει
ο ωκεανός. Αυτό θα μπορούσε να γίνει σε στυλ "freemium", δηλ
να παρέχεται δωρεάν μία μικρή ποσότητα αναλύσεων σε φοιτητές
και Open Source projects και όσοι θέλουν περισσότερο υπολογιστικό
χρόνο / real-time επεξεργασία κλπ (π.χ., μέσα μαζικής ενημέρωσης,
εταιρείες) να μπορούν να πληρώνουν ώστε να καλύπτεται και το
κόστος των ερευνητών.

Θα ήθελα να λάβετε υπόψιν σας ότι οι πιθανές χρήσεις της διαύγειας
ως dataset δεν είναι μόνο για τη λογοδοσία αλλά μπορεί να είναι
και τελείως διαφορετικές όπως π.χ., στατιστικά γλωσσικά μοντέλα
(n-grams) για "νομικίστικα Ελληνικά", τυπικά ορθογραφικά λάθη,
ακόμα και συνηθισμένα layouts και fonts ώστε να διευκολυνθεί η
ψηφιοποίηση εγγράφων του δημοσίου τομέα με ΕΛ/ΛΑΚ.

Μπορώ πολύ εύκολα να φανταστώ "big data" courses σε πανεπιστήμια
(σίγουρα θα έκανα lobbying για εδώ :) ) που να χρησιμοποιούν τη
"διαύγεια" ως dataset και με όλο αυτό το "παιχνίδι" ακαδημαϊκών
και φοιτητών με τα δεδομένα (π.χ., social network analysis)
μπορούν να προκύψουν αρκετά ενδιαφέροντα αποτελέσματα.


Χαιρετισμούς,
Παντελής

πλοήγηση μηνυμάτων