ΕΕΛ/ΛΑΚ - Λίστες Ταχυδρομείου

Re: Ðñüôáóç ãéá ôï workshop êáé ÂïÞèåéá!!

O/H Athanasios Papaioannou έγραψε:

O/H Pantelis Nasikas έγραψε:

Καλησπέρα σας,

Έχω μία πρόταση για παρουσίαση να καταθέσω και μια
ερώτηση αλλά είναι και τα δύο συνδεδεμένα αφού αφορούν
το πρόγραμμα που προσπαθώ να εξελληνίσω.
Πριν ένα χρόνο περίπου στο Uni of Bham που βρισκομουν στο UK έτυχε να βρεθώ στην παρουσίαση μιας εφαρμογής που βγήκε από την εξαιρετική ερευνητική ομάδα του David Mackay στο Cambridge. Η εφαρμογή έχει στόχο να κάνει πιο εύκολη την αλληλεπίδραση με υπολογιστή για άτομα που για διάφορους λόγους δεν μπορούν να
χρησιμοποιήσουν συμβατικό πληκτρολόγιο αλλά και
ποντίκι.
Για περισσότερες πληροφορίες http://www.inference.phy.cam.ac.uk/dasher/

Αυτό που χρειάζεται για να μπορεί να γράφει ελληνικά
είναι ένα ελληνικο αλφάβητο σε συγκεκριμένο xml format
που ήδη δημιούργησα και ένα πρότυπο κείμενο στα ελληνικά πάντα για να εκπαιδευτεί. Στην αναζήτηση
μου για ελληνικά κείμενα στο δίκτυο δε βρήκα σχεδόν
τίποτα. Κοίταξα στο project gutenberg και σε άλλα
site μεσω του google άλλα τίποτα. Αυτό που ζητάω είναι
ένα κείμενο με καθημερινή γλωσσα , ίσως διήγημα αλλά
νομίζω ότι αποσπάσματα εφημερίδων θα ήταν πιο βολικά.
Μιας και έδω και κάμποσο καιρό ασχολούμε με τον ευρύτερο χώρο του Machine Learning παρατήρησα επίσης
ότι δεν υπάρχει στα ελληνικά μια αντίστοιχη συλλογή
κειμένων με τη βάση του reuters οπότε σκέφτομαι ότι
ίσως είναι καιρός ολοι όσοι ενδιαφερόμαστε για τη
δημιουργία μίας σχετικης να οργανωθούμε και να έρθουμε
σε επαφή με εφημερίδες και να οργανωθεί μία βαση με κάπου 10mb κείμενο που θα μπορούσε να
χρησιμοποιηθεί
γενικά σε τέτοιες εφαρμογές.Για την συγκεκριμένη χρειάζομαι κάπου 500k και το μόνο εύκολο είναι να γραψω ένα spider και να μαζεψω απο ελληνικές εφημερίδες στο δίκτυο υλικό.Όμως θεωρώ ότι απο μόνο του δεν είναι σωστό και δε θέλω να παραβιάσω και πνευματικά δικαιώματα μιας και μετά αυτό το κειμενο
θα είναι διαθέσιμο σε οποιονδήποτε κατεβάζει το
πρόγραμμα.

Άν κάποιοι γνωρίζουν πηγές στο δίκτυο με τετοια
κείμενα
θα χαρώ πολύ να δεχτώ τα link τους.Αν υπάρχει
γενικότερο ενδιαφέρον για τη δημιουργία μιας τέτοιας
βασης έχω διάθεση να εργαστώ και να έρθω σε επαφή με
κόσμο ,μιας και ώς τα τέλη νοέμβρη που θα μπώ φαντάρος
ειμαι άνεργος και διαθέσιμος.

Έφόσον μπορέσω να το τελειώσω σκρεφτόμουν να κάνω
μια παρουσίαση του προγράμματος αλλά και γενικότερα
του τι τρέχει με την προσβασιμότητα στο Linux.Έχω ήδη
έρθει σε επαφή και με έναν συμφοιτητή μου στο Birmingham που έχει κατάλληλο εξοπλισμό και διάθεση για να δοκιμάσουμε screen readers και άλλα
προγράμματα.

Έδώ νομίζω ότι πρέπει να σταματήσω γιατι το mail..
μεγάλωσε και σας κούρασα.
Αναμένω σχόλια.

Χαιρετισμοί,
Παντελής


__________________________________
Do you Yahoo!?
New and Improved Yahoo! Mail - Send 10MB messages!
http://promotions.yahoo.com/new_mail
------------------------------------------------------------------------

_______________________________________________
Open-source mailing list
Open-source [ at ] grnet [ dot ] gr

Νομίζω πως η Ελευθεροτυπία έχει ένα corpus από τα φύλλα της αλλά δεν έχω περισσότερες λεπτομέρειες. Θα ψάξω και θα σε ενημερώσω σύντομα.

Θάνος

------------------------------------------------------------------------

_______________________________________________
Open-source mailing list
Open-source [ at ] grnet [ dot ] gr

Περισσότερες πληροφορίες για ελληνικά corpus μπορείς να βρεις εδώ: http://www.ilsp.gr/resources.html

Θάνος


πλοήγηση μηνυμάτων