ΕΕΛ/ΛΑΚ - Λίστες Ταχυδρομείου

φίλτρο για greeklish?

Με αφορμή πρόσφατο post στο debian.gr μου ήρθε η εξής ιδέα:

Να εγκατασταθεί ένα φίλτρο στους mailservers ή στις λίστες 
ταχυδρομείου που να μετατρέπει τα κείμενα απο greeklish σε κανονικά 
ελληνικά. Αυτό είναι καλό για τους εξής λόγους:

α) θα είναι όλη η πληροφορία προσβάσιμη σε μηχανές αναζήτησης
β) θα είναι πιο ευανάγνωστο για όλους, ακόμη και γι' αυτούς που δεν 
έχουν πρόβλημα να διαβάζουν greeklish.
γ) θα μειώσει την -δικαιολογημένη ίσως- "γκρίνια" αυτών που δεν 
μπορούν να διαβάσουν 
δ) είναι σχετικά απλό στην υλοποίηση -ως φίλτρο

Το θέμα είναι ότι δεν έχω εμπειρία στο πως ρυθμίζουμε ένα φίλτρο σε 
μια λίστα -φαντάζομαι ότι εκεί μόνο χρειάζεται, δε θα ήθελα το 
προσωπικό μου email να φιλτράρεται συνεχώς.

Να πως φαντάζομαι τη διαδικασία:

α) μετάτροπή του μηνύματος με βάση έναν από τους πολλούς τρόπους 
γραφής greeklish. Λογικά αυτό θα βγάλει ένα σύνολο από φράσεις 
μετεφρασμένες με διαφορετικούς τρόπους.
β) έλεγχος ορθογραφίας σε κάθε φράση. Η φράση με τα λιγότερα λάθη θα 
είναι μάλλον ένδειξη ότι έχουμε διαλέξει το σωστό μοτίβο για 
μετατροπή.
γ) μετατροπή όλου του κειμένου
δ) μή διαδραστικός έλεγχος ορθογραφίας σε όλο το μήνυμα (για απάλειψη 
λαθών)
ε) επιστροφή και αποστολή.

Τα προβλήματα που βλέπω είναι 2:
α) Καταγραφή όλων των κανόνων μετατροπής, καθώς ο καθένας μας γράφει 
λίγο διαφορετικά greeklish. π.χ. εγώ έγραφα το 'ξ' ως '3' και το 'θ' 
ως '8'. Άλλοι έχουν άλλες ιδιοτροπείες. 
β) πότε θα γίνεται η μετατροπή. Για παράδειγμα: κάποιος απαντά με 
greeklish σε μήνυμα που έχει γραφεί σε ελληνικά UTF-8 ή ISO ή ακόμη 
και αγγλικό μήνυμα (π.χ. ένα forward). Πρέπει να γίνεται σωστή 
ανίχνευση, πράγμα που σημαίνει να μεταφράζεται μόνο το μέρος του 
κειμένου που είναι γραμμένο σε greeklish. Και τί γίνεται σε περίπτωση 
που το εν λόγω κείμενο είναι κρυμμένο σε ένα MIME attachment κλπ.

Τώρα για κάθε μήνυμα αυτή η διαδικασία μπορεί να αποβεί εξαιρετικά 
χρονοβόρα αν δε σχεδιαστεί εξ αρχής σωστά και να έχουμε ένα server ο 
οποίος να τα "φτύσει" πολύ σύντομα. 

Θα ήθελα αν είναι δυνατόν τις ιδέες και παρατηρήσεις σας. ΔΕΝ θα ήθελα 
κώδικα από τώρα, δεν κάνουμε διαγωνισμό για τον καλύτερο perl/κλπ 
coder, σκοπός είναι να λύσουμε το πρόβλημα. Εκτός αν υπάρχει ήδη κάτι 
έτοιμο που να κάνει ακριβώς αυτά που περιέγραψα. Όταν καταλήξουμε στο 
μηχανισμό μπορούμε να γράψουμε κάτι.

Κώστας


απαντήσεις

πλοήγηση μηνυμάτων