2009/3/3 <tsakf [ at ] tee [ dot ] gr>: > Καλά όλα αυτά, και τώρα στο δια ταύτα. Πρέπει να παρθεί μια απόφαση για το > πως θα προχωρήσουμε, είτε να βοηθήσουμε τον Δημήτρη, με το transifex, είτε > να χρησιμοποιήσουμε το gettext, που προτείνει ο Σίμος, ή κάτι άλλο. Η επεξήγηση του Σίμου αφορά το πώς γίνονται οι μεταφράσεις αυτήν τη στιγμή, δηλαδή χειροκίνητα. Με το Transifex (Tx) αυτοματοποιούνται οι manual διεργασίες που κάνει ο μεταφραστής, δηλαδή παίρνει τη βασική ιδέα που ανέφερε ο Σίμος και την εκτελεί server-side για χιλιάδες έργα και μεταφραστές. Στην ειδική περίπτωση του translation re-use (translation memory) θα μπορούσε εύκολα να προστεθεί υποστήριξη στο Tx για κάτι τέτοιο: - Το Tx κάνει ήδη index εκατοντάδες (αν όχι χιλιάδες) έργα ΕΛΛΑΚ. Βάσει αυτών δημιουργεί μια μεγάλη μεταφραστική μνήμη. - Ένας μεταφραστής ή developer προσθέτει το έργο Foo και τo Tx τον ρωτάει "Μπορώ να ψάξω παρόμοια έργα στη βάση δεδομένων μου και να αρχικοποιήσω τις μεταφράσεις του νέου αυτού έργου." - Με το κλικ, το Tx χρησιμοποιεί τη μεταφραστική μνήμη για fuzzy translation των strings και κάνει auto-commit τα νέα αρχεία, για όλες τις γλώσσες. - Επιπλέον, όταν φτιαχτεί ένας web-based editor πάνω από το Transifex, τότε καθώς γίνεται η μετάφραση, δυναμικά το εργαλείο ψάχνει στην μεταφραστική μνήμη και προτείνει έτοιμες/καλύτερες μεταφράσεις. Πλεονεκτήματα: - Αυτοματοποίηση, αποδοτικότητα, εξοικονόμηση χρόνου - Η μεταφραστική μνήμη αντί για 5-50 έργα θα περιέχει 500-2000 - Θα έχουν πρόσβαση αυτόματα σε αυτήν όλοι οι μεταφραστές και developers - Θα είναι εύκολη η λήψη της ίδιας της μνήμης για χρήση offline - Integrated με το web-based editing tool Για τυπικά αρχεία μεταφράσεων των User Interfaces, η χρήση μιας μικρής μεταφραστικής μνήμης μπορεί να έχει επιτυχία μέχρι και 20-30% ακριβής μετάφρασης των strings, συν ακόμη τουλαχιστον 20% fuzzy matching. Με τη χρήση μιας μεγάλης μεταφραστικής μνήμης (χιλιάδων έργων) υπολογίζω ότι τα ποσοστά αυτά θα είναι ψηλότερα. > Πως λοιπόν θα το προχωρήσουμε αυτό; Σαν επιτροπή θα διαλέξουμε; Θα > προτείνουμε κάτι σε κάποιον; Θα προκυρήξουμε διαγωνισμό; Θα ενθαρρύνουμε > την συμμετοχή εθελοντών σε κάποιο project; Τι; Η αλήθεια είναι ότι το παραπάνω σενάριο είναι ένα φιλόδοξο έργο, το οποίο μάλιστα ζήτησαν αρκετά μεγάλα έργα, συμπεριλαμβανομένων των GNOME και Mozilla. Αυτό που ζητάμε στην προκειμένη περίπτωση, νομίζω, είναι να αναπτυχθεί ένα portal ελληνικών μεταφράσεων. O Έλληνας μεταφραστής θα κάνει login και θα έχει στη διάθεση του όλα τα εργαλεία για να μπορεί να βρει, μεταφράσει αποδοτικά και ενημερωθεί για updates για έργα που τον ενδιαφέρουν. Σίγουρα είμαι προκατειλημμένος, αλλά από ότι ξέρω το Transifex είναι ό,τι καλύτερο υπάρχει αυτήν τη στιγμή για να αποτελέσει βάση για κάτι τέτοιο. Ο κύριος λόγος είναι επειδή αποτελεί σχεδιαστική αρχή μας να γίνουμε ακριβώς αυτό: Μια πλατφόρμα πάνω στην οποία μπορούν να χτιστούν περίπλοκα έργα διαχείρισης περιεχομένου και μεταφράσεων. Σε συνέχεια των παραπάνω, οποιαδήποτε πιο low-level ανάπτυξη θα γίνει, όπως είναι λογικό, μέσα στα ίδια τα εργαλεία. Πχ. στο gettext για τη διαχείριση αρχείων μετάφρασης, στο OmegaT για μεταφραστική μνήμη, κλπ. Σε κάθε περίπτωση πάντως, η προκήρυξη για συλλογή προτάσεων υλοποίησης βοηθάει να έχουμε καλύτερη εικόνα των πιθανών λύσεων σε ένα πρόβλημα. -δ >> ---------- Forwarded message ---------- >> From: Simos Xenitellis <simosx [ at ] gmail [ dot ] com> >> To: karounos [ at ] mail [ dot ] ntua [ dot ] gr >> Date: Mon, 2 Mar 2009 23:13:25 +0000 >> Subject: Re: _[Epistimoniki-epitropi-ellak] Syntirisi Ellinopoihsewn ellak >> Για το θέμα των μεταφράσεων και την αποφυγή της επανάληψης της εργασίας, >> το τυπικό είναι να γίνεται χρήση αυτού που λέμε «μεταφραστική μνήμη» >> (translation memory). >> Υπάρχουν εργαλεία που μπορούν να διαβάσουν όλες τις υπάρχουσες >> μεταφράσεις και να παράγουν >> ένα ειδικό αρχείο μεταφραστικής μνήμης. Μετά, τα εργαλεία αυτά μπορούν >> να εφαρμόσουν >> την μεταφραστική μνήμη σε αμετάφραστα αρχεία και να δημιουργήσουν >> αρχικές μεταφράσεις. >> Σε κάθε περίπτωση ο μεταφραστής πρέπει να ελέγχει όλα τα μηνύματα του >> έργου. >> >> Για το ελεύθερο λογισμικό, υπάρχει εργαλείο μεταφραστικής μνήμης από >> το πακέτο gettext. >> Έχουμε οδηγίες στο >> http://wiki.gnome.gr/doku.php?id=translation:translationmemory >> Σε μια τυπική μετάφραση GNOME, γύρω στο 10% των αλφαριθμητικών στις >> μεταφράσεις UI >> μπορούν να εξαχθούν με αυτό το τρόπο. >> Το τυπικό ποσοστό πιστεύω να έχει μειωθεί τώρα διότι τα κοινά αυτά >> μηνύματα πάνε >> σε μια γενική βιβλιοθήκη (library) οπότε τα προγράμματα δε χρειάζονται >> να επαναλαμβάνουν τυπικές λέξεις (π.χ. File, Open, ). >> >> Τα μηνύματα που καταφέρνει να κάνει καλή δουλειά το gettext είναι τα >> μικρά μηνύματα με πολύ λίγες λέξεις, Αρχείο, Επεξεργασία, Βοήθεια, >> κτλ. >> Για να κάνει ένα εργαλείο μεταφραστικής μνήμης καλή δουλειά, πρέπει να >> είναι σε θέση να κάνει καλό «segmentetion», δηλαδή να κόβει τα μεγάλα >> μηνύματα σε προτάσεις ή και φράσεις όπως αναφέρει ο Κώστας. >> Τα εργαλεία ΕΛ/ΛΑΚ που έχουμε τώρα δεν κάνουν segmentation σε επίπεδο >> μικρότερο του μηνύματος με αποτέλεσμα να μην είναι πολύ χρήσιμα στην >> τεκμηρίωση (συχνά, μια ολόκληρη παράγραφος είναι ένα μήνυμα/message). >> Ακόμα, τα εργαλεία μεταφραστικής μνήμης δεν γνωρίζουν από γλώσσες, >> οπότε για την ελληνική γλώσσα δεν γνωρίζουν πτώσεις, κτλ. >> Αυτό που θα μπορούσε να υλοποιηθεί με τη χρήση προσθέτων (plugins). >> >> Υπάρχουν πολλά που θα μπορούσαν να γίνουν στις μεταφραστικές μνήμες. >> Αν υπάρχει η δυνατότητα να ασχοληθεί κάποιος με αυτό, το πακέτο είναι >> το gettext. >> >> Σίμος >> >> 2009/3/2 Theodoros G. Karounos <karounos [ at ] mail [ dot ] ntua [ dot ] gr>: >>> Επειδή το θέμα των ελληνοποιήσεων ΕΛΛΑΚ λογισμικών και πως >>> συντηρούνται είναι προφανώς ενα κοινό θέμα, διεθνώς, προτείνω να >>> λάβουμε υπόψη την δουλειά που έχει γίνει και γίνετε σε πολλά δημοφιλή >>> λογισμικά και να δούμε πως μπορούμε να συμβάλουμε. Κοινοποιώ το email >>> στον Σίμο που συντονίζει αρκετές μεταφράσεις. >>> >>> Θ. >>> >>> 2009/3/1 <tsakf [ at ] tee [ dot ] gr>: >>>> Ναι, και εγώ συμφωνώ με τον Δημήτρη, ότι πρέπει να βρεθεί τρόπος να >>>> γίνονται τα updates αυτόματα, ώστε να μην γίνεται πάλι η δουλειά από >>>> την >>>> ταρχή. Δεν έχω δουλέψει καθόλου το transifex, του Δημήτρη Γλέζου. Ίσως >>>> να >>>> ήταν μια καλή ιδέα, να το χρησιμοποιήσουμε, εάν έχει αυτή την >>>> δυνατότητα >>>> (την αυτόματη ενημέρωση), ή να τον βοηθήσουμε να την προσθέσει. Επειδή >>>> οι >>>> φράσεις είναι δεδομένες πια στο λογισμικό, ίσως άξιζε να δημιουργηθεί >>>> λεξικό φράσεων, όχι λέξεων, για την αυτόματη ελληνοποίηση λογισμικού. -- Dimitris Glezos Jabber ID: glezos [ at ] jabber [ dot ] org, GPG: 0xA5A04C3B http://dimitris.glezos.com/ "He who gives up functionality for ease of use loses both and deserves neither." (Anonymous) --