ΕΕΛ/ΛΑΚ - Λίστες Ταχυδρομείου

Re: FYI: Greek Analyzer for Apache Lucene

  • Subject: Re: FYI: Greek Analyzer for Apache Lucene
  • From: Panagiotis Astithas <past [ at ] ebs [ dot ] gr>
  • Date: Wed, 27 Apr 2005 23:26:45 +0300
Alexios Zavras wrote:
Panagiotis Astithas wrote [edited]:

κάναμε ως EBS Ε.Π.Ε. μια προσφορά στο Apache Lucene project


Eyge!



- η αναζήτηση για λέξεις όπως "ΜΗΧΑΝΙΚΟΣ", "Μηχανικός" και "μηχανικός" επιστρέφει τα ίδια αποτελέσματα, καθώς το search query μετατρέπει όλες τις δυνατές μορφές σε μια μοναδική απεικόνιση, λαμβάνοντας υπόψη τις ιδιαιτερότητες της ελληνικής γλώσσας (τόνοι, διαλυτικά, κλπ.)

[...]

character sets Unicode,


Erwthsh, mia poy les Unicode:
to unification (tonoi, kefalaia-mikra, klp.)
poy les parapanw isxyei kai gia ta polytonika ?

Δυστυχώς όχι, αφ'ενός διότι δεν το απαιτούσαν οι παρούσες ανάγκες μας και αφ'ετέρου διότι δεν είχα πολυτονικές γραμματοσειρές για να κάνω την επαλήθευση. Δεν είναι δύσκολο να προστεθεί από κάποιον που διαθέτει το απαραίτητο test environment, αρκεί να διαθέτει την αντιστοίχιση γραμμάτων με κωδικούς Unicode. Εάν κανείς είναι διατεθειμένος να το υλοποιήσει, μπορώ να βοηθήσω όπου χρειαστεί.

Φιλικά,
--
Panagiotis Astithas, PhD
EBS, Electronic Business Systems Ltd.
18 Evgenidou Street, 115 25, Athens GREECE
Phone: +30 210 674 7631
Fax: +30 210 674 7601
http://www.ebs.gr

αναφορές

πλοήγηση μηνυμάτων