Στις 25 Ιανουαρίου 2011 3:06 μ.μ., ο χρήστης Apollon Oikonomopoulos <apollon [ at ] noc [ dot ] grnet [ dot ] gr> έγραψε: > On 12:08 Tue 25 Jan , Giorgos Keramidas wrote: >> On Mon, 24 Jan 2011 22:06:10 +0200, Nick Kossifidis <mickflemm [ at ] gmail [ dot ] com> wrote: >> > Στις 24 Ιανουαρίου 2011 10:41 π.μ., ο χρήστης Panagiotis Astithas >> > <pastith [ at ] gmail [ dot ] com> έγραψε: >> >> >> >> Αν ψάχνεις για URL regexp, δε νομίζω να βρεις καλύτερο από αυτό: >> >> http://daringfireball.net/2010/07/improved_regex_for_matching_urls >> > >> > Και όμως έχει αρκετά προβλήματα το συγκεκριμένο... >> > >> > α) [a-z][\w-]+: -> asdfasdfasdfasdfasdfasd: εγώ θέλω μόνο http: ή https: >> > β) /{1,3} -> Δε με ενδιαφέρει το file:/// πχ. >> > γ) www\d{0,3}[.] -> κανένα νόημα :P >> > δ) [a-z0-9.\-]+[.][a-z]{2,4}/ -> asdfa--asd..--..adsfa.<κάτι από 2 εώς >> > 4 γράμματα>/ δε μου πολυμοιάζει με domain name :P >> >> Επίσης το '-' δεν είναι valid domain-name character. Παίζει, μεν, σε >> ορισμένες περιπτώσεις, αλλά έχει και ένα σωρό προβλήματα σε άλλες. >> > > Το '-' *είναι* valid domain-name character (βλ. RFC 1034), αρκεί να μη > βρίσκεται στην άκρη του ονόματος (επίσης χρησιμοποιείται και από το IDN, > το οποίο «παράγει» έγκυρα ονόματα χώρου από unicode strings). Αυτό που > είναι πιο περίεργο είναι το underscore, το οποίο χρησιμοποιείται μεν σε > SRV records, όχι όμως σε κοινά hostnames. > > /Α > Αλήθεια με τα unicode domain names τι κάνουμε ? Πώς τα πιάνουμε με regexp ? -- GPG ID: 0xD21DB2DB As you read this post global entropy rises. Have Fun ;-) Nick