360°BlogsVideoBooksAnswersBuzzMapsAgenda
Login
phigita.net! Homepage
Preferences | Tuesday, 06 January 2009, 17:37 PST
Question
Posted: Thursday April 29, 2004
Number of answers: 16

Unicode ή ISO ?

Ποιό προτιμάτε για δημιουργία ελληνικών ιστοσελίδων;

Reader's Answers

Το ISO, χωρίς κανένα ιδιαίτερο λόγο. Το phigita από την άλλη, αν δεν λανθάνομαι, χρησιμοποιεί Unicode.

-- Ιάκωβος Κωνσταντίνου ~iacovos, May 08, 2004

Όχι ιδιαίτερα ενδιαφέρον ερώτηση από τον τρόπο που διατυπώθηκε, ωστόσο, θα προσπαθήσω να εκφράσω την άποψη μου. Υποθέτω ότι με "ISO" εννοείς την κωδικοποίηση iso-8859-7. Αυτή η κωδικοποίηση απαιτεί μόνο μια ψηφιολέξη (byte) για αποθήκευση κάθε ελληνικού χαρακτήρα σε αντίθεση με τη δεκαεξάπιτη (δύο ψηφιολέξεις) κωδικοποίηση unicode.

Η iso-8859-7 προτιμείται κυρίως για το γεγονός ότι προυπήρχε της unicode και συνεπώς υπάρχει καλύτερη υποστήριξη στο διαθέσιμο λογισμικό όπως συστήματα διαχείρισης βάσεων δεδομένων και web servers. Η οικονομία αποθηκευτικού χώρου είναι άλλος ένας λόγος προτίμησης της iso-8858-7. Τέλος, η iso-8859-7 κωδικοποίηση δύναται να χρησιμοποιηθεί ως έχει για να αναπαραστήσει δίγλωσσες ιστοσελιδες που περιέχουν ελληνικά και/ή αγγλικά καλύπτοντας έτσι τις ανάγκες για τις πλείστες περιπτώσεις ανάπτυξης ιστοτοπίων.

Από την άλλη, χρησιμοποιώντας unicode καλύπτεις τις πλείστες υπάρχουσες γλώσσες με εξαίρεση κάποιες ασιατικές (δεν θυμαμαί ποιες ακριβώς). Γι αυτό ακριβώς το λόγο, όταν πρόκειται να αναπτυχθεί λογισμικό που πρέπει να έχει διεθνοποιημένο διαπροσωπείο (user interface) οι μηχανικοί προτιμούν να χρησιμοποιούν unicode. Συνεπώς, ο εκσυγχρονισμός θα επιβάλει, αργά ή γρήγορα, την μετακίνηση σε unicode.

-- Νεόφυτος Δημητρίου ~k2pts, May 08, 2004

Unicode!

Με Unicode μπορούν να απεικονιστούν όλες (http://www.unicode.org/charts/) οι γραφές. Ελληνικού ενδιαφέροντος γραφές είναι τα: μονοτονικό, πολυτονικό, Γραμμική Β, βυζαντινά μουσικά σύμβολα, "κυπριακή γραφή" (παραπλήσια με Γραμμική Α/Β?) και Αιγιακοί αριθμοί.

Με την κωδικοποίηση iso-8859-7 μπορούν να απεικονιστεί μόνο το μονοτονικό.

Δείτε ένα παράδειγμα της ομορφιάς του Unicode: http://www.i18nguy.com/unicode-example.html

Παράδειγμα Γραμμικής Β (απαιτεί εγκατάσταση γραμματοσειράς): http://www.i18nguy.com/unicode-plane1-utf8.html Απαιτεί Linux και Mozilla/Firefox με τις επιλογές GTK2+XFT.

-- Σίμος Ξενιτέλλης ~simos, May 11, 2004

Και όμως δεν είναι όλα καλά και άγια με το Unicode. Σε Internet Explore και Mozilla παίρνω διαφορετικά αποτελέσματα της σελίδας:http://www.i18nguy.com/unicode-example.html

Συγκεκριμένα:

Mozilla Firefox Syracuse (Sicily) Archimedes (physicist c. 287-212 BC) Συρακούσα Ἀρχιμήδης

Internet Explorer Syracuse (Sicily) Archimedes (physicist c. 287-212 BC) Συρακο□σα □ρχιμ□δης

Επίσης πατώντας ALT - 9633 εμφανίζεται το τετράγωνο(□) σε μερικά προγράμματα αλλά σε άλλα φαίνεται (í). Εδώ έπρεπε να το κάνω copy-paste για να δουλέψει το τετράγωνο. Πρώτη φορά βλέπω κάτι τέτοιο. Ξέρει κανείς γιατί;

-- Κωνσταντίνος Κωνσταντίνου ~constandinos, May 11, 2004

Κωνσταντίνο, υπήρχε το ίδιο πρόβλημα με την τελευταία μου καταχώρηση. Πιο συγκεκριμένα το ποίημα εμφανιζόταν μια χαρά στο Mozilla αλλά όχι στον IE – παρόμοια συμπεριφορά με αυτήν που περιγράφεις. Το πρόβλημα, τελικά, είχε να κάνει περισσότερο με τον τρόπο που συσχετίζουν οι δύο φυλλομετρητές τη δεδηλωμένη κωδικοποίηση της σελίδας και τις γραμματοσειρές που "πρέπει" να χρησιμοποιήσουν για την παρουσίαση.

Μετά από λίγο πειραματισμό φαίνεται ότι ο IE χρησιμοποιεί πάντα την προκαθορισμένη γραμματοσειρά ακόμη κι αν αυτή δεν υποστηρίζει αναπαράσταση unicode χαρακτήρων. Αντίθετα, ο Mozilla φαίνεται να χρησιμοποιεί διαφορετική – "συμβατή" – γραμματοσειρά για εκείνους τους χαρακτήρες που ενδεχομένως να μην καλύπτονται από την προκαθορισμένη.

Συνεπώς, αλλάζόντας τη γραμματοσειρά που χρησιμοποιείται σε τίτλους και προδιαμορφωμένο κείμενο – άλλως γνωστό ως κείμενο στην εμβέλεια των συμβόλων :: – λύθηκε το πρόβλημα παρουσίασης ελληνικών πολυτονικών κειμένων στον IE.

-- Νεόφυτος Δημητρίου ~k2pts, May 11, 2004

Νεόφυτε, διορθώθηκε δηλαδή το πρόβλημα στην τελευταία σου καταχώρηση; Επειδή ακόμα εγώ βλέπω κουτάκια με IE :(

-- Ιάκωβος Κωνσταντίνου ~iacovos, May 11, 2004

Ιάκωβε, εξαρτάται…

Σε ποια καταχώρηση αναφέρεσαι; Αν αναφέρεσαι σε αυτά που δημοσίευσε ο Κωνσταντίνος πιο πάνω, τότε "σωστά" βλέπεις τετραγωνάκια στον IE και στις δύο περιπτώσεις – το ίδιο συμβαίνει και σ'εμένα. Αυτό οφείλεται στο ότι άλλαξα τη γραμματοσειρά ώστε να προβάλλονται σωστά οι χαρακτήρες (πολυτονισμού) σε τίτλους και σε προδιαμορφωμένο κείμενο μόνο – πουθενά αλλού. Περιορίστηκα μόνο σε αυτά γιατί, όταν δοκίμασα μια καθολική αλλαγή γραμματοσειράς σε Tahoma, το αισθητικό αποτέλεσμα δεν με ικανοποίησε και, εξάλλου, θεωρώ ότι τις πλείστες φορές ο πολυτονισμός θα χρησιμοποιείται σε αποσπάσματα από παλιότερα κείμενα τα οποία ούτως ή άλλως θα ήταν "πρέπων" να δημοσιευθούν ως προδιαμορφωμένο κείμενο ή με άλλα λόγια ως κείμενο που εμπίπτει στην εμβέλεια της συμβολογραφίας που έχω προαναφέρει, δηλαδή, τους χαρακτήρες ::.

Αν, από την άλλη, αναφέρεσαι στο ποίημα του Δημήτρη Λιμπέρτη για το οποίο παραθέτω ζεύξη πιο πάνω τότε κάτι δεν πάει καλά και πρέπει να το ψάξουμε. Το ποίημα προβάλλεται σωστά (χωρίς τετραγωνάκια) τόσο με τον IE όσο και με το Mozilla κάτω από Windows XP – το ίδιο και με το Mozilla κάτω από Linux (Fedora Core 1).

Για να κάνω και λίγο κύρηγμα, να με συγχωρείς :) – συνηθίζεται να δημοσιεύονται περισσότερες λεπτομέρειες όταν γίνεται αναφορά σε κάποιο "πρόβλημα" ώστε να δίνεται η δυνατότητα περαιτέρω διερεύνησης κάτω ακριβώς από τις ίδιες συνθήκες που το πρόβλημα είχε προκύψει. Στη συγκεκριμένη περίπτωση, υποθέτω πως η έκδοση του λειτουργικού συστήματος θα ήταν βοηθητική :)

-- Νεόφυτος Δημητρίου ~k2pts, May 11, 2004

Το θέμα όμως είναι πιο γενικό! Δεν είναι μόνο IE - Mozilla! Γράφω το συγκεκριμένο σύμβολο σε 4 διαφορετικούς editors και παίρνω διαφορετικά αποτελέσματα. Συγκεκριμένα 2 προιόντα της Macromedia το Homesite και το Dreamweaver δείχνουν τον χαρακτήρα διαφορετικά από άλλα προιόντα όπως Notepad και Word.

Επίσης τώρα είμαι σπίτι και ο χαρακτήρας αυτός όταν τον δημιουργώ πατώντας ALT - 9633 είναι διαφορετικός. Μιας και ανάφερες τα λειτουργικά, και σπίτι χρησιμοποιώ Windows 2k Professional και στην δουλειά Windows 2k Server. Ουσιαστικά είναι το ίδιο λειτουργικό σύστημα με ελάχιστες διαφορές κυρίως σε IIS. Ίσως να μην είναι 9633 και έγραψα λάθος το νούμερο.

Επιπλέον τώρα που βλέπω το σχόλιο μου σε IE βλέπω πάλι τα τετράγωνα…. :-D Έτσι έπρεπε να είναι βέβαια αλλά δεν είχα σκοπό να είναι έτσι!

-- Κωνσταντίνος Κωνσταντίνου ~constandinos, May 11, 2004

Με συγχωρείς Νεόφυτε :)

Αναφέρομαι στο ποίημα του Δημήτρη Λιμπέρτη - στην τελευταία σου καταχώρηση. Όσο για το λειτουργικό χρησιμοποιώ Win XP Pro και MyIE2 (παραλλαγή του IE). Δοκίμασα και τον IE αλλά δυστυχώς και πάλι δεν φαίνεται καλά :( O Mozilla όμως είναι μια χαρά…

-- Ιάκωβος Κωνσταντίνου ~iacovos, May 11, 2004

Θα κάνω λίγο κύρηγμα και από τη δική μου την πλευρά. Το γεγονός ότι μια εφαρμογή δεν εμφανίζει σωστά το πολυτονικό σύστημα δε σημαίνει ότι το πρότυπο Unicode έχει σφάλματα. Ίσως να σημαίνει ότι η εφαρμογή δεν είναι ρυθμισμένη σωστά, και πρέπει να επικοινωνήσεις με τον κατασκευαστή για να προσφέρει σωστή υποστήριξη Unicode.

Σε Windows XP οι εξ ορισμού γραμματοσειρές που περιέχουν γλύφους (γράμματα) για το πολυτονικό είναι η Arial Unicode. Όταν εγκαταστήσεις το Office XP, παίρνεις και την Palatino Linotype. Η Tahoma δεν υποστηρίζει πολυτονικό παρά μόνο μονοτονικό. Αν γράφεις πολυτονικό κείμενο και η επελεγμένη γραμματοσειρά δεν έχει τον αντίστοιχο χαρακτήρα, τότε υπάρχουν οι παρακάτω εκδοχές

α. Τον εμφανίζει ως ορθογώνιο (WinXP) ή ορθογώνιο που περιέχει τον κωδικό Unicode (Linux). β. Το σύστημα αντικαθιστά τους γλύφους που λείπουν με αυτούς από μια άλλη γραμματοσειρά (Linux).

Το Linux κάνει αντικατάσταση από οποιαδήποτε γραμματοσειρά έχει διαθέσιμο το γλύφο και επιτρέπει "προτιμήσεις" σχετικά με το ποια γραμματοσειρά να προτιμήσει (pango).

Περισσότερα για γραμματοσειρές (και ελεύθερο λογισμικό), κοίταξε: http://www.ellak.gr/modules.php?op=modload&name=phpWiki&file=index&pagename=GreekFonts

Σχετικά με τα προϊόντα της Macromedia: Είναι γνωστό από καιρό ότι δεν έχουν καλή υποστήριξη Unicode. Ψάξε στο Διαδίκτυο για περισσότερα. Ακόμα, τα προϊόντα της Macromedia γενικά δεν σου επιτρέπουν εύκολα να αλλάξεις γραμματοσειρά. Επικοινώνησε με τη μαμά εταιρία για περισσότερα.

-- Σίμος Ξενιτέλλης ~simos, May 12, 2004

Ο Σίμος έχει απόλυτο δίκαιο. Το αν ένα πρότυπο υποστηρίζεται σωστά εξαρτάται από την εταιρία που κατασκευάζει το λογισμικό που το χρησιμοποιεί το πρότυπο. Είναι υποχρέωση της εταιρίας να υποστηρίζει τα αιτήματα των χρηστών της και αν δεν το κάνει, είναι καλύτερα να αλλάξεις εταιρία παρά πρότυπο!

Είναι τουλάχιστον απαράδεκτο πρότυπα που δεν τίθεται θέμα συζήτησης για την καταλληλότητα τους (όπως π.χ. Unicode, CSS σε αντίθεση π.χ. με τη διαμάχη DVD-R/DVD+R) να μην υποστηρίζονται σωστά από όλα τα υπερκείμενα προγράμματα (βλέπε πώς ο IE χώρισε το internet στα δύο με το crappy Javascript και την απαράδεκτη υποστήριξη του για τα CSS).

Το unicode είναι ένα MUST πρότυπο. Από τα λίγα τόσο must.

-- Δημήτρης Γλέζος ~glezos, May 13, 2004

[…] απαράδεκτη υποστήριξη του για τα CSS

Τι είναι τόσο απαράδεκτο; Χρησιμοποιώ CSS (CSS Level 2) και δουλεύουν το ίδιο σε IE/Mozilla/Opera. Τουλάχιστον ότι δοκίμασα μέχρι στιγμής.

Ίσως αναφέρεσαι στο ότι ο IE έχει την δυνατότητα να χρησιμοποιεί ένα υπερσύνολο του CSS Level 2 αλλά αυτό δεν πρέπει να ενοχλεί κανένα web developer επειδή αν δεν θέλει ο developer ας μην τα χρησιμοποιήσει!

-- Κωνσταντίνος Κωνσταντίνου ~constandinos, May 13, 2004

Αφήνοντας στο πλάι χοντρά χαρακτηριστικά όπως π.χ. το ότι δεν ακολουθεί σωστά το HTTP πρωτόκολλο (π.χ. μαντεύει πάντα τον τύπο του doc ανεξάρτητα από Content-type) και άλλα τέτοια, θα αναφέρω μόνο προβλήματα σχετικά με το CSS πρότυπο (αν και είμαστε εκτός θέματος).

  • Δεν υποστηρίζει em values στα μεγέθη κειμένου (πολύ σημαντικό για μεγένθυνση κειμένου, αλλαγές ανάλυσης οθόνης και προσβασιμότητα χρηστών με ειδικές ανάγκες).
  • Δεν υποστηρίζονται σωστά προσωπικά style sheets.
  • Δεν υποστηρίζονται τα pseudo-elements (αν και υποστηρίζονται τα pseudo-classes!).
  • Το formatting model δεν ακολουθεί το πρότυπο (π.χ. τα margins άμα τα προσθέσεις σε κάποια σημεία δεν βγαίνουν σωστά).
  • Τα margins δεν κάνουν collapse εκεί που πρέπει (κάποιες φορές θέλουν P elements για να "στρώσουν" και τότε το διάκενο μεταξύ των elements γίνεται πιο μεγάλο από όσο θα έπρεπε - κλασικό πρόβλημα "διαφοράς όψης" μεταξύ browsers).
  • Αν δεν βάλεις κάποιο tag στο document σου, τότε αυτό δεν ισχύει (όπως πχ με το BODY tag).
  • Το line spacing προστίθεται και στο τέλος του element (συχνμά μεγάλα διάκενα στις επικεφαλίδες).
  • Κάποια inline elements δεν κληρονομούν σωστά τα attributes (π.χ. SPAN μέσα σε H1 που κληρονομεί το background του BODY αντί του H1).

Ένα κλασικό παράδειγμα: Τα Pure CSS menus του Eric Meyer (http://www.meyerweb.com/eric/css/edge/menus/demo.html).

Από το 2001 (και τον IE 6) δεν έχουνε διορθώσει τα CSS bugs που υπάρχουν εκεί έξω. Εξάλλου οι ίδιοι λένε πως οι αποφάσεις τους οδηγούνται από τις απαιτήσεις των πελατών τους και όχι από τα πρότυπα (http://news.com.com/2100-1032-5088642.html). Πολλοί Web developers και CSS advocates (όπως ο Meyer και ο Zeldman) έχουν καταθέσει πολλά bug reports αλλά δε είδαμε ούτε ένα update για καλύτερο CSS support. Έχουν σταματήσει τις εργασίες αναβάθμισης του standalone browser εδώ και καιρό για χάρη των Longhorn (πράγμα απαράδεκτο αν σκεφτεί κανείς ότι υπάρχουν άνθρωποι εκεί έξω με IE 5 τον οποίο δεν μπορούν να αναβαθμίσουν αν δεν βάλουν Longhorn ή Service Pack).

Συγγνώμη για το ύφος, αλλά εξοργίζομαι όταν ξέρω ότι το 90% των χρηστών του internet χρησιμοποιεί ένα εργαλείο το οποίο δεν κάνει σωστά τη δουλειά του και γι'αυτό υποφέρουν πάμπολλοι web designers (μέσα και ο υποφαινόμενος). Και η εταιρία που το έφτιαξε να αδιαφορεί για αυτό τα τελευταία 3 χρόνια, την ίδια στιγμή που άλλοι παλεύουν για να υιοθετήσουν και να προετείνουν πρότυπα.

Τα πρότυπα είναι για να τηρούνται, αν θέλουμε interoperability και κοινή συμπεριφορά των προγραμμάτων. Πράγματα συφασμένα με την ελευθερία επιλογής μας στα εργαλεία που χρησιμοποιούμε.

Παραθέτω μερικά links ως τροφή για σκέψη.

http://css.nu/pointers/bugs-ie.html http://devedge.netscape.com/library/xref/2003/css-support/ http://archive.webstandards.org/css/winie/ http://www.digital-web.com/articles/toward_a_more_standards_compliant_ie/ http://www.quirksmode.org/

-- Δημήτρης Γλέζος ~glezos, May 13, 2004

Ακολουθώντας την υπόδειξη του Σίμου, δηλαδή χρησιμοποιώντας "Arial Unicode MS", φαίνεται να έχει φτιαχτεί το πρόβλημα που προέκυψε με το πολυτονικό κείμενο. Ιάκωβε έλεγξε και μου λες αν εξακολουθείς να έχεις πρόβλημα με την παρουσίαση του ποιήματος του Δημήτρη Λιπέρτη.

-- Νεόφυτος Δημητρίου ~k2pts, May 15, 2004

OK Νεόφυτε. Είναι μια χαρά τώρα.

-- Ιάκωβος Κωνσταντίνου ~iacovos, May 15, 2004

Ενδιαφέρουσα ανάλυση για την κωδικοποίηση ελληνικών κειμένων από το Σίμο Ξενιτέλη.

-- Νεόφυτος Δημητρίου ~k2pts, October 03, 2004