Connect with us

technokrata

A Unicode és az XML nem férnek össze?

Kütyük

A Unicode és az XML nem férnek össze?

A híres World Wide Web Consortium és a Unicode Consortium jelentése szerint a karakterkészleteket leíró Unicode és az XML nyelv összeakadása a böngészők nem megfelelő működéséhez vezethet.

Ahhoz, hogy minden nyelv a saját karakterkészletével jelen lehessen a PC-k világában, szükség volt egy egységes szabványra, ami ezt meghatározta (különben csak az angol ABC 26 betűjét – plusz írásjelek – lehetne mind a mai napig alkalmazni). Ez lett a Unicode, amely régen tökéletesen működött, ám megfigyelések szerint a hozzá képest újnak számító XML (Extensible Markup Language) formátummal ˝összeakadhat˝. A W3C által digitális dokumentumok készítésére ajánlott standard használata néhány Unicode funkció miatt hibás működéshez vezethet – XML alkalmazásokban, HTML böngészőkben és egyéb szoftverekben is.

A probléma gyökerét a betűkezelés egymástól alapvetően eltérő megközelítésében kell keresni. A Unicode ugyanis lineáris kapcsolatot hoz létre minden egyes karakter között a lapon, ám az XML ennél sokkal rugalmasabban működik: még az egyes karakterek szintjén is különböző stílusok és funkcionalitásbeli jellemzők állíthatók be (természetesen ez nagyobb léptékben – szó, oldal – is működik). Az úgynevezett kompatibilitás karakterek kezelése így jelentősen eltérő módszerrel történik mindkét standardban.

Martin Duerst, a W3C egyik vezetője (aki egyben a Massachusetts-i Intézet egyik kutatója) elmondta, hogy igyekeznek arra rábírni az XML-t alkalmazó fejlesztőket, hogy törekedjenek a Unicode által meghatározott rend alkalmazására. Ennek hiányában ugyanis főként akkor jelentkezik probléma, amikor régebbi adatbázisokkal kerül kapcsolatba egy-egy XML alkalmazás. Egy nem megfelelően kezelt tabulátor (vagy bármelyik másik vezérlőkarakter) ilyenkor galibát okoz.



Szólj hozzá!

További Kütyük

Technokrata a Face-en

Tesztek