Kütyük
A Unicode és az XML nem férnek össze?
A híres World Wide Web Consortium és a Unicode Consortium jelentése szerint a karakterkészleteket leíró Unicode és az XML nyelv összeakadása a böngészők nem megfelelő működéséhez vezethet.
Ahhoz, hogy minden nyelv a saját karakterkészletével jelen lehessen a PC-k világában, szükség volt egy egységes szabványra, ami ezt meghatározta (különben csak az angol ABC 26 betűjét – plusz írásjelek – lehetne mind a mai napig alkalmazni). Ez lett a Unicode, amely régen tökéletesen működött, ám megfigyelések szerint a hozzá képest újnak számító XML (Extensible Markup Language) formátummal ˝összeakadhat˝. A W3C által digitális dokumentumok készítésére ajánlott standard használata néhány Unicode funkció miatt hibás működéshez vezethet – XML alkalmazásokban, HTML böngészőkben és egyéb szoftverekben is.
A probléma gyökerét a betűkezelés egymástól alapvetően eltérő megközelítésében kell keresni. A Unicode ugyanis lineáris kapcsolatot hoz létre minden egyes karakter között a lapon, ám az XML ennél sokkal rugalmasabban működik: még az egyes karakterek szintjén is különböző stílusok és funkcionalitásbeli jellemzők állíthatók be (természetesen ez nagyobb léptékben – szó, oldal – is működik). Az úgynevezett kompatibilitás karakterek kezelése így jelentősen eltérő módszerrel történik mindkét standardban.
Martin Duerst, a W3C egyik vezetője (aki egyben a Massachusetts-i Intézet egyik kutatója) elmondta, hogy igyekeznek arra rábírni az XML-t alkalmazó fejlesztőket, hogy törekedjenek a Unicode által meghatározott rend alkalmazására. Ennek hiányában ugyanis főként akkor jelentkezik probléma, amikor régebbi adatbázisokkal kerül kapcsolatba egy-egy XML alkalmazás. Egy nem megfelelően kezelt tabulátor (vagy bármelyik másik vezérlőkarakter) ilyenkor galibát okoz.
[fbcomments url="https://www.technokrata.hu/kutyuk/2003/06/18/a-unicode-es-az-xml-nem-fernek-ossze/" width="800" count="off" num="3" countmsg=""]






