Zgodovina problema
Zgodovina je (kdo ve, zakaj) potekala tako, da so prve računalnike izdelali angleško
govoreči narodi. Že pri prvih poskusih uveljavitve računalnika v Evropi se je pojavil
problem neangleških črk, saj angleške črke uporablja samo angleščina.
Vsi drugi
jeziki uporabljajo poleg angleških črk še svoje dodatke. Veliki narodi so se hitro
prislinili zraven in iz prvotnega angleškega nabora črk je nastal prvi ASCII nabor, ki je
vseboval poleg angleških še nemške črke, pa še nekaj španskih, francoskih in skandinavskih.
ASCII nabor že v začetku ni pokrival niti vseh zahodnoevropskih jezikov (npr.: v francoščini
je vključeval samo male črke,...), zato so se hitro pojavili dodatni nabori znakov za
dodatne črke. Trenutno velja na tem področju velika zmešnjava, saj lahko npr. slovenski
č-š-ž najdemo v različnih naborih na povsem različnih mestih.
Zato se neredko zgodi, da imamo Slovenci težave pri uporabi računalnika. Komu se še ni
zgodilo, da bi se črke č-š-ž na lepem spremenile v nekaj povsem drugega? (Meni npr.
se v e-pošti beseda "" včasih skrivnostno spremeni v
"".) Drugo neprijetno
dejstvo pa je, da slovenskih črk marsikdaj sploh ne moremo uporabljati v mednarodni
izmenjavi. Pri večjezičnih besedilih sestavljalci na začetku izberejo nabor znakov, ki
ustreza "večjim" jezikom (po navadi zahodnoevropskim) in ostale jezike pišejo v okrnjeni
obliki — brez strešic: Kucan, Drnovsek, Jansa,...
Nova rešitev
Na srečo Slovenci nismo edini narod s takšnimi problemi. Na pobudo velikega števila
različnih narodov je nastal nov nabor znakov:
Unicode
(
glej kodno tabelo).
Po eni strani je to samo še en nov
nabor, ki č-š-ž spet prestavlja na druge pozicije, in zato med Slovenci še ni ravno
posebej popularen.
Po drugi strani pa nudi tudi nekaj več: Unicode združuje
v isti kodni tabeli črke iz res zelo velikega števila črkopisov (več verzij latinice,
več verzij cirilice, grške, arabske, hebrejske črke, kitajski in japonski znaki, pa še kaj). To pomeni, da je nabor
Unicode kot nalašč za pripravo večjezikovnih besedil — npr. za članek o Sloveniji, napisan
v italijanščini.
Zgled: V Unicodu lahko brez težav napišemo naslov članka
,
kar prej ni bilo mogoče: v vzhodnoevropski kodni tabeli se je namreč napis spremenil
v , v zahodnoevropski pa v ,
kar so potem avtorji popravljali v .
Unicode je zelo uporaben tudi za sestavljanje seznamov imen iz različnih jezikov. Tudi
pri nas žal redko vidimo pravilno zapisana imena in priimke slavnih svetovnih politikov,
športnikov, ipd. Ali veš, da se Lech Walensa (Poljska) v resnici piše
; da romunski diktator ni bil Ceausescu, pač pa
, da češki skladatelj ni bil Dvoržak, pač pa
,...
Kako deluje?
Unicode lahko zajema tako veliko število različnih znakov, ker dopušča tudi kode večje
od 255 (kar v starejših kodnih tabelah ni bilo mogoče). Črko z določeno kodo (npr. 345)
dobimo tako, da jo zapišemo v obliki (to
si lahko ogledaš tudi v tem dokumentu: klikni z desno miškino tipko in izberi
"Ogled izvorne kode"). Slovenske črke dobimo kot:
Verjetno ti je že jasno, zakaj se Slovenci še niso množično navdušili nad kodno tabelo
Unicode: kar precej zoprno je vsakič namesto č napisati .
Vendar obstajajo elegantnejše rešitve - jaz npr. uporabljam urejevalnik spletnih strani,
ki mi omogoča, da pišem č-š-ž popolnoma normalno, pri shranjevanju dokumenta pa jih
program samodejno spremeni v ustrezne kode.
Obstaja pa še preprostejša rešitev: spletno stran lahko pripraviš z urejevalnikom,
ki omogoča neposredno shranjevanje v obliki Unicode. To zna npr. program
Beležnica
(oziroma angleško
Notepad) — izberi Shrani kot/Unicode.
V takem urejevalniku lahko vse (slovenske pa tudi druge) črke natipkaš povsem normalno.
Pomembno je le, da v glavi spletne strani navedeš, da želiš uporabljati nabor Unicode.
To narediš z ukazom:
Zanimivosti
Kodno tabelo Unicode lahko uporabljaš tudi na večini boljših mobilnih telefonov,
npr.
Nokia, SonyEricsson, itd. V ustreznem meniju izberi nastavitev abecede "Unicode" (ali tudi "domače črke") in
potem boš lahko pošiljal SMS sporočila, ki vsebujejo črke č-š-ž. Taka sporočila lahko
sprejemajo (in pravilno prikažejo č-š-ž) vsi novejši mobilni telefoni.
Še opozorilo: v Unicodu imajo žal SMS-ji manjšo maksimalno dolžino!
Težave z Unicodom?
Nekateri starejši spletni brskalniki ne podpirajo nabora Unicode ali pa ga podpirajo le delno.
Taki brskalniki so na srečo že precej redki. Novejši brskalniki brez težav prikažejo črke č-š-ž, pa tudi še celo vrsto
drugih črk in simbolov.
Kot je videti, bodo računalniki (in druge naprave), ki uporabljajo kodno tabelo Unicode, kmalu popolnoma prevladali in
težav s slovenskimi črkami ne bo več. Razen tistih v glavah: ne vem zakaj je toliko Slovencev, ki
pri komuniciranju s tujci č-š-ž preprosto pozabijo in začnejo pisati npr.: »Srecko Kosovel was born in Sezana« in podobno.
Tem "Slovencem" naj bo za zgled angleška Wikipedija, ki pogumno zapiše »Srečko« in »Sežana«, prav tako pa tudi
»Župančič«, »Pavček« in »Ajdovščina«.
Enako pogumni pa bodimo tudi pri tujih jezikih. Ne pozabimo, da slovenski pravopis določa, da moramo pri osebnih imenih (iz jezikov,
ki pišejo z latinico) upoštevati izvirno obliko. Kdaj bomo torej začeli dosledno pisati:
Dodatek – čez 15 let
Ta članek sem napisal okoli leta 2003. Danes (leta 2018) z veseljem ugotavljam, da se je Unicode kar precej uveljavil v svetu. Tudi ustvarjalci
novega standarda HTML 5 so vzeli Unicode za privzeti font. Ovire za uporabo naših črk č-š-ž torej izginjajo.
Žal pa je tudi v letu 2018 še vedno dosti Slovencev, ki mislijo, da tujcem delajo uslugo, če pišejo slovenska imena brez strešic, npr.:
Yesterday Slavoj Zizek came to Portoroz.