Problem slovenskih črk

DOMAČA STRAN

MATEMATIKA

PISAVE
• Glagolica
• Bohoričica
• Metelčica
• Dajnčica
• Gajica
• Problem slovenskih črk
• Tabela UNICODE
• Cirilica

RAZNO

Zgodovina problema

Zgodovina je (kdo ve, zakaj) potekala tako, da so prve računalnike izdelali angleško govoreči narodi. Že pri prvih poskusih uveljavitve računalnika v Evropi se je pojavil problem neangleških črk, saj angleške črke uporablja samo angleščina. Vsi drugi jeziki uporabljajo poleg angleških črk še svoje dodatke. Veliki narodi so se hitro prislinili zraven in iz prvotnega angleškega nabora črk je nastal prvi ASCII nabor, ki je vseboval poleg angleških še nemške črke, pa še nekaj španskih, francoskih in skandinavskih. ASCII nabor že v začetku ni pokrival niti vseh zahodnoevropskih jezikov (npr.: v francoščini je vključeval samo male črke,...), zato so se hitro pojavili dodatni nabori znakov za dodatne črke. Trenutno velja na tem področju velika zmešnjava, saj lahko npr. slovenski č-š-ž najdemo v različnih naborih na povsem različnih mestih.
Zato se neredko zgodi, da imamo Slovenci težave pri uporabi računalnika. Komu se še ni zgodilo, da bi se črke č-š-ž na lepem spremenile v nekaj povsem drugega? (Meni npr. se v e-pošti beseda "križišče" včasih skrivnostno spremeni v "kriľiąče".) Drugo neprijetno dejstvo pa je, da slovenskih črk marsikdaj sploh ne moremo uporabljati v mednarodni izmenjavi. Pri večjezičnih besedilih sestavljalci na začetku izberejo nabor znakov, ki ustreza "večjim" jezikom (po navadi zahodnoevropskim) in ostale jezike pišejo v okrnjeni obliki — brez strešic: Kucan, Drnovsek, Jansa,...

Nova rešitev

Na srečo Slovenci nismo edini narod s takšnimi problemi. Na pobudo velikega števila različnih narodov je nastal nov nabor znakov: Unicode (glej kodno tabelo).
Po eni strani je to samo še en nov nabor, ki č-š-ž spet prestavlja na druge pozicije, in zato med Slovenci še ni ravno posebej popularen.
Po drugi strani pa nudi tudi nekaj več: Unicode združuje v isti kodni tabeli črke iz res zelo velikega števila črkopisov (več verzij latinice, več verzij cirilice, grške, arabske, hebrejske črke, kitajski in japonski znaki, pa še kaj). To pomeni, da je nabor Unicode kot nalašč za pripravo večjezikovnih besedil — npr. za članek o Sloveniji, napisan v italijanščini.

Zgled: V Unicodu lahko brez težav napišemo naslov članka Città Sežana, kar prej ni bilo mogoče: v vzhodnoevropski kodni tabeli se je namreč napis spremenil v Cittŕ Sežana, v zahodnoevropski pa v Città Se¾ana, kar so potem avtorji popravljali v Città Sezana.

Unicode je zelo uporaben tudi za sestavljanje seznamov imen iz različnih jezikov. Tudi pri nas žal redko vidimo pravilno zapisana imena in priimke slavnih svetovnih politikov, športnikov, ipd. Ali veš, da se Lech Walensa (Poljska) v resnici piše Wałęsa; da romunski diktator ni bil Ceausescu, pač pa Ceauşescu, da češki skladatelj ni bil Dvoržak, pač pa Dvořák,...

Kako deluje?

Unicode lahko zajema tako veliko število različnih znakov, ker dopušča tudi kode večje od 255 (kar v starejših kodnih tabelah ni bilo mogoče). Črko z določeno kodo (npr. 345) dobimo tako, da jo zapišemo v obliki ř (to si lahko ogledaš tudi v tem dokumentu: klikni z desno miškino tipko in izberi "Ogled izvorne kode"). Slovenske črke dobimo kot:

Č =	Č
č =	č
Š =	Š
š =	š
Ž =	Ž
ž =	ž

Verjetno ti je že jasno, zakaj se Slovenci še niso množično navdušili nad kodno tabelo Unicode: kar precej zoprno je vsakič namesto č napisati č. Vendar obstajajo elegantnejše rešitve - jaz npr. uporabljam urejevalnik spletnih strani, ki mi omogoča, da pišem č-š-ž popolnoma normalno, pri shranjevanju dokumenta pa jih program samodejno spremeni v ustrezne kode.

Obstaja pa še preprostejša rešitev: spletno stran lahko pripraviš z urejevalnikom, ki omogoča neposredno shranjevanje v obliki Unicode. To zna npr. program Beležnica (oziroma angleško Notepad) — izberi Shrani kot/Unicode. V takem urejevalniku lahko vse (slovenske pa tudi druge) črke natipkaš povsem normalno. Pomembno je le, da v glavi spletne strani navedeš, da želiš uporabljati nabor Unicode. To narediš z ukazom:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Zanimivosti

Kodno tabelo Unicode lahko uporabljaš tudi na večini boljših mobilnih telefonov, npr. Nokia, SonyEricsson, itd. V ustreznem meniju izberi nastavitev abecede "Unicode" (ali tudi "domače črke") in potem boš lahko pošiljal SMS sporočila, ki vsebujejo črke č-š-ž. Taka sporočila lahko sprejemajo (in pravilno prikažejo č-š-ž) vsi novejši mobilni telefoni.
Še opozorilo: v Unicodu imajo žal SMS-ji manjšo maksimalno dolžino!

Težave z Unicodom?

Nekateri starejši spletni brskalniki ne podpirajo nabora Unicode ali pa ga podpirajo le delno. Taki brskalniki so na srečo že precej redki. Novejši brskalniki brez težav prikažejo črke č-š-ž, pa tudi še celo vrsto drugih črk in simbolov.

Kot je videti, bodo računalniki (in druge naprave), ki uporabljajo kodno tabelo Unicode, kmalu popolnoma prevladali in težav s slovenskimi črkami ne bo več. Razen tistih v glavah: ne vem zakaj je toliko Slovencev, ki pri komuniciranju s tujci č-š-ž preprosto pozabijo in začnejo pisati npr.: »Srecko Kosovel was born in Sezana« in podobno. Tem "Slovencem" naj bo za zgled angleška Wikipedija, ki pogumno zapiše »Srečko« in »Sežana«, prav tako pa tudi »Župančič«, »Pavček« in »Ajdovščina«.

Enako pogumni pa bodimo tudi pri tujih jezikih. Ne pozabimo, da slovenski pravopis določa, da moramo pri osebnih imenih (iz jezikov, ki pišejo z latinico) upoštevati izvirno obliko. Kdaj bomo torej začeli dosledno pisati: Carl Friedrich Gauß, Karol Wojtyła, Émile Zola, ...

Dodatek – čez 15 let

Ta članek sem napisal okoli leta 2003. Danes (leta 2018) z veseljem ugotavljam, da se je Unicode kar precej uveljavil v svetu. Tudi ustvarjalci novega standarda HTML 5 so vzeli Unicode za privzeti font. Ovire za uporabo naših črk č-š-ž torej izginjajo.

Žal pa je tudi v letu 2018 še vedno dosti Slovencev, ki mislijo, da tujcem delajo uslugo, če pišejo slovenska imena brez strešic, npr.: Yesterday Slavoj Zizek came to Portoroz.