You are here

Ćirilički URL

Kroz istoriju računara se vodila bitka za korišćenje lokalnih pisama u softveru i na hardveru koji je dominantno proizveden u Americi. Davno pre ere interneta, korisnici su se hvatali ukoštac sa činjenicom da „27. slovo“ jednostavno nije predviđeno, i da ih nisu podržavali sistemi kao što su DOS, Windows, Unix… Čak i kada je stanje stvari počelo krajem prošlog veka da se popravlja, to su više bile kozmetičke promene nego suštinsko poboljšanje – postojale su desetine različitih standarda, štampače su zbunjivali ti čudni kodovi (a rezultat koji su pružali je bio jako neizvesan) itd.

Korisnici su, naravno, nalazili prečice. To je rezultiralo dodatnim haosom, desetinama standarda, fontovima lošeg kvaliteta i ponekad sasvim onemogućenom razmenom dokumenata između platformi.

Na svu sreću, stvari se popravljaju.

Kako napraviti dobar sajt na ćirilici

Postepeno, to je reč koja sve najbolje objašnjava. Jer podrška nastaje postepeno. Kada je IDN format domena tek nastao, pretraživači su ga različito tretirali, svaki na svoj način. Na primer, Mozilla Firefox je zahtevala posebno odobrenje (tzv. hardcoding) za dozvoljene nazive domena, a .срб nije bio među podrazumevanima.

Sledeća dilema bila je set karaktera. Međunarodni simboli bili su obuhvaćeni sa više standarda, a jedan od najodgovornijih aktera tog haosa bio je niko drugi do Majkrosoft sa svojom idejom o „boljim i drugačijim“ odgovorima na pitanja koja su već odgovorena.

Poštuj tvorca

Jedini put napretka je zapravo put poštovanja internet standarda. Kada je reč o neengleskim pismima, kao što je slučaj sa srpskom ćirilicom, ispostavilo se da je traženi standard UTF-8.

Pre svega, potrebno je da obavestite pregledač (browser) koji set karaktera koristite u dokumentu:

<meta charset="utf-8" />

Zatim, potrebno je da koristite isti set karaktera i u samom URL-u:

https://www.rnids.rs/национални-домени/регистрација-националних-домена

To je ono što standard omogućava. Pregledači ne omogućavaju? To je njihov problem. Zaista jeste. A taj se problem neće rešiti sam. Čak i danas, karakteri međunarodnih pisama imaju drugačiji tretman u odnosu karaktere engleskog alfabeta. Opet, to je njihov problem. Upornost je ključ, ne traženje prečica.

Na kraju, nije loša ideja da obavestite “buntovne“ pregledače šta pokušavate da postignete:

<!--[if lt IE 7]><html class="lt-ie9 lt-ie8 lt-ie7" lang="sr" dir="ltr"><![endif]-->
<!--[if IE 7]><html class="lt-ie9 lt-ie8" lang="sr" dir="ltr"><![endif]-->
<!--[if IE 8]><html class="lt-ie9" lang="sr" dir="ltr"><![endif]-->

To je primer nestandardnog, ali efikasnog rešenja.

Obavestite pretraživačku mašinu

Često je nelatinički sadržaj duplikat sadržaja na latinici. Obavestite pretraživače da je to slučaj. Ovo je od nedavno dostupna mogućnost, ali mi toplo preporučujemo da je koristite:

<link href="/%D0%BD%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D0%BD%D0%B8-%D0%B4%D0%BE%D0%BC%D0%B5%D0%BD%D0%B8/%D1%80%D0%B5%D0%B3%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%86%D0%B8%D1%98%D0%B0-%D0%BD%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D0%BD%D0%B8%D1%85-%D0%B4%D0%BE%D0%BC%D0%B5%D0%BD%D0%B0" rel="alternate" hreflang="sr" />

<link href="/lat/nacionalni-domeni/registracija-nacionalnih-domena" rel="alternate" hreflang="sr-Latn" />

<link href="/en/national-domains/registering-national-domains" rel="alternate" hreflang="en" />

Koristimo isti URL kao iznad ali Google Chrome i dalje „sakriva“ ćirilicu. Ne obraćajte pažnju, pre ili kasnije će se opametiti. U stvari sva tri URL-a koriste isto UTF-8 kodiranje.

„Obavestiti“ pretraživače da je reč o istom sadržaju može biti od koristi, jer onda neće favorizovati ni engleski ni bilo koji drugi jezik – ponašaće se u skladu sa podešavanjima korisnikovog sistema. Ako ste iz Srbije, i koristite ćirilicu, Windows (ili drugi operativni sistem) to mora da zna, a vi morate da prestanete da se osećate „pomalo neprijatno“ zato što koristite maternji jezik i njegovo pismo. Sami se moramo izboriti, niko drugi to neće učiniti za nas.

Strpljenja, molim

Internet će vremenom sigurno podržavati sva moguća pisma, i više od toga. Ali, traženje jednokratnih prečica neće pomoći da se to dogodi, štaviše, usporiće proces adaptacije. Ako postoji standard – primenjujte ga!

Pratite fabulu

Kako pregledači i drugi softveri napreduju, kvalitet podrške za ne-engleska pisma raste. To je van svake sumnje, posvedočili smo tokom prošle decenije. Možda ćete pasti u iskušenje da koristite „hakerske“ trikove i pravite jednokratna rešenja koja će momentalno ispravno prikazivati slova, ali nemojte. Mnogo je bolja ideja da zahtevate tu mogućnost– Google, Microsoft, Mozilla i drugi nisu gluvi na takve zahteve.

Sveobuhvatna upotreba pisma

Ne postoji nijedan razlog da sadržaj sajta bude na ćirilici, a URL na latinici. Možda je tako moralo ranije, ali više ne. Zašto da pravite korak unazad, kada možete ići dva unapred?

Male tajne velikih majstora

Postoji nekoliko „caka“ koje mogu biti korisne pri radu sa URL-ovima na neengleskim pismima.

Apač veb server, koji se više nego dominantno koristi na internetu, ima poteškoće da interpretira direktan unos ćirilice u konfiguracione fajlove. Potrebno je da pribegavate upotrebi IDN ekvivalenata, ili vršite preusmeravanja i sl. Na primer:

ServerName xn--d1aholi.xn--90a3ac # actually, рнидс.срб

Prilično je zabavna činjenica da se sam konfiguracioni fajl zove рнидс.срб.conf. To je zato što Linux nema problem sa ćirilicom, a iznad svega nema ni Apač, osim što…

Kada pokušate da kopirate ćirilički URL, dobićete nešto ovako:

https://www.rnids.rs/%D1%9B%D0%B8%D1%80%D0%B8%D0%BB%D0%B8%D1%86%D0%B0-%D0%BD%D0%B0-%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82%D1%83/idn-%D0%B5%D0%BD%D0%BA%D0%BE%D0%B4%D0%B5%D1%80

U pitanju je vrlo jednostavan URL, koji zapravo ovako glasi https://www.rnids.rs/ћирилица-на-интернету/idn-енкодер. Međutim, većina pregledača će vam „pripomoći“ transkodovanjem. URL je sasvim ispravan i radi, ali ga razume samo mašina, ljudima je sasvim beskoristan.

Google Chrome se nedavno rešio ove loše navike, i sad je moguće kopirati ćirilički URL iz adresnog polja u drugi pregledač. Ovim se ponovo naglašava pređašnja preporuka „strpljenja, molim“. Drugi pregledači to još nisu postigli, ali postoji način da se i sa ovim izađe na kraj – uklonite samo jedno slovo, na primer prvo h iz naziva protokola, i pregledač će ispravno kopirati URL. Ovako to izgleda u poslednjoj verziji Firefox-a:

ttps://www.rnids.rs/ћирилица-на-интернету/idn-енкодер

Bitka traje, ali to je bitka koju smo već dobili.

 

Vladimir Marić, Mrežni sistemi d.o.o.