You are here

Ћирилички URL

Кроз историју рачунара се водила битка за коришћење локалних писама у софтверу и на хардверу који је доминантно произведен у Америци. Давно пре ере интернета, корисници су се хватали укоштац са чињеницом да „27. слово“ једноставно није предвиђено, и да их нису подржавали системи као што су DOS, Windows, Unix… Чак и када је стање ствари почело крајем прошлог века да се поправља, то су више биле козметичке промене него суштинско побољшање – постојале су десетине различитих стандарда, штампаче су збуњивали ти чудни кодови (а резултат који су пружали је био јако неизвесан) итд.

Корисници су, наравно, налазили пречице. То је резултирало додатним хаосом, десетинама стандарда, фонтовима лошег квалитета и понекад сасвим онемогућеном разменом докумената између платформи.

На сву срећу, ствари се поправљају.

Како направити добар сајт на ћирилици

Постепено, то је реч која све најбоље објашњава. Јер подршка настаје постепено. Када је IDN формат домена тек настао, претраживачи су га различито третирали, сваки на свој начин. На пример, Mozilla Firefox је захтевала посебно одобрење (тзв. hardcoding) за дозвољене називе домена, а .срб није био међу подразумеванима.

Следећа дилема била је сет карактера. Међународни симболи били су обухваћени са више стандарда, а један од најодговорнијих актера тог хаоса био је нико други до Мајкрософт са својом идејом о „бољим и другачијим“ одговорима на питања која су већ одговорена.

Поштуј творца

Једини пут напретка је заправо пут поштовања интернет стандарда. Када је реч о неенглеским писмима, као што је случај са српском ћирилицом, испоставило се да је тражени стандард UTF-8.

Пре свега, потребно је да обавестите прегледач (browser) који сет карактера користите у документу:

<meta charset="utf-8" />

Затим, потребно је да користите исти сет карактера и у самом URL-у:

https://www.rnids.rs/национални-домени/регистрација-националних-домена

То је оно што стандард омогућава. Прегледачи не омогућавају? То је њихов проблем. Заиста јесте. А тај се проблем неће решити сам. Чак и данас, карактери међународних писама имају другачији третман у односу карактере енглеског алфабета. Опет, то је њихов проблем. Упорност је кључ, не тражење пречица.

На крају, није лоша идеја да обавестите “бунтовне“ прегледаче шта покушавате да постигнете:

<!--[if lt IE 7]><html class="lt-ie9 lt-ie8 lt-ie7" lang="sr" dir="ltr"><![endif]-->
<!--[if IE 7]><html class="lt-ie9 lt-ie8" lang="sr" dir="ltr"><![endif]-->
<!--[if IE 8]><html class="lt-ie9" lang="sr" dir="ltr"><![endif]-->

То је пример нестандардног, али ефикасног решења.

Обавестите претраживачку машину

Често је нелатинички садржај дупликат садржаја на латиници. Обавестите претраживаче да је то случај. Ово је од недавно доступна могућност, али ми топло препоручујемо да је користите:

<link href="/%D0%BD%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D0%BD%D0%B8-%D0%B4%D0%BE%D0%BC%D0%B5%D0%BD%D0%B8/%D1%80%D0%B5%D0%B3%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%86%D0%B8%D1%98%D0%B0-%D0%BD%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%B0%D0%BB%D0%BD%D0%B8%D1%85-%D0%B4%D0%BE%D0%BC%D0%B5%D0%BD%D0%B0" rel="alternate" hreflang="sr" />

<link href="/lat/nacionalni-domeni/registracija-nacionalnih-domena" rel="alternate" hreflang="sr-Latn" />

<link href="/en/national-domains/registering-national-domains" rel="alternate" hreflang="en" />

Користимо исти URL као изнад али Google Chrome и даље „сакрива“ ћирилицу. Не обраћајте пажњу, пре или касније ће се опаметити. У ствари сва три URL-а користе исто UTF-8 кодирање.

„Обавестити“ претраживаче да је реч о истом садржају може бити од користи, јер онда неће фаворизовати ни енглески ни било који други језик – понашаће се у складу са подешавањима корисниковог система. Ако сте из Србије, и користите ћирилицу, Windows (или други оперативни систем) то мора да зна, а ви морате да престанете да се осећате „помало непријатно“ зато што користите матерњи језик и његово писмо. Сами се морамо изборити, нико други то неће учинити за нас.

Стрпљења, молим

Интернет ће временом сигурно подржавати сва могућа писма, и више од тога. Али, тражење једнократних пречица неће помоћи да се то догоди, штавише, успориће процес адаптације. Ако постоји стандард – примењујте га!

Пратите фабулу

Како прегледачи и други софтвери напредују, квалитет подршке за не-енглеска писма расте. То је ван сваке сумње, посведочили смо током прошле деценије. Можда ћете пасти у искушење да користите „хакерске“ трикове и правите једнократна решења која ће моментално исправно приказивати слова, али немојте. Много је боља идеја да захтевате ту могућност– Google, Microsoft, Mozilla и други нису глуви на такве захтеве.

Свеобухватна употреба писма

Не постоји ниједан разлог да садржај сајта буде на ћирилици, а URL на латиници. Можда је тако морало раније, али више не. Зашто да правите корак уназад, када можете ићи два унапред?

Мале тајне великих мајстора

Постоји неколико „цака“ које могу бити корисне при раду са URL-овима на неенглеским писмима.

Апач веб сервер, који се више него доминантно користи на интернету, има потешкоће да интерпретира директан унос ћирилице у конфигурационе фајлове. Потребно је да прибегавате употреби IDN еквивалената, или вршите преусмеравања и сл. На пример:

ServerName xn--d1aholi.xn--90a3ac # actually, рнидс.срб

Прилично је забавна чињеница да се сам конфигурациони фајл зове рнидс.срб.conf. То је зато што Linux нема проблем са ћирилицом, а изнад свега нема ни Апач, осим што…

Када покушате да копирате ћирилички URL, добићете нешто овако:

https://www.rnids.rs/%D1%9B%D0%B8%D1%80%D0%B8%D0%BB%D0%B8%D1%86%D0%B0-%D0%BD%D0%B0-%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%BD%D0%B5%D1%82%D1%83/idn-%D0%B5%D0%BD%D0%BA%D0%BE%D0%B4%D0%B5%D1%80

У питању је врло једноставан URL, који заправо овако гласи https://www.rnids.rs/ћирилица-на-интернету/idn-енкодер. Међутим, већина прегледача ће вам „припомоћи“ транскодовањем. URL је сасвим исправан и ради, али га разуме само машина, људима је сасвим бескористан.

Google Chrome се недавно решио ове лоше навике, и сад је могуће копирати ћирилички URL из адресног поља у други прегледач. Овим се поново наглашава пређашња препорука „стрпљења, молим“. Други прегледачи то још нису постигли, али постоји начин да се и са овим изађе на крај – уклоните само једно слово, на пример прво h из назива протокола, и прегледач ће исправно копирати URL. Овако то изгледа у последњој верзији Firefox-а:

ttps://www.rnids.rs/ћирилица-на-интернету/idn-енкодер

Битка траје, али то је битка коју смо већ добили.

 

Владимир Марић, Мрежни системи д.о.о.