You are here

ICANN generation panels: Doprinos stručnjaka RNIDS-a višejezičnosti interneta

27. 07. 2022.

Višejezičnost na internetu dugo nije samo san entuzijasta, već proces koji traje više od decenije. Taj proces je doneo plodove u vidu internacionalizovanih naziva domena kakav je naš .срб, ali i .rs nazivi domena koje je moguće registrovati koristeći proširen set karaktera iz latiničkih pisama jezika nacionalnih manjina koje žive u Srbiji. No, da bi svi svetski jezici i pripadajuća pisma na standardizovan i sistematičan način bili korišćeni u domenima najvišeg nivoa (TLDs), na inicijativu ICANN-a (Internet korporacija za dodeljene nazive i brojeve) od 2014. godine formirane su volonterske radne grupe (generation panels) čiji je zadatak bio da izrade tehničke i leksičke dokumente na osnovu kojih se kreiraju pravila za upotrebu određenog pisma za domene najvišeg nivoa. U ovom izuzetno važnom poslu i posvećenom i dugotrajnom radu dva takva panela učestvovali su stručnjaci iz Fondacije „Registar nacionalnog internet domena Srbije“ (RNIDS): Mirjana Tasić, savetnica u RNIDS-u i Dušan Stojičević, trenutno član Upravnog odbora RNIDS-a.

Gledajući iz ugla ICANN-a, da bi internet bio globalno dostupan korisnicima, nije dovoljno ispuniti tehničke preduslove za pristup mreži. Najveći deo svetske populacije ne koriti engleski alfabet (za čijih 26 znakova su doneti inicijalni standardi), a jedva trećina populacije koristi latiničko pismo. Zato i zajednica koju ICANN okuplja godinama aktivno radi na popularizaciji internacionalizovanih naziva domena (IDN) koji omogućavaju da se nazivi domena registruju upotrebom znakova iz lokalnih pisama (arapski, kineski, ćirilički i drugi znakovi). U martu je na javnu raspravu stavljena, a u maju i usvojena peta verzija Root Zone Label Generation Rules (RZ-LGR-5), a u pravila je integrisano 26 pisama koja se koriste u stotinama jezika širom sveta.

Mirjana i Dušan govorili su o svojim iskustvima i utiscima o rukovođenju međunarodnim radnim grupama, samom procesu i postignutim rezultatima.

Mirjana Tasić

Bez uputstva za upotrebu

„Da bismo na nivou ICANN-a imali pravila u otvaranju TLD-jeva (domena najvišeg nivoa) na pismima drugačijim od engleske latinice, formirano je dosta radnih grupa koje su imale zadatak da sveobuhvatno obrade jedno pismo i da produkuju pravila. Kasnije su se ta pravila u krovnoj radnoj grupi, u čijem sam radu takođe učestvovao, sublimirala i doneta su za sva pisma sveta, tako da otvaranje nekog TLD-ja ne naruši uređenost dosadašnjeg DNS sistema“, objašnjava Dušan Stojičević koji je predsedavao radom Ćiriličkog panela. Ovaj panel se bavio ćiriličkim pismom jezika sveta, uključujući srpsko, rusko, belorusko, ukrajinsko, mongolsko, bugarsko, severnomakedonsko ćiriličko pismo, kao i ćirilicu koja se koristi u državama kao što su Kazahstan, Uzbekistan itd.

Stojičević dalje objašnjava da su pravila prvenstveno nastojala da preduprede problem phishing-a (recimo, PC i PC naizgled su isti, ali jedno je ćirilica, a drugo je latinica – rs i pc). Međutim, ovaj tip dualizma samo je jedan u nizu primera sa kojima su se stručnjaci okupljeni u radnim grupama susreli. Mirjana Tasić preuzela je rukovođenje Latiničkim panelom 2016. godine. Panel je rad završio ove godine, a Mirjana primećuje da je radna grupa gotovo dve godine rešavala problem varijanti određenih znakova u latiničkom pismu za koje se smatra da predstavljaju isti glas (kakav je npr. ß u nemačkom jeziku).

„Naš zadatak je bio da kreiramo jedan dokument koji treba da reši većinu problema vezanih za upotrebu latiničkog pisma na internetu i da ustanovimo koji je to prihvatljiv skup latiničkih znakova za kreiranje domena najvišeg nivoa“, objašnjava Mirjana Tasić i konstatuje da je najveći izazov sa kojim su se radne grupe suočile rešavanje kompleksnog problema bez ikakvog pređašnjeg primera kako da se posao obavi.

Takav posao od 2014. godine obavljalo je 17 radnih grupa koje su „pokrile“ 26 svetskih pisama i okupile 270 volontera poput Mirjane i Dušana koji su radili više od deset hiljada sati da bi isporučili predloge za standardizaciju novih domena najvišeg nivoa.

Izazov po izazov

Prema rečima Mirjane Tasić, Latinički panel suočio se sa činjenicom da više od 1.200 svetskih jezika koristi latiničko pismo, dok je u živoj upotrebi svega njih 210. Zatim, brojni latinički znakovi se više ne koriste, čak i oni obuhvaćeni UNICODE standardom, pa je jedan od zadataka radne grupe bio da prepoznaju i „očiste“ znakove kojih nema u živim jezicima. Dakle, počevši sa 26 znakova koliko ih ima u engleskom alfabetu, radna grupa je prepoznala 210 „živih“ znakova latiničkog pisma prihvatljivih za kreiranje TLD-jeva.

Dok je rad u Latiničkom panelu bio opterećen obiljem informacija, rad u Ćiriličkom panelu povremeno su pratile političke debate. „Ma koliko stručni bili ljudi u panelu, i struka se ponekad izgubi u istorijskim debatama. Upravo je moja uloga bila da izlečim neosporne znalce od nacionalističkih ispada, i to sam uradio na najjednostavniji mogući način – prvi predloženi dokument nije sadržao tekstove već samo tabele i gole činjenice. Izbegnuta je bila bilo kakva istorija ćirilice kao pisma, ili istorija prostora koji ga upotrebljava, čime je ceo panel vraćen u osnovni zadatak – napraviti pravila“, komentariše Dušan Stojičević.

Dušan Stojičević

On dalje objašnjava da je bilo i mnogo različitih mišljenja u pristupima ovoj specifičnoj problematici – nivo bilo kakvih zabrana, što u suštini i jesu pravila koja su doneta, može biti dubok ili plitak. „Mi smo se odlučili da idemo na dubok nivo pravila, ne ostavljajući mnogo prostora za naknadna tumačenja. Očigledna sličnost ćirilice sa latinicom, ipak osnovnim pismom za domene, najviše je uticala da se ode u dubinu, pristupi restriktivno“ kaže Stojičević.

Hiljade sati i hiljade stranica

„Finalni izveštaj Latiničkog panela, usvojen nakon javne rasprave, sumiran je na 87 stranica. Međutim, bilo je osam verzija konačnog teksta, a imali smo više od 1.000 strana radnih dokumenata od kojih je u konačnu verziju uključeno oko 200 stranica u dodatke glavnom izveštaju. Rezultat rada je sumiran u xml dokumentu koji ima oko 11.300 redova. To obilje materijala je prezentovano, takođe, da bi se stekao uvid koliko je zapravo posla obavljeno“, kaže Mirjana Tasić. S obzirom na to da je rukovodila grupom, Mirjana je pripremala dnevni red sastanaka, zapisnike, sumirala zaključke, te organizovala sastanke. Održano je više od 130 onlajn sastanaka sa kolegama koje su učestvovale u radu panela. „U nekom momentu, ICANN nam je dodelio saradnike koji su pomagali, jer je obim posla prevazišao mogućnosti nas koji smo radili volonterski“, kaže Mirjana.

Isti izveštaj isporučio je Ćirilički panel, tehničko-leksički dokument na oko 100 strana, koji je prezentovan u više formi (uključujući xml sa striktnim pravilima), bez ikakvih političko-istorijskih priča koje su u početku opterećivale rad ovog panela.

„Iza kulisa se nalazi veliki i posvećen rad koji je završetak imao u Istanbulu, u ICANN habu, gde se okupila većina članova Ćiriličkog panela kako bi obavili poslednje poliranje dokumenta i pravila. U dva dana intenzivnog rada, prošli smo sve radne dokumente i sva slova ćirilice, upoređivali sa drugim pismima (jermenski, latinica, grčki alfabet...) i finalna pravila su objavljena. Interesantan je bio i rad na krovnom panelu, koji je sublimirao kompletna pravila za sva svetska pisma. U ovoj grupi nije bilo političkih trzavica, već dubokih rasprava i mnogih konkretnih zamerki na rad panela, jer je prvi zadatak bio da se proveri rad svih panela. Kako smo svi bili sa različitih meridijana (dakle, vremenskih zona) često su virtuelni sastanci bili organizovani usred noći, što iziskuje dodatni napor jer je tema izuzetno kompleksna“, sumirao je Dušan Stojičević.

Posao koji nikad nije završen

„Jedina konzervativna stvar na internetu jeste poštovanje standarda. Standardi se mogu dopunjavati sa protokom vremena i novim zahtevima, ali se ništa ne izbacuje, samo se dodaje“, kaže Mirjana Tasić i primećuje da je internet živa stvar, kao i svetski jezici i pisma.

Dušan Stojičević primećuje da nije prestao da bude predsedavajući Ćiriličkog panela jer se jezici i pisma non-stop menjaju. „Mi jesmo doneli pravila koja su implementirana i već ih moraju zadovoljiti novi TLD-jevi (recimo – nova runda za dodelu new gTLD-jeva se očekuje uskoro), ali se i ta pravila menjaju. Navešću dva primera – Crna Gora je u doba našeg rada donela odluku za dva nova slova u ćirilici, ali su ih sada ukinuli. Drugi primer je Kazahstan koji je zvanično prešao na latinicu, ali je kod njih i dalje u opticaju ruska ćirilica koju upotrebljavaju za svoj jezik (kazah) i imaju ćirilički TLD. Dakle, rad nije prestao, još uvek me kontaktiraju koordinatori iz ICANN, sada se samo prate dešavanja u svetu, poput navedenih, koja utiču na eventualnu promenu pravila.“

Ipak, donošenje pravila, njihovo stalno unapređenje i pokretanje novih gTLD-jeva nije dovoljno da internet zaista i suštinski postane višejezičan. Stojičević primećuje da je tek deset godina nakon prvih IDN-ova uspostavljena prava ravnoteža u pravilima između svih pisama na nivou domena najvišeg nivoa. Isto tako, ako se IDN posmatra kao projekat, uspešan je u sredinama koje koriste svoje pismo u svakom segmentu života poput Kine, Rusije, Japana i Indije. No, posmatran očima prosečnog korisnika IDN je nedovoljno pristupačan – tastature, operativni sistemi, sadržaj na datom jeziku, pismu su jedini lek, a domeni su samo šraf koji povezuje internet i multijezičnost. „Za potpuni uspeh IDN-a potrebno je korisnicima napraviti jednostavno i kompletno kompujtersko okruženje na maternjem pismu (jeziku)“, zaključuje Dušan Stojičević.