You are here

ICANN generation panels: Допринос стручњака РНИДС-а вишејезичности интернета

27. 07. 2022.

Вишејезичност на интернету дуго није само сан ентузијаста, већ процес који траје више од деценије. Тај процес је донео плодове у виду интернационализованих назива домена какав је наш .срб, али и .rs називи домена које је могуће регистровати користећи проширен сет карактера из латиничких писама језика националних мањина које живе у Србији. Но, да би сви светски језици и припадајућа писма на стандардизован и систематичан начин били коришћени у доменима највишег нивоа (TLDs), на иницијативу ICANN-а (Интернет корпорација за додељене називе и бројеве) од 2014. године формиране су волонтерске радне групе (generation panels) чији је задатак био да израде техничке и лексичке документе на основу којих се креирају правила за употребу одређеног писма за домене највишег нивоа. У овом изузетно важном послу и посвећеном и дуготрајном раду два таква панела учествовали су стручњаци из Фондације „Регистар националног интернет домена Србије“ (РНИДС): Мирјана Тасић, саветница у РНИДС-у и Душан Стојичевић, тренутно члан Управног одбора РНИДС-а.

Гледајући из угла ICANN-а, да би интернет био глобално доступан корисницима, није довољно испунити техничке предуслове за приступ мрежи. Највећи део светске популације не корити енглески алфабет (за чијих 26 знакова су донети иницијални стандарди), а једва трећина популације користи латиничко писмо. Зато и заједница коју ICANN окупља годинама активно ради на популаризацији интернационализованих назива домена (IDN) који омогућавају да се називи домена региструју употребом знакова из локалних писама (арапски, кинески, ћирилички и други знакови). У марту је на јавну расправу стављенa, а у мају и усвојена пета верзија Root Zone Label Generation Rules (RZ-LGR-5), а у правила је интегрисано 26 писама која се користе у стотинама језика широм света.

Мирјана и Душан говорили су о својим искуствима и утисцима о руковођењу међународним радним групама, самом процесу и постигнутим резултатима.

Мирјана Тасић

Без упутства за употребу

„Да бисмо на нивоу ICANN-a имали правила у отварању TLD-јева (домена највишег нивоа) на писмима другачијим од енглеске латинице, формирано је доста радних група које су имале задатак да свеобухватно обраде једно писмо и да продукују правила. Касније су се та правила у кровној радној групи, у чијем сам раду такође учествовао, сублимирала и донета су за сва писма света, тако да отварање неког TLD-ја не наруши уређеност досадашњег DNS система“, објашњава Душан Стојичевић који је председавао радом Ћириличког панела. Овај панел се бавио ћириличким писмом језика света, укључујући српско, руско, белоруско, украјинско, монголско, бугарско, северномакедонско ћириличко писмо, као и ћирилицу која се користи у државама као што су Казахстан, Узбекистан итд.

Стојичевић даље објашњава да су правила првенствено настојала да предупреде проблем phishing-а (рецимо, PC и PC наизглед су исти, али једно је ћирилица, а друго је латиница – rs и пц). Међутим, овај тип дуализма само је један у низу примера са којима су се стручњаци окупљени у радним групама сусрели. Мирјана Тасић преузела је руковођење Латиничким панелом 2016. године. Панел је рад завршио ове године, а Мирјана примећује да је радна група готово две године решавала проблем варијанти одређених знакова у латиничком писму за које се сматра да представљају исти глас (какав је нпр. ß у немачком језику).

„Наш задатак је био да креирамо један документ који треба да реши већину проблема везаних за употребу латиничког писма на интернету и да установимо који је то прихватљив скуп латиничких знакова за креирање домена највишег нивоа“, објашњава Мирјана Тасић и констатује да је највећи изазов са којим су се радне групе суочиле решавање комплексног проблема без икаквог пређашњег примера како да се посао обави.

Такав посао од 2014. године обављало је 17 радних група које су „покриле“ 26 светских писама и окупиле 270 волонтера попут Мирјане и Душана који су радили више од десет хиљада сати да би испоручили предлоге за стандардизацију нових домена највишег нивоа.

Изазов по изазов

Према речима Мирјане Тасић, Латинички панел суочио се са чињеницом да више од 1.200 светских језика користи латиничко писмо, док је у живој употреби свега њих 210. Затим, бројни латинички знакови се више не користе, чак и они обухваћени UNICODE стандардом, па је један од задатака радне групе био да препознају и „очисте“ знакове којих нема у живим језицима. Дакле, почевши са 26 знакова колико их има у енглеском алфабету, радна група је препознала 210 „живих“ знакова латиничког писма прихватљивих за креирање TLD-јева.

Док је рад у Латиничком панелу био оптерећен обиљем информација, рад у Ћириличком панелу повремено су пратиле политичке дебате. „Ма колико стручни били људи у панелу, и струка се понекад изгуби у историјским дебатама. Управо је моја улога била да излечим неоспорне зналце од националистичких испада, и то сам урадио на најједноставнији могући начин – први предложени документ није садржао текстове већ само табеле и голе чињенице. Избегнута је била било каква историја ћирилице као писма, или историја простора који га употребљава, чиме је цео панел враћен у основни задатак – направити правила“, коментарише Душан Стојичевић.

Душан Стојичевић

Он даље објашњава да је било и много различитих мишљења у приступима овој специфичној проблематици – ниво било каквих забрана, што у суштини и јесу правила која су донета, може бити дубок или плитак. „Ми смо се одлучили да идемо на дубок ниво правила, не остављајући много простора за накнадна тумачења. Очигледна сличност ћирилице са латиницом, ипак основним писмом за домене, највише је утицала да се оде у дубину, приступи рестриктивно“ каже Стојичевић.

Хиљаде сати и хиљаде страница

„Финални извештај Латиничког панела, усвојен након јавне расправе, сумиран је на 87 страница. Међутим, било је осам верзија коначног текста, а имали смо више од 1.000 страна радних докумената од којих је у коначну верзију укључено око 200 страница у додатке главном извештају. Резултат рада је сумиран у xml документу који има око 11.300 редова. То обиље материјала је презентовано, такође, да би се стекао увид колико је заправо посла обављено“, каже Мирјана Тасић. С обзиром на то да је руководила групом, Мирјана је припремала дневни ред састанака, записнике, сумирала закључке, те организовала састанке. Одржано је више од 130 онлајн састанака са колегама које су учествовале у раду панела. „У неком моменту, ICANN нам је доделио сараднике који су помагали, јер је обим посла превазишао могућности нас који смо радили волонтерски“, каже Мирјана.

Исти извештај испоручио је Ћирилички панел, техничко-лексички документ на око 100 страна, који је презентован у више форми (укључујући xml са стриктним правилима), без икаквих политичко-историјских прича које су у почетку оптерећивале рад овог панела.

„Иза кулиса се налази велики и посвећен рад који је завршетак имао у Истанбулу, у ICANN хабу, где се окупила већина чланова Ћириличког панела како би обавили последње полирање документа и правила. У два дана интензивног рада, прошли смо све радне документе и сва слова ћирилице, упоређивали са другим писмима (јерменски, латиница, грчки алфабет...) и финална правила су објављена. Интересантан је био и рад на кровном панелу, који је сублимирао комплетна правила за сва светска писма. У овој групи није било политичких трзавица, већ дубоких расправа и многих конкретних замерки на рад панела, јер је први задатак био да се провери рад свих панела. Како смо сви били са различитих меридијана (дакле, временских зона) често су виртуелни састанци били организовани усред ноћи, што изискује додатни напор јер је тема изузетно комплексна“, сумирао је Душан Стојичевић.

Посао који никад није завршен

„Једина конзервативна ствар на интернету јесте поштовање стандарда. Стандарди се могу допуњавати са протоком времена и новим захтевима, али се ништа не избацује, само се додаје“, каже Мирјана Тасић и примећује да је интернет жива ствар, као и светски језици и писма.

Душан Стојичевић примећује да није престао да буде председавајући Ћириличког панела јер се језици и писма нон-стоп мењају. „Ми јесмо донели правила која су имплементирана и већ их морају задовољити нови TLD-јеви (рецимо – нова рунда за доделу new gTLD-jева се очекује ускоро), али се и та правила мењају. Навешћу два примера – Црна Гора је у доба нашег рада донела одлуку за два нова слова у ћирилици, али су их сада укинули. Други пример је Казахстан који је званично прешао на латиницу, али је код њих и даље у оптицају руска ћирилица коју употребљавају за свој језик (казах) и имају ћирилички TLD. Дакле, рад није престао, још увек ме контактирају координатори из ICANN, сада се само прате дешавања у свету, попут наведених, која утичу на евентуалну промену правила.“

Ипак, доношење правила, њихово стално унапређење и покретање нових gTLD-јева није довољно да интернет заиста и суштински постане вишејезичан. Стојичевић примећује да је тек десет година након првих IDN-ова успостављена права равнотежа у правилима између свих писама на нивоу домена највишег нивоа. Исто тако, ако се IDN посматра као пројекат, успешан је у срединама које користе своје писмо у сваком сегменту живота попут Кине, Русије, Јапана и Индије. Но, посматран очима просечног корисника IDN је недовољно приступачан – тастатуре, оперативни системи, садржај на датом језику, писму су једини лек, а домени су само шраф који повезује интернет и мултијезичност. „За потпуни успех IDN-а потребно је корисницима направити једноставно и комплетно компујтерско окружење на матерњем писму (језику)“, закључује Душан Стојичевић.