Србија

Српски језик неспреман за дигиталну будућност

Симпатични јапански робот „асимо” ћаскао је недавно с Београђанима на енглеском. Ако желимо да му једног дана затражимо кафу на српском потребно је да му обезбедимо „уџбенике” из којих ће учити наш језик.

Да би осигурао себи опстанак у дигиталној будућности, неопходно је да језик има дигитализоване ресурсе. Према резултатима најновијег истраживања, српски је нажалост у групи оних који су у умреженом друштву информација и знања осуђени да нестану.

– Наш језик није припремљен за дигитално доба. Као што су поједини језици који нису имали писмо изумрли с последњим говорником, мислимо да језицима који немају добру подршку технологија прети дигитално изумирање, односно потиснуће их велики светски језици – каже професор математике Иван Обрадовић, који је са групом домаћих информатичара и лингвиста урадио анализу за српски језик у оквиру студије Технолошког савеза за вишејезичну Европу (МЕТА-НЕТ).

Језичке технологије већина људи редовно користи. На пример, за проверу граматичке исправности („спел чек” за енглески или РАС за српски). Ту спадају и интерактивне „секретарице” на смартфонима и системи аутоматског превођења попут популарног „Гугловог” преводиоца.

Језичке технологије, посебно машинско превођење, у највећој мери се ослањају на статистичке методе које захтевају невероватно велики број писаних и говорних фајлова, што је проблем за језике с малим бројем говорника. Често су непрецизне, што се види у неразумљивим машински преведеним упутствима за техничке производе, али и другде.

– Недавно сам добио писмо од жене која се представља као „промашај Селена”. Систем је механички превео енглеску реч „госпођица” као „промашај” јер се исто пише и изговара (miss). Дигитализовани језички ресурси побољшавају те преводе – објашњава Обрадовић, директор Информативног центра Београдског универзитета.

Дигитализација језичких ресурса је производња у дигиталном облику онога што смо навикли да срећемо у штампаном: речника, граматика, текстова, информација. Врло су важни паралелни корпуси на више језика, који су основа за машинско превођење.

У студији коју су за МЕТА-НЕТ урадили домаћи истраживачи, предвођени професором Душаном Витасом са Математичког факултета, српски је добио две јединице (за аутоматско превођење и граматичку проверу) и две двојке (за синтезу говора и расположивост језичких ресурса).

Исте оцене су добили бугарски, мађарски, румунски, грчки и језици земаља бивше СФР Југославије. Најбоље је оцењен енглески (четворком), а тројку су добили немачки, француски, холандски, италијански и шпански.

Холандски је, каже Обрадовић, добар пример да и мали језици могу да добију високо место на лествици. Иако нема велики број говорника, тамошња стручна јавност је препознала значај дигитализације.

Оно што енглески, француски и немачки имају, а српски (тренутно) нема јесте управо обимна језичка збирка у електронском облику.

Оливера Дурбаба, професор на катедри за германистику Филолошког факултета, каже да Немци овај посао раде веома темељно и развијају корпусне базе деценијама.

– Немачки и српски, у том смислу, не могу да се пореде, јер су немачки ресурси много обимнији и људи су обучени да направе спону између технологије и лингвистичке обраде. Код нас базе постоје, али су мале и неповезане.

Овај посао тражи ширу сарадњу лингвиста и информатичара и свих који се баве језиком и препознају значај информационих технологија за језик, наглашава професор Обрадовић.

Ако српски у неком будућем истраживању заради петицу, да ли то значи да ће зависност од енглеског бити мања?

– У Београду већ имамо неколико паметник кућа. Идеја је да сутра у управљању говорним језиком можемо да се обраћамо паметним уређајима на српском. Такође, уколико бисмо имали висок ниво подршке за машинско превођење, могли бисмо да користимо свој језик, а да га машина преводи. Не може се очекивати да ће рачунари савршено радити књижевне преводе, али у пословној комуникацији би то било сасвим могуће – закључује Обрадовић.

———————————————-

Интернет не доноси пропаст

У јавности се често води полемика о томе да ли ће начин комуникације на интернету нанети штету језику. Др Оливера Дурбаба, која је проучавала језик на „Фејсбуку” и форумима, верује да интернет неће довести до пропасти српског.

– Тај језик, без обзира што је писан, носи све особености говорног језика. Он се сада само измешта у други медиј, што нама истраживачима олакшава посао, јер постоји у писаној форми. Наравно да то није књижевни стандард, али од разговорног стила и не очекујемо да има књижевни стил. Проблем настаје онда када у писани говор неосновано убацујемо елементе разговорног стила: у саставима, семинарским радовима или у штампи.

 
 
Политика

Оцените текст

0 / 5

Your page rank:

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Back to top button
Close

Детектовали смо Адблокер!

Поштовани, рекламе су једини начин финансирања нашег сајта те вас молимо да угасите адблокер на нашем сајту како би нам тако помогли да наставимо да објављујемо још боље и квалитетније вести без цензуре и длаке на језику. Хвала на разумевању!