Српски језик неспреман за дигиталну будућност

0
(0)

Симпатични јапански робот „асимо” ћаскао је недавно с Београђанима на енглеском. Ако желимо да му једног дана затражимо кафу на српском потребно је да му обезбедимо „уџбенике” из којих ће учити наш језик.

Да би осигурао себи опстанак у дигиталној будућности, неопходно је да језик има дигитализоване ресурсе. Према резултатима најновијег истраживања, српски је нажалост у групи оних који су у умреженом друштву информација и знања осуђени да нестану.

– Наш језик није припремљен за дигитално доба. Као што су поједини језици који нису имали писмо изумрли с последњим говорником, мислимо да језицима који немају добру подршку технологија прети дигитално изумирање, односно потиснуће их велики светски језици – каже професор математике Иван Обрадовић, који је са групом домаћих информатичара и лингвиста урадио анализу за српски језик у оквиру студије Технолошког савеза за вишејезичну Европу (МЕТА-НЕТ).

Језичке технологије већина људи редовно користи. На пример, за проверу граматичке исправности („спел чек” за енглески или РАС за српски). Ту спадају и интерактивне „секретарице” на смартфонима и системи аутоматског превођења попут популарног „Гугловог” преводиоца.

Језичке технологије, посебно машинско превођење, у највећој мери се ослањају на статистичке методе које захтевају невероватно велики број писаних и говорних фајлова, што је проблем за језике с малим бројем говорника. Често су непрецизне, што се види у неразумљивим машински преведеним упутствима за техничке производе, али и другде.

– Недавно сам добио писмо од жене која се представља као „промашај Селена”. Систем је механички превео енглеску реч „госпођица” као „промашај” јер се исто пише и изговара (miss). Дигитализовани језички ресурси побољшавају те преводе – објашњава Обрадовић, директор Информативног центра Београдског универзитета.

Дигитализација језичких ресурса је производња у дигиталном облику онога што смо навикли да срећемо у штампаном: речника, граматика, текстова, информација. Врло су важни паралелни корпуси на више језика, који су основа за машинско превођење.

У студији коју су за МЕТА-НЕТ урадили домаћи истраживачи, предвођени професором Душаном Витасом са Математичког факултета, српски је добио две јединице (за аутоматско превођење и граматичку проверу) и две двојке (за синтезу говора и расположивост језичких ресурса).

Исте оцене су добили бугарски, мађарски, румунски, грчки и језици земаља бивше СФР Југославије. Најбоље је оцењен енглески (четворком), а тројку су добили немачки, француски, холандски, италијански и шпански.

Холандски је, каже Обрадовић, добар пример да и мали језици могу да добију високо место на лествици. Иако нема велики број говорника, тамошња стручна јавност је препознала значај дигитализације.

Оно што енглески, француски и немачки имају, а српски (тренутно) нема јесте управо обимна језичка збирка у електронском облику.

Оливера Дурбаба, професор на катедри за германистику Филолошког факултета, каже да Немци овај посао раде веома темељно и развијају корпусне базе деценијама.

– Немачки и српски, у том смислу, не могу да се пореде, јер су немачки ресурси много обимнији и људи су обучени да направе спону између технологије и лингвистичке обраде. Код нас базе постоје, али су мале и неповезане.

Овај посао тражи ширу сарадњу лингвиста и информатичара и свих који се баве језиком и препознају значај информационих технологија за језик, наглашава професор Обрадовић.

Ако српски у неком будућем истраживању заради петицу, да ли то значи да ће зависност од енглеског бити мања?

– У Београду већ имамо неколико паметник кућа. Идеја је да сутра у управљању говорним језиком можемо да се обраћамо паметним уређајима на српском. Такође, уколико бисмо имали висок ниво подршке за машинско превођење, могли бисмо да користимо свој језик, а да га машина преводи. Не може се очекивати да ће рачунари савршено радити књижевне преводе, али у пословној комуникацији би то било сасвим могуће – закључује Обрадовић.

———————————————-

Интернет не доноси пропаст

У јавности се често води полемика о томе да ли ће начин комуникације на интернету нанети штету језику. Др Оливера Дурбаба, која је проучавала језик на „Фејсбуку” и форумима, верује да интернет неће довести до пропасти српског.

– Тај језик, без обзира што је писан, носи све особености говорног језика. Он се сада само измешта у други медиј, што нама истраживачима олакшава посао, јер постоји у писаној форми. Наравно да то није књижевни стандард, али од разговорног стила и не очекујемо да има књижевни стил. Проблем настаје онда када у писани говор неосновано убацујемо елементе разговорног стила: у саставима, семинарским радовима или у штампи.

 
 
Политика

Да ли је овај текст користан?

Кликните на звезду и оцените!

Ако вам је текст користан...

Поделите га са пријатељима!

Актуелно

Јурић: Регистрованим педофилима треба да буде откривен идентитет

5 (1) Оснивач Фондације „Тијана Јурић“ Игор Јурић заложио се данас да педофилима и предаторима …

Фалсификовани напредњаци уводе и цензуру „нeпримерних садржаја“ на Интернету!

2.5 (2) Министар за рад, запошљавање, борачка и социјална питања Зоран Ђорђевић изјавио је данас …

Оставите одговор

Ваша адреса е-поште неће бити објављена. Неопходна поља су означена *

Send this to a friend