Спеціалізована комп'ютерна програма допомагає вченим реконструювати давні мови
Уявіть собі все багатство знань, які можуть почерпнути люди, отримай вони можуть переміститися назад і відновити стародавні мови. На жаль, подорожі в часі зараз є лише науковою фантастикою, але от з древніми мовами справа йде трохи краще. Вчені з Каліфорнійського університету в Берклі та університету Британської Колумбії створили спеціалізоване програмне забезпечення, за допомогою якого комп'ютери можуть відновити деякі стародавні мови, використовуючи фрагменти протоязыков, які збереглися на сьогоднішній день у деяких сучасних мовах.
Протоязыки - це лінгвістичні "предки", від яких відбулися всі сучасні мови. До цих предкам відносяться Прото-Індо-Європейський (Proto-Indo-European), Прото-Афроазиатский (Proto-Afroasiatic) і Прото-Австронезийский (Proto-Austronesian) мови. Реконструкція мов, що входять у три вищевказані групи, є копітким і трудомістким заняттям, яке може зайняти кілька років роботи кваліфікованого вченого-лінгвіста.
Нове програмне забезпечення використовує правила сучасної лінгвістичної теорії і принципи статистичної обробки для відновлення давніх мов. В даний час робота програми зосереджена на 637 мовах і діалектах Австронезійської групи, а база цих мов містить близько 140 тисяч слів. Програмне забезпечення копіює роботу вченого-лінгвіста з точністю 85 відсотків, але робить це набагато і набагато швидше, ніж людина. З використанням нового програмного забезпечення величезна робота по реконструкції одного з стародавніх мов може бути виконана за кілька годин або днів часу.
В основі алгоритму комп'ютерної програми лежить лінгвістична теорія, яка описує розвиток і зміна мов з плином часу. Майже всі мови Австронезійської групи мають масу слів з загальними корінням, співзвуччями, словосполучення та інші відмінні риси, які якраз і є тими шуканими слідами вихідного протоязыка.
"Відмінною рисою нової системи є те, що в ній реалізовано безліч інноваційних ідей та досвіду, набутого вченими в спробах ручної реконструкції стародавніх мов. Але комп'ютерна програма без праці може оперувати великими даними, великими наборами слів і великою кількістю вихідних мов, але комп'ютерна обробка займає набагато менше часу, ніж ручний", - розповідає Ден Кляйн (Dan Klein), професор в галузі комп'ютерних наук і технологій з Каліфорнійського університету.
Крім реконструкції стародавніх мов і перекладу збережених стародавніх текстів, нове лінгвістичне програмне забезпечення може використовуватися для передбачення того, як сучасні мови зміняться в майбутньому протягом довгого періоду часу.