Дата публикации: 22 октября 2020 г. MIT: восстановить утерянные языки поможет машинное обучениеСистема, разработанная в MIT CSAIL, призвана помочь лингвистам расшифровать языки, которые были потеряны для истории. Недавние исследования показывают, что на большинстве языков, которые когда-либо существовали больше не говорят. Десятки этих мертвых языков также считаются утерянными или «нерасшифрованными», то есть мы недостаточно знаем об их грамматике, лексике или синтаксисе, чтобы действительно понимать тексты. Утраченные языки - это больше, чем просто академическое любопытство; без них мы упускаем всю совокупность знаний о людях, которые на них говорили. К сожалению, на большинстве из мертвых языков осталось очень мало записей, которые современный человек не понять. Исследователи из Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (MIT’s Computer Science and Artificial Intelligence Laboratory ,CSAIL) разработали новую систему, которая может автоматически расшифровывать утерянный язык, не требуя глубоких знаний о его связи с другими языками. Специалисты MIT показали, что их система может сама определять взаимосвязь между языками и использовали ее, чтобы подтвердить недавние исследования, предполагающие, что иберийский язык на самом деле не связан с баскским. Конечная цель команды состоит в том, чтобы система могла расшифровывать утерянные языки, которые ускользали от лингвистов на протяжении десятилетий, используя всего несколько тысяч слов. Возглавляемая профессором Массачусетского технологического института Региной Барзилай (Regina Barzilay), система основывается на нескольких принципах, базирующихся на выводах исторической лингвистики, таких как тот факт, что языки обычно развиваются только определенным предсказуемым образом. Предлагаемый алгоритм позволяет оценить близость между двумя языками; фактически, при тестировании на известных языках он может даже точно определять языковые семьи. Команда применила свой алгоритм к иберийскому языку с учетом баскского языка, а также к менее вероятным кандидатам из романских, германских, тюркских и уральских языковых семей. Хотя баскский и латынь были ближе к иберийскому, чем другие языки, они все же слишком разные, чтобы их можно было считать родственными. Подробнее здесь. Источник: news.mit.edu
Популярные издания ФГБНУ «Аналитический центр»
Издания 2019 года
Издания 2018 года
открыть полный список изданий Центра → Документ был изменён 11.11.2019 в 10:50. |
Поиск данных
об аттестации педагогических работников Издания Центра
|