Искусственный интеллект раскроет тайну древних языков

Новое в СХД

В ходе мировой истории человечество создало тысячи разнообразных языков. Многие из них были утрачены или забыты еще в древности. Поэтому нередко археологам попадаются надписи, которые не удается дешифровать. До сих пор это остается проблемой, к решению которой исследователи начали привлекать искусственный интеллект.


MIT и Google Brain взялись за дешифровку

Со времени изобретения письма, которое произошло, по разным версиям 5-6 тыс. лет назад, люди придумали множество систем, которые позволяют превращать фонетические звуки языков в визуальные символы. Однако большинство древних языков сегодня являются мертвыми, и ученым приходится прикладывать немалые усилия для их дешифровки. Иногда это удается, как в случае с египетскими символами, надписями майя, древнекитайской письменностью. Но, существенная часть древних языков – ольмекский, прото-эламский, кипро-минойский, харрапский (письменность долины Инда) и множество других, все еще хранят свои тайны, к раскрытию которых пока не удалось подойти даже в общих чертах. Поэтому для решения столь сложной задачи, ученые решили привлечь искусственный интеллект. В этом направлении развивается несколько академических проектов, но самый новый из них был инициирован исследователями одной из лабораторий Массачусетского технологического института (MIT) и сотрудниками проекта Google Brain, работающими над созданием искусственного интеллекта.

Результатом совместных усилий стала разработка алгоритма, который способен сопоставлять однокоренные слова неизвестных языков с понятиями, которые уже известны благодаря дешифровке из родственных языков. Алгоритм опубликован на ресурсе arXiv, но еще далек от совершенства и позволяет решить лишь очень ограниченный круг задач. Но, перспективы у данного метода, по мнению ученых, есть. «На данный момент в мире используется до 7 тыс. языков, а количество исчезнувших языков насчитывает десятки тысяч, – говорит Татьяна Бочарникова, глава представительства NetApp в России и странах СНГ. – Дешифровка такого объема требует значительных мощностей для хранения и управления огромными массивами данных. Однако основную работу по дешифровке все равно придется делать людям, которым предстоит искать взаимосвязи между родственными языками».

Египетское иероглифическое письмо

Эффект будет от универсальной системы дешифровки

Эффективность алгоритма проверили в частности на примере критского линейного письма Б, частично дешифрованного в 50-е годы прошлого века, и угаритского языка. Результат показал рост эффективности процесса на 5% по сравнению с ранее используемыми методами. В то же время, исследователи подчеркивают, что для эффективной дешифровки неизвестных языков все равно необходимы те или иные опорные системы, например, родственные языки, правила и семантические значения символов, которые уже разгаданы. Без этого с вопросом дешифровки не справится даже искусственный интеллект, поскольку предложенный алгоритм работает по принципу поиска и сравнения однокоренных слов.

Вместе с тем, исследователи воодушевлены полученным результатом и заявили о намерениях продолжать изыскания, а также разрабатывать другие более совершенные алгоритмы дешифровки. Идеальным вариантом, по мнению ученых является создание некой универсальной системы, которая бы позволила применять ее ко многим языкам, а не к строго определенным, как это происходит сейчас.