Они всё понимают

Они всё понимают

В № 1 (446) газеты «За рубежом» за 1969 год была опубликована статья «Машина читает Гомера». В ней рассказывалось, как компьютер анализировал тексты античных поэм и какие выводы из этого получились.


Машина должна была помочь с разгадкой, кто же на самом деле создавал эти произведения: «В течение последних пятидесяти лет специалисты по древним греческим текстам утверждали, что «Гомер» в действительности – общее имя по крайней мере шести различных авторов».

 

Благодаря компьютерному анализу появилась возможность опровергнуть бытующее мнение: «На недавнем конгрессе Международной федерации по обработке научной информации, состоявшемся в Эдинбурге, доктор Мортон заявил, что анализ 250 тысяч слов Гомера, проведённый с помощью электронно-вычислительной машины, убеждает в идентичности стихотворца».

 

Доктор Мортон и профессор электронной техники при Эдинбургском университете Сидней Михалсон сравнили 300 слов из 15-й главы «Одиссеи» с другими отрывками этой же поэмы и «Илиады»: «Данные, полученные электронно-вычислительной машиной после анализа длины и структуры предложений, указывают на идентичность текста Гомера во всём произведении. Статистически было бы невозможно получить одни и те же результаты, если бы текст принадлежал разным авторам».

 

В статье отмечалось, что хоть Гомер и использовал в своих произведениях исторический и мифологический материал, он никогда не воспроизводил его дословно, а редактировал и обрабатывал, формируя свой собственный стиль. Для того чтобы доказать, что идентичность стиля не является результатом использования стихотворной формы текста, ученые подвергли анализу отрывки из произведений Эзиода и Арата. Размеры их строф и другие лингвистические характеристики оказались разными.

 

Проверить данные анализа можно было с помощью каталога с указанием строф и стилевых совпадений в произведениях Гомера: «Этот метод позволяет определить нетождественность текстов и стиля даже в отрывках, не превышающих по размеру 10 строк. Полный каталог четверти миллиона слов Гомера был составлен электронно-вычислительной машиной «Атлас» всего за 30 секунд. Для выполнения такой работы учёному-специалисту понадобилось бы больше года».

 

«Эволюция» навыков работы компьютеров с текстами продолжилась и дальше. Компьютерная лингвистика, зародившаяся в 1950-х годах, сегодня решает целый ряд прикладных задач. Одна из них – перевод текстов. Если сначала автоматические приложения в лучшем случае могли осилить лишь несколько слов, то сейчас получить вполне связный перевод нужного отрывка уже не является такой большой проблемой, как минимум, если речь идёт об английском и других распространённых языках. Технология перевода получила своё развитие в коллаборации с синтезом речи. Так, компания «Яндекс» пару лет назад запустила закадровый перевод видео. Посмотреть с русской озвучкой теперь можно любой англоязычный ролик.

 

До этого Google представила технологию синхронного перевода устной речи Translatotron. Программа слушает человеческую речь и переводит её на другой язык, минуя этап транскрибирования и машинного перевода и сохраняя при этом интонацию говорящего. В будущем подобный сервис станет еще одним шагом на пути к снятию языкового барьера.

 

Перевод, распознавание и синтез речи – это еще не все направления, по которым работает компьютерная лингвистика. Другая ее задача – автореферирование, то есть создание краткой аннотации, или реферата, документа. Сейчас эта технология используется в том числе и в интернете. В браузерах начала появляться функция краткого пересказа страницы, это должно сэкономить время пользователя: предоставить ему выжимку текста, например для ответа на конкретный вопрос или решения какой-то проблемы. Подобную опцию имеют также новостные агрегаторы, которые собирают информацию из разных источников, предлагая пользователю на выбор сразу несколько ресурсов, где можно прочитать полный текст.

 

Компьютерная лингвистика также облегчает жизнь людей с инвалидностью. Технологии помогают неговорящим преобразовывать текст в речь, а незрячие пользуются устройствами, которые читают вслух текстовую информацию.

 

Работа компьютера с устной и письменной речью – одно из самых перспективных направлений развития технологий. Появление генеративных нейросетей и других разработок на их основе только подтверждает, что взаимодействие человека с машиной становится всё теснее.


Сергей Меляхов

В иллюстрации использовано фото с сайта https://unsplash.com/ и изображение из архива редакции

24.11.2023
Важное

Путь гения: Эрнест Долфи и революция джаза в нью-йоркских клубах 1960-х.

29.02.2024 09:00:00

ФРС - центральный банк США, созданный в 1913 году для обеспечения стабильности финансовой системы.

28.02.2024 19:00:00

Как изменилась культура маори из-за попыток ассимиляции европейцами и распространения «западного» образа жизни.

28.02.2024 17:00:00

Автопроизводители США требуют запретить ввоз китайских машин из Мексики.

28.02.2024 15:00:00
Другие Фото

На фото: Императрица Китая Вань Жун курит в компании своего супруга, императора Китая Айсиньгёро Пу И.
Китай, 1930 год.
Фотограф: неизвестен
Источник: getarchive.net

На фото: Мать с ребенком.
Япония, Токио, конец 19 века.
Фотограф: Матуши Накаджима
Источник: flickr.com

На фото: Народный комиссар обороны СССР К. Е. Ворошилов на Красной площади.
СССР, Москва, 1928 год.
Фотограф: Дмитрий Дебабов
Источник: Wikimedia Commons

На фото: Золотая пластинка с пояснениями для внеземной цивилизации.
США, 1977 год.
Фотограф: Не указан
Источник: Wikimedia Commons