Они всё понимают

Они всё понимают

В № 1 (446) газеты «За рубежом» за 1969 год была опубликована статья «Машина читает Гомера». В ней рассказывалось, как компьютер анализировал тексты античных поэм и какие выводы из этого получились.


Машина должна была помочь с разгадкой, кто же на самом деле создавал эти произведения: «В течение последних пятидесяти лет специалисты по древним греческим текстам утверждали, что «Гомер» в действительности – общее имя по крайней мере шести различных авторов».

 

Благодаря компьютерному анализу появилась возможность опровергнуть бытующее мнение: «На недавнем конгрессе Международной федерации по обработке научной информации, состоявшемся в Эдинбурге, доктор Мортон заявил, что анализ 250 тысяч слов Гомера, проведённый с помощью электронно-вычислительной машины, убеждает в идентичности стихотворца».

 

Доктор Мортон и профессор электронной техники при Эдинбургском университете Сидней Михалсон сравнили 300 слов из 15-й главы «Одиссеи» с другими отрывками этой же поэмы и «Илиады»: «Данные, полученные электронно-вычислительной машиной после анализа длины и структуры предложений, указывают на идентичность текста Гомера во всём произведении. Статистически было бы невозможно получить одни и те же результаты, если бы текст принадлежал разным авторам».

 

В статье отмечалось, что хоть Гомер и использовал в своих произведениях исторический и мифологический материал, он никогда не воспроизводил его дословно, а редактировал и обрабатывал, формируя свой собственный стиль. Для того чтобы доказать, что идентичность стиля не является результатом использования стихотворной формы текста, ученые подвергли анализу отрывки из произведений Эзиода и Арата. Размеры их строф и другие лингвистические характеристики оказались разными.

 

Проверить данные анализа можно было с помощью каталога с указанием строф и стилевых совпадений в произведениях Гомера: «Этот метод позволяет определить нетождественность текстов и стиля даже в отрывках, не превышающих по размеру 10 строк. Полный каталог четверти миллиона слов Гомера был составлен электронно-вычислительной машиной «Атлас» всего за 30 секунд. Для выполнения такой работы учёному-специалисту понадобилось бы больше года».

 

«Эволюция» навыков работы компьютеров с текстами продолжилась и дальше. Компьютерная лингвистика, зародившаяся в 1950-х годах, сегодня решает целый ряд прикладных задач. Одна из них – перевод текстов. Если сначала автоматические приложения в лучшем случае могли осилить лишь несколько слов, то сейчас получить вполне связный перевод нужного отрывка уже не является такой большой проблемой, как минимум, если речь идёт об английском и других распространённых языках. Технология перевода получила своё развитие в коллаборации с синтезом речи. Так, компания «Яндекс» пару лет назад запустила закадровый перевод видео. Посмотреть с русской озвучкой теперь можно любой англоязычный ролик.

 

До этого Google представила технологию синхронного перевода устной речи Translatotron. Программа слушает человеческую речь и переводит её на другой язык, минуя этап транскрибирования и машинного перевода и сохраняя при этом интонацию говорящего. В будущем подобный сервис станет еще одним шагом на пути к снятию языкового барьера.

 

Перевод, распознавание и синтез речи – это еще не все направления, по которым работает компьютерная лингвистика. Другая ее задача – автореферирование, то есть создание краткой аннотации, или реферата, документа. Сейчас эта технология используется в том числе и в интернете. В браузерах начала появляться функция краткого пересказа страницы, это должно сэкономить время пользователя: предоставить ему выжимку текста, например для ответа на конкретный вопрос или решения какой-то проблемы. Подобную опцию имеют также новостные агрегаторы, которые собирают информацию из разных источников, предлагая пользователю на выбор сразу несколько ресурсов, где можно прочитать полный текст.

 

Компьютерная лингвистика также облегчает жизнь людей с инвалидностью. Технологии помогают неговорящим преобразовывать текст в речь, а незрячие пользуются устройствами, которые читают вслух текстовую информацию.

 

Работа компьютера с устной и письменной речью – одно из самых перспективных направлений развития технологий. Появление генеративных нейросетей и других разработок на их основе только подтверждает, что взаимодействие человека с машиной становится всё теснее.


Сергей Меляхов

В иллюстрации использовано фото с сайта https://unsplash.com/ и изображение из архива редакции

24.11.2023
Важное

Определились команды, которые сыграют в ½ Лиги чемпионов.

17.04.2025 17:00:00

В сентябре в столице Бразилии состоится II Форум БРИКС «Традиционные ценности».

17.04.2025 09:00:00
Другие Ретроспективы

Заголовок: «Поющее пламя».
Номер и дата выпуска: № 16 (409) от 12-18 апреля 1968 года.
Источник: газета «За рубежом».

Источник: газета «За рубежом».
Номер и дата выпуска: 45 (230), 6 ноября 1964 г.

Еженедельное международное обозрение ЦТ СССР.
Эфир: 9 февраля 1979 г.
Источник: Главная редакция информации.

Автор: Уильям Гарнер
Источник: газета «За рубежом».
Номер и дата выпуска: № 39 (1576) 1990 г.