Разговорчивые компьютеры

Разговорчивые компьютеры

В № 35 (1000) газеты «За рубежом» за 1979 год была напечатана статья «ЭВМ учится слушать и говорить», в которой объяснялось, как компьютеры распознавали речь и сами синтезировали её.


«Созданные за последние годы устройства распознавания речи в виде раздельно произносимых слов в лабораторных условиях обеспечивают правильное распознавание 98-99 процентов слов из словаря, содержащего 100 слов, а в эксплуатационных условиях – 50 процентов слов и меньше», – так описывались успехи машин того периода.

На практике устройства голосового ввода могли заменить клавиатуру в ЭВМ и других автоматизированных системах, например при обучении операторов управления воздушным движением.

Более успешно специалисты учили компьютеры говорить с пользователем: «В области средств синтезирования речи достигнут гораздо больший прогресс, чем в области средств распознавания речи и особенно восприятия слитной речи, а не отдельно произносимых слов. Так, фирма «Курцвейл компьютер продактс» (Кембридж, штат Массачусетс) выпускает аппарат, имеющий оптическое устройство и синтезатор речи, предназначенный для чтения текстов для слепых. А компания «Белл лэбратриз» создала учрежденческую автоматическую справочную систему, в которой по телефону можно получить справку о номере телефона и местонахождении любого сотрудника в данный момент».

Компания «Интернэшнл бизнес мэшинз» разрабатывала средства распознавания речи для автоматизации процессов в канцелярской работе, например для чтения, редактирования и написания деловой корреспонденции. «В этих средствах используется статистический метод распознавания, косвенным образом связанный с принципами лингвистики. Так, если слово представляет собой определённую часть речи, например глагол, то существует вероятность того, что за ним будет следовать другая вполне определённая часть речи».

С тех пор технологии распознавания и синтеза речи успешно развивались и сегодня широко используются во многих сферах деятельности. А так называемые голосовые помощники (компьютерные сервисы распознавания речи, созданные на базе искусственного интеллекта) и вовсе стали частью нашей повседневности. С их помощью мы, не используя экраны мобильных гаджетов, можем открыть нужное приложение, позвонить конкретному человеку, вызвать такси, найти необходимую информацию в интернете или включить понравившийся фильм.

Одним из первых в эту технологию поверил основатель компании Apple Стив Джобс и в свое время вложился в разработку инженеров из Стэнфорда. Тогда и появилась знаменитая на весь мир голосовая помощница Siri. Долгое время она была доступна пользователям техники от Apple только в цифровом магазине, а затем компания приобрела Siri Inc. Так что теперь голосовой помощник встроен в большинство устройств, функционирующих на базе операционной системы iOS. При этом другие крупные фирмы тоже стали оснащать мобильную и бытовую технику аналогичными голосовыми помощниками.

В основе таких технологий лежат алгоритмы, которые обучают встроенный искусственный интеллект разным сценариям разговора с человеком и поиску наиболее подходящих вариантов ответа. Со временем нейросети научились не только распознавать речь, но и выполнять простые команды. Благодаря этому технология «умный дом» вышла на новый уровень. Впервые автоматизированную систему управления бытовыми приборами, освещением и отоплением в 1978 году презентовали специалисты компании Pico Electronics (Шотландия). В основу автоматики легла широкополосная проводная система, позволяющая одним нажатием кнопки (на дистанционном пульте) управлять освещением, открывать жалюзи, регулировать отопление и пр. Сегодня все это и даже больше (например, поставить чайник, запустить стирку, отдать команду роботу-пылесосу) можно делать с помощью голоса при наличии умной станции с голосовым помощником. Такие выпускает американская компания Amazon, китайская корпорация Xiaomi и некоторые российские фирмы.

Технологии распознавания и синтеза речи нередко используют и в образовании, например при изучении иностранных языков. Экспертами-лингвистами создано одно из самым популярных на сегодняшний день интернет-приложение Duolingo, позволяющее с нуля заговорить на английском, немецком, французском, испанском или португальском. Программа онлайн-обучения включает в себя аудирование (процесс понимания иностранной речи на слух) и проверку произношения пользователя.

Голосовых помощников активно внедряют и на предприятиях. Так, во многих банках и страховых компаниях специалистов кол-центров заменили так называемые чат-боты. Эти программы по голосу или по текстовому сообщению распознают проблему, с которой столкнулся клиент, отвечают на вопросы и предлагают свои варианты решения. В противном случае переводят звонок на живого оператора.

Что касается перспектив голосовых технологий, они по-настоящему впечатляют. Еще в 2018 году специалисты японской компании по производству станков Makino показали, как человек, используя только гарнитуру, может управлять сложнейшими станками: узнавать особенности производимой детали, корректировать их, запускать и останавливать процессы по команде. Не исключено, что такие технологии уже в ближайшее время придут на многие сложные производства и таким образом облегчат труд человека.

Ждут эксперты прорыва голосовых технологий и в медицине. Уже сейчас ведущие институты Америки адаптируют компьютерные технологии, способные распознавать мозговые импульсы людей, перенесших инсульт и лишившихся речи, и интерпретировать их в слова. Результаты обнадеживают, и задача ученых – заставить компьютер считывать сигналы мозга без проводов и вывести систему «мозг-компьютер» в массовое использование. Это не кажется утопией, ведь программисты и инженеры всего мира продолжают совершенствовать взаимодействие человека и машины.


В иллюстрации использовано фото с сайта https://unsplash.com/ и материалы из архива
20.10.2023
Важное

Картина Боттичелли «Мадонна с Младенцем на троне» продана на аукционе Sotheby's за 12,6 млн долларов.

13.12.2024 17:00:00

После реформ президента Хавьера Милея спрос на иностранную валюту в стране сильно ослаб.

13.12.2024 13:00:00

Норвежская компания Vipps стала первой в мире, кто предложил бесконтактную оплату покупок через iPhone без использования Apple Pay.

13.12.2024 09:00:00
Другие Ретроспективы

На фото: Максимилиан Факторович снимает мерки с головы и лица молодой женщины с помощью «калибратора крастоты».
США, Голливуд, 1933 год.
Фотограф: неизвестен
Источник: General Photographic Agency / Getty Images

Заголовок: «Генетические отпечатки»
Номер и дата выпуска: № 38 (1367) 12-18 сентября 1986 г.
Источник: газета «За рубежом».

Источник: газета «За рубежом».
Номер и дата выпуска: 1№ (654) 1-4 января 1973 г.

Источник: газета «За рубежом».

Номер и дата выпуска: 40 (225), 3 октября 1964 г.