За кулисами ИИ

КТО И КАК ПОМОГАЕТ НЕЙРОСЕТЯМ ОБУЧАТЬСЯ И ЧТО С ЭТОЙ РАБОТОЙ НЕ ТАК

Можно подумать, что ИИ — это высокие зарплаты кодеров и красивые интерфейсы. На деле не все так гладко: за умными алгоритмами скрывается труд тысяч людей. Разбираемся в темной стороне автоматизации: кто и как помогает нейросетям обучаться и что с этой работой не так.


ДАТА-ДВОРНИКИ

У краудсорсинга много названий: микроработа, кликворкинг, клаудворкинг. Одни теоретики используют нейтральный термин «платформенный труд», а другие предпочитают более зловещий — «призрачная работа». Пожалуй, самое емкое название предложила социолог Лилли Ирани: краудсорсеры — это дата-дворники, или чистильщики данных.

аи_1200-2++++.jpg


В самом общем смысле краудсорсинг — это выполнение небольших заданий, которое происходит через интернет-платформы, например Amazon Mechanical Turk или Toloka (бывш. «Яндекс Толока»). Как правило, подрядчиками выступают разработчики ИИ: чтобы обучать алгоритмы, нужно огромное количество данных, обработанных живыми людьми. Поэтому они и «дворники»: зачастую их задача состоит в том, чтобы обеспечить ИИ «чистыми» данными.

Еще одно сходство с настоящими дворниками в том, что труд краудсорсеров неблагодарный и не очень-то статусный — за свою работу они не получат признания. Но без их труда не обойтись: кто-то должен чистить данные, как и улицы.


Без краудсорсеров невозможно было бы разработать современный ИИ. Дело в том, что нейросети — это воплощение коннекционистского подхода к разработке алгоритмов, когда ИИ самостоятельно ищет закономерности в данных — и чем больше данных, тем лучше. Но данные должны быть не абы какие — их нужно упаковать в упорядоченные датасеты. Грубо говоря, если ИИ должен научиться отличать собаку от кошки, ему нужно показать тысячи разных картинок с кошкой и тысячу — с собакой. Краудсорсеры этим и занимаются — соотносят кошек с кошками, а собак с собаками.

Задачи у краудсорсеров самые разные. Они, например, определяют, к какой категории относится то или иное изображение (есть указанный объект на нем или нет), это нужно для разработки компьютерного зрения. Или записывают своим голосом сотни небольших фраз, на которых потом обучают голосовых помощников. И даже обучают алгоритмы для беспилотных автомобилей. Для этого нужно смотреть короткие видео с видеорегистраторов, а затем оценивать, с какой вероятностью пешеход начнет переходить дорогу перед машиной.



«МАГИЯ» ТЕХНОЛОГИЙ


В 1770 году венгерский изобретатель Вольфганг фон Кемпелен создал «механического турка» — машину, способную играть в шахматы. Она состояла из большого деревянного ящика, шахматной доски, стоящей на нем, и фигуры мужчины, одетого в турецкий костюм — халат и тюрбан. Кемпелен служил при дворе австро-венгерской императрицы Марии Терезии и рассчитывал произвести на нее впечатление своим изобретением.

И у него получилось, причем под впечатлением была не только императрица, но и весь мир. Механический турок в самом деле мог играть в шахматы с живым человеком. Десятилетиями его показывали на выставках по всей Европе, а затем и в США, где он неизменно обыгрывал самых сильных соперников. С ним играли Наполеон Бонапарт и Бенджамин Франклин (и ни один не выиграл). Кто-то считал, что дело в колдовстве, кто-то — что таинственной машиной управляют демоны. Прав оказался знаменитый писатель Эдгар Аллан По, утверждавший, что турком управляет живой человек.

Один из самых известных автоматов в истории оказался фальсификацией. И окончательно ее развенчали только спустя 84 года после его создания: турок сгорел в пожаре и его последний владелец решил раскрыть карты. Инженерный гений Кемпелена заключался не в том, чтобы научить машину играть в шахматы, а в том, чтобы скрыть оператора внутри машины. Внутри автомата поочередно скрывались самые сильные шахматисты того времени.

В этой истории отражается противоречие, характерное для автоматизации труда в целом. По идее, машины должны избавить нас от труда, при этом у машинного труда есть и неудобная человеческая сторона. Машины не уничтожают труд, но меняют его конфигурацию — заставляют работников подстраиваться под себя, а не наоборот. Те, кто когда-то был ремесленником, после изобретения конвейера стали выполнять более специализированные задачи, а еще подстроились под машинный ритм и график работы. Их труд оказался скрыт за стенами фабрики, и мы ничего о них не узнаем, если только об этом не расскажут профсоюзы.

Краудсорсинговые платформы — это те же заводы, но уже цифровые. И сокрытие труда с его фрагментацией в них выведено на новый уровень. Дизайн платформ устроен так, что краудсорсеры никогда точно не знают, для кого они размечают данные. И общество тоже не узнает, кто из них внес вклад в разработку того или иного продукта. Медиа остается обсуждать только видимую часть ИИ: скажем, новые функции ChatGPT, обновления интерфейса или скандалы в руководстве OpenAI. Поэтому краудсорсинг и называют скрытой, невидимой или даже «призрачной» работой.

Самая первая краудсорсинговая платформа, Amazon Mechanical Turk, как раз названа в честь того самого механического турка. Идея сервиса принадлежит Джеффу Безосу, основателю Amazon.

Краудсорсинг он называет «искусственным искусственным интеллектом».

Мы используем компьютер, чтобы он выполнил за нас ту или иную интеллектуальную задачу, но здесь, по задумке предпринимателя, все наоборот. Есть задачи, которые люди должны сделать вместо компьютеров. И само название сервиса намекает: человеческий труд должен быть скрытым, как шахматист внутри шахматного автомата.


ИГРА ВМЕСТО РАБОТЫ

Труд краудсорсеров скрыт еще и потому, что создатели платформ не считают его полноценным трудом. Точнее, они преподносят труд как игру — способ играючи заработать деньги, выполняя простые задачи. На это указывает, например, наличие игровых элементов в интерфейсах краудсорсинговых платформ. На Mechanical Turk работники стремятся заполучить «квалификацию мастера», как если бы это было очередным достижением в ролевой игре. К тому же геймифицированные интерфейсы могут добавлять сами разработчики. Это и полосы прогресса, и таблицы лидеров, и значки для особо отличившихся работников.

Еще одна причина «невидимости» труда краудсорсеров в том, что его никто не регулирует. Он не локализован в каком-то определенном месте: работники разбросаны по всему миру. Как правило, он происходит вне публичных мест, как пишет социолог Мориц Альтенрид. Поэтому ни одно национальное трудовое законодательство на краудсорсеров не распространяется. Это значит, что для них нет ни минимального размера оплаты труда, ни нормированного рабочего дня. Им заплатят столько, сколько захочет работодатель, и работают они столько, сколько смогут.

У «невидимой» работы зачастую такая же «невидимая» зарплата. Далеко не везде ее выдают деньгами. Во многих странах Африки Amazon платит подарочными ваучерами, а некоторые платформы, как пишет социолог Фил Джонс, платят исключительно ваучерами и всевозможными купонами.

Наконец, внутри невидимой работы есть еще одна «невидимая» работапоиск новых задач. Каждый, кто составлял резюме и ходил на собеседование, знает, что это отдельный труд (и что за него никто не заплатит). Краудсорсерам, работающим фултайм, приходится проходить через эту процедуру каждый день — проверять сразу несколько платформ и ждать, когда для них появится что-то подходящее. В 2021 году социологи из США и Мексики подсчитали, что работники Amazon Mechanical Turk тратят на это треть своего рабочего времени.

Если платформы все-таки платят деньгами, то ставки, как правило, невелики. В 2023 году исследователи цифрового труда из оксфордского проекта FairWork составили статистику по 15 краудсорсинговым платформам (в выборке были работники из 51 страны). Они выяснили, что средняя почасовая оплата краудсорсера составляет $2,15, или $344 в месяц при 40-часовой рабочей неделе. Для развитых стран это маленькая сумма: в США минимальная почасовая оплата в три раза выше — $7,25. С другой стороны, для некоторых развивающихся стран это сравнительно неплохо. Это почти средняя зарплата в Индии ($380), или около половины средней зарплаты в Бразилии ($571).

Поэтому среди краудсорсеров много жителей Глобального Юга. По одним оценкам, половина работников платформ — из Индии, Пакистана и Бангладеш. Другие исследователи цифрового труда также заявляют, что выходцев из стран Глобального Юга среди краудсорсеров большинство. Исследования демографии конкретных платформ не всегда подтверждают такие обобщения: например, социологи из Университета Нью-Йорка утверждают, что больше всего работников Amazon Mechanical Turk находятся в США (75 %), а работники из Индии составляют лишь 16 %.

Тем не менее для работников из обеспеченных стран краудсорсинг — способ заработать денег сверх основной работы. А для жителей Глобального Юга это зачастую основное и единственное место работы, как отмечает Фил Джонс. При этом разработчики ИИ, которых краудсорсеры обеспечивают данными, сосредоточены в странах Глобального Севера.


ПУТЬ К ПРОЗРАЧНОСТИ


Главная сложность краудсорсинга даже не в том, что их работа плохо оплачивается, а в радикальной нестабильности этого вида труда. У краудсорсеров нет постоянной профессии: то, чем они занимаются, напрямую определяется запросами индустрии ИИ. Как и то, сколько они зарабатывают.

Например, в этому году краудсорсеры из Бразилии рассказали изданию Rest of World, что когда-то платформы позволяли зарабатывать неплохие деньги, но сейчас наступили тяжелые времена. Коэльо из города Фос-ду-Игуасу зарабатывала на уровне бразильского среднего класса и даже смогла купить себе машину. Но в последние годы ее доход снизился. А сообщество бразильских краудсорсеров стало более враждебным по отношению к новичкам: они опасаются, что приток рабочей силы еще сильнее обесценит их труд. Поэтому если раньше они помогали новеньким адаптироваться в специальных чатах, то теперь они, напротив, пускают в группы поддержки только «старожилов».

Индустрия ИИ развивается, и ей нужно все больше данных, поэтому краудсорсеры точно не останутся без работы. А в Бразилии даже надеются, что заработки снова вырастут. Но нестабильность краудсорсинга никуда не исчезнет, так же как и его монотонность. От этого не спасет и геймификация: на самом деле, это не развлечение, а инструмент постоянного цифрового надзора. А ощущение постоянного контроля со стороны платформы напрямую коррелирует с выгоранием, как недавно показали психологи из Китая и Кореи.

Положение краудсорсеров не улучшится до тех пор, пока их работа не станет видимой. Во-первых, видимой для законодательства: государства могли бы регулировать деятельность краудсорсинговых платформ, находящихся на их территории. И, например, сделать так, чтобы краудсорсерам платили по крайней мере не меньше минимальной зарплаты в их стране. Ответственность за это лежит и на разработчиках платформ: в идеале, как утверждает американский юрист Александр Фельстинер, они сами должны заботиться о том, чтобы трудовые права краудсорсеров соблюдались.

Во-вторых, нужно, чтобы в целом индустрия ИИ стала видимой, или скорее прозрачной. Как пишет социолог Лилли Ирани, и техногиганты, и небольшие ИИ-стартапы поддерживают иллюзию «магии» искусственного интеллекта: мол, технологии сами всему научатся, а разработчики их оптимизируют и упакуют в красивые интерфейсы. На самом деле, индустрия ИИ не заменяет труд. Его просто прячут внутри краудсорсинговых платформ и перемещают в более бедные страны.

Сами платформы должны предлагать работникам прозрачные условия, чтобы они знали, для кого они чистят данные. Чтобы, например, не оказалось, что беженцы из Сирии, сами того не зная, помогают тренировать алгоритмы машинного зрения для Вооруженных сил США. С другой стороны, разработчики ИИ должны быть честны в том, насколько много искусственному интеллекту нужно человеческих ресурсов. И нам пора перестать думать об искусственном интеллекте как о волшебной технологии, существующей независимо где-то в интернете. На самом деле он состоит из сложных трудовых и технологических инфраструктур. Говоря короче, за автоматизацией скрываются человеческие лица, как напоминала Ирани.


Иван Неткачев, Setters Media
Иллюстрация: использованы изображения Lucas Rathgeb, Olena Bohovyk и Jon Tyson

22.11.2024
Важное

Обезлесение серраду привело к тому, что климат в этом регионе стал мало подходящим для ведения сельского хозяйства.

14.12.2024 13:00:00

В российский прокат выходит фильм «Дева Мария: Мать Христа» о жизни Марии до того, как она стала Богородицей.

14.12.2024 09:00:00

Картина Боттичелли «Мадонна с Младенцем на троне» продана на аукционе Sotheby's за 12,6 млн долларов.

13.12.2024 17:00:00
Другие Статьи

В китайской провинции Хэйлунцзян в путь отправился первый туристический поезд, маршрут которого пролегает через популярные зимние объекты.

Британия планирует полностью отказаться от автомобилей с двигателями внутреннего сгорания к 2030 году, но путь будет непростым.

Продолжение книги «История русско-китайских отношений 1917-1949 гг.» российского историка, востоковеда и китаеведа Владимира Дацышена.

Легенды гранжа Alice In Chains и их знаменитый концертный альбом «MTV Unplugged».