Можно подумать, что ИИ — это высокие зарплаты кодеров и красивые интерфейсы. На деле не все так гладко: за умными алгоритмами скрывается труд тысяч людей. Разбираемся в темной стороне автоматизации: кто и как помогает нейросетям обучаться и что с этой работой не так.
В самом общем смысле краудсорсинг — это выполнение небольших заданий, которое происходит через интернет-платформы, например Amazon Mechanical Turk или Toloka (бывш. «Яндекс Толока»). Как правило, подрядчиками выступают разработчики ИИ: чтобы обучать алгоритмы, нужно огромное количество данных, обработанных живыми людьми. Поэтому они и «дворники»: зачастую их задача состоит в том, чтобы обеспечить ИИ «чистыми» данными.
Без краудсорсеров невозможно было бы разработать современный ИИ. Дело в том, что нейросети — это воплощение коннекционистского подхода к разработке алгоритмов, когда ИИ самостоятельно ищет закономерности в данных — и чем больше данных, тем лучше. Но данные должны быть не абы какие — их нужно упаковать в упорядоченные датасеты. Грубо говоря, если ИИ должен научиться отличать собаку от кошки, ему нужно показать тысячи разных картинок с кошкой и тысячу — с собакой. Краудсорсеры этим и занимаются — соотносят кошек с кошками, а собак с собаками.
Задачи у краудсорсеров самые разные. Они, например, определяют, к какой категории относится то или иное изображение (есть указанный объект на нем или нет), это нужно для разработки компьютерного зрения. Или записывают своим голосом сотни небольших фраз, на которых потом обучают голосовых помощников. И даже обучают алгоритмы для беспилотных автомобилей. Для этого нужно смотреть короткие видео с видеорегистраторов, а затем оценивать, с какой вероятностью пешеход начнет переходить дорогу перед машиной.
В 1770 году венгерский изобретатель Вольфганг фон Кемпелен создал «механического турка» — машину, способную играть в шахматы. Она состояла из большого деревянного ящика, шахматной доски, стоящей на нем, и фигуры мужчины, одетого в турецкий костюм — халат и тюрбан. Кемпелен служил при дворе австро-венгерской императрицы Марии Терезии и рассчитывал произвести на нее впечатление своим изобретением.
И у него получилось, причем под впечатлением была не только императрица, но и весь мир. Механический турок в самом деле мог играть в шахматы с живым человеком. Десятилетиями его показывали на выставках по всей Европе, а затем и в США, где он неизменно обыгрывал самых сильных соперников. С ним играли Наполеон Бонапарт и Бенджамин Франклин (и ни один не выиграл). Кто-то считал, что дело в колдовстве, кто-то — что таинственной машиной управляют демоны. Прав оказался знаменитый писатель Эдгар Аллан По, утверждавший, что турком управляет живой человек.
В этой истории отражается противоречие, характерное для автоматизации труда в целом. По идее, машины должны избавить нас от труда, при этом у машинного труда есть и неудобная человеческая сторона. Машины не уничтожают труд, но меняют его конфигурацию — заставляют работников подстраиваться под себя, а не наоборот. Те, кто когда-то был ремесленником, после изобретения конвейера стали выполнять более специализированные задачи, а еще подстроились под машинный ритм и график работы. Их труд оказался скрыт за стенами фабрики, и мы ничего о них не узнаем, если только об этом не расскажут профсоюзы.
Краудсорсинговые платформы — это те же заводы, но уже цифровые. И сокрытие труда с его фрагментацией в них выведено на новый уровень. Дизайн платформ устроен так, что краудсорсеры никогда точно не знают, для кого они размечают данные. И общество тоже не узнает, кто из них внес вклад в разработку того или иного продукта. Медиа остается обсуждать только видимую часть ИИ: скажем, новые функции ChatGPT, обновления интерфейса или скандалы в руководстве OpenAI. Поэтому краудсорсинг и называют скрытой, невидимой или даже «призрачной» работой.
Самая первая краудсорсинговая платформа, Amazon Mechanical Turk, как раз названа в честь того самого механического турка. Идея сервиса принадлежит Джеффу Безосу, основателю Amazon.
Краудсорсинг он называет «искусственным искусственным интеллектом».Мы используем компьютер, чтобы он выполнил за нас ту или иную интеллектуальную задачу, но здесь, по задумке предпринимателя, все наоборот. Есть задачи, которые люди должны сделать вместо компьютеров. И само название сервиса намекает: человеческий труд должен быть скрытым, как шахматист внутри шахматного автомата.
ИГРА ВМЕСТО РАБОТЫ
Труд краудсорсеров скрыт еще и потому, что создатели платформ не считают его полноценным трудом. Точнее, они преподносят труд как игру — способ играючи заработать деньги, выполняя простые задачи. На это указывает, например, наличие игровых элементов в интерфейсах краудсорсинговых платформ. На Mechanical Turk работники стремятся заполучить «квалификацию мастера», как если бы это было очередным достижением в ролевой игре. К тому же геймифицированные интерфейсы могут добавлять сами разработчики. Это и полосы прогресса, и таблицы лидеров, и значки для особо отличившихся работников.
Еще одна причина «невидимости» труда краудсорсеров в том, что его никто не регулирует. Он не локализован в каком-то определенном месте: работники разбросаны по всему миру. Как правило, он происходит вне публичных мест, как пишет социолог Мориц Альтенрид. Поэтому ни одно национальное трудовое законодательство на краудсорсеров не распространяется. Это значит, что для них нет ни минимального размера оплаты труда, ни нормированного рабочего дня. Им заплатят столько, сколько захочет работодатель, и работают они столько, сколько смогут.
Поэтому среди краудсорсеров много жителей Глобального Юга. По одним оценкам, половина работников платформ — из Индии, Пакистана и Бангладеш. Другие исследователи цифрового труда также заявляют, что выходцев из стран Глобального Юга среди краудсорсеров большинство. Исследования демографии конкретных платформ не всегда подтверждают такие обобщения: например, социологи из Университета Нью-Йорка утверждают, что больше всего работников Amazon Mechanical Turk находятся в США (75 %), а работники из Индии составляют лишь 16 %.
Тем не менее для работников из обеспеченных стран краудсорсинг — способ заработать денег сверх основной работы. А для жителей Глобального Юга это зачастую основное и единственное место работы, как отмечает Фил Джонс. При этом разработчики ИИ, которых краудсорсеры обеспечивают данными, сосредоточены в странах Глобального Севера.
Главная сложность краудсорсинга даже не в том, что их работа плохо оплачивается, а в радикальной нестабильности этого вида труда. У краудсорсеров нет постоянной профессии: то, чем они занимаются, напрямую определяется запросами индустрии ИИ. Как и то, сколько они зарабатывают.
Например, в этому году краудсорсеры из Бразилии рассказали изданию Rest of World, что когда-то платформы позволяли зарабатывать неплохие деньги, но сейчас наступили тяжелые времена. Коэльо из города Фос-ду-Игуасу зарабатывала на уровне бразильского среднего класса и даже смогла купить себе машину. Но в последние годы ее доход снизился. А сообщество бразильских краудсорсеров стало более враждебным по отношению к новичкам: они опасаются, что приток рабочей силы еще сильнее обесценит их труд. Поэтому если раньше они помогали новеньким адаптироваться в специальных чатах, то теперь они, напротив, пускают в группы поддержки только «старожилов».
Положение краудсорсеров не улучшится до тех пор, пока их работа не станет видимой. Во-первых, видимой для законодательства: государства могли бы регулировать деятельность краудсорсинговых платформ, находящихся на их территории. И, например, сделать так, чтобы краудсорсерам платили по крайней мере не меньше минимальной зарплаты в их стране. Ответственность за это лежит и на разработчиках платформ: в идеале, как утверждает американский юрист Александр Фельстинер, они сами должны заботиться о том, чтобы трудовые права краудсорсеров соблюдались.
Во-вторых, нужно, чтобы в целом индустрия ИИ стала видимой, или скорее прозрачной. Как пишет социолог Лилли Ирани, и техногиганты, и небольшие ИИ-стартапы поддерживают иллюзию «магии» искусственного интеллекта: мол, технологии сами всему научатся, а разработчики их оптимизируют и упакуют в красивые интерфейсы. На самом деле, индустрия ИИ не заменяет труд. Его просто прячут внутри краудсорсинговых платформ и перемещают в более бедные страны.
Сами платформы должны предлагать работникам прозрачные условия, чтобы они знали, для кого они чистят данные. Чтобы, например, не оказалось, что беженцы из Сирии, сами того не зная, помогают тренировать алгоритмы машинного зрения для Вооруженных сил США. С другой стороны, разработчики ИИ должны быть честны в том, насколько много искусственному интеллекту нужно человеческих ресурсов. И нам пора перестать думать об искусственном интеллекте как о волшебной технологии, существующей независимо где-то в интернете. На самом деле он состоит из сложных трудовых и технологических инфраструктур. Говоря короче, за автоматизацией скрываются человеческие лица, как напоминала Ирани.
Обезлесение серраду привело к тому, что климат в этом регионе стал мало подходящим для ведения сельского хозяйства.
В российский прокат выходит фильм «Дева Мария: Мать Христа» о жизни Марии до того, как она стала Богородицей.
Картина Боттичелли «Мадонна с Младенцем на троне» продана на аукционе Sotheby's за 12,6 млн долларов.
В китайской провинции Хэйлунцзян в путь отправился первый туристический поезд, маршрут которого пролегает через популярные зимние объекты.
Британия планирует полностью отказаться от автомобилей с двигателями внутреннего сгорания к 2030 году, но путь будет непростым.
Продолжение книги «История русско-китайских отношений 1917-1949 гг.» российского историка, востоковеда и китаеведа Владимира Дацышена.
Легенды гранжа Alice In Chains и их знаменитый концертный альбом «MTV Unplugged».