Читать книгу: «Искусственный интеллект. Путь к новому миру», страница 3
История за фото:
Это может быть момент из их отдыха на морском побережье. Возможно, это романтическая прогулка вдоль пляжа, когда они решили остановиться, чтобы запечатлеть счастливый момент. Пара, вероятно, связана общей страстью к тому, чем занимается мужчина (судя по футболке, может быть, связано с ZEROCODER), что делает их не только партнерами в жизни, но и союзниками в работе или увлечениях. Это мгновение олицетворяет гармонию и радость, которые они испытывают друг с другом.
Гонка вооружений
Появление столь мощного и вирального продукта, как ChatGPT‑3.5 и GPT‑4, запустило «гонку вооружений» в сфере технологий. Например, в 2023 году Google вывел на рынок сервис Bard. В его основе лежит усовершенствованная языковая модель PaLM 2. Изначально разработка «владела» только английским языком, но впоследствии стала полиглотом – сейчас способна работать на русском, японском, китайском и других языках. По функционалу сравнима с ChatGPT, но ее запуск не был столь успешным – на одной из публичных демонстраций система выдала неверную информацию.
Свою модель запустил и другой технологический гигант – Microsoft. Впрочем, его разработка, Bing AI, работает на базе технологий OpenAI, так как последняя предлагает открытое для коммерческого использования решение. К тому же Microsoft – один из ее инвесторов. Еще одну систему запустили бывшие сотрудники OpenAI – брат и сестра Даниэла и Дарио Амодеи. Последний занимал пост вице-президента OpenAI по исследованиям. В 2021 году, еще до того, как американская компания выпустила свой знаменитый продукт, они ушли и основали стартап Anthropic, а спустя два года выпустили чат-бота под названием Claude. Они наравне с бывшими руководителями в 2023 году подняли крупнейшие инвестиционные раунды в своем сегменте. Amazon в ноябре 2023 года объявил о запуске своего бизнес-чат-бота под названием Q. Чат-бот основан на 17-летнем опыте работы с веб-сервисами Amazon и предназначен для помощи сотрудникам в таких вопросах, как оптимизация задач и коммуникаций, создание сообщений в блогах, обобщение контента, а также написание и анализ кода.
В «забеге» участвуют не только американские компании. Китайский технологический гигант Baidu в 2023 году запустил бота Ernie Bot. Как и его главному конкуренту ChatGPT, пользователи могут задавать ему любые вопросы. Он поможет подготовить анализ рынка, предложит маркетинговые слоганы, обобщит документы и многое другое. Не отстают и российские разработчики: это во многом продиктовано потребностями аудитории. Например, многие отечественные компании (а также специалисты) опасаются за конфиденциальность данных при работе с зарубежными сервисами. На момент написания книги официально использовать американский ChatGPT в России нельзя. Для регистрации в сервисе потребуется иностранный номер телефона, но не у каждого он есть, а получить его трудоемко. Когда я осознал эту проблему, то решил создать своеобразную «прослойку» и запустил на основе СhatGPT чат-бота в Телеграме – Нейрокота. Помимо ChatGPT, он использует Whisper – нейронную сеть, которая преобразовывает речь из аудио в текст (также создана разработчиками OpenAI). Благодаря Whisper Нейрокот воспринимает и расшифровывает голосовые сообщения. То есть ему можно надиктовать текст, и он его расшифрует. Сначала мы разработали бота с помощью зерокодинга (позволяет создавать продукты с помощью готовых шаблонов, инструментов моделирования и графического интерфейса без написания кода). Но когда количество пользователей превысило 10 000 человек, мы с командой решили усилить сервис и переписать его на языке высокого уровня. Сейчас у него сложная бэкенд-инфраструктура. В основном его просят поискать ответы на вопросы, написать письмо и пр.
Из крупных российских разработок можно отметить YandexGPT. Эту нейросеть в мае 2023 года запустила компания «Яндекс». В июле 2023 года она стала доступна бизнесу. С ее помощью можно генерировать и структурировать тексты, а также создавать собственных виртуальных ассистентов. 27 июня в «Яндексе» сообщили, что нейросеть может подключаться к сети и тезисно пересказывать актуальные статьи из интернета. Это отличает ее от американского конкурента, который на момент написания этой книги не мог подключаться к сети без дополнительных плагинов (расширений). Уже в сентябре 2023 года холдинг представил новую версию языковой модели YaGPT 2, в осенью 2024 года компания представила YandexGPT 4, адаптированную для решения бизнес-задач с использованием подхода с рассуждениями. По сравнению с предыдущей она более универсальна и способна решать больше задач, улучшилось и качество ее ответов. Для обучения YandexGPT использовались данные из книг, журналов, газет и других открытых источников из интернета.
Кроме того, компания встроила нейросеть в работу одного из своих флагманских продуктов – виртуального голосового помощника Алисы. Благодаря YandexGPT Алиса научилась писать тексты и предлагать идеи. Она также встроена в приложение для генерации изображений «Шедеврум». Сервис генерирует изображения на основе текстового описания. Скажем, вам нужен пост для социальной сети, но нет подходящей картинки. Достаточно написать модели пару слов, чтобы она создала несколько интересных изображений. Более того, у компании есть отдельная нейросеть YaART, к которой обращаются «Шедеврум» и YandexGPT, когда необходимо сгенерировать изображение. Аналогичным образом поступает DALL-E в ChatGPT.
«Шедеврум», DALL-E – не единственные модели, которые преобразовывают тексты в изображения. Есть целое направление нейронок – они называются диффузными. Такие сети состоят условно из двух нейронок: первая воспринимает и обрабатывает текст, а вторая на основе текста генерирует изображение. Достойную конкуренцию американским моделям составляет и разработка «Сбера» GigaChat. Он способен отвечать на ответы, поддерживать беседу, писать код и генерировать изображения. Наверное, главное преимущество этой разработки, скажем, перед ChatGPT, в том, что она обучена на русских материалах, а значит, генерирует более качественные ответы на русском языке. На базе GigaChat разработчики могут создавать собственные ИИ-приложения.
Подобные модели начали разрабатывать в середине 2010-х годов. Одним из первопроходцев стала команда OpenAI. В 2019 году она выпустила DALL-E, способную создавать изображения на основе текстовых описаний. Разработка финансировалась из гранта Microsoft на сумму 1 млрд долларов США. В основу модели легла нейросеть по обработке естественного языка GPT‑3. Для широкой аудитории DALL-Eстала доступна через два года – в январе 2021 года. А в апреле 2022 года появилась ее улучшенная версия – DALL-E2.
В ноябре 2021 года команда разработчиков Sber AI создала аналогичную нейросеть, которая обрабатывает запросы на русском языке. Проект получил название ruDALL-E, но отношения к оригинальному DALL-E не имеет: российские специалисты обучали нейросеть с нуля. Разработчики заявляют, что процесс обучения ruDALL-E стал самой большой вычислительной задачей в России.
В мае 2022 года нейросеть Imagen, генерирующую изображения, выпустилGoogle. На официальном сайте продукта разработчик утверждает, что Imagen превосходит DALL-E по точности изображений и соответствию картинки техническому заданию.
Основное ограничение всех вышеперечисленных нейронных сетей в том, что они работают на серверах компаний-разработчиков, поэтому бизнес не может использовать ни ChatGPT, ни YandexGPT или GigaChat на своих серверах. Поэтому активно развиваются и различные Open Source языковые модели, доступные в виде коробочных решений, которые могут быть развернуты на вычислительных мощностях бизнеса. Одна из самых мощных Open Source языковых моделей – нейросеть Mistral, разработанная французскими разработчиками.
Среди генеративных нейросетей для создания изображений в том же 2022 году свою модель Stable Diffusion выпустила компания Stability AI. Это модель с открытым исходным кодом, которую может скачать любой желающий и запустить на своем компьютере. Любопытно, что именно эта компания могла стать той, подстегнувшей Альтмана и его компанию быстрее выпускать свой текстовый сервис. Дело в том, что буму, который произвел ChatGPT осенью 2022 года, предшествовал другой – тот, что возник вокруг Stable Diffusion. С его помощью можно было сгенерировать любое изображение на основе краткого описания за пару секунд. До этого никто не мог себе такое и представить! Среднестатистическому пользователю, который глубоко не погружался в мир искусства, казалось, что подобные работы могут создавать только художники с гигантским опытом и талантом.
Возможно, вы пропустили тот бум и даже никогда не слышали о Stable Diffusion. Впрочем, если вы живете в России и используете социальные сети, гарантирую, что вы соприкасались с этой нейросетью. По данным компании, летом 2022 года решение применяли более 200 000 разработчиков. И одной из команд была российская – из компании Prisma Labs, основанной в 2016 году бывшим менеджером по продукту в Mail.ru Group Алексеем Моисеенковым вместе с партнерами.
В декабре 2018 года Prisma Labs запустила приложение Lensa для обработки портретных фото и селфи при помощи алгоритмов машинного обучения. Сервис позиционировали как «моментальный Photoshop», как писал TechCrunch. Среди прочего он позволял отбеливать зубы, подкрашивать брови, выравнивать кожу, восстанавливать искаженные пропорции лица или менять фон на заднем плане. На создание приложения ушло около полугода. Первые несколько лет оно не вызывало бурного восторга, но за следующие четыре года ее скачали 22,2 млн человек. И это не так впечатляет, как количество скачиваний в одном только ноябре 2022 года: тогда приложение загрузили 1,6 млн раз, что на 631 % больше, чем в октябре. СМИ связывали бум с обновлением Lensa: в том же месяце команда добавила новую функцию под названием Magic Avatars на основе искусственного интеллекта, а именно: разработки Stable Duffision. Она позволяет пользователям загрузить 10–20 собственных фотографий, на базе которых ИИ генерирует несколько новых портретов в разных стилях. За несколько дней после обновления Lensa стало самым скачиваемым приложением в AppStore в сегменте «Фото и видео». Социальные сети, включая Facebook и Instagram , заполонили портреты пользователей в образах космонавтов, элегантных джентльменов и сказочных фей. Причем приложение оказалось популярным не только в российском сегменте интернета. По данным Sensor Tower, в топ стран, где оно стало наиболее популярным, вошли также США и Бразилия. На последнюю пришлась треть ноябрьских скачиваний, а рост месяц к месяцу в этой стране превысил 20 000 %.
В кратчайшие сроки Stability AI благодаря виральности своей разработки стала одной из самых популярных компаний Кремниевой долины, а ее основатель Эмад Мостак – одной из самых влиятельных фигур в технологической сфере. Бывший сотрудник компании, который устроился в нее после двух десятков лет работы в Adobe, называл Мостака самым большим визионером, которого когда-либо видел. В мае Белый дом назвал Stability AI, наряду с Microsoft и NVIDIA, одним из семи лидеров в разработке ИИ, которые будут привлечены к сотрудничеству в рамках фундаментальной федеральной инициативы по безопасности искусственного интеллекта. Мостак ужинал с основателем Amazon Джеффом Безосом и даже общался с соучредителем Google Сергей Брином. Последний, как пишут СМИ, редко показывается на публике, но посетил одну из вечеринок Мостака в Сан-Франциско. Впрочем, позже оказалось , что Мостак подтасовал часть фактов своей биографии и успеху его стартапа во многом способствовала откровенная ложь. Но это уже другая история.
Если вернуться к нейросетям, способным преобразовывать текст в изображение, то сейчас самым популярным сервисом можно назвать Midjourney. В 2022 году о нем, кажется, говорил весь интернет. Казалось поразительным, что всего за несколько секунд модель создавала изображения, неотличимые от работ цифровых художников. Впрочем, это отмечали и художники – и в некоторых сгенерированных работах узнавали свои. Например, в январе 2023 года на компанию подали иски несколько иллюстраторов: они обвиняли компанию в нарушении интеллектуальных прав. Они предполагали, что создатели модели использовали их работы при ее обучении. Похожие иски художники подали и на конкурирующую Stability AI.
Midjourney в 2022 году основал ученый и предприниматель Дэвид Хольц – 33-летний выпускник факультета прикладной математики Университета Северной Каролины в Чапел-Хилл. В студенчестве Хольц успел поработать в Институте Макса Планка, где изучал алгоритмы нейровизуализации и разрабатывал карту мозга крысы на клеточном уровне, и даже в исследовательском центре NASA, где занимался технологией LiDAR (обнаружение и определение дальности с помощью света используется в том числе в камерах iPhone для лучшей фокусировки на объекте).
Надо сказать, что за время после выпуска нейросеть Midjourney претерпела серьезные изменения. Я сам попробовал ее в ноябре 2022 года и помню, что испытал разочарование. Сервис генерировал довольно непонятные картинки, которые мало чем походили на реальные объекты из жизни. Впоследствии команда совершила качественный скачок – и быстро! Сейчас я постоянно использую этот сервис, в частности для нужд компании – генерации рекламных баннеров и др.
Часть II
В которой я рассказываю о том, как ИИ изменит рынок труда и бизнес
Глава 1
Рынок труда. Разработка, которая изменит все
На самом деле, интерес вокруг ChatGPT во многом подогревали разговоры о том, как разработка изменит рынок труда. В дебатах участвовали многие, в том числе известные в технологической среде эксперты и предприниматели. Одним из активных участников и, можно сказать, фанатом разработки стал Билл Гейтс. В своем блоге он назвал искусственный интеллект одной из составляющих Четвертой промышленной революции. Он признавался, что за свою жизнь видел две революционных технологии. Первая – это графический пользовательский интерфейс. Он стал предшественником операционных систем и помог сделать компьютерные вычисления доступными. А вторая – как раз модель GPT от OpenAI. Гейтс сравнил развитие ИИ с созданием микропроцессора, персонального компьютера, интернета и мобильного телефона. Как и они, новая технология изменит самые разные индустрии и станет неотъемлемой частью процессов, считает он. Он прогнозировал , что модель сможет автоматизировать задачи в самых разных областях: от программирования до здравоохранения, сделать работу офисных сотрудников более эффективной и в конечном итоге изменить мир.
О влиянии ИИ на рынок труда высказывался не только Гейтс. Можно с уверенностью сказать, что в 2022 и 2023 годах это была одна из самых горячих тем. СМИ чуть ли не каждый день выпускали материалы о том, кого бот может заменить уже сейчас и заменит в будущем. На эту тему активно спорили и в социальных сетях, и дома на кухне. В этой книге я хотел бы внести свою лепту в эти обсуждения и поделиться своими наблюдениями и прогнозами. Но начну с сухой статистики.
По подсчетам консалтинговой фирмы Goldman Sachs, искусственный интеллект сможет полностью автоматизировать 300 млн (или одну пятую) рабочих мест в странах с развитой экономикой (в первую очередь в США и Европе) и в пределах 10–20 % в развивающихся странах. В США прогресс в сфере искусственного интеллекта никак не затронет только 30 % работников, занимающихся физическим трудом, 63 % смогут автоматизировать часть своих рабочих задач, а 7 % окажутся под угрозой увольнения, говорится в исследовании. Достоверной статистики по России нет, но вряд ли в ней мы увидели бы более позитивную картину.
На первый взгляд, это пугающий прогноз. Впрочем, если задуматься и копнуть поглубже, в том, что технологии меняют рынок труда, нет ничего удивительного: на протяжении истории люди старались упростить себе жизнь за счет изобретений – так появились огонь, колесо и другие технологии. Каждая новая фундаментальная находка меняла мир, двигала его вперед и так или иначе влияла на то, как люди работают. Безусловно, самый показательный период нашей истории – промышленная революция. Начавшись в Великобритании и пройдя по странам Европы и другим регионам мира, она примерно за три-пять поколений трансформировала аграрное общество, где большинство населения вело натуральное хозяйство, в индустриальное, где ручной труд был заменен машинным. Эта технологическая революция позволила в одной только Великобритании увеличить эффективность труда почти втрое между 1700 и 1870 годами. Во столько же раз вырос и объем сельскохозяйственного производства. Благодаря этому прорыву страна в этот период стала самой урожайной в Европе и потеснила Голландию на пьедестале доминирующей в мире силы.
Конечно, революция происходила не только в сельском хозяйстве. Изобретенный в XVII веке паровой двигатель способствовал появлению целой плеяды технологий: железнодорожных составов, кораблей, водяных насосов, станков на заводах и фабриках, котельных, первой моторизованной сельхозтехники, деревообрабатывающих предприятий, ранних автомобилей и грузовиков. Все это держалось на паровых двигателях, пока их не заменили электро- и двигатели внутреннего сгорания в конце XIX – начале XX века. Таким образом, одно изобретение не просто дало гигантский толчок для развития промышленности, но соединило города и страны и создало огромное количество рабочих мест.
Не обошлось и без сокращений – внедрение технологий никогда не проходит безболезненно. Так, в начале XV века прялка позволила значительно повысить производительность труда: один рабочий теперь мог создавать столько пряжи, сколько до этого обеспечивали 200 человек вместе. Но не все восприняли это с энтузиазмом: в Кельне даже запретили устройство, посчитав, что оно провоцирует безработицу в текстильной индустрии, лишая работы тех, кто использует ручное веретено. В XVI веке подобный запрет в разных частях Европы коснулся станков для плетения лент. А в начале XIX века ремесленники под руководством Неда Лудда устраивали массовые протесты и якобы уничтожали прядильные машины. Участников сопротивления прозвали луддитами. Впоследствии у этого термина появилось второе значение – так называют людей, которые проявляют «технофобские» наклонности, то есть с опаской и даже агрессией относятся к новым изобретениям и в целом к техническому прогрессу. Кстати, это не первый случай в истории, когда люди сопротивлялись технологиям, переживая за свои рабочие места. Когда в XV веке начали печатать первые книги, граверы по дереву из немецкого Аугсбурга (Augsburg) устраивали протесты, посчитав, что развитие печатного дела лишит их работы. Забегая вперед, скажу, что этого не случилось. Впоследствии граверы перестроились и стали заниматься книжной иллюстрацией.
Но вернемся к технологическому прогрессу. Как когда-то паровой двигатель изменил лицо человечества, так в ХХ веке это начали делать информационные технологии. Благодаря им появились роботы-манипуляторы, автоматизированные системы складского учета и множество других изобретений, которые в разы снизили потребность в ручном труде на производствах. Как и в предыдущую революцию, сотни тысяч людей лишились работы. Так, с 2000 года промышленность только в США лишилась пяти миллионов рабочих мест, причем половину сократили из-за повышения производительности и автоматизации производства. Но на замену старым рабочим местам пришли новые, которые отвечали требованиям изменившегося мира. Так, в зоне ответственности людей остались сложные задачи, связанные с проектированием, внедрением и обучением машин, а также созданием новых технологических продуктов.
Что выделяет текущую революцию? На протяжении истории «главными полигонами роботизации» были заводские цеха, как верно подметили в своей книге «Человек + машина. Новые принципы работы в эпоху искусственного интеллекта» Джеймс Уилсон и Пол Доэрти. Поэтому все вышеупомянутые революции в первую очередь влияли на «синих воротничков» – представителей рабочих специальностей. Это они вынуждены были переучиваться, брать на себя новые функции или оставаться за бортом прогресса. ChatGPT же поставил под сомнение потребность в высококвалифицированных специалистах – тех, кто занят не физическим, а интеллектуальным трудом. Прогнозы экспертов и аналитиков сходятся в том, что часть задач в таких областях, как образование, право, технологии и искусство, вероятно , отойдет машинам. Это связано со способностью генеративного ИИ предсказывать закономерности на естественном языке и динамически использовать их. Согласно исследованию Пенсильванского университета ChatGPT способен взять на себя минимум 50 % рабочих задач в каждой пятой профессии. И в первую очередь в зоне риска оказываются юристы, переводчики, исследователи, писатели, поэты, журналисты, специалисты по коммуникациям, финансовые аналитики и пр. Если бы мы могли отмотать время, скажем, на год назад и спросить всех этих людей, верят ли они в то, что в ближайшее время появится сущность, которая придет за ними и автоматизирует почти 100 % их задач, да они бы воскликнули: «Вы сошли с ума! Как можно автоматизировать создание журнальной статьи? А юридического документа?»
Но это уже происходит. За прошедшие с запуска ChatGPT месяцы десятки компаний объявили о частичной замене персонала искусственным интеллектом. Так, глава британского телекоммуникационного гиганта BT Group в 2023 году сообщил , что к 2030 году сократит штат на 55 000 рабочих мест и 10 000 из них заменит искусственным интеллектом. По похожему пути пошел медиаконцерн Axel Springer. В одном из его портфельных изданий Bild сократили 200 сотрудников, включая редакторов, корректоров и фоторедакторов. Под волну сокращений попали сотрудники Corporate America. Компания решилась на такой шаг из-за риска рецессии. Услугами ИИ стали пользоваться в медиакомпании Buzzfeed. Она заявила, что теперь будет заказывать материалы искусственному интеллекту – боту ChatGPT. Что любопытно, после этой новости акции компании выросли на 200 %. В декабре Buzzfeed сократили 12 % сотрудников – это 180 человек.
Компания Google также уволила сотни сотрудников из своего отдела продаж рекламы. Хотя Google не связывает сокращения напрямую с искусственным интеллектом, в записке для сотрудников, полученной Business Insider, главный бизнес-директор Google Филипп Шиндлер упомянул об искусственном интеллекте и его влиянии на мир, объявив о сокращениях. Microsoft также удваивает ставку на искусственный интеллект, инвестируя миллиарды в разработчика ChatGPT OpenAI, поскольку это снижает потребность в рабочих местах. Платформа изучения языков Duolingo признала сокращение на 10 % числа подрядчиков в конце 2023 года. Впрочем, в компании отрицали, что все сокращения были связаны с увеличением использования искусственного интеллекта. Duolingo добавила, что иногда использует ИИ для создания предложений и переводов и что ИИ может помочь подрядчикам работать быстрее.
Внимание общественности привлек кейс индийского стартапа Dukaan. Основатель сервиса Суумит Шах (Suumit Shah) рассказал в Twitter о том, что заменил 90 % специалистов службы поддержки чат-ботом на основе искусственного интеллекта. Время на ответ значительно сократилось: если человек отвечал в среднем в течение одной минуты сорока четырех секунд, то робот делает это мгновенно. И это не единственный СЕО, кто автоматизирует рабочие процессы. Согласно подсчетам IBM, три четверти СЕО стремятся внедрить искусственный интеллект и указывают на повышение производительности как на главную причину. В июне 2023 года из-за ИИ 3900 рабочих в США потеряли работу, согласно данным компании Challenger, Gray & Christmas Meanwhile, которая предоставляет карьерные консультации.
О волнах сокращений свидетельствуют и посты сотрудников в социальных сетях. Один из пользователей платформы Reddit рассказывал о том, что один из клиентов отказался от его услуг после появления чата. Заказчик признал, что ИИ пока создает не самые качественные тексты, но стоит дешевле человека. Как писало издание Moneycontrol со ссылкой на исследование платформы для поиска работы Resumebuilder, в половине американских компаний, где применяли ChatGPT, уже заменили часть сотрудников моделью.
ИИ не обходит стороной и российский бизнес. Отечественные компании тоже потихоньку отказываются от специалистов, чью работу может взять на себя чат, в том числе ради экономии ресурсов. В первую очередь это касается переводчиков, копирайтеров, а также людей, которые работают с данными и программистов.
Надо сказать, что все эти изменения здорово пугают. И дело даже не в том, что мое будущее на рынке труда, как и десятков сотен человек в России и мире, оказалось под вопросом. Страшит скорость изменений. Промышленная революция в корне изменила мир и то, как человек работает, но эти изменения происходили в течение нескольких десятилетий. То же самое можно сказать и о компьютерной революции конца ХХ века. Если тогда люди адаптировались к изменениям постепенно, год за годом, поколение за поколением, то теперь действовать приходится мгновенно, в режиме реального времени. Текущие прогнозы показывают, что треть работы американских специалистов может быть автоматизирована уже к 2030 году.
Бесплатный фрагмент закончился.
Начислим
+12
Покупайте книги и получайте бонусы в Литрес, Читай-городе и Буквоеде.
Участвовать в бонусной программе








