Дмитрий Масюк, Яндекс: «Нейросети сами ничего изначально не делают. Их обучают люди»
Эксперт рассказал, почему нейросети, которые начали появляться еще 20 лет назад, показали за последние два года революционный рост
Читать на полной версииРуководитель бизнес-группы Поиска и рекламных технологий Яндекса Дмитрий Масюк рассказал в интервью главному редактору радиостанции Business FM Илье Копелевичу о том, в каких бытовых и профессиональных областях сегодня применяется искусственный интеллект, почему поумнела Алиса и кто управляет колесящими по городу роверами
У нас в гостях руководитель бизнес-группы Поиска и рекламных технологий Яндекса Дмитрий Масюк. На самом деле, эти слова не говорят о самом главном в его работе. Уточним: именно в этом бизнесе сосредоточен центр развития нейросетей: там же и Алиса, там же, собственно, YandexGPT.
Дмитрий Масюк: Я бы не сказал, что искусственный интеллект и нейросети — это самое главное в нашей работе, но это самое интересное.
Это то, о чем мы будем сегодня говорить. Итак, YandexGPT и другие сервисы, построенные на искусственном интеллекте, родились именно в этом бизнесе. Расскажите, как это произошло и когда?
Дмитрий Масюк: Нейросети, в принципе, развиваются последние лет 20. И я думаю, что ни для кого это не секрет. При этом последние полтора года, с ноября 2022 года, происходит ренессанс, взрывное развитие нейросетей нового поколения. Все началось со всем известного ChatGPT, после чего почти все технологические гиганты в мире и в России побежали делать похожие нейросети. В чем тут чудо? Машина научилась понимать естественный язык и разговаривать на нем же.
Насколько близки вы были к тому, чтобы создать нечто похожее на ChatGPT от OpenAI на основе тех наработок, которые существовали? Это было легко сложить в похожую модель?
Дмитрий Масюк: Нам понадобилось где-то полгода на то, чтобы сделать модель, которая на русском языке стала лучше, чем ChatGPT 3.5, с которого начался мировой взрыв, в общем-то. То есть, в действительности, за полгода — девять месяцев можно было повторить тот невероятно инновационный успех, который сделали ребята из OpenAI.
А была ли такая идея в Яндексе — взять и запустить в люди — ранее? Или идея не приходила и вы увидели, что сделали ребята из OpenAI? И оказалось, что у вас уже было наработано много, так сказать, кирпичиков, которые просто нужно было в это сложить.
Дмитрий Масюк: Мне кажется, технологические паттерны в мире повторяются. И можно находить аналогии. И здесь похожая ситуация происходила с электрокарами. Они были и до Tesla. Но когда Tesla 10 лет назад сделала свой Model S, все человечество осознало: за этим будущее. И сейчас нет практически ни одного производителя в мире, который бы не делал электрокары. И ребята из OpenAI также показали всем, как действительно можно.
Такая упаковка, которую можно сразу к широкому кругу пользователей повернуть.
Дмитрий Масюк: Есть вопрос и упаковки, и того, что они обучили модель на таком колоссальном количестве данных — в 10 раз превышающем то, что было до этого, — и получился невероятно умный продукт. «Болталки» были и до этого.
Вот, как раз хотел сказать, мы же с Алисой разговариваем уже лет пять. Иногда она смешит.
Дмитрий Масюк: Я надеюсь, и будет продолжать. Мы очень гордимся тем, что она смешно себя ведет. Да. Но здесь случился некий качественный переход. И теперь абсолютно всем очевидно, что за этим будущее. Раньше казалось, что автоматизация будет потихонечку помогать и поедать, так сказать, человеческий труд, начиная с наиболее простой работы. А теперь вдруг оказывается, что и юрист, и креативщик чувствуют, ну как минимум, что есть инструмент, который им существенно может помогать, а как максимум добавил и страха, что может и его опередить.
Чем я в простой жизни, может быть, не в профессиональной, мог бы пользоваться?
Дмитрий Масюк: Например, можно спросить: «Кто такой Дмитрий Масюк»? И наш новый продукт Нейро даст очень хороший, основанный на конкретных источниках, суммирующий ответ, размером со страничку, который потом можно уточнять.
А чем это отличается от Алисы?
Дмитрий Масюк: Она не сказала бы, кто этот конкретный человек, потому что она скорее не знает об этом. Мы как раз скрестили нейросети нового поколения, которые галлюцинируют (слово года по Оксфордскому словарю) с Поиском. И получился продукт, который, с одной стороны, знает все то, что есть в интернете, с другой стороны — умеет емко и качественно об этом говорить.
Компилировать. Вы знаете, я, например, не верю Википедии, лезу проверять. В связи с этим вопрос, искусственный интеллект, он же все равно тащит информацию из интернета. Сортирует ли он источники по степени надежности?
Дмитрий Масюк: В Нейро, в нашем новом продукте, да. Смотрите, почему не только кликбейтные вещи уходят пользователю: у нас сидят сотни людей, которые занимаются фактчекингом, занимаются оценкой качества тех или иных информационных ресурсов, и это постоянная работа. Каждый день это происходит, наверх идут только наиболее качественные источники.
То есть они ранжируются. Но они ранжируются, кстати, нейросетью или вручную человеком?
Дмитрий Масюк: Это супервопрос. Нейросети сами ничего изначально не делают. Их обучают люди. Но поскольку мы имеем дело с миллионами, десятками миллионов, миллиардами новостных сайтов и каких-то информационных ресурсов, люди, конечно, обучают нейросети, как это делать. И, собственно, нейросеть с помощью человеческой оценки учится оценивать и источники. И Нейро, когда мы ему задаем вопрос, конечно, берет не самые популярные источники, а самые качественные, отобранные нейросетью.
То есть сейчас уже нейросеть может сама ранжировать источники? Или все еще сидит команда специалистов и расставляет, так сказать, рейтинги?
Дмитрий Масюк: Это постоянный процесс, где нейросеть уже неплохо с этим справляется.
Но от человеческого труда вы тут пока не можете отказаться, да?
Дмитрий Масюк: Пока нет.
Все сейчас зомбируют предпринимательское сообщество: если они не научатся пользоваться искусственным интеллектом, то завтра искусственный интеллект просто научится обходиться без них. Давайте представим некоего предпринимателя, скажем, продавца, производителя детской одежды или обуви. На маркетплейсах. Есть что-то для него?
Дмитрий Масюк: Если мы говорим про, условно, кондитерский цех, конечно, сейчас нейросети в сути происходящего (в процессе приготовления) еще не разобрались. Но во всем, что касается продаж, — да. Мы в среднем сейчас видим, что на 10-15% тексты, написанные нейросетью, лучше продают товар на маркетплейсах, чем тексты, написанные человеком. По ним чаще кликнут по рекламе. Конечно, профессиональный маркетолог сделает это здорово, но у многих бизнесов нет в штате такой возможности. Руководитель маленького предприятия едва ли не сам там заводит рекламу. И уже сейчас есть инструменты, которые позволяют привлекать клиентов на основе нейросетей.
Это очень, кстати, понятная практическая задача. Как она решается? То есть если я, условно, малый-средний бизнесмен, производитель каких-то услуг, товаров — я продаю это на широкий рынок через маркетплейс. Мне нужно коммуницировать. Что сделает нейросеть? Цена — также один из важнейших вообще элементов продвижения товара на маркетплейсе. Есть масса задач в поле зрения таких предпринимателей. Вот искусственный интеллект в Яндексе, что он может им предложить на практическом уровне? Как это выглядит, как это сделать? Нужно что-то купить, какую-то услугу?
Дмитрий Масюк: Я бы говорил опять-таки прежде всего про рекламный бизнес, поскольку, на самом деле, у нас есть множество внедрений и на нашем маркетплейсе в Яндекс Маркете, но, мне кажется, это дальше от моей области экспертизы. В рекламе опять-таки есть три задачи: что человеку рассказать, которому мы показываем рекламу, кому показать это изображение или текст. У Яндекса Поиск, например, — это продукт с самой большой аудиторией в России. Им пользуются 50 млн человек каждый день — это больше, чем у YouTube, Telegram. Соответственно, у нас есть возможность показать рекламное объявление миллионам людей. И, наконец, третья задача рекламы — сколько за это заплатить (если мы рекламу показываем, например, на сайте BFM.ru). Потому что можем показать мы, а может какая-то другая рекламная сеть.
Нейросети сейчас полностью могут автоматизировать рекламный цикл. Производитель кондитерский изделий, если есть какая-то точка продаж, собственно, интернет-магазин, может сказать: «Я занимаюсь кондитерскими изделиями», далее указать ссылку на этот сайт. А дальше изображение можно выбрать автоматизированное, сгенерированное нашими нейросетями. Текст можно взять автоматизированный, сгенерированный нейросетями. Система сама подберет оптимальную аудиторию, которой ей это стоит показать. Наконец, если реклама показывается на внешних ресурсах, не на Яндексовых, сказать, сколько за это сайту заплатить. Не все в курсе, что, когда человек заходит на сайт, в реальном времени происходит конкуренция между разными рекламными системами.
Чтобы этот инструмент заработал, что нужно на стороне пользователя сделать? Есть просто анкета, набор вопросов, товаров, услуг? Он потом проверил и утвердил?
Дмитрий Масюк: У нас есть два рекламных продукта. Один — Яндекс Директ, он для более профессиональных пользователей, хотя там можно просто тоже настроить рекламу. И Яндекс Бизнес, здесь буквально за 10 тысяч рублей можно купить подписку и хоть полностью опять-таки автоматизировать весь рекламный цикл.
Десять тысяч рублей — за сколько времени?
Дмитрий Масюк: Десять тысяч рублей можно положить на счет, и дальше, если очень хорошо себя ведет реклама, она съестся быстрее.
То есть десять тысяч — это включая уже рекламу?
Дмитрий Масюк: Да.
А вот сервис, сам сервис, который вы сейчас описали, он что-то стоит или это бесплатно?
Дмитрий Масюк: Мы, конечно, что-то на этом зарабатываем, но чудо интернет-рекламы и почему она выигрывает у традиционных медиа последние годы, в том, что ты платишь только за результат. Ты не платишь за клик давно уже. Ты платишь за установку приложения, за звонок к себе на сайт.
Конкретно эта услуга нейросети по созданию рекламного объявления, текста, его размещения, сама услуга, она ничего не стоит. Она включена в стоимость продаж?
Дмитрий Масюк: В стоимость результата.
Это была очень утилитарная задача. То, что мне сразу пришло в голову. А вы теперь расскажите, пожалуйста, о том, что мне не приходит в голову в плане бизнеса.
Дмитрий Масюк: Смотрите, вопрос этот супер, но я бы вот всякому, кто об этом задумается, предложил бы подумать над таким же вопросом, который был актуален 15 лет назад: «А вот как компьютер можно использовать в бизнесе или для личных целей?» И мозг, вообще говоря, немножко немеет, поскольку возможностей просто океан.
Познание океана начинается с каких-то шагов.
Дмитрий Масюк: Все так, да. Я просто хочу подсветить таким образом универсальность технологии. Она действительно универсальная, и надо понимать, что мы находимся в самом начале развития цикла. Вспомните, когда появились телефоны мобильные… Cейчас просто смешно на них смотреть. Или интернет когда появился, дома все сидели, карточки эти стирали, код с них, монеткой, и скорость была ужасная, файл качался очень долго. И где мы находимся сейчас? Я убежден, и Яндекс, в частности, убежден, что мы говорим про похожую универсальность технологии, которая будет в ближайшие 5-10 лет разворачиваться. И это не крипта, например, которую пять лет назад все обсуждали, и это очень нишевое осталось явление. Мы говорим про действительно технологическую революцию, хотя сейчас мы в ней находимся примерно полтора года. Мы говорим про буквально, вдумайтесь, искусственный интеллект. Снова вернемся к кондитерскому производству. Как сейчас в этой области используется компьютер? — Каких только не представить аспектов. Опять-таки человек исследует наверняка рецептуры, человек думает, где ему найти точку продаж на компьютере и так далее. Здесь другого рода технология. Это мозг буквально, который может решать любые интеллектуальные задачи. И в первую очередь эти задачи сейчас решаются в текстовом домене. Когда я говорю «текст» — это довольно широкая история. Программисты пишут текст. И нейросети сейчас в Яндексе — 11% разработчиков каждый день пользуются нашими нейросетями для того, чтобы автоматизировать написание программ. Мы делаем инструмент для служб поддержки, где сотрудник службы поддержки, у нас их тысячи, если не десятки тысяч, — выдают им подсказки о том, что ответить пользователю. Юрист сейчас может с помощью нейросетей написать первый драфт документа, который потом легко детализировать. И юрист, и служба поддержки это вроде бы разные полюса по степени нагрузки интеллектуальной, но все эти модели настолько умные. Мы опросили тысячи бизнесов, тех, кто чем пользуется. Так вот, примерно полгода назад около 20% бизнесов утверждали, что они уже используют генеративный искусственный интеллект. То есть это каждый пятый. 80% пока не пользуются, но скорость роста очень высокая. И основные точки приложения — маркетинг и продажи.
Расскажите, чтобы научить YandexGPT правильно писать юридические тексты, вы нанимаете каких-то отдельных юридических специалистов, которые прокачивают, обкатывают, поправляют ошибки?
Дмитрий Масюк: Смотрите, любая нейросеть, YandexGPT 3, в частности, обучена буквально на всем интернете. Например, PubMed — это международный ресурс, куда выкладывают все медицинские статьи. На этих текстах нейросеть обучена. На всех юридических документах, которые хранятся открыто в интернете, нейросеть обучена. Модель прочитала все более-менее доступные юридические тексты на русском языке, и уже сейчас из «коробки» она может посоветовать юристу, как сделать драфт такого-то договора в таком-то законе, что, она думает, написано по такому-то случаю и так далее. Можно легко сказать, и в этом будет много правды, что нейросеть нередко ошибется. Надо понимать, что мы находимся в 5-7-летнем цикле где-то на первых полутора годах. И к концу этого года модели будут уже сильно круче, чем сейчас. Через два года еще круче, чем через год. Тут прослеживается прямая аналогия с мобильными телефонами или компьютерами. Мы несемся с огромной скоростью, как и десяток компании в мире, в то, чтобы эти модели быстро умнели. И здесь легко представить скепсис, вспомнив первые переводчики, которые переводили пословно. Сейчас с любым текстом, пусть не художественным пока, такие переводчики качественно справляются. Но, я вас уверяю, что и с художественной литературой эта задача будет решена, через год-два. Соответственно, умность модели, чтобы она смогла, в частности, юристу на самые тонкие вопросы моментально отвечать, без того, чтобы лазить по консультанту или гаранту, это вопрос небольшого количества лет.
Давайте попробуем теперь, насколько возможно, кратко и понятно, чисто функционально, а не по устройству, объяснить, что такое API, что с его помощью делает пользователь на своей стороне для того, чтобы использовать возможности искусственного интеллекта на стороне того, кто его предоставляет, будь то ChatGPT или YandexGPT, или GigaChat Сбера?
Дмитрий Масюк: API — это просто то, что называется машинный интерфейс. Это способ не ручками задать вопрос модели, («слушай, вот помоги тут с таким-то вопросом»), а способ сделать это машине. Например, у продавца чего-то есть тысяча товаров, и нужно написать хорошее описание. Можно задавать вопрос в интерфейс Яндекса с GPT, там, Алисы, а можно с помощью API сделать табличку, и любой программист мало-мальски квалифицированный сможет написать программку, которая обращается к нашей модели и говорит: cлушай, вот шоколадный батончик, в составе то-то, напиши классное описание для того, чтобы выгрузить, например, на маркетплейс. API — это универсальный интерфейс, доступ к модели, которой можно миллион раз задать любой вопрос с какими-то уточнениями.
Для меня стало понятно, что это такое, когда у нас здесь был Александр Жадан, который сначала диплом написал и прославился, а потом нашел себе невесту на дейтинговых приложениях, но ему понадобился API. Он создал чат-бота, и пока занимался другими делами, тот чат-бот, запрограммированный с помощью API, работал за него и отсеивал, отсеивал, отсеивал, потом он смотрел результат и так нашел невесту. Ну это такая своеобразная история про чат-бот для дейтинговых приложений. А для бизнеса какого рода практические задачи с помощью API можно решать?
Дмитрий Масюк: У нас есть самые разные случаи. Мы видим людей, бизнесы в HR-процессах, если у них есть массовый наем, который осуществляется с помощью наших же технологий. Похоже на дейтинг, да, забавно. С помощью наших технологий в облаке распознают созвон, например, с кандидатом, превращают разговор в текст и делают системы. Модель распознает не только текст, а то, что вот это говорит один человек, а это другой.
А в других сферах, там, где речь идет не о собеседованиях, есть какие-то примеры?
Дмитрий Масюк: Поддержка, описание товаров, исправление ошибок: везде, где речь идет о работе с текстами, можно пользоваться моделью. Есть много компаний, которые массово с текстами работают. Все это можно сделать с помощью YandexGPT 3 или моделей, которых, на самом деле, не так мало сейчас.
А для какой-то научной работы, для научно-исследовательской уже существуют модели или пока такие вещи сложноваты для нейросетей?
Дмитрий Масюк: Можно себе представить работу лингвиста, который хочет понять, а как поменялся язык, например, за последние пять лет или за последние десять лет. И вот он с помощью нашей модели просит буквально, прочитав какое-то колоссальное количество текстов, вычленить, какие слова или выражения стали употребляться чаще или реже. Я сейчас фантазирую, но огромный объем науки оперирует с текстовыми данными, и мы имеем дело с очень дешевым интеллектуальным трудом. Модели наши ничего не стоят, у них буквально миллисекунды занимает прочитать 100 страниц текста и пересказать.
Скажите, пожалуйста, пользователю, который уже может пользоваться теми сервисами, которые YandexGPT 3 предлагает в сервисах рекламы, в сервисах поиска на Яндексе, есть что-то, что нужно купить? Или пока все в свободном открытом доступе?
Дмитрий Масюк: У нас есть два основных массовых продукта уже сейчас с нейросетями совсем нового поколения. Мы их не так давно запустили. Это Нейро. Он бесплатный, доступен там, где находится наш поисковик, в браузере или в приложении. И это поиск, который дает один какой-то ответ. Буквально задаешь ему любой вопрос, например «Кто такой Илья Капелевич?», и он дает один ответ, сводный. И это инструмент такого познания очень быстрого, экономящего времени.
А есть что-то, что по подписке?
Дмитрий Масюк: Алису мы «скрестили» с нейросетями нового поколения бесплатно, а самая продвинутая модель с нейросетями доступна в Алисе Про по подписке. Там Алиса лучше держит контекст диалога, тоньше, умнее может рассуждать.
Сейчас, мне кажется, среди тех, кто разрабатывает и быстро развивает свои модели, есть понимание, что, да, с одной стороны, надо бы монетизировать этот продукт, но с другой стороны, чем он более массовый, тем он быстрее учится. Нельзя сделать его умным, если не дать ему огромное количество пользователей и базы данных. По этому поводу, естественно, и юридические споры идут, но, прямо скажем, если не будет доступа у моделей искусственного интеллекта к очень большой базе данных, развиваться они не смогут. Так вот здесь встает вопрос о платности и бесплатности для разработчиков. Когда наступит этот водораздел?
Дмитрий Масюк: У информационных сервисов в интернете сейчас есть две модели (под информационным сервисом, я имею в виду радиостанции, журналы). Есть две модели, других не существует: либо реклама, либо подписка. Наша миссия дать всем доступ к технологии и монетизировать ее через рекламу. И у нас есть уверенность, что это получится сделать, например, на продукте Нейро. Если пользователю реклама кажется спамом, это большая проблема для нас, просто потому, что мы потеряли деньги, мы показали неинтересную рекламу. Вообще в обывательском сознании часто реклама — это что-то неприятное. Так вот, здесь полезно понимать, что тот, кто рекламирует, для него это тоже большая проблема, что мы неправильно выбрали. Наше естественное желание, фундаментальное, показывать рекламу, которая пользователю будет интересна, на которую пользователь кликнет.
Это вообще возможно?
Дмитрий Масюк: Возможно. Есть две модели, рекламная и подписочная. Тут надо понимать, что ответ Алисы ли, Поиска ли на нейросетях нового поколения (это называется большая языковая модель) зависит от модели, от ситуации. Но он в 5-10 раз дороже, чем ответ на технологии предыдущего поколения, включая электричество, между прочим. Потому что видеокарты достаточно дорого стоят и потребляют очень много электроэнергии. И у нас есть надежда максимально придерживаться нашей рекламной бизнес-модели. Тем не менее вот мы уже предложили продукт по подписке в Алисе и, вероятно, продолжим наполнять его каким-то специфическим функционалом. Уже есть функционал для детей: Алиса, говорящая на понятном ребенку языке. Какой-то специфический функционал для детей или для образовательных проектов, обучение языкам, — это будет доступно по подписке.
Из новинок, которые я лично наблюдаю в своем районе, это «коробочки» Яндекс на колесиках. Теперь я знаю, что они называются роверами. Они заряжены вот этим вот искусственным интеллектом? Ну потому что, мне кажется, без искусственного интеллекта им не пробраться по Тверской.
Дмитрий Масюк: Все верно. Роверы это наша большая гордость, в частности, большая гордость на уровне того, как люди их воспринимают. Не так давно вирусились фото, где люди буквально им помогали перейти через дорогу, пробраться через сугроб. Они вызывают много эмпатии.
Но правила дорожного движения ровер четко соблюдает. На островках, посреди дороги, на красном свете он стоит, потом едет, когда надо.
Дмитрий Масюк: Это он может, все верно. Может, кому-то кажется, что какие-то люди через камеры смотрят, что происходит. Нет, это не так. Все происходит на системах искусственного интеллекта. Это не такие системы, не такие нейросети, которые мы сейчас обсуждали, — не текстовые. Но это сложнейшая система, собственно, поэтому в мире, хотя многие пытаются, массовую задачу пока никто не решил. У нас есть к концу года внутренняя цель — достигнуть стоимости перевозки на этих роверах, сопоставимой с курьерской. Сейчас ни для кого не секрет, что очень сильно подорожала рабочая сила, квалифицированные, неквалифицированные рабочие.
Но ведь роверу не по силам будет на этаж подняться.
Дмитрий Масюк: Это правда, но у всех, кто пользуется сервисными доставками, думаю, есть выученное ощущение, что зимой дождаться курьера бывает сложнее. Люди меньше хотят зимой сами ходить, больше вызывают заказы, но курьеры такие же люди. Они не меньше склонны в минус 20 выходить на улицу, чем мы с вами. И в пиковые моменты можно спрашивать пользователя: слушай, хочешь ровером получить заказ через 30 минут или человеком через 50 минут?
Где еще, кроме поиска рекламы и доставки, можно пользоваться искусственным интеллектом?
Дмитрий Масюк: Мы хотим дать доступ к Алисе в месте, где люди проводят, к сожалению, часами свою жизнь, — в машинах. У нас есть продукт Яндекс Авто, и мы хотим сейчас, когда меняется понятный ландшафт доступных автомобилей, сделать более доступной нашу Алису с новыми нейросетями водителю или пассажиру. Невидимо для пользователя мы внедряем во все наши сервисы нейросети. Вот сейчас, если в поиске Яндекса поискать какую-то модель телефона, не обязательно читать все отзывы. Можно прочитать просто очень емко структурированные отзывы, узнать, какие плюсы у модели, какие минусы. Это делает та же нейросеть, YandexGPT 3, о которой мы говорили. То же самое и в картах. Скажем, ты хочешь узнать про детский садик, про стоматологическую клинику или про ресторан, — можно не читать все отзывы, а ознакомиться с выжимкой. И вообще везде, где есть какая-то не очень сложная рутинная интеллектуальная работа, мы технологию внедрим. Мало кто об этом задумывается, но еще нейросети используются в прогнозе погоды. Сейчас вся планета увешана миллионами датчиков, которые собирают информацию, нейросети ее обрабатывают и делают прогноз погоды. У нас он один из лучших в мире, мы регулярно сравниваемся в международных рейтингах. И, в частности, прогноз погоды доступен по тому самому API для сельскохозяйственных или ретейловых бизнесов. Это довольно актуально, ведь производственный цикл или трафик людей в магазинах очень здорово зависят от прогноза погоды. Мы видим, что многие продвинутые компании используют наши данные через машинный интерфейс, через API для своих процессов.
Ну что ж, спасибо, надеюсь, что мы все стали чуть-чуть ближе к этому океану возможностей, хотя бы на несколько шагов. Компьютер тоже выглядел страшно, а потом оказалось, что и не нужно понимать, как он работает.