29 марта 2024, 19:15 Технологии
Спецпроект: Строго по делу
Иван Оселедец об ИИ: в чем он сильнее, а в чем — слабее человека
Лента новостей
Основная цель Artificial Intelligence Research Institute — института, который возглавляет Оселедец, — это разработка так называемого сильного ИИ. Что это такое и чем он отличается от «слабого» ИИ, который уже сейчас используется для решения различных технических задач? И почему самое сложное сейчас — это обучить робота моторике?
С доктором физико-математических наук, директором института AIRI — Artificial Intelligence Research Institute — Иваном Оселедцом беседовал главный редактор радиостанции Business FM Илья Копелевич.
Здравствуйте, у нас в студии Иван Оселедец. В свои 40 лет он уже 11 лет доктор физико-математических наук, возглавляет институт, который называется AIRI — Artificial Intelligence Research Institute — институт по исследованию искусственного интеллекта. Профессор Сколтеха, профессор Российской академии наук. Что в вашей деятельности сейчас главное? Если коротко, чем вы занимаетесь в институте? Вы же не конкретные продукты там готовите.
Иван Оселедец: Если коротко, основная цель AIRI — разработка так называемого сильного ИИ. На самом деле, в стране сейчас довольно много центров ИИ, в частности создано шесть крупных исследовательских центров в рамках федеральной программы — Сколтех, «Иннополис», ИТМО, МФТИ, ВШЭ, ИСП РАН, еще сейчас три новых центра создано. Но все они — это структурные подразделения уже существующих вузов. Мы, на самом деле, единственная в стране такая организация, направленная целиком как раз на изучение различных аспектов ИИ, у нас более 150 сотрудников — это математики, физики, инженеры, биологи, и мы изучаем все возможные аспекты на самом деле, но цель у нас — создание «сильного» ИИ.
Что такое сильный? Сейчас пока слабый?
Иван Оселедец: Он становится сильнее. То есть, на самом деле, ИИ сейчас уже научился видеть, работать с картинками, научился читать, работать с текстами, но «сильный» ИИ должен превзойти человека не в одной какой-то задаче, а по максимально широкому спектру, и стать не заменой, а помощником. Помощником врача, помощником журналиста, помощником геолога. Для этого нужно не учить какую-то отдельную большую модель с нуля, а иметь одну большую общую модель, сейчас такое видение, которую мы обучаем под какую-то конкретную прикладную область. То есть как выявить общие связи между, на первый взгляд, такими разными совершенно задачами.
Когда вы говорите, который превзойдет [человека], по этому поводу очень много страхов гуляет. Вот недавно появился в Америке доклад, его процитировали во всех мировых СМИ, по заказу Госдепа, что ужас-ужас может быть. То есть этот «сильный» ИИ может вообще всех уничтожить. Каким именно образом «сильный» ИИ, превосходящий человека, может быть опасен для человека? Если опасен, то чем?
Иван Оселедец: На самом деле, любой новый технологический рывок приводит к изменению того, как мы живем, взаимодействуем и так далее. И на мой личный взгляд, ничем эта история не опасна, но целиком абстрагироваться и жить точно так же, как будто его нет, тоже нельзя. Появление машины позволило нам быстрее перемещаться из одной точки в другую, но это не означает, что люди перестали бегать. Искусственный интеллект — это технология, которая разрабатывается людьми для того, чтобы помочь решать какие-то задачи. То есть, если она решает какую-то задачу лучше, чем человек, это что означает? Это означает, что человеку не надо этой задачей заниматься, у него освобождается время для чего-то другого. У него появляются новые возможности, это мультипликатор способностей человека. То есть надо об этом думать как об усилении возможностей. То есть представьте себе, что у вас может быть не два сотрудника, которым вы платите деньги, а сто. Что бы вы могли сделать в таких условиях, если у вас количество ресурсов гораздо больше? Поэтому тут бояться не надо, надо понимать, как использовать.
Когда вы сказали, что ваша цель научная — это создать такую модель ИИ, которая будет применима в разных областях как некая база с настройкой, я вспомнил сразу пример, который мне очень запомнился в силу его простоты, который привел главный по ИИ в «Яндексе» Александр Крайнов. Он рассказал про своего знакомого исследователя откуда-то из Азии, я сейчас не помню, который создал программу ИИ, которая стала обыгрывать лучших игроков не в шахматы, что давно уже достигнуто, а в игру го, которая считается гораздо более сложной и вариативной. И программа выигрывала, но она не могла на доске сама взять фигурку и подвинуть, или снять и убрать, или... я не знаю правил. И он спросил этого исследователя: а что же ты этому не научил? А тот сказал: вот на это потребовалось бы вычислительной мощности вообще на порядок больше, чем на саму игру го. Вывод, что, например, мы недооцениваем свою моторику, она ИИ не по плечу. Объясните этот феномен: может ли искусственный интеллект в полной мере превосходить человека или всегда это будет только какая-то область, в которой проще методом математических вычислений все сделать?
Иван Оселедец: Действительно, это сейчас очень сложная задача, которая не по плечу даже крупнейшим корпорациям с огромными ресурсами, например Google и так далее. Но я тут не вижу, что это какой-то абсолютно нерешаемый барьер. То есть то, что сейчас происходит, прямо в данный момент, что все пытаются научить моторике, — это действительно сложная задача, которую человек решает легко... Миллионы лет эволюции нам в помощь, а машине это тяжело, научить тяжело. Тот же, например, Сэм Альтман, гендиректор OpenAI, который основной драйвер всей этой истории в мире, говорил буквально несколько дней назад ровно то же самое, что моторика, роботы — это тяжело. Но это не означает, что невозможно. Понимаете, лет десять назад тяжело было отличить кошку от собаки. Машинным зрением. Говорили ровно то же самое — это невозможно, нужны миллионы долларов, нужны огромные вычислительные ресурсы. Прошло буквально несколько лет, и все смеются над этим.
А сейчас машинное зрение любого человека отличает, а не то что кошку от собаки.
Иван Оселедец: Да. Каждый человек в базе данных описывается 512 числами, 512 чисел однозначно отличают человека от миллиардов других.
Но вот, возвращаясь к моторике, извините, простой бытовой вывод. Значит, самые незаменимые роботами — парикмахеры, мастера маникюра и секретарши, которым нужно принести кофе в определенный кабинет, получается. Вот до этого дальше всего сейчас?
Иван Оселедец: До этого дальше всего, с одной стороны, с другой стороны — над этим сейчас все работают. А если над этим сейчас все работают, может быть, через полгода у нас будут такие роботы. Там вопрос в том, что они дорогие очень и себе может позволить их очень малое количество людей. Но давайте пождем чуть-чуть, и, может быть, через полгода мы будем говорить уже про то, что часть этих задач решена. Все развивается очень быстро.
ChatGPT от Сэма Альтмана, который ворвался в бытовую жизнь, с точки зрения развития технологий ИИ — это верхушка айсберга, просто понятная всем, или это действительно сейчас нечто, в чем накопленные технологии реализованы в максимальной степени? И именно на этой базе будет дальше «сильный» ИИ, который в разные стороны пойдет?
Иван Оселедец: Да, ChatGPT появился где-то полтора года назад, это прорыв. То есть с точки зрения исследователей в области ИИ, это было огромным сюрпризом. В том числе это очень хороший урок, что люди тихо работали над своими разработками и просто выкатили результат. А сейчас очень много вокруг новостей про то, что ИИ куда-то применен, но за этим не стоит на самом деле часто какой-то работающей истории. Вот это был пример, что люди работали-работали и действительно выявили модель. Если интересно, я могу коротко сказать, в чем состоит основная идея. Когда обучают эти модели, есть математика и есть то, на чем это учится. Если до этого просто показывали все тексты в интернете, говорят: ну, продолжай, вот у тебя кусочек текста, продолжай. И все это не развивалось. А оказалось, что, если вести диалог с человеком, то есть ты спрашиваешь, получаешь ответ, а дальше человек, ИИ-тренер, это целая профессия появилась, дает оценку ответу. И вот здесь оказалось, что не нужно каких-то миллиардов примеров, а достаточно несколько тысяч, чтобы сделать его гораздо умнее.
Но при этом этот человек его должен потренировать?
Иван Оселедец: Да. Но вот эти взаимодействия, эта информация гораздо более ценная, чем всю библиотеку заставить его прочитать, все книжки на свете. Это был ключевой шаг, как правильно готовить данные для обучения. Это совершенно удивительная вещь. Где-то за полгода примерно более-менее догнали ребят, и сейчас есть огромное количество моделей, ну не огромное, скажем, десятки моделей сравнимого качества, открытых в том числе.
И как-то да, за ChatGPT прямо сразу последовали «Яндекс» и «Сбер». Ну и как говорят продвинутые пользователи, ChatGPT-4 сейчас круче всех.
Иван Оселедец: Он сейчас, с одной стороны, круче всех, но несильно, там нет уже такой «вау»-разницы. ChatGPT относительно всех предыдущих моделей — небо и земля, а между ChatGPT-4 и другими моделями, которые работают с текстом и немножко с картинками, разница не такая критическая.
А все-таки это приближение через СhatGPT искусственного интеллекта к простому человеку, который ничего о нем не знает, а просто навострится с ним работать, ему надо правильные задачи ставить, иначе тоже не получится ничего, но ставишь ему правильную задачу — он делает. Это с точки зрения применения магистральное или, может быть, основное совсем другое? Мы знаем, что в медицине в анализе снимков и анализов применяются модели искусственного интеллекта, где-то еще в промышленности и так далее. Это игрушка — СhatGPT — или это и есть сердце сильного искусственного интеллекта?
Иван Оселедец: Есть то, что называется слабый искусственный интеллект. Это модель, которая может определять какое-то количество, если говорить про медицину, патологий на снимках, условно есть там ковид или нет. Да, узко она понимает. Если ей, например, придет какое-нибудь новое, неизвестное заболевание, она ничего сказать не сможет. Либо пропустит, либо как-то еще, в общем, ее надо постоянно дообучать. А подход, который заложен внутри СhatGPT, конечно, в этом смысле алгоритмически более тяжелый, вычислительно более тяжелый, но он существенно более перспективный как раз с точки зрения «сильного» искусственного интеллекта.
Он может обучаться уже чему угодно? Хочешь научить его разговаривать — научишь разговаривать, захочешь научить его считать, в какой момент семена пора сеять, он будет это делать?
Иван Оселедец: Да, и для этого не нужно огромное количество данных, то есть ему часто достаточно показать 100 примеров, и он уже суть улавливает.
А потом потренировать с тренером-специалистом?
Иван Оселедец: Да, ровно так и происходит. Понятно, что чем больше ты ему данных дашь, тем будет лучше, но это речь идет уже о каких-то процентах, даже долях процентов, а вот базовое качество достигается гораздо быстрее. То есть ты фактически объясняешь, и уже плюс-минус он начинает работать нормально. Ну то есть, например, нейросеть видит снимок и как настоящий врач-рентгенолог пишет описание того, что она видит. Сразу скажу, таких моделей пока не существует, но мы к этому идем. Это может быть не один снимок, а все предыдущие снимки, все анализы. А сейчас модель видит только снимок, она со снимком и работает. А может, у него по результатам анализа какие-то проблемы, и врач смотрит все в комплексе, настоящий врач, а разделять его на зрение, чтение и так далее довольно глупо, поэтому все идет к мультимодальности, то есть возможности понимать разные типы входных данных: и текст, и звук, и генетическую информацию, и так далее.
Давайте перейдем к бизнесу. У нас тут недавно правительство опубликовало данные, что мы чуть ли не в первой десятке. Извините, я говорю «чуть ли», потому что мне кажется, что у нас любят бежать с отчетами по применению искусственного интеллекта в реальных технологиях. Как на самом деле, в каких технологиях мы действительно применяем искусственный интеллект, с каким успехом, в чем это выражается?
Иван Оселедец: Наверное, не имеет смысла говорить про IT-компании, там просто 95% бизнеса завязано на те или иные технологии искусственного интеллекта. Вторые такие, если условно их рейтинговать, это банки. Вся наша финансовая сфера очень хорошо цифровизована, многие финансовые решения принимаются с использованием искусственного интеллекта, и минимизация участия человека напрямую влияет на финансовые показатели. Любой человек представляет собой там набор покупок, которые он совершал, из этой информации можно достать и информацию о здоровье человека. Вся жизнь превращается в вектор, и это связывается с предсказанием продолжительности жизни, можно даже это предсказывать. Активно работает производство, многие нефтегазовые компании используют это на разных этапах: при поиске полезных ископаемых, при оптимизации работы оператора. На самом деле, практически в любом бизнес-процессе тем или иным образом можно использовать технологии искусственного интеллекта. Отдельная тема — как выделять те бизнес-процессы, где это реально нужно, это только бизнес и может понять. Можно взять любой бизнес, любой бизнес-процесс, в любые компоненты можно внедрить либо искусственный интеллект, либо элементы искусственного интеллекта для того, чтобы либо повысить производительность, либо снизить издержки.
На ваш взгляд, проникновение программы искусственного интеллекта слабого, узкого, отраслевого у нас действительно повсеместное? Вы назвали в основном банки и нефтегазовые компании. Но и медицина, мы знаем, что в Москве был огромный эксперимент во время ковида, когда надо было делать много анализов.
Иван Оселедец: Медицина — это уникальная история. Тому, что сделано в московском эксперименте, можно только аплодировать. Там собраны, систематизированы протоколы, даны ответы на вопросы, которые в мире только обсуждают, по поводу рисков, этики, все это прямо протоколами зафиксировано. Тут мы очень далеко ушли, и я надеюсь, что не будем останавливаться в темпах развития.
А еще, или на этом пока список заканчивается? Знаете, у нас на портале BFM.ru много просмотров собрала новость о том, что сельскохозяйственные большие холдинги развивают искусственный интеллект и он очень поможет. Это правда?
Иван Оселедец: Потенциал там гигантский. Проблема состоит в том, что эти технологии новые и достаточно сложно убедить людей, которые много лет работали, даже не на уровне топ-менеджмента, а на уровне агрономов, чтобы они пользовались ИИ. Мы проводили лично опрос агрономов: чем вы пользуетесь? Они сказали, что пользуются прогнозом погоды. Все. Никакими другими умными средствами они не пользуются, потому что не видят в этом выгоды для себя.
Скажите, а в научных исследованиях и в опытно-конструкторских работах, при разработке новой техники, там, где люди что-то придумывают, искусственный интеллект реально применяется или нет в качестве помощника?
Иван Оселедец: Да. Об этом много говорят. В России очень много удачных примеров именно в такой опытно-конструкторской деятельности я так с разбегу привести не могу, обычно там все-таки используются классические методы моделирования, потому что самолеты рассчитывали 50-60 лет назад, и они неплохо работают. То есть использовать методы искусственного интеллекта там можно и нужно, но это как раз доработка «сильного» искусственного интеллекта для того, чтобы он работал конструктором.
А если бы он помогал конструкторам, хотя бы варианты просчитывал?
Иван Оселедец: Да, условно говоря, какую деталь мне использовать. Сейчас в таком виде это не умеет делать никто, потому что нужны хорошо подготовленные данные для обучения, а они находятся внутри. Мы сейчас работаем в этом направлении. Это сложный проект, то есть шаги технологические понятны, но нужны данные, нужны люди, нужны — самое главное — правильно поставленные задачи. То есть, условно говоря, что можно сделать, приведу простой пример. Можно сказать: нарисуй мне трехмерную машину, дизайн новой машины. Он рисует. Но если ты начинаешь ее крутить, на самом деле сконструировать такую машину невозможно, потому что она физически не будет держаться в таком виде. Нужно сгенерировать не красивую картинку, а полную конструктор-схему.
Для этого ее нужно научить всем элементам, всем возможным гайкам, материалам и так далее?
Иван Оселедец: Конечно, то есть дизайнер может нарисовать — я так вижу, инженер скажет, что это невозможно сделать. Это можно сделать на уровне больших моделей, но пока это еще не сделано.
Это не сделано у нас или это не сделано вообще?
Иван Оселедец: Это вообще не сделано.
А какие, помимо СhatGPT, самые яркие достижения искусственного интеллекта вы бы привели в мире, что он сделал то, чего до сих пор не могли сделать люди?
Иван Оселедец: Из известных примеров, если чуть-чуть отойти назад, действительно, очень много сделано в компании DeepMind Technologies, это компания Google. В частности, это предсказание новых лекарств, большой прогресс в предсказании свойств белков, языковые модели, про них уже говорилось. И, на самом деле, тут нет явных лидеров, есть крупные игроки, которые делают примерно одно и то же, и происходит непрерывный рост технологий. Таких историй, что ничего не было и появилось, их, может быть, один-два примера. Кроме ChatGPT, это, например, AlphaFold, которая предсказывает пространственную структуру белка. А в основном область двигается небольшими поступательными шагами, но так как там работает много народу, если посмотреть через несколько лет, окажется, что произошел большой прорыв, но этот прорыв состоит из ста маленьких шагов.
Известно, что программы искусственного интеллекта требуют определенного «железа» с большой вычислительной мощностью и для искусственного интеллекта для этих программ нужны определенных характеристик чипы. Вот что с этой стороны, и для нас в частности, в условиях санкций?
Иван Оселедец: Сейчас есть монополист, это тайваньская компания Nvidia, которая производит графические карты GPU, они их сейчас позиционируют как чипы для искусственного интеллекта — V100, A100, H100, вот недавно объявили B100. Они хороши тем, что, во-первых, для них написано огромное количество уже готового программного обеспечения, поэтому, если ты купил такой чип, у тебя код будет работать совершенно одинаково, то есть тебе не надо тратить время на переписывание низкоуровневого кода, и они очень мощные, то есть это основной путь. Понятно, что производственные мощности ограничены, есть санкции, и особо это никому не нравится, но присутствует эффект глобализации, что все вложились в одном направлении и теперь пожинают эти плоды. Тем не менее карточки есть, вычислительные мощности тоже есть, понятно, что их всегда не хватает. Алгоритмы так устроены, что, если тебе дадут в десять раз больше карточек, ты их загрузишь, это не значит, что у тебя алгоритмы будут в десять раз лучше, там не линейная связь. Есть ряд работ исследовательских, поисковых работ, направленных на создание альтернативных вычислительных систем.
Я знаю, что сейчас готовится учебник по искусственному интеллекту уже для школы. Вы в курсе? С какого класса? И, кстати, объясните на пальцах родителям, что будут проходить в этом учебнике по искусственному интеллекту?
Иван Оселедец: На мой взгляд, конечно, учебник — это очень важно. Но в первую очередь искусственный интеллект — это практическая работа. То есть учить теории искусственного интеллекта в виде учебника довольно бессмысленно. Целевая функция такого учебника — дать материал учителям для того, чтобы эти работы проводить. На русском действительно очень мало систематизированного материала, есть какие-то посты в интернете, какой-то перевод. На самом деле, что для школы, что для вузов никаких нормальных учебных материалов нет, а специалистов, которые могут качественно провести лекции, пока недостаточно. То есть идея, вся эта история для того, чтобы подготовить даже не сам учебник, а методические материалы: как, в каком порядке, что надо учить. А практические занятия могут проводить уже более-менее толковые семинаристы и так далее.
Ну, не чтобы практически научиться работать и создавать программы искусственного интеллекта, они ведь отличаются от простого программирования, потому что там уже другие принципы, а чтобы просто люди представляли вообще, что это. Мы же имеем представление, хотя не умеем лазить в мотор автомобиля, но хоть примерно представляем принципы его работы и даже, хоть и отдаленно, принципы работы компьютера, хотя бы про двоичный код что-то знаем. А про искусственный интеллект можно это объяснить и нужно ли?
Иван Оселедец: Там все равно есть какой-то набор базовых принципов. Ну совсем просто мы пытались читать лекции для школьников — пятый класс, шестой класс. В относительно специальных школах. Но попытка провалилась. Вот есть такое понятие — массив. Вот для меня как человека, которому много лет, понятно, что такое массив: это набор чисел, записанных подряд. А если не знать, что это такое, это просто формат хранения данных. Вот у вас картинка, картинку мы представляем, а в числах, как она записывается, как это все хранится, как с этим идет работа, как сохраняются данные в памяти компьютера, какие операции с ними применить, как это запрограммировать — это уже техническая вещь.
Получалось ли с кем-то в школе поставить им задачу, простую с точки зрения создания продукта для искусственного интеллекта, чтобы они справились?
Иван Оселедец: Да, такой пример есть. Мы брали школьников на стажировки, наверное, восьмой класс. Ребенок не знал базовых понятий, но он умел задавать вопросы. То есть он начинает что-то делать, говорит, мне непонятно, ему объясняешь, говорит — понятно.
А какие задачи?
Иван Оселедец: Задача была такая: были картинки, на которых написаны математические формулы, нужно было их оцифровать. То есть если раньше такая задача оцифровки требовала целой компании, например, ABBY, то сейчас легко это можно сделать с помощью как раз тех самых больших моделей. Не решать задачу, а переписывать ее в виде специальных текстовых символов, грубо говоря, распознать текст. Написан какой-то текст от руки, перевести его в текст, сделать такую модельку с нуля, чтобы она хорошо распознавала текст. В целом вроде бы задача сложная, у всех разный почерк. Оказывается, что все это разбивается на вполне понятные шаги, то есть сбор данных, обработка этих данных, сравнение. Не все шаги целиком, но большую часть шагов школьник успешно прошел.
Искусственный интеллект — это отдельная специальность в самом ближайшем будущем или это продолжение тех же, которые есть?
Иван Оселедец: Это междисциплинарная история. У нас в институте есть и физики, и биологи, и химики, мы работаем и с психологами.
С лингвистами наверняка?
Иван Оселедец: С лингвистами как раз нет. Оказалось, что, с точки зрения больших моделей неважно, на каком языке написан текст, он не сильно чувствителен. Это удивительная вещь, я лично не вижу необходимости в каком-то глубоком понимании лингвистических конструкций, за это могут меня поругать, но это факт.
В заключение я хочу к страшилкам вернуться, их, как всегда, много, когда что-то новое появляется. Искусственный интеллект поработит человека, подчинит и так далее. Вот еще раз, чего стоит бояться, где риски, скажите кратко.
Иван Оселедец: На мой взгляд, риски в том, что его будут использовать некомпетентные люди. Это мультипликатор способностей человека. Если способности человека отрицательные, то мультипликатор может их только усилить. Я приведу конкретный пример, это реальная история: сейчас много развернуто систем поддержки принятия решений, то есть окончательное решение принимает врач, нигде у нас решение не принимает программа. Но врач туда заносит анализы, программа выдает, например, рекомендацию, что это онкология. То есть врач должен в этот момент внимательно посмотреть тоже на серьезнейший диагноз. Если просто человеку сказать, что у него онкология, у него инфаркт может случиться. Тут нужно подумать, позвать коллегу, разобраться, чтобы он не пропустил. Искусственый интеллект может ошибаться в некоторых случаях, стопроцентной гарантии никто дать не может. А человек сказал: «Ну раз она сказала, значит, я пишу», потому что ему неохота было разбираться, написали и написали. Мне кажется, это основной риск.
То есть не то, что искусственный интеллект заимеет собственные желания и волю, а то, что он ограничит наш человеческий интеллект за ненадобностью?
Иван Оселедец: Конечно, и, более того, даст инструмент некомпетентным людям.