19 мая 2026 г.

Взросление ИИ: от галлюцинаций до агентов

Аналитическое эссе об эпохе искусственного интеллекта

Взросление ИИ: от галлюцинаций до агентов

Роман З., аналитик венчурного рынка в Raison


Четыре года назад ChatGPT вышел в публичный доступ. Тогда у всех было два главных вопроса об ИИ: почему он так часто ошибается, и не заменит ли он нас? В 2026 году мы знаем, как на них ответить.

Введение

В последние несколько лет человечество проходит через техническую революцию: в нашу жизнь пришел искусственный интеллект. И, как многие технологии до него, ИИ был встречен неоднозначно.

В 2022 году в публичный доступ вышла ChatGPT. Уже первая версия умела отвечать на вопросы, писать код и тексты, помогать в исследованиях. Сейчас всё это кажется привычным — нейросети справляются с такими задачами на высоком уровне. Но в 2022-м их компетентность давала весомые поводы для скептицизма.

Иллюстрация: ChatGPT (OpenAI)

Медиа того времени хорошо иллюстрируют двойственность момента. The New York Times и The Guardian писали примерно об одном и том же: машина, которая умеет поддерживать человекоподобный разговор, — это впечатляет. Но она же может убедительно нести откровенную чепуху.

С простыми задачами ChatGPT справлялся хорошо, но сложными — плохо. Особенно наглядно это проявилось в программировании: нейросеть генерировала настолько много ошибочных решений, что администрация Stack Overflow, главного IT-форума мира, запретила публиковать ответы, написанные ИИ. Но даже тогда было понятно: потенциал у технологии огромный.

NYT тогда написали, что возможные последствия ChatGPT для общества слишком масштабны, чтобы уместить их в одну колонку. Одни говорили, что это начало конца для всех профессий, связанных с умственным трудом. Другие — что через год про это забудут.

Прошло четыре года. Оба лагеря ошиблись, и оба оказались правы. Разберем по порядку.

Глава 1. ИИ справляется

Главным препятствием для нейросетей всегда было качество ответов. Первые версии страдали от галлюцинаций — явления, при котором модель генерирует уверенно звучащий, но фактически ошибочный текст.

Технология не стояла на месте. Новые методы обучения, цепочки размышлений, более чистые датасеты, взаимодействие с пользователями и другими нейросетями — все это дало огромный толчок в развитии. Публичный лидерборд по галлюцинациям наглядно показывает разрыв между поколениями моделей. GPT-o3-pro, флагман своего времени, давал около 23% галлюцинаций. ChatGPT 5.4-nano, более компактная модель текущего поколения, — 3,4%. Если раньше каждый четвертый ответ содержал фактические ошибки, то теперь — каждый двадцать девятый.

Параллельно решалась другая проблема — взаимодействие с внешним миром. В 2022-м существовало только окно чата. Если нужно было, например, найти что-то в базе данных, человек должен был сам знать про SQL, самостоятельно получить подключение к базе данных, понимать структуру и уметь объяснить задачу нейросети достаточно точно. Экономия от написания кода ИИ при таком раскладе могла оказаться минимальной.

Иллюстрация: Claude (Anthropic)

Теперь наступила эпоха агентского ИИ. Появились протоколы вроде MCP (Model Context Protocol — стандарт, позволяющий ИИ-агентам подключаться к внешним сервисам, базам данных и инструментам без участия человека), компании доработали свои процессы и ПО с учетом возможностей интеграции. Результат: бизнес-аналитик может даже не знать, что находится «под капотом» системы. Он просто формулирует запрос — и агент сам подтягивает данные, проводит первичный анализ, рисует графики и компонует презентацию.

Наиболее ярко это проявляется в программировании. ИИ теперь способен самостоятельно анализировать, редактировать и писать код в масштабах целых проектов, автоматически создавать pull-запросы на GitHub. Это породило неожиданную проблему: таких запросов стало так много, что разработчики open-source проектов физически не могут просматривать их все.

Об этом подробно пишет Джефф Гирлинг, известный open-source разработчик и автор одного из популярных YouTube-каналов об инфраструктуре и DevOps. Значительная часть потока AI-сгенерированных pull-запросов — это «слоп» (англ. slop — помои): программирование стало доступно людям, которые не умеют нормально формулировать задачи.

При этом экономические последствия галлюцинаций по-прежнему реальны. Fourdots считают потери только от фактчека за ИИ — и цифры немаленькие. Ошибки в коде, сгенерированном нейросетью, обходятся в не считанные часы дебага.

ИИ все еще нуждается в человеке для постановки задач. Но после написания качественного промта можно просто наблюдать, как агент за минуты делает то, на что у инженера раньше уходили часы. Блогер-программист Teo.gg подробно разбирает, как именно изменился software engineering — советуем смотреть с 20-й минуты.

Программирование стало доступно людям, которые не умеют правильно ставить задачи.

Особняком стоит история с безопасностью. Anthropic анонсировала модель Claude Mythos, специализирующуюся на коде и кибербезопасности, — но не ее выход в открытый доступ, а решение его отложить. В рамках проекта Glasswing выяснилось, что модель настолько эффективна в поиске и эксплуатации уязвимостей, что Anthropic решила для начала представить ее лишь небольшому кругу доверенных компаний: те должны успеть защитить свою инфраструктуру раньше, чем эти же техники возьмут на вооружение хакеры.

И форум Stack Overflow, кстати, теперь на грани закрытия. Его вытеснили нейросети.

Глава 2. Нас не заменят

Итак, ИИ становится точнее и лучше взаимодействует с внешним миром. Когда он начнет отнимать рабочие места?

Изображение: Gemini (Google)

MIT (Massachusetts Institute of Technology) недавно провел масштабное исследование о том, какую долю специалистов способен заменить ИИ. Задача оказалась непростой: рабочие места очень разные. Если считать только те вакансии, которые ИИ может заменить полностью, картина выглядит неожиданно скромно — около 2% рынка труда США.

Исследователи пошли дальше. Используя официальный реестр Бюро трудовой статистики, они разбили вакансии по навыкам — с учетом сложности и востребованности каждого. Затем составили список навыков, которые ИИ уже умеет выполнять, и наложили один набор данных на другой.

Результат получил название Iceberg Index. Полностью заменимые ИИ вакансии — лишь верхушка айсберга. Если считать частичную замену, под воздействие ИИ попадает до 11% рынка труда. Препринт исследования доступен на ResearchGate, а Economics Explained разбирают его доступным языком.

Важно понимать цель такого исследования. Это не попытка напугать безработицей. Всем участникам рынка нужно понимать, куда и как движется ИИ. Будущим выпускникам — чтобы выбирать предметы осознанно. Руководителям — чтобы не гнаться за увольнениями, а грамотно внедрять ИИ там, где он действительно усиливает команду. Самим ИИ-компаниям — чтобы понимать, к каким задачам готовить модели.

Всем участникам рынка нужно понимать, куда и как движется ИИ

Вывод исследования совпадает с тем, что витает в воздухе нашего времени: ИИ нас не заменит, а скорее дополнит. Список навыков ИИ будет расширяться, но вакансии будут сокращаться не в той же пропорции. Гораздо большая часть работы просто хорошо дополняется нейросетями: они освобождают сотрудников от рутины и позволяют успевать больше за то же время.

Технология наступает, но пока не на нас

В начале этого текста я обозначил два тезиса, которые доминировали в 2022 году: «ИИ не справляется с задачами, хотя потенциал есть» и «ИИ скоро заменит белых воротничков, нас ждет безработица». Оба звучат пессимистично. Но если посмотреть на них вместе, в контексте 2026 года, — они скорее дают повод для оптимизма.

ИИ нас не заменит, а скорее дополнит

Да, ИИ изменил мир, и куда большим числом способов, чем можно уместить в одну статью. Да, он влияет на рынок труда. Но не столько заменяя людей, сколько дополняя их. Это все равно отражается на найме: опытные сотрудники теперь справляются с большим объемом работы, и потребность в новых людях снижается. Но ИИ здесь далеко не единственная причина, а молодым, как правило, проще освоить новую технологию.

Да, ИИ пока несовершенен. Самые важные решения ему доверить нельзя. Но его возможности будут активно расти — и в хорошем, и в пугающем направлении.

Двойственность из дискурса об ИИ никуда не делась, она просто повзрослела. Мы больше не шутим над тем, что нейросеть несет бред. Теперь она оказывает давление на рынок труда и на котировки акций. Один человек с помощью нейросети способен качественно решать за неделю больше важных задач, чем когда-либо раньше — и это только начало.

*Иллюстрации созданы тремя разными нейросетями по единому промту, чтобы посмотреть, как каждая интерпретирует одно и то же задание.

**Эта статья написана при помощи Gemini и Claude.

Была ли эта статья полезной?
215 просмотров
ПОДЕЛИТЬСЯ:

Начать

Мы отправим вам сообщение со ссылкой для скачивания приложения.