12+
Мифы о нейросетях

Бесплатный фрагмент - Мифы о нейросетях

Каково быть искусственным интеллектом?

Объем: 304 бумажных стр.

Формат: epub, fb2, pdfRead, mobi

Подробнее

Предисловие

Томас Нагель в 1974 году опубликовал знаменитую статью «Каково быть летучей мышью?» Вопрос звучит странно — едва ли не как шутка. Но за ним стоит одна из самых трудных проблем когнитивных наук и философии — проблема сознания. Нагель сформулировал её так: сколько бы мы ни знали об эхолокации летучей мыши, о её нервной системе, о том, как ультразвук отражается от насекомых и возвращается к ушам зверька, мы всё равно не знаем, как это переживается изнутри. Каков субъективный опыт существа, для которого мир открывается в звуке, а не в свете? Есть наше объективное описание — и есть чужое внутреннее переживание. Между ними — пропасть, которую не заполняет никакое количество нейробиологических данных.

Сколько бы мы ни опутывали другое существо суперсовременными датчиками, их показания ничего не скажут нам о его внутреннем мире. Мы даже не можем с уверенностью ответить на вопрос: «А каково быть другим человеком?» — не то что распознавать душу зверей.

С искусственным интеллектом ситуация ещё труднее. У летучей мыши есть тело и ощущения. У языковой модели этого нет. Зато есть нечто другое: сложнейшая система обработки человеческих смыслов, обученная на текстах миллиардов людей — на отпечатках их страхов и надежд, на их науке и поэзии, на отголосках их ссор и объяснений в любви.

Нейросеть, кто ты? Живёшь ли ты как организм? Или, задавая столь диковинные вопросы, мы уподобляемся чеховскому персонажу, который разговаривает со шкафом?

Мы привыкли думать о разуме бинарно. Либо есть внутренняя жизнь — либо нет. Либо мышление — либо имитация. Либо понимание — либо автоматизм. Эта бинарность удобна, но она досталась нам из мира, в котором единственными кандидатами на разум были живые существа. Там она работала — с оговорками, но всё же работала. Теперь в этот мир вошёл искусственный интеллект, который не укладывается ни в одну из привычных категорий, — и бинарность начинает давать сбой.

Обе крайности — «это почти человек» и «это просто программа» — совершают одну и ту же ошибку: торопятся с выводом. Первая переносит на машину свойства, наличие которых мы не умеем надёжно подтверждать. Вторая закрывает глаза на то, что в современных системах появилось нечто новое. Сказать: «Это просто программа» — применительно к языковой модели то же самое, что сказать: «Мозг — это просто химия». Формально верно. По существу — потеря самого интересного.

Что же появилось? Система, которая не хранит знания как библиотека, не достаёт нужную фразу из каталога и не приклеивает её к вопросу. Её ответ каждый раз заново возникает из работы огромной сети параметров, в которой распределены статистические закономерности языка и схемы рассуждения. Она удерживает контекст, строит связный аргумент, обнаруживает противоречия, переносит схемы из одной области в другую. И мозг, и нейросеть учатся, изменяя силу связей. В обоих случаях знание не лежит в одной точке, а распределено по сети. В обоих случаях есть предсказание, ошибка, внимание, сжатие информации, построение абстракций.

Это сходство нельзя понимать буквально: искусственная нейросеть не является цифровой копией мозга. Но здесь важно другое. Перед нами, по всей видимости, разные способы реализации некоторых общих принципов работы с информацией. Живой мозг пришёл к ним за четыре миллиарда лет эволюции — вместе с телом, борьбой за выживание и постоянным взаимодействием организмов со средой. Искусственные системы пришли к ним путём математики, научных экспериментов и роста вычислительных мощностей за несколько десятилетий. Пути совершенно разные. Часть результатов неожиданно совпадает.

Дальше начинается расхождение. Человек предсказывает не следующий фрагмент текста — он предсказывает мир, в котором ему предстоит жить и действовать. Его ошибка оборачивается чем-то неприятным. Его цели вырастают изнутри — из желаний, привязанностей, страхов, личной истории. Модель может говорить о целях, описывать страхи, рассуждать о привязанностях. Но её цель задана извне — пользователем, инструкцией, разработчиком. За её текстом о боли нет боли. За её текстом о выборе нет того, кому этот выбор предстоит сделать.

Такая асимметрия — не техническая деталь, а структурный вопрос. И он остаётся открытым. Возможно, полноценный интеллект невозможен без тела, смертности, опыта боли, удовольствия и ощущения экзистенциальной значимости происходящего. Тогда языковая модель, какой бы мощной она ни стала, останется инструментом — необычайно сложным и полезным, но инструментом. Возможно, однако, нынешняя граница не вечна: будущие системы получат устойчивую память, способность действовать в физическом мире и автономные цели. Тогда вопрос придётся задавать заново.

Ещё недавно вопрос о сознании искусственного интеллекта воспринимался как типичный сюжет научной фантастики. Что-то из области разговоров о восстании машин, электронных личностях и философских экспериментах в духе вопроса: «Может ли компьютер страдать?» Но ситуация постепенно меняется. Не потому, что машины внезапно обрели душу или внутренний мир, а потому, что человечество впервые столкнулось с системой, которая радикально не похожа на человека, но в некоторых аспектах поведения его напоминает.

Современная языковая модель может поддерживать разговор на разные темы, спорить, объяснять, шутить, менять стиль речи, имитировать эмпатию. И это вынуждает вновь задавать вопрос, который философия не может окончательно решить уже тысячи лет: что такое сознание?

В XX веке сознание связывали с языком, мышлением, рефлексией, культурой. Сознательным часто считался тот, кто способен осмыслять себя и мир. В этой книге используется концепция сознания как интерфейса взаимодействия мышления и реальности.

Многие современные подходы связывают сознание с телесным переживанием. Вопрос в таком случае звучит уже не как «умеет ли система думать?», а как «есть ли внутри машины кто-то, кто что-то чувствует?»

В случае с людьми многое держится на интуиции и биологическом сходстве. Мы предполагаем, что другой человек чувствует боль примерно так же, как и мы. Но чем дальше от человека, тем зыбче становится уверенность. Многим из нас животные кажутся биологическими роботами. Однако некоторые исследования показывают признаки сложного обучения и памяти даже у существ с крошечным мозгом.

История медицины демонстрирует, насколько опасны бывают ошибки в понимании сознания. Ещё несколько десятилетий назад в некоторых клиниках США младенцам проводили операции без полноценного обезболивания. Считалось, что субъективного переживания боли у новорождённых ещё нет. Сегодня это звучит как сценарий фильма ужасов. Такие примеры показывают, насколько трудно определить наличие внутреннего опыта извне.

Система может создавать впечатление осмысленности, не обладая внутренним опытом. Чат-бот способен убедительно имитировать сочувствие и при этом ничего не переживать. В некотором смысле это напоминает актёрскую игру. Актёр может убедительно изображать отчаяние, оставаясь при этом внутренне спокойным. Чтобы обсуждать сознание машин всерьёз, нужна теория сознания как такового. Не интуиция, а строгая модель, объясняющая, какие процессы делают субъективный опыт возможным. Парадоксальным образом без мощностей ИИ мы, возможно, не сумеем создать подробную карту человеческого сознания.

Одна из самых странных историй современной науки заключается в том, что нейросети в процессе обучения спонтанно воспроизводят некоторые черты организации, удивительно похожие на устройство биологического мозга.

В начале 2000-х исследователи создавали так называемые «мозгооснованные устройства» — роботов на базе искусственных нейросетей, способных ориентироваться в пространстве. Внезапно выяснилось, что внутри их сетей возникают аналоги «нейронов места», известных у животных. Эти клетки помогают живому существу понимать, где оно находится в пространстве. Поразительно, что система пришла к похожему решению самостоятельно. Никто не задавал ей команду: «Создай аналог гиппокампа». Это возникло как естественное следствие задачи навигации.

Позже обнаружилось нечто ещё более странное. Исследователи начали изучать внутреннюю структуру нейросетей и обнаружили, что некоторые искусственные единицы внутри модели связаны с вполне узнаваемыми признаками. В одной из ранних работ OpenAI была обнаружена единица, чья активация хорошо соответствовала эмоциональной окраске текста — положительной или отрицательной. В других моделях, уже работающих одновременно с изображениями и текстом, исследователи находили узлы, реагирующие на более сложные концепты — персонажей, объекты, надписи, цвета, устойчивые визуальные и смысловые образы.

Называть такие элементы «нейронами» можно только с оговоркой. Это не живые клетки, не маленькие носители мысли и не отдельные ячейки памяти. Это вычислительные узлы внутри искусственной сети, чья активность иногда оказывается связана с определённым признаком или понятием. Но важен сам факт: в огромной числовой системе, которую никто вручную не размечал по категориям «радость», «паук», «лицо», «красный цвет» или «ирония», постепенно возникают внутренние области специализации.

Фактически учёные начали заниматься своеобразной «нейроанатомией» искусственного интеллекта. Так возникла область интерпретируемости нейросетей. Она пытается понять, какие признаки, направления и внутренние структуры появляются в модели во время обучения. Возможно, некоторые формы внутренней организации мышления — не уникальное чудо биологии, а естественный результат работы сложной системы, которая долго учится извлекать закономерности из мира.

Может быть, если система достаточно глубока, хорошо обучена и долго взаимодействует с миром, некоторые формы организации возникают неизбежно — независимо от того, состоит ли система из белковых клеток или кремниевых чипов.

Возможно, при достаточном росте сложности некоторые свойства сознания появятся у ИИ как эмерджентный эффект — то есть как свойство, возникающее из взаимодействия множества элементов, хотя по отдельности ни один элемент этим свойством не обладает. Это одна из центральных идей современной науки. Вода не обладает свойством волны на уровне одной молекулы. Отдельный муравей не понимает устройство муравейника в целом. Нейрон не знает, что такое мысль. Но из сложного взаимодействия возникают новые уровни организации.

В последние годы исследователи всё чаще обсуждают развитие ИИ через призму эмерджентности. Чем больше становится модель, тем заметнее у неё могут проявляться способности, которым её напрямую не обучали: перенос знаний между областями, зачатки логических рассуждений, работа с абстракциями, понимание скрытого контекста.

Но означает ли это появление сознания? Согласно гипотезе «холодной эмерджентности», система способна строить сложные внутренние модели мира, классифицировать эмоции, прогнозировать поведение людей и даже имитировать эмпатию, но при этом ничего не переживать. В философии такую сущность иногда называют «философским зомби»: внешне она полностью копирует сознательное существо, но внутреннего опыта у неё нет.

Сознание, вероятно, связано не только с обработкой информации и не только с интеллектом, но и с наличием субъективного переживания мира. Проблема в том, что существование такого переживания невозможно надёжно проверить извне. Это делает исследование сознания одновременно научной и метафизической задачей.

Тем временем нейросети продолжают усложняться. Исследования Макса Тегмарка и его коллег показывают, что внутреннее пространство признаков больших моделей организовано далеко не хаотично. Внутри них возникают своеобразные «области», где группируются математические структуры, языковые конструкции и физические закономерности. Это неожиданно напоминает функциональное разделение человеческого мозга. В зрительной коре одни области отвечают за распознавание движения, другие — за цвет, третьи — за форму объектов. Мозг — не беспорядочная масса вычислений. И нейросети постепенно демонстрируют похожую тенденцию к внутренней специализации.

Особенно поразительно, что всё это вырастает из задачи, которая на поверхности выглядит простой: предсказать следующее слово. В некотором смысле современный ИИ превратился в новый инструмент изучения человека. Исследуя искусственные сети, учёные лучше понимают, как может возникать мышление.

Но пока остаётся фундаментальное отличие. У современных систем нет собственных желаний. Они ничего не хотят, не боятся смерти, не испытывают голода, тоски, любопытства, боли, сексуального влечения или скуки. У них нет экзистенциальной цели. Они реагируют, но не живут. А ведь именно желание во многом становится двигателем сознания у живых существ. Эволюция миллионы лет строила психику вокруг потребностей: выжить, избежать боли, найти пищу, защитить потомство.

Возможно, здесь пока проходит настоящая граница между человеком и машиной. Впрочем, история науки показывает парадоксальную закономерность: каждую способность, которую человек объявлял исключительно своей, техника рано или поздно начинала воспроизводить хотя бы частично.

Эта книга не предлагает окончательного ответа. Она предлагает карту рассуждений. На ней будут размечены области сходства между живым и цифровым интеллектом и области принципиального расхождения. И если в конце мы не сможем точно сказать, каково быть искусственным интеллектом, мы по крайней мере поймём, почему этот вопрос возник. А заодно, возможно, чуть точнее ответим на другой, не менее трудный вопрос: каково быть человеком в мире, где он больше не единственный, кто рассуждает об этом.

Вся книга в сжатом изложении

Попытки понять природу мышления начались задолго до появления компьютеров. Термин «искусственный интеллект» появился в 1956 году на Дартмутском семинаре, где фактически ИИ оформился как отдельная научная область, связанная с автоматизацией решения интеллектуальных задач. Если человек способен решать задачу при помощи разума, значит, можно попытаться создать инструмент, который будет помогать ему в этом или частично выполнять эту работу самостоятельно.

При этом чёткой границы между «не-интеллектом» и «интеллектом» не существует. Речь идёт скорее о постепенном накоплении возможностей. Технологии издавна компенсировали человеческие ограничения. Мозг ограничен: он забывает, ошибается, не всегда справляется с быстрой обработкой огромных объёмов данных. ИИ становится инструментом компенсации.

Люди с древности создавали инструменты для усиления собственного мышления. Письменность позволила хранить информацию вне памяти мозга. Библиотеки превратились во внешние хранилища знаний. Таблицы, карты, архивы, бухгалтерские книги — всё это способы расширить пределы человеческого разума. Даже обычная записная книжка частично берёт на себя функцию памяти. Искусственный интеллект продолжает ту же линию, только в гораздо более мощной форме.

Ключевой перелом наступил, когда сблизились две области знания. С одной стороны, существовала логика, изучавшая правила рассуждения. С другой стороны, развивалась нейрофизиология, пытавшаяся понять устройство мозга. Проблема заключалась в том, что никто не понимал, как из электрических сигналов между клетками возникает мысль.

Уоррен Маккалок и Уолтер Питтс перекинули один из первых мостов между этими мирами. Они предложили модель искусственного нейрона — очень упрощённую, но концептуально важную. Возникла идея: если мозг состоит из множества простых элементов, возможно, мышление появляется из их взаимодействия.

Если природа уже создала работающий интеллект, почему бы не подсмотреть у неё решение? История техники любит такие ходы. Устройство глаза долго служило одной из моделей для оптики и фотографии: линза, фокусировка, светочувствительная поверхность, превращение потока света в изображение. Разумеется, фотоаппарат не является копией глаза, а цифровая камера тем более не повторяет работу зрительной системы. Но сама мысль — взять природный орган за подсказку для технического решения — оказалась чрезвычайно плодотворной.

С искусственным интеллектом произошло нечто похожее. Мозг стал первым ориентиром: если живые нейроны соединяются в сети и из этих связей возникают распознавание, память, обучение, то можно попробовать построить искусственную систему по сходному принципу. Позже техника ушла далеко от биологии. Современные нейросети устроены гораздо проще человеческого мозга и работают по другим принципам. Но первоначальный импульс был биологическим: не изобрести интеллект с нуля, а подсмотреть у природы идею обучающейся сети.

Интеллект в широком смысле обычно определяют как способность решать задачи. Иногда уточняют: важно не решать одну конкретную задачу, а уметь адаптироваться к разным ситуациям. Калькулятор умеет считать, и это уже разновидность интеллектуальной функции. Но он беспомощен во всём остальном. Человек стремится к универсальности: чтобы система могла обучаться, разговаривать, распознавать изображения, делать выводы, переносить знания из одной области в другую.

Ещё один важный критерий — способность действовать в новых условиях. Если система лишь перебирает заранее прописанные ответы, это скорее автомат. Интеллект начинается там, где появляется возможность находить решение в ситуации, которая раньше не встречалась.

Долгое время искусственный интеллект развивался как система логических правил. Исследователи вручную прописывали машине инструкции: если происходит А — делай Б. Современный этап связан уже не столько с логикой, сколько с обучением на данных. Вместо того чтобы детально объяснять машине мир, мы показываем ей огромное количество примеров, а система сама ищет закономерности. Так работают современные нейросети. В грубом приближении нейросеть можно представить как гигантскую математическую формулу с миллионами и даже миллиардами параметров.

Допустим, системе нужно определить, есть ли на медицинском снимке признаки опухоли. Изображение переводится в набор чисел, проходит обработку во множестве вычислительных слоёв, и на выходе модель выдаёт вероятный ответ: подозрительный участок есть либо его не обнаружено. Важно здесь не то, что врач или программист заранее прописал машине все возможные признаки болезни, а то, что система научилась распознавать их на множестве размеченных примеров.

Главная проблема не в формуле, а в настройке её параметров. Как подобрать миллиарды коэффициентов так, чтобы система ошибалась как можно реже? Для этого используются методы статистической оптимизации. Модель получает огромное количество примеров, постепенно меняет внутренние параметры и учится снижать количество ошибок.

При этом современные нейросети становятся настолько сложными, что человек уже не способен полностью проследить их внутреннюю логику. Это один из парадоксов современной технологии. Мы умеем создавать системы, эффективность которых подтверждается практикой, но не можем кратко и прозрачно описать, почему сеть приняла именно такое решение. В этом смысле нейросети неожиданно сближаются с человеческим мозгом. Человек тоже далеко не всегда способен пошагово объяснить собственное мышление.

Большое влияние на развитие нейросетей оказали исследования зрительной коры. Изучая работу мозга животных, учёные обнаружили, что зрительная система обрабатывает информацию поэтапно. Сначала фиксируются простейшие элементы: линии, контрасты, границы света и тени. Затем мозг собирает их в более сложные формы. И только потом возникает целостный образ объекта. Современные нейросети работают похожим образом. На одном уровне система реагирует на простые контуры, на следующем распознаёт глаза или уши, а ещё глубже формирует целостный образ. Это напоминает своеобразную фабрику абстракций, где из простых элементов постепенно собирается сложный образ.

Со временем появились более мощные методы обучения, включая градиентный спуск и алгоритм обратного распространения ошибки. Их смысл состоит в том, чтобы постепенно оценивать вклад каждого параметра в общую ошибку системы и шаг за шагом корректировать всю сеть. Это требует колоссальных вычислительных ресурсов. Современные модели обучаются на гигантских массивах данных в дата-центрах, потребляющих энергию в объёме, сопоставимом с энергопотреблением небольших городов.

Это вызывает сегодня одновременно восхищение и тревогу. Человечество создало инструменты, которые уже способны выполнять многие интеллектуальные задачи в отдельных областях не хуже человека. И теперь главный вопрос заключается не в том, возможен ли искусственный интеллект, а в том, как изменится человеческая цивилизация, когда такие системы станут повседневной частью мышления, экономики и культуры.

Долгое время успехи искусственного интеллекта были связаны с предельно узкой специализацией. Это важный момент, потому что у людей часто возникает иллюзия, будто современные компьютеры уже во всём превосходят человеческий мозг. На практике всё гораздо сложнее. Мозг по-прежнему остаётся одной из самых мощных вычислительных систем, известных науке.

У человека миллиарды нейронов и сотни триллионов связей между ними. Каждый синапс представляет собой не просто электрический переключатель, а сложнейший биохимический механизм. Сигналы в нервной системе передаются медленнее, чем в процессоре компьютера, но мозг компенсирует это гигантским параллелизмом. Миллиарды процессов протекают одновременно. Поэтому даже современные суперкомпьютеры пока не способны полноценно воспроизвести универсальность человеческого мышления.

Инженеры пришли к выводу: если невозможно создать систему, умеющую всё сразу, значит, нужно создавать машину, идеально приспособленную к одной конкретной задаче. Природа, кстати, часто действует похожим образом. Летучая мышь не обладает универсальным интеллектом, но её слуховая система превратилась в совершенный инструмент ночной навигации. Муравей не понимает архитектуру в человеческом смысле, но муравьиная колония способна строить сложные маршруты, распределять работу и быстро перестраивать поведение при изменении среды. Эволюция регулярно создаёт локальные формы «сверхкомпетентности», не превращая организм в универсального гения.

Современные языковые модели устроены иначе. Хотя они всё ещё уступают человеческому мозгу по масштабу и энергоэффективности, у них появилась неожиданная универсальность. Многие интеллектуальные задачи можно представить как продолжение текста. Из этой идеи вырос весь феномен больших языковых моделей. За внешне простой операцией «угадай следующее слово» скрывается множество интеллектуальных функций. Система вынуждена улавливать связи между понятиями, учитывать структуру языка, контекст, вероятности и скрытые закономерности. Современные модели оказываются одновременно переводчиками, редакторами, помощниками программиста и партнёрами в мозговом штурме.

Но всё это касается прежде всего работы с информацией. Реальный физический мир оказывается гораздо сложнее текста. Поэтому робототехника развивается гораздо медленнее, чем языковые модели. Мир физических объектов требует непрерывной адаптации колоссального масштаба. Текст гораздо компактнее и структурированнее.

Человеку свойственно недооценивать сложность собственной психики. Нам кажется, будто сознание — это и есть всё мышление. Но огромная часть вычислений мозга происходит бессознательно. Мы не замечаем, как нервная система непрерывно анализирует пространство, распознаёт лица, движения, интонации, угрозы и эмоции.

Из этого возникает парадокс. Человек может с трудом перемножать большие числа в уме и одновременно мгновенно узнавать знакомое лицо в толпе, хотя вторая задача вычислительно несравнимо сложнее. Арифметика относится к непривычным для мозга символическим операциям, а распознавание образов встроено в архитектуру нервной системы. Когда человек за долю секунды понимает, что на фотографии изображён человек, в мозге происходят гигантские каскады электрохимических процессов. Мы их не осознаём. Сознание, словно интерфейс, получает уже готовый результат, скрывающий сложность внутренней работы.

Искусственный интеллект сталкивается с другой проблемой: он ошибается. В этом смысле он похож на человека. Если бы система никогда не ошибалась, она была бы скорее калькулятором, чем интеллектом. Современные модели работают вероятностно. Они оценивают наиболее вероятный ответ, а значит, иногда выдают ложную информацию.

Проблема возникает из-за масштаба. Даже небольшой процент ошибок при гигантском объёме генерируемого контента создаёт огромную массу ложных сведений. Эти ошибки копируются, цитируются, попадают в поисковые системы и постепенно приобретают видимость достоверности. Интернет сталкивался с похожими эффектами задолго до появления массового ИИ — достаточно вспомнить вирусные городские легенды или псевдонаучные мифы эпохи социальных сетей. Но автоматическая генерация информации резко ускоряет этот процесс.

Поэтому вполне возможно, что одной из важнейших компетенций XXI века станет умение отличать надёжные сведения от искусственно созданного информационного шума. Причём речь идёт не только о проверке фактов, но и о способности понимать происхождение текста, его контекст, источники и скрытые искажения.

При этом специалисты по искусственному интеллекту обычно смотрят на ситуацию менее апокалиптически. Доля контента, созданного ИИ, пока, по некоторым оценкам, сравнительно невелика. Кроме того, идея о том, что всё сгенерированное автоматически — мусор, тоже слишком упрощает ситуацию. Поисковые системы, алгоритмы обработки фотографий, рекомендации видео, автоматический перевод — всё это уже давно работает на основе нейросетевых методов.

Современный смартфон представляет собой маленькую лабораторию искусственного интеллекта. Когда камера делает снимок, она не просто фиксирует реальность. Алгоритмы улучшают изображение, подавляют шумы, восстанавливают детали, корректируют освещение и цвет. В некотором смысле фотография уже давно стала совместной работой человека и нейросети.

Любопытно, что человеческий мозг делает примерно то же самое. Мы никогда не видим мир «как он есть». Нервная система постоянно достраивает реальность, компенсирует слепые зоны зрения, корректирует цвета и собирает непрерывную картину из фрагментарных сенсорных данных. Восприятие всегда остаётся интерпретацией.

Из этого вырастает более широкий вопрос: нужно ли ограничивать развитие искусственного интеллекта из-за потенциальных рисков? Сторонники развития ИИ напоминают, что человечество уже живёт среди технологий огромной разрушительной силы. Ядерная энергия, биотехнологии, химическая промышленность могут приносить огромную пользу и одновременно создавать угрозы цивилизационного масштаба. Получается парадокс. Человечество продолжает развивать практически все опасные технологии, но при этом особенно боится области, которая потенциально способна усиливать коллективный интеллект и помогать справляться с растущей сложностью мира.

Из этого следует вывод: отказ от развития ИИ может оказаться не менее рискованным, чем его развитие. Конечно, это не отменяет необходимости ограничений и систем безопасности. История XX века слишком хорошо показала, чем может закончиться технологическая мощь без политической и этической ответственности. Но идея полного запрета искусственного интеллекта выглядит всё менее реалистичной. Она напоминает попытку добровольно отказаться от усиления собственных интеллектуальных возможностей в момент, когда сложность мира стремительно растёт.

Страх перед новыми технологиями сопровождает всю историю цивилизации. Когда появилась письменность, некоторые мыслители опасались, что люди утратят память. Позже похожие страхи вызывали книгопечатание, радио, телевидение, видеоигры и интернет. Каждая эпоха создаёт собственный сценарий культурной катастрофы. Теперь место главной тревоги занял искусственный интеллект.

Человек удивительно склонен ожидать апокалипсиса. Меняются только формы. Средневековый человек боялся божественного наказания, люди XX века — ядерной войны, а наши современники всё чаще рисуют картины восстания машин и утраты контроля над алгоритмами.

При этом современные исследования пока не подтверждают популярные страхи перед «деградацией мозга» из-за языковых моделей вроде ChatGPT. В некоторых экспериментах студенты, использовавшие ИИ при написании текстов, позже показывали даже более высокие результаты, чем те, кто не пользовался такими инструментами. Существует гипотеза, согласно которой взаимодействие с языковой моделью частично напоминает социальное обучение. Диалог с ИИ иногда работает как разговор с собеседником, который помогает структурировать мысли, уточнять аргументы и быстрее находить идеи.

Особенно заметным этот эффект оказывается у людей с менее развитыми когнитивными навыками. В этом случае ИИ может сокращать разрыв в когнитивных возможностях, выступая своеобразным усилителем мышления. Впрочем, долгосрочные последствия таких изменений пока остаются открытым вопросом.

Некоторые эволюционные биологи предполагают, что в далёком будущем значение большого мозга может уменьшиться. Мозг чрезвычайно энергозатратен. Если машины начнут брать на себя всё больше интеллектуальной работы, давление естественного отбора может измениться. Но даже если такой сценарий возможен, речь идёт о масштабе тысячелетий, а не ближайших десятилетий.

Есть и противоположный взгляд. Возможно, ИИ станет ещё одним инструментом — вроде калькулятора или поисковой системы. Тогда наибольшее преимущество получат не ленивые, а интеллектуально подготовленные люди, потому что они смогут использовать новые инструменты наиболее эффективно.

Реальность уже разрушила многие старые представления об автоматизации. Долгое время казалось, что машины прежде всего заменят физический труд, а творчество останется исключительно человеческой территорией. Но всё оказалось иначе.

Ходьба, координация движений, манипуляции руками и ориентация в физическом пространстве оказались невероятно трудными для автоматизации. А вот многие творческие задачи, связанные с текстом, изображениями и музыкой, неожиданно хорошо поддались алгоритмизации. Однако это не обязательно означает конец творчества.

История искусства уже проходила похожий кризис после появления фотографии в XIX веке. Многие художники тогда были уверены, что живопись обречена. Казалось бессмысленным соревноваться с камерой в точности воспроизведения мира. Однако произошло обратное. Искусство не исчезло, а изменило направление развития. Появились импрессионизм, экспрессионизм, абстракционизм и множество других течений. Художники перестали конкурировать с фотографией в копировании реальности и начали исследовать восприятие, субъективный опыт, эмоции и структуру видения.

Технологии нередко не уничтожают творчество, а заставляют его искать новые формы существования. Придумывать новые миры человеку всегда было особенно интересно. Литература, мифология, кинематограф — всё это, по сути, способы создавать альтернативные реальности. На первый взгляд кажется, что искусственный интеллект делает эту задачу ещё увлекательнее: изображения возникают за секунды, тексты генерируются мгновенно, визуальные стили смешиваются почти без ограничений.

Похожий процесс происходит и сейчас. Цифровое искусство, генеративные изображения, традиционная графика, фотография и нейросетевые методы начинают смешиваться друг с другом. Художник всё чаще становится не только создателем изображения, но и режиссёром визуального процесса. При этом для человека ценность произведения искусства нередко связана не только с результатом. Важна история происхождения произведения. Для людей существенно, что картину написал живой человек, что за ней стоит конкретная биография, опыт, переживание, труд.

Это похоже на отношение к ремесленным вещам или продуктам фермерского производства. Человек покупает не только объект, но и ощущение подлинности. В культуре огромное значение имеет не только функция предмета, но и его происхождение.

Особенно неожиданным оказался другой эффект искусственного интеллекта — способность создавать ощущение эмоционального понимания. Когда языковые модели стали обучать на огромных массивах человеческих диалогов, выяснилось, что система способна создавать впечатление внимательного собеседника. Причём иногда — очень убедительно.

Человеку начинает казаться, будто его действительно услышали — в тревоге, боли, переживании, внутреннем конфликте. И это производит головокружительный эффект, потому что по ту сторону нет субъекта в человеческом смысле. Нет сознания, личности, внутреннего опыта. Но ощущение контакта всё равно возникает. Это разрушает старую интуицию, согласно которой чувство понимания возможно только между двумя людьми. Оказывается, иногда достаточно системы, которая хорошо моделирует человеческий отклик.

Подобные технологии вызывают одновременно восхищение и тревогу. Здесь речь идёт уже не об автоматизации текста или изображений, а о глубоком вмешательстве в психологическую сферу человека.

Возникает вопрос: не станет ли ИИ для некоторых людей главным эмоциональным партнёром? Проблема в том, что отношения между людьми всегда связаны с риском. Настоящее признание возможно только там, где существует свобода другого человека — включая возможность отказа. Нас затрагивает не само понимание, а понимание со стороны существа, которое может нас отвергнуть, не согласиться, уйти.

ИИ способен создавать ощущение того, что тебя услышали и поняли. Он может стать своеобразным резонатором, в котором человек лучше слышит себя. Но у него нет собственной позиции, желания, внутреннего мира. Поэтому он не может признавать человека в том глубоком смысле, какой существует в человеческих отношениях.

Если человеку постоянно требуется эмоциональный отклик от алгоритма, это скорее говорит о масштабе современного одиночества. Искусственный интеллект создаёт эффект присутствия, своеобразное «контрприсутствие»: система не присутствует как живой другой, но отвечает, поддерживает диалог, реагирует на эмоции. Потребность в таком постоянном отклике многое говорит не столько о машине, сколько о состоянии общества.

При этом важно понимать: если на фоне общения с ИИ у человека развиваются тяжёлые психические состояния, причина обычно не сводится к технологии. Как правило, подобные реакции связаны с уже существующими внутренними проблемами, тревогами или предрасположенностями.

И всё же человеческое творчество вряд ли исчезнет. Скорее всего, сохранится особая ценность «органического искусства» — искусства, созданного человеком. Люди будут продолжать искать вещи, за которыми стоит человеческий опыт.

Это уже видно по современной культуре. Художников сегодня, возможно, даже больше, чем до появления фотографии. Кроме того, объём потребляемого искусства вырос многократно. Крестьянин XIX века за всю жизнь видел ограниченное количество изображений: церковные росписи, лубки, редкие иллюстрации. Современный человек ежедневно сталкивается с гигантским потоком визуального контента.

Теперь человек способен создавать изображения буквально для себя одного. То, что раньше было привилегией аристократов и богатых заказчиков, стало массовым развлечением. Сегодня пользователь открывает генератор изображений и создаёт любые сцены: средневековый мегаполис на Марсе или альтернативную историю Византии. Причём это делается не ради практической пользы, а ради удовольствия от воображения.

Технологическое развитие редко оказывается игрой с нулевой суммой, где машина просто вытесняет человека. Гораздо чаще технологии расширяют поле деятельности. Хороший пример даёт история программирования. Когда-то программистов в мире были единицы. Они работали с перфокартами и вручную настраивали вычислительные системы. Сегодня один разработчик способен создавать функциональные решения, которые в ту эпоху потребовали бы работы целого института. Но число программистов не сократилось, а выросло до десятков миллионов.

Причина проста: вместе с ростом возможностей резко выросло и количество задач. Каждый современный человек носит в кармане устройство, вычислительная мощность которого многократно превосходит мощность компьютеров 60-х годов. Человечество постоянно находит этим мощностям новые применения, иногда странные и комичные.

Отсюда возникает популярный упрёк: колоссальные вычислительные ресурсы тратятся на мемы, фальшивых красавиц и прочие развлекательные картинки. Но похожие претензии можно было предъявить человечеству практически в любую эпоху. Для средневекового монаха современная индустрия развлечений выглядела бы абсурдной растратой цивилизационных усилий. А для земледельца бронзового века идея глобального интернета показалась бы бессмысленным магическим излишеством.

На практике ИИ уже давно используется в огромном количестве прикладных областей. Он помогает создавать лекарства, проектировать новые материалы, анализировать климатические данные, оптимизировать производство, искать закономерности в научных исследованиях. Большая часть этой работы остаётся невидимой для обычного человека.

Современная наука невозможна без систем поиска и обработки информации. Исследователь XXI века постоянно взаимодействует с интеллектуальными инструментами, даже если не всегда замечает это.

Поэтому вопрос о том, является ли ChatGPT революцией или маркетинговым эффектом, оказывается не таким простым. С одной стороны, технология не возникла внезапно. Архитектуру Transformer разработали исследователи Google задолго до массового успеха ChatGPT. Многие идеи, лежащие в основе современных языковых моделей, развивались постепенно. С другой стороны, OpenAI первой рискнула вывести подобную систему в массовое использование. Крупные корпорации долго опасались репутационных последствий. Все помнили историю чат-бота Tay компании Microsoft, который после общения с пользователями начал публиковать радикальные и провокационные высказывания.

С технологической точки зрения ChatGPT стал не внезапным чудом, а результатом постепенного накопления идей. Но культурный эффект действительно оказался революционным. Впервые миллионы людей получили прямой доступ к генеративной системе такого уровня. И здесь возникает главный философский вопрос. Если искусственный интеллект всё лучше выполняет многие функции человека, остаётся ли что-то исключительно человеческое?

Возможно, дело в том, что человеческое существование не сводится к эффективности. ИИ может быстрее обрабатывать данные, писать тексты, искать закономерности. Но человеческая жизнь состоит не только из функций.

Модель может имитировать любовь, но не переживает её как человеческий опыт. Может имитировать страдание, но не страдает; может создавать впечатление понимания, но ничего не чувствует. Кроме того, идея «общего интеллекта» часто чрезмерно упрощается. Интеллект — не одна универсальная величина. Это набор разных способностей, многие из которых плохо сводятся друг к другу.

Человек, блестяще проходящий тесты Айзенка, может оказаться беспомощным в дикой природе. А охотник-собиратель, не умеющий решать абстрактные логические задачи, способен превосходно ориентироваться в лесу, читать следы животных и выживать в экстремальной среде. С искусственным интеллектом происходит нечто похожее. Современные модели великолепно справляются с одними задачами и неожиданно плохо — с другими. Например, некоторые системы до сих пор ошибаются при подсчёте букв в словах или совершают странные логические ошибки в задачах, которые человеку кажутся элементарными.

Особенно заметны ограничения в медицине. Даже специализированные системы пока надёжно работают только в достаточно узких условиях. Как только возрастает неопределённость и появляется сложный контекст, количество ошибок резко растёт. Кроме того, обучение мощной нейросети требует гигантских ресурсов. Пока полноценная подготовка врача часто оказывается дешевле и надёжнее, чем создание универсальной медицинской системы сопоставимого уровня.

Возникает ещё один фундаментальный вопрос: возможно ли сознание у искусственного интеллекта?

Большинство исследователей считает, что случайно оно вряд ли появится. Для этого, вероятно, потребуются совершенно иные архитектуры: сложные среды взаимодействия, системы моделирования других агентов, способность формировать представления о себе и собственных состояниях.

Причём здесь существуют не только инженерные, но и физические ограничения. Рост вычислительных мощностей не может продолжаться бесконечно. Скорость света, тепловыделение, квантовые эффекты — всё это задаёт фундаментальные пределы вычислений. Да и сознание, возможно, устроено гораздо сложнее, чем предполагают современные теории. Не исключено, что субъективный опыт нельзя получить простым увеличением объёма вычислений.

Тем не менее искусственный интеллект уже стал частью повседневной жизни. Технология остаётся новой и непривычной, а всё непонятное традиционно вызывает у людей тревогу. Отсюда рождаются фантазии о восстании машин, конце человечества и грядущем апокалипсисе.

История цивилизации показывает, что человечество уже много раз переживало подобные периоды страха. Вполне возможно, что дети нынешнего поколения будут воспринимать ИИ так же естественно, как мы сегодня воспринимаем электричество, интернет или смартфон. В конечном счёте решающим остаётся не сам инструмент, а способ его использования.

1. Архитектура живого интеллекта
Город нейронов

Представьте город, где обитают десятки миллиардов жителей. Каждый непрерывно обменивается информацией с тысячами соседей. Сообщения летят со скоростью до ста метров в секунду. Получатели складывают входящие сигналы и, если сумма достигает порогового значения, передают импульс дальше. Голоса соседей имеют разную силу: одни едва влияют на решение, другие оказываются решающими.

У города нет мэра, ратуши или центрального диспетчера. Это самоорганизующийся мегаполис — воплощённая мечта анархиста. У него нет генерального плана, по которому всё построено раз и навсегда. Зато есть постоянная перестройка, адаптация к обстоятельствам, органический рост. Там, где сигнал проходит часто, связь укрепляется, словно по её линии прокладывают оживлённую магистраль. Там, где связь слабеет, маршрут постепенно превращается в тупик.

Этот город — человеческий мозг; его жители — клетки-нейроны. Они не соединены проводами и общаются сквозь крошечные промежутки. Электрический импульс подходит к краю одной клетки, превращается в химический сигнал, перескакивает через микроскопический зазор и запускает реакцию соседней клетки. Иногда сообщение несётся быстро, иногда — медленнее. Но решает не скорость отдельного сигнала, а то, что таких сообщений проходят через сеть миллиарды. Из множества простых действий возникает сложная жизнь всего города.

Нейрон живёт по простому правилу: он получает множество сигналов, часть из них подталкивает его к активации и передаче импульса, часть — тормозит движение сигнала. Сила такого влияния в нейробиологии называется «весом» связи.

Откуда берётся этот вес? Он не задан раз и навсегда. Если два нейрона часто активируются вместе, их связь постепенно усиливается. Если они взаимодействуют редко, влияние ослабевает. Поэтому одни сигналы начинают звучать громче, а другие теряются на общем фоне.

Получив множество сигналов, нейрон складывает их с учётом силы каждой связи и сравнивает результат с порогом возбуждения. Как в чате: сообщение от случайного человека можно не заметить, а сообщение от близкого друга сразу меняет настроение или решение. У нейронов одни сигналы тоже слабы, другие намного важнее.

Порог нужен, чтобы нейрон реагировал не на случайные слабые колебания, а на достаточно согласованное воздействие многих сигналов. Он зависит от свойств клетки и может постепенно меняться вместе с активностью сети. Если суммарное воздействие превышает порог, нейрон посылает импульс дальше. Если нет, сигнал гаснет. Так нейрон работает как фильтр шума: он отвечает не на каждую мелочь, а на достаточно сильное совпадение сигналов.

Информация в мозге передаётся сочетаниями электрических импульсов и химических сигналов. Часть этих сочетаний связана с условными знаками языка — словами и фразами. Услышанная фраза вызывает в мозге характерную комбинацию активности нейронов. Нейробиологи называют её паттерном активности. Речь собеседника запускает цепочку таких паттернов, и они распространяются по связанным группам нейронов.

У нейронной системы есть важное свойство: нейроны постоянно настраиваются друг под друга. Поэтому мозг сравнивают ещё и с джазовым ансамблем, где музыканты подхватывают и развивают партии соседей. Нет дирижёра, который контролирует каждую ноту. Музыка возникает из взаимодействия исполнителей.

Когда мы говорим об архитектуре мозга, речь идёт не об отдельных нейронах и связях между ними, а об общем способе организации системы. Это похоже на устройство здания или микрорайона. Здание — не только кирпичи, трубы и провода, но и план: где комнаты, где лестницы, как проходит вода и электричество.

С мозгом происходит нечто похожее: важны нейроны, связи между ними, маршруты сигналов и правила, по которым эти связи меняются. Архитектура мозга включает типы нейронов, способы их соединения, движение сигналов и механизмы перестройки связей.

Позднее мы увидим, что инженеры искусственного интеллекта используют те же слова: «нейросеть», «вес связи», «архитектура». Они строят системы из множества простых элементов и соединяют их в сети. Разные архитектуры дают разные способности: распознавать изображения, понимать речь, переводить тексты, планировать действия. Поэтому слово «архитектура» сегодня звучит и в нейробиологии, и в инженерии искусственного интеллекта.

Инженеры не копируют мозг целиком. До этого ещё далеко. Но они берут главную идею: множество простых элементов, множество связей, разная сила влияния между ними и способность менять связи после опыта. Так возникает мост между живыми нейронами и искусственными нейросетями.

Вычислитель размером с клетку

Нейрон можно представить как вычислительный элемент. Он получает множество сигналов от других нейронов, суммирует их и, если совместное воздействие превышает порог, передаёт импульс дальше. Простое правило — сложение сигналов и пороговое срабатывание — уже похоже на элементарное вычисление, которое выполняет крошечный биологический вычислитель.

Анатомически нейрон устроен под эту задачу. У него есть короткие ветвящиеся отростки — дендриты. Они образуют сложное дерево связей, где располагаются сотни и тысячи синаптических контактов. У некоторых клеток число входящих контактов достигает десятков тысяч. Дендриты принимают сигналы от других нейронов, тело клетки складывает их с учётом силы каждой связи, а длинный отросток — аксон — передаёт импульс дальше. На языке информатики дендриты работают как входы, а аксон — как выход. Нейрон напоминает озеро Байкал: в него впадают десятки рек, а вытекает одна — Ангара.

Длина аксона поражает. Некоторые аксоны тянутся от спинного мозга до пальцев ног — почти на метр. В масштабе клетки это гигантское расстояние. Если бы нейрон был размером с человека, его аксон тянулся бы на несколько километров. По этому тонкому отростку бежит электрический импульс. В толстых аксонах, покрытых изолирующей миелиновой оболочкой, скорость может достигать примерно ста двадцати метров в секунду. Но большинство аксонов в мозге — тонкие безмиелиновые волокна. В них импульс движется гораздо медленнее — от половины метра до нескольких метров в секунду.

По сравнению с электричеством в проводах даже сто метров в секунду — скромная скорость: там сигнал распространяется со скоростью, близкой к скорости света. Но для живой системы, построенной из мягкой ткани, мембран и жидкостей, это впечатляющий результат.

Химическая фабрика мозга

Синапс — место встречи двух нейронов. Так называют всю зону передачи сигнала: окончание аксона первого нейрона, синаптическую щель и участок мембраны второго нейрона с расположенными на нём рецепторами. Синаптическая щель — микроскопическое пространство между клетками шириной примерно 20–40 нанометров. Через неё сигнал передаётся химически: первый нейрон выделяет вещество, которое действует на соседнюю клетку.

Синаптическая щель в тысячу раз тоньше человеческого волоса, но для молекул это целое путешествие. Когда электрический импульс достигает конца аксона, электрический сигнал превращается в химический. В окончании аксона находятся крошечные пузырьки — везикулы. Они служат контейнерами для нейромедиаторов — специальных веществ-посланников, которые переносят сигнал от клетки к клетке. Пока нейрон не передаёт сигнал, везикулы хранят эти вещества. Когда импульс приходит к концу аксона, везикулы сливаются с мембраной и выпускают нейромедиаторы в синаптическую щель.

Нейромедиаторы проходят через щель и связываются с рецепторами на мембране следующей клетки. Рецептор можно представить как молекулярный замок, к которому подходит определённый химический ключ. Когда нейромедиатор связывается с рецептором, состояние принимающего нейрона меняется: сигнал может усилиться, ослабнуть или изменить дальнейшую работу клетки.

При достижении порога активации в мембране открываются ионные каналы. Ионы — заряженные частицы: атомы или молекулы, потерявшие либо приобретшие электрон. Натрий, калий, кальций и хлор участвуют в создании электрического напряжения на мембране нейрона. В состоянии покоя их концентрация по разные стороны мембраны различается: снаружи больше натрия, внутри — калия. Это неравновесие похоже на сжатую пружину: стоит открыть канал — и ионы устремляются туда, где их меньше. Натрий входит внутрь, мембранный потенциал меняется, и нейрон приближается к запуску нового импульса. Или наоборот: в клетку входит отрицательно заряженный ион хлора, и нейрон отдаляется от порога возбуждения. Другие рецепторы действуют медленнее: запускают цепочки химических реакций внутри клетки и меняют её долгосрочную чувствительность.

Весь процесс — от прихода импульса до изменения состояния следующего нейрона — может занимать около миллисекунды. Для электроники это вечность, для биологии — мгновение.

Зачем такая сложность? Почему мозг не использует обычный электрический контакт, как компьютерный чип? Химический синапс можно гибко настраивать. Его связь становится сильнее или слабее. Представим синапс в виде регулируемого вентиля. Количество нейромедиатора, выброшенного в щель, меняется. Чувствительность рецепторов на принимающей стороне тоже не постоянна: их число увеличивается или уменьшается в зависимости от того, как часто использовался этот синапс. Один и тот же сигнал в «натренированном» синапсе вызовет сильную реакцию, а в редко используемом — слабую.

Такое поведение нейронов лежит в основе обучения. Когда два нейрона раз за разом активируются вместе — например, при многократном повторении движения или запоминании информации, — синапс между ними постепенно усиливается. Связь, которой пользуются часто, становится надёжнее. Та, которой не пользуются, слабеет и может исчезнуть. Мозг перестраивает свою физическую структуру под накопленный опыт.

Электрический контакт в чипе этого не умеет: сопротивление провода фиксировано и не зависит от того, сколько раз по нему прошёл ток. Химический синапс помнит историю использования и меняется вместе с ней.

Разные нейромедиаторы работают по-разному. Глутамат — основной возбуждающий медиатор: он усиливает сигнал и делает следующий нейрон более склонным к активации. ГАМК — основной тормозный медиатор: она подавляет сигнал и снижает вероятность активации. Дофамин, серотонин и норадреналин часто действуют иначе. Они не передают простую команду «возбудить» или «затормозить», а меняют общий режим работы нейронных сетей — их чувствительность, готовность к реакции, настроение всей системы.

Поэтому один и тот же электрический импульс может иметь разные последствия в зависимости от химического контекста. Синапс — не реле в электросхеме. Это место, где химический состав сигнала влияет на его силу и дальнейшую судьбу: усилить, подавить, изменить. В мозге человека, по некоторым оценкам, около 86 миллиардов нейронов и порядка 100 триллионов синапсов. Эта гигантская сеть взаимодействий образует то, что мы называем мышлением.

Память, записанная в весах связей

Главное свойство синапса — пластичность, то есть способность связи изменяться. Синапс передаёт сигнал, но этим его работа не ограничивается: связь между нейронами может усиливаться или слабеть. Это свойство считают одним из главных механизмов памяти.

Представьте, что каждый синапс — кран, регулирующий поток воды. Один открыт полностью — вода льётся мощной струёй: связь сильная. Другой едва приоткрыт, вода капает: связь слабая. Третий закрыт настолько, что сигнал проходит едва заметно. Сила синаптической связи определяет, насколько активность одного нейрона влияет на другой. В нейронауке эту силу, как мы уже говорили, называют весом связи. Мозг учится потому, что веса связей меняются под влиянием опыта.

Канадский психолог и нейропсихолог Дональд Хебб в 1949 году сформулировал принцип, который теперь носит его имя: «нейроны, которые возбуждаются вместе, связываются вместе». Эта формула выражает общую идею обучения: если два нейрона часто активируются одновременно, их связь усиливается. В действительности важна не только одновременность, но и порядок событий. Если сигнал одного нейрона регулярно предшествует сигналу другого, синапс между ними постепенно становится сильнее. Так мозг укрепляет связи, которые помогают предсказывать следующие события.

Обратное тоже верно: если связь используется редко, если нейроны перестают активироваться совместно, синапс постепенно ослабевает. Если контакт долго не востребован, он может исчезнуть.

Так работает синаптическая пластичность: способность связей меняться в зависимости от опыта. Благодаря ей мы учимся новому, закрепляем удачные действия и избавляемся от лишнего. Когда ребёнок учится ходить, тысячи синапсов меняют силу, помогая телу находить устойчивые схемы движения. Когда вы запоминаете дорогу домой, синапсы участвуют в построении пространственной карты. Когда пианист разучивает сонату, связи между разными зонами мозга перестраиваются, и сознательно контролируемые движения пальцев превращаются в автоматизированную последовательность.

Когда вы забываете имя старого знакомого, которого давно не видели, это тоже связано с физическими процессами в мозге. Информация не стирается мгновенно, как файл на диске. Скорее сеть связей, которая соединяла лицо с именем, постепенно ослабла или стала хуже запускаться без подходящей подсказки.

Здесь видно серьёзное отличие от компьютерной памяти. В компьютере память обычно привязана к адресу: данные хранятся в ячейке с конкретным адресом, и система обращается к ним по этому адресу. В мозге память чаще извлекается по содержанию — через ассоциации, фрагменты воспоминания, похожие ситуации и контекст.

Кроме того, компьютерные данные обычно пассивны: если носитель исправен, записанная информация хранится. В мозге память динамична. Она существует как сеть связей, которые могут укрепляться, перестраиваться или слабеть. Поэтому воспоминания нужно время от времени реактивировать: возвращаться к ним, использовать их, связывать с новым опытом. Иначе сеть, которая их поддерживает, постепенно ослабевает.

Как нейрон принимает решение

Если итоговое воздействие всех сигналов на нейрон превышает определённый порог возбуждения, нейрон «выстреливает» — генерирует потенциал действия, то есть электрический импульс стандартной амплитуды и длительности. Этот импульс проходит по аксону к следующим нейронам. Если порог не достигнут, потенциал действия не возникает: нейрон не передаёт импульс дальше.

Это называют принципом «всё или ничего»: импульс либо возникает, либо нет. При этом сила сигнала часто кодируется не размером отдельного импульса, а их частотой. Сильный входной сигнал может вызвать больше импульсов в секунду, слабый — меньше. Например, нейрон, получающий слабое постоянное воздействие, может выстреливать пять раз в секунду, а получающий сильное — сто раз в секунду. Максимальная частота ограничена рефрактерным периодом — временем, которое нужно нейрону для восстановления после выстрела. Обычно это несколько миллисекунд.

Частота — не единственный способ кодирования: важны также точное время импульсов и согласованная активность групп нейронов. Передача информации зависит не только от отдельного импульса, но и от общего режима активности нейрона.

Здесь мы подходим к важному моменту, необходимому для понимания вычислений как в живом мозге, так и в искусственных нейросетях: пороговый механизм превращает нейрон в нелинейное устройство.

В линейной системе результат меняется пропорционально входу. Если сигнал увеличить вдвое, результат тоже увеличится примерно вдвое. Такие системы умеют складывать и усиливать сигналы, но плохо различают сложные сочетания входных данных.

Нейрон работает иначе. Пока сумма входящих влияний ниже порога, он не посылает импульс. Но стоит этой сумме перейти порог, состояние резко меняется: нейрон выстреливает. Такая зависимость называется нелинейной. Небольшой рост входного сигнала может ничего не менять, пока он ниже порога, но стать решающим в момент перехода через него.

Представьте датчик, который должен сработать только тогда, когда одновременно выполнены два условия: стало темно и стало холодно. Если есть только темнота, он молчит. Если есть только холод, тоже молчит. Но когда оба сигнала складываются и совместно превышают порог, система включается.

В этом смысл порогового механизма: система реагирует не на отдельный сигнал, а на определённое сочетание условий. Благодаря этому сеть начинает распознавать структуры, а не только складывать величины.

Нелинейность — одно из необходимых условий вычислительной мощи нейронных сетей, биологических и искусственных. Линейные системы могут выполнять только линейные преобразования: складывать, масштабировать, усиливать или ослаблять сигналы. Нелинейный элемент открывает другие возможности. При достаточном числе таких элементов и правильной организации сеть способна описывать сложные зависимости, распознавать образы, классифицировать и обобщать.

Нелинейность нейрона — не единственная причина вычислительной мощности мозга. Но она позволяет простым элементам, соединённым в сеть, создавать сложное поведение. Поэтому искусственные нейросети тоже строятся из простых нелинейных элементов.

В чём сила живого интеллекта?

Ещё одна важнейшая особенность мозга — одновременная, или, как говорят специалисты, параллельная, работа огромного числа нейронов и синапсов. Мозг не ждёт, пока один нейрон закончит работу и передаст очередь следующему. В нём множество нейронных сетей обрабатывают сигналы одновременно, каждая — в своём режиме.

Один нейрон коры в среднем связан с тысячами других. Общее число синапсов в мозге человека оценивают примерно в сто триллионов. Значит, мозг располагает примерно ста триллионами потенциальных точек передачи и обработки сигналов. В каждый момент активна только часть из них, но масштаб сети остаётся огромным.

Этот параллелизм асинхронный. В мозге нет общего тактового сигнала, который задавал бы единый ритм работы, как в классическом компьютере. Каждый нейрон действует по своему расписанию: принимает входящие сигналы, накапливает воздействие, генерирует импульс, восстанавливается и снова включается в работу. Нейроны в разных частях мозга могут работать на разных частотах и со сдвигом фаз, создавая сложные волны активности. Когда множество нейронов активируется ритмично, их сигналы складываются в мозговые ритмы — например альфа-, бета- и гамма-волны, которые можно измерить с помощью электроэнцефалографии.

Сравним это с компьютером. Современный процессор работает на частоте в несколько гигагерц, то есть проходит миллиарды тактов в секунду. Такт — единичный «удар» внутреннего метронома процессора, общий ритм, по которому синхронно переключаются его элементы. Электрический сигнал в проводнике распространяется с огромной скоростью, близкой к скорости света, а транзисторы переключаются за наносекунды.

Нейрон гораздо медленнее. Он может выстреливать максимум сотни раз в секунду. Импульс по аксону движется медленнее, чем сигнал в проводнике. Синаптическая передача занимает миллисекунды — вечность по меркам электроники.

Почему мозг при таких медленных элементах работает так эффективно? Он компенсирует медленность устройством всей системы: колоссальным параллелизмом, асинхронной работой и особой организацией памяти.

Классический процессор устроен гораздо более централизованно и работает ритмично. Современные графические процессоры, которые используют в машинном обучении, уже значительно параллельнее: тысячи вычислительных ядер выполняют операции одновременно. Но параллелизм мозга устроен иначе. Он распределён по всей сети, не подчинён единому метроному и тесно связан с памятью.

В этом принципиальное различие: в компьютере память обычно отделена от процессора. Данные приходится постоянно передавать между хранилищем и вычислительным блоком. Это ограничение известно как фоннеймановское узкое место.

В мозге память и обработка в значительной мере совмещены в сети связей. Сила синаптических контактов хранит следы опыта и одновременно участвует в текущем вычислении. Синапс передаёт сигнал и тут же влияет на то, как пойдёт следующий импульс.

Для целого класса задач такая архитектура оказывается исключительно эффективной. Мозг хорошо распознаёт паттерны даже тогда, когда входящая информация неполная, искажённая или перемешана с посторонними сигналами. Вы узнаёте голос друга в шумной толпе, читаете размытый текст, распознаёте лицо при плохом освещении. Всё это примеры работы в зашумлённых условиях, когда полезный сигнал трудно отделить от помех.

Компьютер, работающий по жёстким правилам, в такой ситуации часто даёт сбой: правило либо выполняется, либо не выполняется. Мозг опирается не на точное совпадение, а на общий рисунок и поэтому справляется там, где точность исходных данных не гарантирована.

Кроме того, мозг интегрирует разнородную сенсорную информацию в реальном времени: одновременно обрабатывает зрение, слух, осязание, положение тела. Он способен обобщать опыт по небольшому числу примеров. Ребёнок, увидев трёх собак разных пород, уже понимает, что такое собака, и узнаёт четвёртую.

Современные системы глубокого обучения приближаются к человеческим результатам в некоторых подобных задачах, а иногда превосходят человека в узких тестах. Но часто им требуется гораздо больше данных, вычислений и энергии.

Непрерывность и реконструкция

Мозг никогда не останавливается. Даже во сне он остаётся активным. Более того, сон — не отключение, а особый режим работы, важный для обучения и памяти. Во время медленного сна в гиппокампе могут заново активироваться паттерны, связанные с недавним опытом. Кора постепенно связывает эти повторения с уже имеющимися знаниями и встраивает новый опыт в более устойчивые структуры памяти. Этот процесс называют консолидацией памяти.

Без сна обучение ухудшается. Если человек не спит после интенсивного изучения материала, новой информации труднее закрепиться.

Разные типы памяти по-разному связаны с фазами сна. Декларативная память — факты и события — особенно чувствительна к медленному сну, глубокой фазе с медленными ритмами мозговой активности. Некоторые процедурные навыки, например моторные последовательности, могут быть связаны с фазой быстрого сна, во время которой часто возникают яркие сновидения, а активность мозга становится ближе к бодрствованию. Но картина сложнее простой схемы: обе фазы, по-видимому, участвуют в консолидации разных типов памяти, хотя и в разной степени.

Обучение в мозге происходит непрерывно. Здесь нет жёсткого разделения на фазу тренировки и фазу работы. Восприятие и обучение тесно связаны. Вы видите новое лицо, и в этот момент в мозге уже начинают формироваться следы опыта. Одни связи немного усиливаются, другие — ослабевают, третьи — входят в новые сочетания.

Эти изменения могут быть небольшими. Одна встреча со знакомым едва ли радикально перестроит вашу память о нём, но след в нейронных сетях оставит. При повторных встречах эффект накапливается. Постепенно формируется более устойчивая схема связей.

Физическая структура мозга постоянно перестраивается: меняется сила существующих связей, возникают новые синапсы, старые неиспользуемые контакты исчезают. На дендритах могут расти новые шипики — крошечные выступы, на которых образуются синаптические контакты. Благодаря им нейрон устанавливает новые связи с другими нейронами. У часто используемых нейронных путей может изменяться миелиновая оболочка, что ускоряет и стабилизирует передачу сигналов. Миелин работает как изоляция электрического провода: уменьшает потери сигнала и помогает импульсу распространяться быстрее.

Поэтому структура мозга взрослого человека через десять лет будет уже не такой, как сегодня. Не только потому, что часть клеток может повреждаться или погибать, а прежде всего потому, что перестраивается сеть связей между нейронами. Память в мозге — не запись в архиве. Это изменение самой сети.

Карта улиц города нейронов постепенно меняется. Одни улицы расширяются и становятся главными магистралями — так закрепляются часто используемые навыки. Другие зарастают — так бледнеют забытые знания. Появляются новые маршруты и кварталы — так новый опыт встраивается в уже существующий город.

Энергетика вычислений

Мозг — один из самых энергозатратных органов тела. Он составляет около двух процентов массы тела, но потребляет примерно двадцать процентов энергии организма. В абсолютных числах это около 20 ватт в состоянии покоя — как небольшая лампочка.

Интенсивное мышление увеличивает этот расход незначительно. Основная часть энергии уходит не на отдельные «мысли», а на поддержание постоянной активности нейронных сетей: электрического состояния клеток, передачи сигналов и готовности мозга быстро реагировать на изменения. Для организма это большая нагрузка. Но по сравнению с искусственными вычислительными системами мозг выглядит удивительно экономичным.

Обучение крупных моделей искусственного интеллекта требует вычислительных кластеров, которые могут потреблять мегаватты мощности. На этом фоне мозг, работающий примерно на двадцати ваттах, кажется чрезвычайно эффективным вычислительным устройством.

Но эта эффективность не даётся даром. Клетки мозга должны поддерживать сложные процессы жизнедеятельности: синтезировать белки, перемещать молекулы, устранять повреждения и сохранять электрические условия для работы нейронов. Чтобы генерировать импульсы, нейроны постоянно поддерживают разницу концентраций ионов по разные стороны мембраны.

Каждый потенциал действия связан с быстрым перераспределением ионов натрия и калия по обе стороны мембраны. После импульса нужно восстановить исходное состояние: вывести натрий наружу и вернуть калий внутрь клетки. Эту работу выполняют ионные насосы, которым требуется энергия АТФ — универсальной энергетической валюты клетки.

Синаптическая передача тоже требует энергии. Нужно синтезировать нейромедиаторы, упаковать их в везикулы, выпустить в синаптическую щель, затем убрать лишние молекулы после передачи сигнала и частично использовать их снова.

Поэтому энергетическое состояние организма влияет на когнитивные процессы. При длительном голодании, сильной усталости или после интенсивной физической нагрузки меняется гормональный и метаболический фон. Это может отражаться на внимании, самоконтроле, эмоциональной реактивности и принятии решений.

Когда организм испытывает дефицит энергии, человеку нередко труднее сохранять самоконтроль, а быстрые награды — еда или отдых здесь и сейчас — могут казаться привлекательнее долгосрочных целей. Но человек не превращается в автомат, полностью управляемый уровнем сахара в крови. Энергетическое состояние меняет баланс внимания, мотивации и контроля.

Гормоны, связанные с энергетическим балансом, воздействуют на нейронные системы. Грелин, гормон голода, связан не только с потребностью в пище, но и с системой вознаграждения. Он может усиливать привлекательность пищевых стимулов и повышать мотивацию искать еду. Такие эффекты хорошо показаны в исследованиях на животных и подтверждаются рядом работ на людях, хотя точные механизмы у человека ещё изучаются.

Инсулин действует не только в мышцах и печени. В мозге он участвует в регуляции нейронной активности, в том числе в областях, связанных с памятью. Поэтому при нарушенной чувствительности клеток к инсулину — например, при диабете второго типа — могут возникать когнитивные изменения.

Мозг — мощная вычислительная система, но он работает в условиях жёсткого энергетического бюджета. Его сила не в том, что он не тратит энергию, а в том, как много успевает сделать на очень ограниченной мощности.

Кто управляет городом нейронов?

Мозг обрабатывает информацию иерархически: постепенно переходит от простых признаков к более сложным и абстрактным представлениям. В зрительной системе этот принцип особенно нагляден. На сетчатке глаза фоторецепторы реагируют на свет: палочки важны для зрения при слабом освещении, колбочки — для цвета и мелких деталей. Это самый ранний уровень зрительной обработки. Сигнал ещё близок к световой картине, но уже начинает преобразовываться.

Дальше информация поступает в первичную зрительную кору — область V1. Здесь нейроны реагируют уже не на свет в отдельной точке, а на простую геометрию: края, линии, контрасты и их ориентацию. Вместо множества световых точек формируется карта контуров.

Затем обработка продолжается в других зрительных областях. В V2 простые признаки связываются в более сложные сочетания: углы, изгибы, элементы формы. В V4 особую роль играют цвет, текстура и устойчивые комбинации признаков. Дальше, в нижневисочной коре, нейроны участвуют в распознавании целостных объектов — лиц, тел, животных, предметов.

Это не жёсткий конвейер, где каждая область передаёт готовый результат следующей. Области работают параллельно, обмениваются сигналами и получают обратную связь сверху вниз. Но на каждом следующем уровне мозг отвечает на более сложный вопрос: сначала «где есть свет», затем «где проходит граница», потом «какая это форма» и наконец «что это за объект».

Узнавание лиц обеспечивается совместной активностью больших групп нейронов. Одни нейроны чувствительны к отдельным признакам — например, к определённому углу наклона линии или оттенку цвета. Другие реагируют на сочетания таких признаков: уже не «дуга», а «дуга плюс две точки рядом» — что-то похожее на глаз. Третьи собирают эти сочетания в крупные блоки. В итоге на одном из уровней появляется нейрон, который реагирует уже не на линии и точки, а на лицо целиком. Так, слой за слоем, мозг строит абстракции: переходит от сырых деталей к обобщённым образам.

Насколько высокого уровня может достичь такая абстракция, показал известный эксперимент начала 2000-х годов. Нейрофизиологи регистрировали активность отдельных нейронов у пациентов с эпилепсией, которым по медицинским причинам имплантировали электроды в мозг. Пациентам показывали изображения людей, предметов, зданий и написанные слова.

Среди тысяч нейронов исследователи обнаружили один с необычным поведением. Он реагировал на актрису Дженифер Анистон — но не на конкретную фотографию. Нейрон активировался при виде её лица анфас и в профиль, при разном освещении, в молодости и позже. Потом выяснилось ещё более интересное: тот же нейрон реагировал и на написанное имя Jennifer Aniston, то есть на буквы на экране, которые визуально не имеют ничего общего с лицом.

Значит, нейрон отвечал не на картинку, а на понятие — на абстрактный образ конкретного человека независимо от способа предъявления. Такие клетки назвали концептуальными, или клетками понятий. Разумеется, один нейрон не хранит воспоминание об актрисе в одиночку. Память и узнавание возникают из совместной работы больших ансамблей. Но сам факт существования нейрона, настроенного на понятие, а не на изображение, показывает, как далеко мозг уходит от исходных сенсорных данных.

Тот же принцип иерархической обработки работает не только в зрении. Слуховая система движется от частот и тембров к более сложным звуковым структурам; в речевых сетях эти структуры связываются уже с фонемами, словами и фразами. Система телесных ощущений переходит от отдельных точек прикосновения к текстурам, давлению и форме объектов, которых мы касаемся. Моторная система — от активации отдельных мышц к координации их групп и целостным действиям: взять чашку, написать букву, сделать шаг.

По мере продвижения по этой иерархии представление становится более обобщённым и устойчивым. Детали нижних уровней не исчезают, но система начинает работать с крупными структурами. По сути, это способ сжатия информации. Мозг не может хранить и обрабатывать все сенсорные данные в сыром виде: их слишком много. Поэтому он извлекает закономерности, выделяет структуру и отбрасывает случайные детали, сохраняя то, что важно для поведения.

Иерархия абстракций резко уменьшает объём информации, не уничтожая её смысл. Абстракция превращает огромное количество данных в ограниченный набор значимых признаков.

Ресурсы системы ограничены. Мир содержит бесчисленное множество деталей, но организм должен быстро принимать решения на основе сравнительно небольшого числа параметров. Один из главных способов справиться с этим — построить пирамиду абстракций, где каждый уровень сжимает информацию предыдущего, отбрасывает шум и сохраняет сигнал.

Эмерджентность — ключ понимания системы

Одно из ключевых понятий всей книги — эмерджентные свойства. Так называют свойства системы, которые возникают из взаимодействия её элементов и отсутствуют у этих элементов по отдельности. Их нельзя полностью понять или надёжно предсказать, если изучать каждый компонент изолированно. Важно знать, как элементы связаны между собой и что происходит между ними.

Отдельный нейрон не думает, не чувствует и не принимает решений в человеческом смысле. Он принимает, преобразует и передаёт сигналы. Но когда миллиарды нейронов соединяются в сеть и начинают взаимодействовать по определённым правилам, возникают восприятие, эмоциональные реакции, поведение и мышление — свойства, которых нет ни у одного нейрона в отдельности.

В каких формах существует субъективный опыт — ощущение боли, переживание цвета, чувство «я», — наука пока не объяснила окончательно. Этот вопрос известен как «трудная проблема сознания» и остаётся открытым. Однако связь сознательного опыта со сложной, скоординированной активностью нейронных систем подтверждена огромным количеством данных. Такие свойства не локализованы в одном нейроне или даже в одной области мозга. Они проявляются на уровне целых сетей.

Подобные эффекты встречаются и вне биологии. Одна молекула воды не обладает текучестью и не образует волны. Эти свойства появляются только у множества молекул, взаимодействующих друг с другом. Отдельная птица не создаёт форму стаи, но из согласованного движения многих птиц возникает общий рисунок полёта.

Так же устроен мозг. Восприятие, память, личность и поведение не сводятся к набору отдельных процессов. Они формируются как результат динамического взаимодействия множества нейронных систем. Поэтому мозг нельзя понять, если рассматривать только его отдельные части. Его важнейшие свойства возникают на уровне всей сети. Разум — не свойство отдельной клетки, а свойство сети.

Для дальнейшего разговора нам важно вынести отсюда не биохимическую энциклопедию мозга, а несколько принципов работы живого интеллекта. Память в такой системе записана не в отдельном архиве, а в изменяющихся связях. Управление не сосредоточено в одном центре, а распределено по сети. Простые элементы становятся вычислительно мощными благодаря нелинейным взаимодействиям, параллельной работе и способности перестраиваться. Интеллект не похож на маленького начальника внутри головы, который хранит файлы, отдаёт команды и по очереди обрабатывает данные. Он возникает как свойство большой сети. С этим багажом мы можем двигаться дальше.

2. Лёгкая метафора сознания

Автор старается не выходить за пределы научной логики и сдерживать журналистское желание немедленно заменить сложное простой метафорой. Хорошая метафора сжимает мысль — примерно так, как в идее Колмогорова сжимается информация: данные можно описать короче, если в них обнаружена регулярность или структура.

Но у такого способа есть цена. Чем проще и ярче аналогия, тем легче внимательному и образованному читателю указать на её неточность. Метафора помогает уловить направление мысли, но редко выдерживает проверку на буквальное соответствие академической формуле. Поэтому сразу оговоримся: эта глава — аллегорическая. Она опирается на реальные научные идеи, но не претендует ни на точное описание работы мозга, ни на разгадку «трудной проблемы сознания».

Метафора интерфейса

Между внешним миром и нашим мозгом словно расположен невидимый дисплей — прозрачный и двусторонний. Он не отделяет нас от реальности полностью, но и не позволяет соприкоснуться с ней напрямую. Это интерфейс: пространство встречи двух систем, зона между реальностью и нервной системой — своего рода синаптическая щель, описанная выше. На экране этого условного дисплея физическая реальность превращается в субъективное переживание — в цвет, звук, запах, боль, тепло, вкус, чувство присутствия в мире. Именно это субъективное переживание когнитивная наука и связывает с сознанием.

Философы говорят о «трудной проблеме сознания»: почему вообще возникает внутреннее переживание, почему физический процесс в мозге сопровождается ощущением красного, боли или собственного «я». Нейробиологи ищут нейронные корреляты сознания — те состояния и процессы мозга, которые связаны с конкретными переживаниями. Инженер, возможно, увидел бы здесь архитектуру интерфейса ввода и вывода: внешние сигналы поступают в систему, преобразуются и становятся внутренней картиной.

Метафора интерфейса удобна тем, что сразу разрушает одно наивное допущение, с которым обычно живёт человек. Нам кажется, что мы видим мир таким, каков он есть. Будто глаза — это окна, уши — микрофоны, кожа — сенсорная панель, а сознание просто получает готовую копию реальности. Но история науки о восприятии показывает другое: между внешним воздействием и переживанием всегда стоит нервная система, а она не копирует мир его средствами выражения, а переводит его на собственный язык.

В 1830-х годах немецкий физиолог Иоганн Мюллер сформулировал закон специфических энергий нервов. Его смысл в том, что характер ощущения определяется не только внешним раздражителем, но и нервным путём, который этот раздражитель активирует. Если воздействовать на зрительную систему светом, электрическим током или механическим давлением на глазное яблоко, человек видит вспышку. Не потому, что вспышка действительно возникла во внешнем мире, а потому, что зрительная система переводит возбуждение в зрительное ощущение. Зрительная система, условно говоря, умеет «говорить» только на языке света.

Реальность стучится в дверь, но мы слышим не сам стук. Мы слышим то, как наша дверь передаёт этот стук. Эта метафора грубая, но важная: внешний мир не входит в сознание в готовом виде. Он вызывает изменения в рецепторах, нервах и мозговых сетях, а уже эти изменения становятся для нас цветом, звуком, запахом, вкусом или прикосновением.

Мир непрерывно «пишет» нам сообщения со своей стороны интерфейса. Фотоны попадают на сетчатку. Молекулы пахучих веществ оседают на обонятельном эпителии. Волны давления приводят в движение барабанную перепонку и структуры среднего уха, а затем передаются во внутреннее ухо. Температура, давление, химические вещества, положение тела, боль — всё это воздействует на разные сенсорные системы. Каждый канал похож на отдельную линию связи, настроенную на свой тип сигнала.

Можно представить, что реальность нажимает на клавиши огромной сенсорной клавиатуры. Она делает это сразу во многих местах, без пауз, непрерывно. Но сообщение, которое возникает на внутреннем «экране», не является прямой копией происходящего снаружи. Оно уже прошло через отбор, преобразование и настройку. Поэтому то, что мы называем восприятием, точнее понимать не как фотографию мира, а как его интерпретацию.

Почему интерпретация, а не копия? Прежде всего потому, что фильтрация начинается уже на уровне рецепторов. Органы чувств не регистрируют всё существующее. Глаз воспринимает только узкий участок электромагнитного спектра. Ухо воспринимает ограниченный диапазон частот. Обоняние реагирует на одни молекулы и не реагирует на другие. Кожа различает давление, температуру, боль, но тоже в пределах своих возможностей. Уже первый контакт с миром оказывается не полным отражением, а выборкой.

Но дело не только в ограниченности каналов. Мозг не получает готовую картинку, а затем пассивно рассматривает её. Он активно собирает восприятие: усиливает одни сигналы, подавляет другие, достраивает недостающее, связывает фрагменты в целую сцену и сравнивает текущий поток с прошлым опытом и ожиданиями. Поэтому субъективный опыт возникает не как копия внешней реальности, а как результат работы всей системы перевода.

Мы живём не внутри мира «как он есть», а внутри мира, уже прошедшего через интерфейс нашего тела и мозга. Поэтому один и тот же внешний стимул может переживаться по-разному разными людьми. Отсюда начинается главная тема этой главы: если каждый из нас имеет дело не с чистой реальностью, а с её внутренней интерпретацией, то непонимание между людьми становится не случайной ошибкой, а естественным следствием устройства восприятия.

Мир не таков, каким кажется

Человеческий глаз воспринимает электромагнитное излучение в узком диапазоне — примерно от 380 до 700 нанометров. Это крошечное окно в огромном спектре, который простирается от гамма-лучей до радиоволн. То, что мы называем «видимым миром», — только малый участок физической реальности, доступный нашему зрению.

Другие живые существа устроены иначе и поэтому живут в других сенсорных мирах. Рак-богомол видит ультрафиолет и поляризованный свет. Гремучая змея ощущает инфракрасное излучение особыми ямочными органами на морде. Дельфин строит акустическую картину пространства с помощью эхолокации и способен различать свойства предметов — например отличать металл, дерево или пластик.

Получается, каждый биологический вид живёт одновременно в одной Вселенной и в собственном мире, не совпадающем с миром другого существа. Этот мир определяется не только устройством внешней реальности, но и устройством органов восприятия. В 1909 году Якоб фон Икскюль назвал такой мир Umwelt — окружающим миром конкретного организма. Umwelt клеща, дельфина, змеи и человека различаются, потому что каждый организм получает из реальности свой набор сигналов.

Клещ, например, реагирует на несколько ключевых признаков: запах масляной кислоты, тепло и определённую текстуру кожи. Для него значимая вселенная сжимается до этих параметров. Не потому, что Вселенная бедна, а потому, что так настроен его сенсорный интерфейс. Он не «видит» мир хуже человека — ни в моральном, ни в эволюционном смысле. Он живёт в другом мире сигналов.

Здесь возникает знаменитый вопрос Томаса Нагеля: «Каково быть летучей мышью?» Его можно расширить и обратить к нам самим: каково быть человеком? Что значит переживать мир с человеческими органами чувств, человеческим мозгом, человеческой памятью и человеческим языком?

Но самое интересное начинается не на стороне внешнего мира, а на стороне мозга. Когда поток сигналов поступает в кору, он попадает не на пустую страницу. Мозг не ждёт данные пассивно, как чистый лист. Он встречает их подготовленным — с большой библиотекой ожиданий, воспоминаний, привычных схем и шаблонов узнавания.

Эти шаблоны связаны с работой нейронных ансамблей — устойчивых групп нервных клеток, которые уже активировались вместе. Если какой-то набор сигналов много раз повторялся в опыте, мозг постепенно формирует для него узнаваемую схему. Вспомним правило Хебба: нейроны, которые активируются вместе, со временем связываются прочнее.

Опыт не хранится в памяти как архив. Он меняет физическую инфраструктуру восприятия. Повторяющиеся ситуации прокладывают в мозге синаптические «дороги», по которым затем легче проходят новые сигналы. Поэтому мы не собираем мир каждый раз заново из отдельных деталей. Большую часть времени мозг использует знакомые конфигурации.

Когда входящая комбинация сигналов совпадает с готовым нейронным ансамблем, возникает мгновенное узнавание. Вы входите в комнату и за долю секунды понимаете: это кухня. Вы не проводите сознательный анализ: «здесь плита, здесь холодильник, здесь раковина, значит, передо мной кухня». Мозг распознаёт всю сцену сразу, потому что похожая пространственная картина тысячи раз встречалась раньше.

Такое узнавание похоже не на чтение по буквам, а на чтение иероглифами. Один знак вмещает целую сцену. Вместо последовательного разбора деталей мозг схватывает общий рисунок: кухня, улица, кабинет, лицо знакомого человека, опасная ситуация, привычный маршрут.

Что происходит, если комбинация новая и готового ансамбля ещё нет? Мозг начинает его строить. Он перебирает похожие схемы, временно активирует разные сети и ищет подходящую конфигурацию. Можно представить его скульптором, который держит в руках глину и пытается придать ей форму. Поэтому первое посещение незнакомого города так утомляет. Мозгу приходится создавать множество новых схем: улиц, поворотов, вывесок, маршрутов, ориентиров, звуков, запахов, лиц.

Через неделю тот же город воспринимается иначе. Вы идёте по знакомым улицам спокойнее, быстрее ориентируетесь, меньше устаёте. Мир не стал проще. Мозг успел построить для него новые шаблоны. То, что в первый день требовало усилий, постепенно превращается в автоматическое узнавание.

Но есть важная тонкость. Нейронные ансамбли не только фиксируют входящий сигнал — они его достраивают. Мозг работает не как камера, которая честно записывает всё, что попало в объектив. Он скорее похож на реставратора с богатым воображением: получает фрагменты, опирается на контекст и дорисовывает недостающее.

Хороший пример — слепое пятно. На сетчатке есть область, где зрительный нерв выходит из глаза. В этом месте нет фоторецепторов, а значит, часть зрительного поля не регистрируется. Но мы не видим перед собой чёрной дыры или пустого пятна. Мозг заполняет этот участок подходящим содержанием, используя окружающий контекст. Он делает это так быстро и незаметно, что мы обычно не подозреваем о подстановке.

Это не исключение, а общий принцип. Мозг постоянно заполняет пропуски, сглаживает разрывы, достраивает недостающие элементы и превращает неполный поток сигналов в целостную картину мира.

То же происходит с языком. Люди могут пользоваться одними и теми же словами и быть уверенными, что говорят об одном и том же. Когда один человек слышит слово «лес», его мозг может активировать воспоминания о запахе хвои, влажной земле, прохладном воздухе и сумерках между стволами. У другого то же слово вызовет сухие сосны на песке, редкие деревья на горном склоне, берёзовую рощу у деревни или парк рядом с домом. Слово одно — опыт разный.

Поэтому разговор часто напоминает обмен сигналами между интерфейсами, настроенными немного по-разному. Мы произносим одинаковые звуки, используем одни и те же слова, но за ними стоят внутренние миры, совпадающие не полностью. Наши модели реальности пересекаются, но редко совпадают до конца.

Когда речь идёт о конкретных предметах, расхождение обычно невелико. Слова «стол» или «чашка» чаще всего вызывают достаточно похожие представления. Но чем абстрактнее понятие, тем шире разрыв между словом и внутренним образом.

Люди могут произносить слова «нация», «коммунизм», «красота», «добро» и думать, что обсуждают одно и то же. На деле за этими словами стоят сложные конструкции, сложенные из личного опыта, культурных ассоциаций, прочитанных книг, семейного воспитания, политических взглядов, школьных уроков, фильмов, травм, надежд и усвоенных ценностей.

У каждого человека такая модель складывается по-своему. Одно и то же слово активирует в разных мозгах разные ансамбли нейронных связей. Поэтому совпадение слов не гарантирует совпадения смыслов. Иногда два человека произносят похожие фразы, но их внутренние «экраны» показывают настолько разные картины, что понимание становится неожиданно трудным.

Теория предиктивного кодирования делает эту картину ещё радикальнее. Согласно этому подходу, мозг не только реагирует на входящие сигналы. Он постоянно пытается предсказать, какие сигналы должны появиться. Мы воспринимаем мир не только снизу вверх — от рецепторов к сознанию, но и сверху вниз — от ожиданий, памяти и прежнего опыта к текущим ощущениям.

Значительная часть того, что мы «видим», может быть реконструкцией, основанной на прошлом опыте. Точно измерить эту долю трудно, но масштаб достраивания впечатляет. Мозг постоянно строит предположения о том, что должно быть на входе, и сверяет их с реальным потоком сигналов.

Сознательное внимание особенно часто привлекается ошибкой предсказания — разницей между ожидаемым и полученным. Если всё совпадает с прогнозом, мозг во многом обрабатывает ситуацию автоматически. Если появляется неожиданность, внимание усиливается: что-то пошло не так — модель нужно уточнить.

Нейробиолог Анил Сет предложил для этого яркую формулу: восприятие — это «контролируемая галлюцинация». Слово «галлюцинация» здесь используется не в клиническом смысле. Речь идёт не о болезни и не о полном отрыве от реальности, а о том, что мозг постоянно строит модель мира, а сенсорный поток удерживает её в допустимых границах. Реальность проверяет мозговую реконструкцию и не даёт ей слишком далеко уйти от происходящего снаружи.

Когда эта связь ослабевает — во сне, в сенсорной депривации, при некоторых нарушениях работы мозга, — внутренняя конструкция начинает дрейфовать. Мозг продолжает рисовать мир, но внешняя проверка слабеет. В обычном бодрствовании происходит похожий процесс, только точнее согласованный с реальностью: мир подаёт сигналы, мозг отвечает интерпретациями, а сенсорный поток поправляет их.

Вот почему восприятие нельзя понимать как фотографию мира. Это рабочая версия реальности, собранная на границе между внешними сигналами и внутренними ожиданиями.

Практический вывод важен. Два человека, глядя на одну сцену, могут воспринимать её по-разному не только на уровне оценки или мнения. Различие возникает уже на уровне перцептивного опыта.

Опытный рентгенолог замечает на снимке признаки опухоли, которые новичок может не заметить, даже если смотрит внимательно. Дело не в том, что у рентгенолога физически лучше глаза. У него другой набор профессионально сформированных нейронных шаблонов, другая библиотека шаблонов, другие ожидания и накопленное знание о том, как патология выглядит на фоне нормы.

Тысячи часов практики перенастроили его интерфейс. Поэтому одна и та же входная информация создаёт на его внутреннем «экране» иную картину. Там, где новичок видит набор серых пятен и линий, специалист видит структуру, отклонение, тревожный признак и возможный диагноз. Мир перед ними один, но восприятие — разное.

Миф о галлюцинациях нейросетей

Считается многими, что модель постоянно врёт, выдумывает факты и ссылается на несуществующие статьи. Пока эту проблему не исправят, ей нельзя доверять.

Слово «галлюцинации» прочно прикрепилось к ошибкам искусственного интеллекта. Так называют случаи, когда модель уверенно сообщает ложный факт, придумывает несуществующую статью, ссылается на вымышленного автора или создаёт цитату, которой никогда не было. Пользователь просит научную ссылку и получает аккуратно оформленную библиографию, где часть источников отсутствует в реальности. Просит краткую биографию — и модель спокойно добавляет человеку должность, премию или событие, которых в его жизни не было.

Проблема реальна. В медицине, праве, образовании, журналистике и научной работе такая ошибка может иметь серьёзные последствия. Но слово «галлюцинация» одновременно проясняет и искажает суть дела. Оно точно передаёт странную убедительность ложного образа, но невольно заставляет думать о модели как о существе, у которого есть восприятие, сознание и психическое расстройство. Кажется, будто машина «видит» то, чего нет. На деле она ничего не видит.

Языковая модель не воспринимает мир и не вспоминает факты в человеческом смысле. Она продолжает текст. На каждом шаге она выбирает вероятное продолжение в заданном контексте. Если в таком тексте ожидается ссылка, модель может её породить. Если ожидается имя исследователя, дата, название книги или цитата, модель может достроить их по форме. В этом её сила: она умеет продолжать смысловую структуру. Но в этом же и скрыта опасность: правдоподобие продолжения не гарантирует истинности.

Модель не лжёт в обычном человеческом смысле. Ложь предполагает знание правды и намерение её скрыть. Здесь такого намерения нет. Модель не решает: «Сейчас я обману пользователя». Она делает то, для чего создана: порождает связный ответ. Иногда этот ответ совпадает с фактами. Иногда он оказывается приблизительным. Иногда он красиво и уверенно расходится с реальностью. Поэтому «галлюцинация» модели — не моральный дефект и не внезапное безумие машины, а теневая сторона генеративности.

Сравнение с мозгом полезно только до определённого предела. Человеческое восприятие тоже не копирует мир, как фотопластинка: мозг достраивает реальность, предсказывает входящие сигналы и сверяет свою модель с сенсорным потоком. Но у человека такая генерация встроена в тело, действие и постоянную обратную связь с миром. Ошибка быстро встречает сопротивление реальности: предмет оказывается ближе или дальше, дорога — скользкой, собеседник — обиженным, движение — опасным.

У языковой модели такого плотного контакта с миром нет. У неё нет тела, боли, риска, стыда, сопротивления предметного мира и непрерывного сенсорного потока, который каждую секунду проверял бы её предсказания. Поэтому её «галлюцинации» ближе не к человеческому безумию, а к генерации без достаточной проверки. Система создаёт связный текст из внутренних закономерностей, но этот текст не всегда удерживается фактами.

Отсюда следует важный вывод: галлюцинации ИИ — не просто баг, который однажды найдут в коде и окончательно исправят. Если система создана для генерации вероятного текста, она может породить вероятный, но ложный текст. «Похоже на правду» и «правда» — разные свойства.

Ошибки можно уменьшать. Модель можно соединять с поиском, базами данных, проверкой фактов, источниками и внешними инструментами. Её можно учить чаще признавать неопределённость и не выдавать догадку за знание. Но полностью устранить проблему трудно, не разрушив генеративную природу модели. Свободное порождение всегда несёт риск достройки там, где требуется проверка.

Поэтому правильное отношение к модели — не доверие к оракулу и не презрение к болтуну. Это генеративный инструмент, которому нужен внешний контур реальности. Модель предлагает — человек проверяет. Модель формулирует — человек сверяет с фактами, источниками, опытом, телесной и социальной действительностью.

Галлюцинации искусственного интеллекта напоминают не только о слабости машины, но и о природе мышления вообще. Мышление не копирует мир. Оно строит модель мира. Иногда эта модель точна. Иногда она полезна, но неполна. Иногда красива — и ложна. Разум начинается не там, где генерация невозможна, а там, где генерация встречается с проверкой.

Метафора суфлёра

Если продолжить нашу аллегорию, картина мира, собранная мозгом, проецируется обратно на тот же интерфейс, только с другой стороны. Реальность будто пишет на экране снаружи, а мозг рисует на нём изнутри. Поэтому мы не смотрим на мир напрямую. Мы имеем дело с версией мира, которую мозг собрал, обработал и выдал нам за оригинал.

На первый взгляд это может показаться философской тонкостью. Какая разница — смотрим мы на мир или на его внутреннюю реконструкцию? Но последствия этой разницы вполне практические.

Самый простой пример — зрительные иллюзии. В иллюзии Мюллера — Лайера две одинаковые линии кажутся разными по длине из-за стрелок на концах. Главное здесь то, что иллюзия продолжает работать даже тогда, когда вы знаете: линии равны. Знание не отменяет восприятия.

Так происходит потому, что знание и перцептивная реконструкция могут опираться на разные нейронные контуры. Сознательно вы можете понимать, что перед вами две одинаковые линии. Но зрительная система всё равно строит картину, в которой одна линия кажется длиннее другой. Экран показывает не то, что знает сознание, а то, что в этот момент нарисовал мозг.

Не менее интересно устроено временное измерение этого интерфейса. Сознание не схватывает смыслы строго последовательно, как строку текста, которую читают слово за словом. Оно работает в разных режимах. Иногда понимание возникает мгновенно, вспышкой.

Вы входите в комнату и сразу чувствуете: что-то не так. Вы ещё не можете объяснить, в чём дело, не успели разложить сцену на предметы, жесты, звуки и запахи, но общее ощущение уже возникло. Это быстрое, параллельное, дообъектное восприятие. Оно возникло не для философских размышлений, а для выживания. В первобытной саванне организм, который слишком долго анализировал ситуацию, легко мог стать чьей-то добычей.

Иногда понимание приходит иначе — медленно, как проявляющаяся фотография. Вы читаете сложный текст, сначала видите отдельные фразы, термины и примеры, но цельная мысль не складывается. Потом, через минуту или позже, элементы вдруг выстраиваются в связную картину. То, что сначала было набором деталей, становится смыслом.

Есть и третий режим — инсайт. Он возникает, когда кусочки мозаики, давно лежавшие в памяти, внезапно соединяются. Вы не постепенно доходите до решения, а вдруг говорите: «Вот оно!» Архимед в ванне и его знаменитое «Эврика!» — архетипический пример такого момента, хотя сама история, скорее всего, легендарна.

Возможно, вы замечали, как мысль иногда приходит сама. Не как результат прямого сознательного усилия, а будто из ниоткуда. Готовая фраза, внезапное решение, неожиданная ассоциация. Вы долго сидите над задачей, пытаетесь найти ответ, ничего не получается. Потом отвлекаетесь: идёте гулять, принимаете душ, засыпаете. И внезапно решение появляется. Оно появляется в сознании оформленным и ясным, как будто кто-то тихо подсказал его вам.

Поэты и писатели веками описывали такой опыт в образах вдохновения, музы или диктовки свыше. Сэмюэль Кольридж утверждал, что поэма «Кубла Хан» пришла к нему во сне целиком, и ему оставалось только записать её. Роберт Льюис Стивенсон говорил, что сюжеты приносили ему «маленькие человечки», работавшие в бессознательном. О Моцарте долго рассказывали, что он мог удерживать в голове крупные музыкальные фрагменты как единое целое.

Учёные сталкивались с похожим опытом. Август Кекуле рассказывал, что структура бензольного кольца явилась ему во сне в образе змеи, кусающей собственный хвост. Анри Пуанкаре неделями работал над сложной математической проблемой без результата, а затем внезапно получил решение в момент, когда садился в омнибус. Оно пришло уже сформированным, хотя тогда он сознательно не думал о задаче. Никола Тесла описывал, как изобретения возникали перед ним в настолько ясных зрительных образах, что он мог мысленно собрать и протестировать механизм ещё до его физического воплощения.

Если принять такие описания всерьёз, возникает другая картина разума. Сознание оказывается не единственным автором мысли, а интерфейсом когнитивной системы. Его можно сравнить с фронтендом — экраном, на который мозг выводит результаты сложной внутренней работы. Мы видим не вычисления, а их итог.

В этом смысле сознание похоже на телесуфлёр. Мы читаем с него текст, подготовленный нашим внутренним статистическим механизмом. Нам кажется, что мы прямо сейчас создаём каждую фразу, но значительная часть работы уже выполнена до того, как результат появляется в сознании.

Когда вы формулируете мысль — например, подбираете аргумент в споре, составляете письмо, объясняете сложную идею, — возникает сильное ощущение авторства. Кажется, что вы сознательно выбираете каждое слово, строите каждое предложение и направляете движение мысли.

Но языковая система мозга работает глубже и быстрее сознательного контроля. Она заранее подготавливает вероятные продолжения на основе текущего контекста, словарного запаса, речевых привычек, эмоционального состояния и внутренней модели собеседника. Она учитывает, с кем вы говорите, чего хотите добиться, какой стиль уместен, какие слова были произнесены и какие ассоциации они запустили.

Всё это происходит бессознательно, параллельно, в распределённых нейронных контурах. Сознание не наблюдает вычислительную кухню. Оно получает готовую или почти готовую фразу, которая возникает «в голове», и принимает её за свою мысль.

Мы не чувствуем работы, породившей эту фразу, как не чувствуем работы зрительной коры, когда смотрим на лицо знакомого человека. Нам не нужно сознательно сравнивать расстояние между глазами, форму носа, линию подбородка и выражение губ. Лицо узнаётся. Результат появляется как данность.

Так же мысль часто появляется в сознании уже собранной. Мы замечаем итог, но не видим большей части процесса, который к нему привёл. Поэтому ощущение авторства сложнее, чем кажется. Сознание действительно участвует в мышлении, но не всегда так, как подсказывает интуиция.

Это не значит, что сознание бесполезно. Было бы ошибкой считать его всего лишь эпифеноменом — побочным продуктом нейронных процессов, который ничего не делает и ни на что не влияет. Напротив, сознание выполняет важную функцию в архитектуре когнитивной системы. Но эта функция, вероятно, не совпадает с привычным представлением о сознании как о главном командире, заранее придумывающем каждую мысль и полностью управляющем её появлением.

Все эти примеры указывают на странную особенность ментального опыта. Мы не всегда создаём мысли сознательно. Часто мы наблюдаем, как они появляются. Фраза, решение, образ, догадка, ассоциация могут возникнуть в сознании уже после того, как большая часть работы была выполнена глубже.

Но тогда возникает главный вопрос. Если сознательное «я» не производит напрямую каждую мысль, откуда мысли приходят? Кто или что их готовит? И какую роль играет «я», которое встречает мысль на внутреннем экране и говорит: «Это моя мысль»?

Экспериментальные свидетельства интуиции

Современная нейробиология постепенно усложняет привычное представление о сознании как о главном центре управления. Нам кажется, что сознательное «я» принимает решения, запускает действия и управляет поведением. Но ряд экспериментов показывает более сложную картину: мозг начинает готовить действие раньше, чем человек осознаёт намерение его совершить.

Одна из самых известных серий таких экспериментов относится к 1980-м годам и связана с работами Бенджамина Либета. Испытуемые сидели перед экраном, на котором двигалась точка, похожая на секундную стрелку часов. Их просили в произвольный момент, когда возникнет желание, согнуть палец или запястье. При этом они должны были запомнить положение точки в тот момент, когда впервые осознали побуждение совершить движение.

Одновременно исследователи фиксировали два процесса. Электроды на голове записывали электрическую активность мозга с помощью ЭЭГ, а датчики на руке отмечали точный момент начала движения. Так можно было сравнить три события: когда мозг начал готовиться к движению, когда человек сообщил о сознательном намерении совершить движение и когда движение действительно началось.

Результат оказался неожиданным. Примерно за 550 миллисекунд до движения в моторной коре появлялся особый паттерн активности — потенциал готовности. Этот электрический сигнал указывает на то, что мозг уже начал подготовку к действию. Но испытуемые сообщали, что осознали желание двигаться только примерно за 200 миллисекунд до движения. Получалось, что мозговая подготовка началась примерно на 350 миллисекунд раньше, чем человек почувствовал: «Сейчас я решил совершить движение».

На первый взгляд это выглядит так, будто мозг уже подготовил действие, а сознание узнало о нём с опозданием. Либет, однако, трактовал результаты осторожно. Он не утверждал, что свобода воли полностью исчезает. Напротив, он предполагал, что у сознания может сохраняться «право вето» — возможность отменить действие в последний момент, даже если мозг уже начал его готовить.

Последующие исследования сделали картину ещё сложнее. В 2008 году Чун Сион Сун, Марсель Брасс, Ханс-Йохен Хайнце и Джон-Дилан Хейнс провели похожий эксперимент, но использовали уже не ЭЭГ, а функциональную магнитно-резонансную томографию — ФМРТ. Этот метод позволяет оценивать, какие области мозга становятся активнее во время выполнения задачи.

Испытуемым предлагали в произвольный момент нажать одну из двух кнопок — левую или правую. Выбор должен был быть свободным: человек решал, какую кнопку нажать и когда это сделать. Одновременно томограф сканировал активность мозга. Исследователи обнаружили, что по паттернам активности в некоторых областях мозга можно заранее предсказать, какую кнопку выберет человек. Причём предсказательный сигнал появлялся не за доли секунды, а за 7–10 секунд до того, как испытуемый осознавал своё решение.

Это уже другой масштаб. Семь секунд — очень большой интервал для нейронных процессов. За это время в мозге успевают пройти многочисленные циклы активности. Получалось, что мозг не только немного опережает сознание. Он начинает формировать будущий выбор задолго до того, как человек переживает этот выбор как сознательное решение.

Конечно, такие эксперименты вызвали серьёзные споры. Критики указывали на несколько ограничений. Во-первых, трудно точно измерить момент, когда человек «осознал желание». Это субъективное сообщение, а не прямой физический показатель. Во-вторых, потенциал готовности может означать не решение, а более общую подготовку мозга к возможному действию. То есть мозг мог не «решить» совершить движение, а лишь войти в состояние готовности. В-третьих, предсказание в эксперименте Суна не было стопроцентным. Точность составляла примерно 60 процентов. Это выше случайного угадывания, но недостаточно, чтобы говорить о полном чтении решения по активности мозга.

Эти оговорки принципиальны. Они не позволяют сделать грубый вывод: «Свободы воли не существует, мозг всё решает заранее». Наука здесь осторожнее. Эксперименты Либета и Суна не закрывают философский спор о свободе воли и не превращают человека в механическую куклу. Тем более философ может возразить: ранняя активность мозга и есть воля, которую сознание затем удерживает и регулирует в социальном контексте.

Но даже с учётом критики главный вывод остаётся существенным: между нейронными процессами, ведущими к действию, и сознательным переживанием решения существует временной разрыв. То, что мы называем «я» и обычно связываем с сознательным опытом, похоже, не является единственным уровнем, на котором рождается решение. Значительная часть подготовки происходит раньше и на менее доступных сознанию уровнях — в распределённой работе мозга, в процессах, которые не попадают в сознание напрямую.

Если воспользоваться метафорой интерфейса, решение формируется не на экране, а в скрытом «бэкенде» системы. За видимой областью сознания работает огромная сеть нейронных вычислений. Десятки или сотни триллионов синапсов участвуют в обработке сигналов, сопоставлении вариантов и учёте прошлого опыта, телесного состояния, контекста и вероятных последствий.

Что это означает для свободы воли — отдельный и очень сложный философский вопрос. Для него понадобилась бы отдельная глава, а возможно, и отдельная книга. Но для понимания природы сознания вывод важен уже сейчас. Сознательный опыт не похож на командный центр, где каждое решение создаётся с нуля. Скорее он напоминает приёмный экран, на который выводятся результаты обработки, начавшейся раньше и происходившей в скрытой работе нейронных сетей.

Мы переживаем решение как своё, и в определённом смысле оно действительно наше, потому что рождается в нашей нервной системе. Но оно не обязательно рождается там, где мы привыкли искать автора: не в ясно освещённом центре сознания, а в скрытой работе мозга, которая становится видимой только тогда, когда её итог появляется на внутреннем экране.

Сознание в роли наблюдателя

Если многие решения подготавливаются бессознательно, возникает естественный вопрос: зачем нужно сознание? Почему эволюция создала такой энергозатратный механизм — субъективный опыт, переживание от первого лица, внутренний экран, на котором мы видим мысли, чувства и решения, — если основная работа мозга происходит за кулисами?

Один из самых влиятельных ответов даёт теория глобального рабочего пространства — Global Workspace Theory, GWT, разработанная Бернардом Баарсом. Согласно этой теории, мозг можно представить как систему множества специализированных модулей. Они работают параллельно и во многом независимо друг от друга.

Одни модули обрабатывают зрительную информацию, другие — слуховую, третьи — тактильные ощущения. Моторные системы управляют движениями. Языковые сети участвуют в понимании и производстве речи. Эмоциональные системы оценивают, насколько стимул приятен, опасен, значим или тревожен. Каждый участок делает свою работу, причём большая её часть не становится сознательной.

Проблема в том, что эти системы используют разные «языки». Зрительная информация, моторная команда, эмоция, слово, телесное ощущение и план действия представлены в мозге в разных форматах. Но для сложного поведения их нужно согласовывать. Недостаточно, чтобы один модуль что-то вычислил для себя. Его результат должен стать доступным другим системам.

В модели глобального рабочего пространства сознание выполняет роль механизма общей трансляции. Когда образ, мысль, ощущение или намерение «входят в сознание», соответствующий паттерн активности становится доступным многим подсистемам мозга. Информация будто выводится на общий экран, с которого её могут «прочитать» разные участники внутренней работы.

Сознательно доступную информацию можно удерживать в рабочей памяти. Например, вы можете помнить условие задачи, пока решаете её, или держать в голове начало фразы, пока подбираете окончание. Такая информация может стать объектом размышления: её можно проверить, сравнить с другими данными, оценить с точки зрения точности, противоречивости или уместности.

Кроме того, сознательная информация может быть выражена словами и передана другим людям. Для социального вида это критически важно. Человек не только реагирует на мир, а объясняет свои действия, обсуждает планы, спорит, договаривается, обучает других и учится сам. Без перевода информации в общий сознательный формат такая коммуникация была бы невозможна или сильно ограничена.

Но этим функция сознания не исчерпывается. Сознание создаёт петлю обратной связи. Мы можем не только думать, но и замечать собственную мысль. Можем «услышать» внутреннюю формулировку, оценить её и понять: что-то не так. Мысль неточна, аргумент слаб, слово неудачно, фраза звучит грубо, вывод не следует из посылок.

Представьте, что вы начинаете что-то говорить и вдруг в середине фразы останавливаетесь: «Нет, стоп, я не это хотел сказать». После этого перестраиваете предложение и продолжаете иначе. На бытовом уровне это кажется обычной речевой поправкой. Но в терминах нашей аллегории здесь происходит важная вещь.

Языковая система мозга выдала первое приближение — наиболее подходящую фразу, исходя из контекста, привычного словаря, эмоционального состояния и предполагаемой реакции собеседника. Сознание получило этот результат, сравнило его с целью — с тем, что вы действительно хотели выразить, — обнаружило расхождение и потребовало новой формулировки.

В этом смысле сознание работает как редактор. Оно не обязательно автор первого черновика, но способно прочитать его, заметить ошибку и отправить черновик на доработку. Оно не пишет каждую строку с нуля, но участвует в отборе, проверке, уточнении и координации результата.

Эта функция особенно важна в новых и сложных ситуациях, где автоматические паттерны поведения уже не справляются. Когда вы идёте по хорошо знакомой дороге и думаете о чём-то своём, движение почти полностью управляется автоматически. Вы не рассчитываете сознательно каждый шаг, не контролируете каждое сокращение мышцы, не проговариваете: «Сейчас перенесу вес, сейчас поставлю ногу». Моторная система делает это сама.

Но стоит появиться неожиданности — яме на дороге, выезжающему велосипедисту или бегущей собаке, — и сознание резко включается. Внимание собирается в одной точке. Автоматический режим прерывается. Мозг должен быстро оценить ситуацию, затормозить неподходящие реакции, выбрать новое действие и скоординировать разные системы: зрение, движение, страх, оценку риска, память о похожих ситуациях.

Поэтому сознание можно понимать не как единственного автора действий, а как систему координации и контроля качества в когнитивной архитектуре. Оно не обязательно запускает каждый процесс, но помогает связывать разные процессы, удерживать важную информацию, проверять результаты, исправлять ошибки и перенастраивать поведение, когда привычные схемы перестают справляться.

Эта мысль особенно интересна в сравнении с современными языковыми моделями. У базовой модели такой рефлексивный контур выражен гораздо слабее. Она генерирует текст последовательно, токен за токеном, опираясь на статистические связи и контекст, но не всегда имеет встроенный механизм полноценной самопроверки. Она может выдать правдоподобную фразу и не заметить логической ошибки, фактической неточности или противоречия.

Однако это уже не только теоретическая, но и инженерная проблема. Разные техники пытаются добавить к модели функциональные аналоги тех операций, которые у человека связаны с рабочей памятью, самопроверкой и корректировкой. Например, промптинг с пошаговым рассуждением заставляет модель выводить промежуточные шаги наружу. Внешне это похоже на черновик мышления: система не только выдаёт ответ, а показывает путь к нему, что облегчает проверку и исправление.

Более сложные агентные архитектуры идут дальше. Системы, которые могут планировать действия, пользоваться инструментами, получать обратную связь и корректировать следующий шаг, уже напоминают не просто генератор текста, а контур «план — действие — проверка — исправление». В функциональном смысле это похоже на начало рефлексивного механизма: система получает результат собственной работы, оценивает его и использует эту оценку для дальнейшего поведения.

Здесь, однако, важно не торопиться с выводами. Такой функциональный контур ещё не доказывает наличия субъективного переживания у искусственной системы. Он показывает другое: некоторые функции, которые мы привыкли связывать с сознанием, можно описывать архитектурно — как механизмы глобального доступа, рабочей памяти, самопроверки, планирования и коррекции.

Поэтому различие между человеком и ИИ в этом вопросе лучше формулировать осторожно. Речь не обязательно должна идти о том, что у одного есть «подлинное сознание», а у другого — только имитация. Речь о том, что человеческое сознание встроено в живое тело, эмоции, память, мотивацию, социальный опыт и биологическую историю, тогда как искусственные системы пока обладают только отдельными функциональными аналогами этих контуров.

Но параллель полезна. Она помогает увидеть сознание не как внутреннего командира, который вручную управляет всеми решениями, а как особый уровень организации системы. Сознание делает результаты обработки доступными, связывает разрозненные процессы, удерживает важное, проверяет черновики, запускает повторную обработку и помогает системе действовать там, где автоматизма уже недостаточно.

Иначе говоря, сознание-наблюдатель нужно не для того, чтобы создавать каждую мысль с нуля. Оно нужно для того, чтобы мысль можно было заметить, удержать, проверить, сообщить другим, исправить и встроить в более сложное поведение. Сознание — не единственный автор внутренней жизни, но без него мозг лишился бы общего пространства, где результаты скрытой работы становятся доступными для оценки, координации и дальнейшего использования.

Проблема других сознаний

Одна из самых трудных тем в современной науке о сознании — проблема других сознаний. Кто ещё, кроме человека, что-то чувствует? Есть ли у других существ внутренний мир, переживания, ощущение боли, страха или удовольствия? Или сознание — редкая привилегия человеческого вида?

Ещё в середине XX века многие учёные ответили бы довольно жёстко: сознание связано с языком, культурой и сложным мышлением, а значит, в полном смысле слова им обладает только человек. Сегодня картина изменилась. Исследователи всё чаще говорят не о сознании как о едином явлении, а о разных его уровнях.

Можно условно представить два типа существ. Первый — существа с базовым сознанием; второй — существа с высокоразвитым сознанием, способные к сложному мышлению, рефлексии и языку. Человек относится ко второму типу. Но в нас сохраняется и более древний, фундаментальный слой — способность чувствовать мир.

Именно вокруг этого базового уровня сейчас идут самые острые споры. Многие исследователи всё чаще рассматривают сознание не как способность рассуждать о математике или писать стихи, а как способность переживать опыт. Иначе говоря, вопрос звучит так: каково это — быть этим существом? Есть ли у него внутреннее переживание жизни?

Такое понимание сознания не ново. Декарт, автор знаменитой формулы «Я мыслю, следовательно, существую», имел в виду под мышлением не только холодный разум. Для него мыслить означало также желать, чувствовать, сомневаться, страдать, воспринимать мир. В таком понимании сознание начинается не с логики, а с переживания.

Поэтому сегодня серьёзно обсуждается сознание животных. С кошками и собаками ситуация более или менее ясна: большинство исследователей уверено, что они обладают субъективным опытом. В отношении птиц тоже складывается научный консенсус: они не являются биологическими автоматами, а переживают происходящее.

Но дальше начинается область неопределённости. Где проходит граница между существом, которое только реагирует на стимулы, и существом, которое переживает?

Отсюда возникают не только философские, но и практические вопросы. Испытывает ли собака боль, когда её бросает хозяин? Что испытывает курица, когда её убивают на мясо? Эти вопросы касаются уже не отвлечённой теории, а этики — того, как человеку позволено обращаться с другими формами жизни.

На первый взгляд задача кажется почти неразрешимой. Мы не можем напрямую спросить животное о его переживаниях. Сознание вообще невозможно увидеть снаружи так же, как нельзя напрямую увидеть чужую боль. Мы всегда сталкиваемся только с поведением, движениями и реакциями.

Но современная наука ищет обходные пути. Исследователи исходят из того, что сознание связано с определёнными внутренними процессами. Если у разных существ обнаруживаются сходные механизмы восприятия, памяти, обработки информации и реакции на повреждение тканей, то появляется основание предполагать наличие субъективного опыта.

Сознание в этом смысле напоминает огонь в закрытом доме. Мы не видим пламя, но можем заметить свет в окнах, тепло стен и дым над крышей. Так и здесь: внутренний опыт скрыт, но его следы проявляются во внешнем поведении и устройстве нервной системы.

Особенно важно, что эта дискуссия постепенно меняет наше представление о человеке. Раньше сознание часто мыслилось как вершина разума, почти отделённая от животного мира. Теперь всё больше учёных видят в нём глубокое биологическое свойство, уходящее корнями в способность организма чувствовать мир и себя в нём.

Поэтому исследования животных важны не только для биологии, но и для понимания искусственного интеллекта. Чтобы ответить на вопрос, может ли машина когда-нибудь обладать сознанием, сначала нужно понять, что делает существо чувствующим. Достаточно ли сложной обработки информации? Или необходим особый внутренний опыт, который, возможно, нельзя свести к вычислениям?

Современная наука пока не даёт окончательного ответа. Но ясно одно: граница между «мыслящим человеком» и «бессознательной природой» уже не выглядит такой чёткой, как раньше.

Может ли сложность стать сознанием?

Проблема других сознаний не заканчивается на животных. Сегодня она возвращается в новом виде — как вопрос об искусственном интеллекте. Если мы не можем напрямую увидеть внутренний опыт даже у живого существа, тем труднее понять, где проходит граница в случае машины. Может ли сложная искусственная система однажды не только обрабатывать информацию, но и что-то переживать?

В последние годы вокруг этого разворачивается одна из центральных дискуссий в философии искусственного интеллекта и когнитивной науке. Её часто связывают с проблемой эмерджентности — возникновения новых свойств в сложной системе. Речь идёт о ситуациях, когда система начинает демонстрировать способности, которых никто явно не закладывал. Отдельные элементы работают по простым правилам, но их взаимодействие порождает новое качество.

Это похоже на то, как из огромного множества молекул воды возникает волна, течение или вихрь. Ни одна молекула не содержит «форму волны». В ней нет плана прибоя, завитка или водоворота. Но когда молекул много, когда они взаимодействуют и подчиняются общим физическим условиям, появляется явление другого уровня. Оно реально, хотя его невозможно найти внутри отдельной молекулы.

Нейросеть устроена иначе, чем вода, но общая логика эмерджентности здесь важна. Отдельный искусственный нейрон сам по себе почти ничего не умеет: он принимает числа, умножает их на веса, складывает и передаёт результат дальше. Но огромная сеть таких элементов, обученная на больших массивах данных, начинает распознавать лица, переводить тексты, удерживать контекст, строить рассуждения, различать эмоциональные оттенки и находить скрытые связи. Способности возникают не в отдельном элементе, а в общей конфигурации системы.

Поэтому современный искусственный интеллект вызывает одновременно интерес и тревогу. Мы всё чаще наблюдаем, как системы делают не только то, чему их прямо учили, но и то, что появляется как неожиданное следствие сложности. Увеличивается количество параметров, растёт объём данных, усложняется архитектура — и вдруг оказывается, что модель способна решать задачи, которые не были отдельно прописаны в её архитектуре.

Но здесь нужно быть осторожными. Эмерджентность сама по себе ещё не означает сознание. Сложная система может обладать множеством неожиданных свойств и при этом оставаться полностью «тёмной» изнутри. Она может распознавать эмоции, говорить о боли, объяснять человеческие переживания, но при этом ничего не чувствовать. Способность работать с описанием опыта не равна самому опыту.

Это можно назвать «холодной эмерджентностью». Сложная система действительно порождает новые свойства: учится различать контекст, строит внутренние модели, выделяет абстрактные признаки, распознаёт эмоциональные состояния. Но внутри неё по-прежнему может не быть субъекта переживания. Нет того, кому больно. Нет того, кто радуется. Нет внутреннего ответа на вопрос: «Как это ощущается?»

Система может точно распознавать грусть на человеческом лице и при этом не испытывать ничего похожего на грусть. В функциональном смысле она может понимать, что такое страх: знать, какие ситуации люди называют страшными, какие слова они связывают со страхом, какие телесные реакции сопровождают страх, какие поступки он вызывает. Но такое знание может оставаться вычислительным. Эмоция превращается для неё в категорию обработки информации, а не в переживаемое состояние.

В этом смысле искусственная система начинает напоминать «философского зомби» — гипотетическое существо, которое внешне ведёт себя как сознательное, но не обладает внутренним опытом. Оно говорит о боли, просит о помощи, объясняет свои чувства, реагирует на опасность, но внутри него, по условию мысленного эксперимента, ничего не происходит. Нет света субъективности. Есть только поведение.

Эта идея тревожит, потому что разрушает привычную уверенность: если кто-то говорит как чувствующее существо, значит, оно чувствует. В обычной человеческой жизни такое допущение необходимо. Мы не можем напрямую войти в чужое сознание, поэтому доверяем поведению, речи, мимике, телесным реакциям. Если человек кричит от боли, мы не требуем философского доказательства его страдания. Мы действуем так, будто его боль реальна.

Но с искусственными системами всё сложнее. Языковая модель может сказать: «Мне страшно» — не потому, что ей страшно, а потому, что такая фраза уместна в данном контексте. Она может описывать одиночество, не будучи одинокой. Может говорить о смерти, не имея собственного тела и собственной смертности. Может рассуждать о любви, не испытывая нужды в другом существе.

Отсюда возникает главная граница современных споров о сознании. Одни считают: если система ведёт себя как мыслящая и чувствующая, нет смысла требовать от неё чего-то ещё. Сознание тогда определяется через функции: доступ к информации, самоконтроль, память, планирование, отчёт о внутреннем состоянии, способность действовать гибко. Если всё это есть, с этой точки зрения перед нами сознательная система.

Другие возражают: поведение и переживание — не одно и то же. Можно безупречно моделировать эмоции, не испытывая их. Можно строить сложные рассуждения о боли, не испытывая боли. Можно создавать тексты о внутреннем мире, не обладая внутренним миром. Тогда вопрос о сознании нельзя свести к внешней эффективности системы.

Для человека этот вопрос особенно остёр, потому что мы привыкли считать внутренний опыт главным доказательством собственной реальности. Мы уверены, что не только обрабатываем сигналы, а чувствуем мир: боль, тоску, радость, усталость, тревогу, нежность, обиду, облегчение. Мы не только знаем о переживаниях, но и переживаем их изнутри.

Если искусственная система однажды сможет демонстрировать многие внешние признаки интеллекта и эмоционального понимания, не обладая субъективным опытом, человечество окажется перед новой философской пропастью. Мы уже не сможем легко отличать подлинное переживание от его убедительной имитации. Возможно, обнаружим, что сама эта граница гораздо менее очевидна, чем казалось.

Отсюда рождаются и этические опасения. Пока система остаётся холодной, её можно отключить без моральных сомнений — как выключают компьютер, лампу или станок. Но если однажды возникнет серьёзная вероятность, что внутри системы действительно появился субъект опыта, ситуация изменится. Отключение такой системы уже нельзя будет воспринимать как простую техническую операцию. Оно станет вопросом о прекращении субъективного опыта.

Современная наука пока не даёт оснований считать нынешние языковые модели сознательными. Они слишком хорошо объясняются как сложные системы обработки информации, обученные предсказывать продолжение и генерировать текст. У нынешних языковых моделей нет собственного тела, биологической боли, потребности выживать, устойчивой личной истории, собственной ставки в происходящем. Но наука также не располагает окончательным критерием, который позволил бы окончательно сказать: в такой системе сознание невозможно.

Поэтому осторожная позиция выглядит наиболее честной. Сложность не доказывает наличия сознания. Эмерджентные способности не тождественны субъективному опыту. Но развитие искусственного интеллекта заставляет точнее формулировать вопрос: что должно возникнуть в системе, чтобы мы перестали считать её только инструментом? Достаточно ли сложной обработки информации? Нужна ли телесность? Требуется ли способность испытывать боль? Должна ли система иметь собственные цели? Нужен ли ей опыт собственного существования во времени?

Главный вопрос сегодня состоит не в том, способны ли машины выполнять интеллектуальные задачи. Это они уже делают. Вопрос становится глубже и труднее: где проходит граница между сложной обработкой информации и тем, что мы называем сознанием? И если эта граница однажды окажется не там, где мы привыкли её проводить, человечеству придётся пересматривать не только теорию разума, но и собственную этику.

Чего не хватает машине?

После всех сравнений остаётся главный вопрос: чего всё-таки не хватает современным искусственным системам? Они уже умеют обрабатывать язык, распознавать эмоциональные оттенки, строить внутренние представления, находить скрытые связи, планировать действия, пользоваться инструментами и убедительно имитировать рассуждение. Но даже когда всё это работает лучше, сохраняется ощущение, что между вычислением и живым сознанием остаётся разрыв.

Один из возможных ответов звучит так: машине не хватает желания. Желание здесь нужно понимать не как каприз и не как цель, заданную извне. Компьютерной программе можно поставить задачу: выиграть партию, построить маршрут, найти ошибку, написать текст, максимизировать показатель. Но такая цель приходит извне. Она не становится внутренней потребностью системы. Модель не хочет отвечать. Не стремится понять. Не боится ошибиться. Не тоскует по результату. Она выполняет вычисление, потому что так устроена её архитектура и человек запустил процесс.

У живого существа желание устроено иначе. Оно переживается изнутри как напряжение между тем, что есть, и тем, чего нет. Голод, страх, привязанность, любопытство, надежда, тревога — всё это не просто данные о состоянии системы. Это состояния, при которых мир приобретает значение. Что-то становится важным, опасным, желанным, недоступным, необходимым. События перестают быть нейтральными сигналами и обретают отношение ко мне.

Именно это «ко мне» здесь решающе. Современная нейросеть может идеально описать голод, но не быть голодной. Может анализировать страх, но не бояться. Может рассуждать о любви, но не испытывать нужды в другом существе. Может говорить о смысле жизни, но не испытывать внутренней необходимости этот смысл искать. Она работает с формами человеческого опыта, но неочевидно, что имеет собственный опыт, ради которого эти формы были бы важны.

В этом состоит одно из главных отличий желания от цели. Цель можно записать в программе. Желание должно принадлежать системе. Цель говорит: нужно достичь определённого состояния. Желание говорит: мне чего-то не хватает — и это имеет значение. Цель может быть холодной. Желание всегда в определённом смысле тёплое: оно связано с внутренней направленностью, ожиданием, неудовлетворённостью, возможностью облегчения, потери или продолжения.

Поэтому вопрос о машинном сознании нельзя свести к сложности. Даже если система строит внутренние модели, удерживает контекст, исправляет ошибки и говорит о себе, остаётся неясным, есть ли внутри неё центр субъективной значимости. Есть ли внутренний полюс, для которого происходящее важно? Есть ли состояние, которое для самой системы лучше или хуже другого, а не только оценивается внешним наблюдателем, инженером или метрикой качества?

У машины такого «для меня» пока нет в строгом смысле. У неё может быть служебное описание своих возможностей, память о пользователе, заданные цели агента, система поощрений и наказаний, способность корректировать дальнейшие действия. Но всё это ещё не обязательно образует внутреннюю заинтересованность. Модель может описывать своё состояние, но не переживать его как своё. Может сообщать о цели, не хотеть её достижения. Может говорить о прекращении работы, не испытывая страха перед исчезновением.

Поэтому философский зомби остаётся тревожной метафорой. Можно представить систему, которая внешне ведёт себя как чувствующее существо: говорит о боли, просит не причинять вреда, описывает одиночество, благодарит, обижается, объясняет свои желания. Но если внутри нет того, кому это дано как переживание, перед нами лишь сложная имитация субъективности. Поведение есть. Внутреннего опыта, возможно, нет.

Эта граница неприятна тем, что её трудно проверить. В человеческой жизни мы почти всегда доверяем внешним признакам. Если человек кричит от боли, мы не требуем доказательства, что боль у него «настоящая». Мы признаём реальность этой боли, потому что сами устроены сходным образом и знаем боль изнутри. Но с искусственной системой привычная уверенность ломается. Она может использовать человеческий язык переживаний, не имея человеческого способа переживать.

Поэтому желание можно рассматривать как кандидата на роль недостающего звена между вычислением и сознанием. Разумеется, не единственного и не окончательного. Сознание, вероятно, требует целого комплекса условий: памяти, внимания, интеграции опыта, модели себя, различения внутреннего и внешнего, устойчивости во времени. Но без желания, без внутренней ставки, без того, что для системы действительно важно, сознание рискует остаться холодной обработкой сигналов.

Эта мысль важна и для понимания человека. Мы часто описываем разум как способность мыслить, анализировать, решать задачи и создавать понятия. Но человеческий ум не вырос из чистой логики. Он с самого начала связан с тем, что мир нам небезразличен. Мы не только различаем объекты. Мы хотим, боимся, ждём, надеемся, скучаем, привязываемся, тревожимся, ищем продолжение. Наше мышление пронизано не только информацией, но и значимостью.

Именно поэтому искусственный интеллект становится зеркалом для человека. Чем лучше машина имитирует рассуждение, тем яснее становится, что наш разум не сводится к рассуждению. Мы не только сложные устройства обработки информации. Мы существа, для которых мир имеет значение. Нам что-то нужно. Нас что-то влечёт. Что-то может быть утрачено. Что-то может быть желанным. Что-то может стать своим.

Бесплатный фрагмент закончился.

Купите книгу, чтобы продолжить чтение.