электронная
144
печатная A5
442
12+
Искусственный интеллект: начала MSM

Бесплатный фрагмент - Искусственный интеллект: начала MSM

Сингулярность неизбежна

Объем:
272 стр.
Возрастное ограничение:
12+
ISBN:
978-5-4490-4338-2
электронная
от 144
печатная A5
от 442

Предисловие ко второму изданию

Интерес к искусственному интеллекту не случаен. Согласитесь, кому не хотелось бы иметь при себе всегда внимательного собеседника или помощника, который работал бы за него 24 часа в сутки без усталости, ссор и эмоций?

Но тема, выбранная в повествовании, затронута не ради популярности.

Мне хочется рассказать вам что-то особенное на тему искусственного интеллекта. Если быть точнее, то это демонстрация работы модели новой системы и подхода к обработке строковых данных, которая показала замечательные результаты буквально за пару месяцев ее реализации моими собственными небольшими усилиями.

То, чем занимается автор на основной работе, — это обработка текстов, видео, работа с журналистами, светом и звуком. Но кроме прочего, у него есть увлечение, занимающее его уже очень давно — программирование.

Свою первую масштабную программу, которая обрабатывала электронные резюме я создал в 2009 году, постепенно дорабатывал и патентовал в 2013-м году как «Комплекс обработки резюме «Спартак». Его суть заключалась в автоматической обработке резюме от приема и до переписки с клиентами без вмешательства человека в этот процесс. Это был существенный прорыв в автоматизации на тот момент. Моя система отличалась очень высокой точностью обработки (до 98% точности распознавания). Но речь сейчас не о ней. Я привел этот пример, как небольшой экскурс к собственной квалификации.

В связи с возросшим в последние годы интересом к ИИ, я постоянно ломал голову над тем, каким образом можно выстроить систему, которая позволит работать со сложными и запутанными объектами реального мира; которая поможет реализовать механизмы мышления, а не имитации или статистической обработки данных, реализованных в современных нейросетях.

Решение пришло внезапно, — вечером 4 августа 2017 года. И на следующий день я приступил к работе над программой, которая оказалась с одной стороны — невероятно проста, а с другой стороны — чрезвычайно интеллектуальна. К моменту, когда я писал эти строки прошло всего несколько месяцев, но уже теперь мы можем видеть потрясающие результаты, подтверждающие верность и перспективность выбранного направления.

Работа над концепцией MSM, — задача не из простых, и я буду рад всем тем, кого она заинтересует и привлечет к интереснейшей практической работе, имеющей своей целью построение сильной логической машины.

На страницах книги вы как следует потренируете мозги и узнаете, что делает человека — человеком. А затем, поймете, как с помощью простейших средств можно построить программу, претендующую на разумность в человеческом понимании. Даже если вы совершенно не знакомы с программированием, — в приложении приводятся исходники на обычном Паскале, которые вы можете свободно использовать для того чтобы попробовать построить свою систему на основе логики MSM. В разделе исходников автор даже оставил немного свободного места для ваших собственных заметок, а также привел примеры классификатора, включающего самые различные объекты реального мира.

Кстати о классификаторе. Вы многое узнаете о необычном подходе к классифицированию; и даже задумаетесь о том, почему наше мышление парадоксально, что такое «квантовое восприятие», и вероятно осознаете, почему, например, собственный палец можно считать неживым и живым одновременно.

Быть может не все покажется вам в этой книге правильным. Но в любом случае, вы совершите потрясающее путешествие в глубины вашего разума для того чтобы разбудить новые идеи, способные перевернуть мир.

Введение

Если нужно что-нибудь спрятать, лучше всего положить это на самое видное место, потому что там его искать не придет в голову никому.»

Бернар Вебер

«Все, что нашему сознанию не нравится, мы изо всех сил пытаемся от себя спрятать, вытеснить куда-то в тень — с глаз долой, из сердца вон. И даже если сокрытое находится на самом видном месте, мы сделаем все, чтобы его не замечать.»

Андрей Курпатов, «Красная таблетка»

«Ну а с чего Вы решили, что Вы разумная жизнь? Вот это мне всегда было любопытно, давайте посмотрим как Ваш вид закончит свое существование, тогда мы будем говорить о его разумности.»

Александр Невзоров, из интервью в журнале «Сноб» от 16.09.2015 г.

Вопрос о том, что такое разум, разумная жизнь, беспокоит наших современников все чаще. И если бы мы создавали классическое исследование на эту тему, то можно было бы привести десятки выдержек из отечественных и зарубежных монографий, а также привести сотни аргументов в пользу той или иной теории. Но цель этого исследования — не научная диссертация с целью получить ученую степень. Исследование, которое невольно мне пришлось затронуть — это конечно же не вопрос одного дня или года, для более-менее сносного погружения в тему. Но я надеюсь, что читатель имеет голову на плечах, чтобы следовать простым и логичным выводам. Условимся сразу, взяв за постулат крылатое выражение «Sapienti sat» («Разумному достаточно», лат.) Да простят меня те специалисты, на чей кусок хлеба я покусился. (У вас еще будет достаточно времени для критики.) Но сейчас мы попробуем разобраться самостоятельно, на максимально доступных примерах, что же такое человек и как работает человеческое мышление; а главное, что делает человека человеком.

Я попробую начать рассуждение издалека и привести аргументы в доказательство своей гипотезы, которые кажутся мне очевидными настолько, что должны быть понятны и восьмилетнему ребенку.

Что такое человеческий мозг?

Чтобы построить теоретическую модель мозга, нам потребуется сделать несколько допущений, которые наиболее вероятны. И мы привлечем на помощь простую логику.

Да, мозг это очень сложный биологический орган. Но, согласно анатомическим данным, строение мозга человека не уникально. Подобный сложный инструмент имеют многие млекопитающие, такие как лошади, приматы, дельфины; причем по размеру, мозг, например, слона (5 кг) или синего кита (6—8 кг) — значительно превосходит человеческий (1,5 кг). Различия в организации принципа работы человеческого мозга и мозга животного существуют, но они для нас в данный момент малоинтересны. (Поскольку мозг — это лишь «железо», технический базис, но нам более важно, как организован «софт». То есть, нам необходимо представить модель «программного обеспечения», а не реконструировать «процессор»).

Еще, мы не будем считать, что в человеческом теле происходят некоторые процессы, которые не поддаются исследованию и измерению, поскольку личность человека напрямую зависит от состояния и работы его мозга, а любое нарушение этой работы влечет к необратимым последствиям. Грубо говоря, мы должны быть уверены, что человеческая личность, характер, эмоции, поведение — это его мозг и ничего более. Условимся, что это так.

Определимся и в том, что мозг это некий сложный инструмент, но он полностью замкнут в черепной коробке где темно, тепло и тихо. Мозг получает в свое распоряжение наборы импульсов, поступающих к нему с помощью органов зрения, слуха, осязания, обоняния и вестибулярного аппарата. В этом нет никакой магии или волшебства. Задача мозга — обрабатывать поступающие сигналы и производить реакции в соответствии со сложившейся обстановкой. Пока что у нас получается все ровно так же, как и у животных. Но где же появляется различие?

Мозг как эволюционный инструмент

Вспомним, что мозг, как и любой другой орган — помогает адаптироваться к условиям среды и увеличивать шансы к выживанию организма. Удачная стратегия «самореализации» этого органа (как и любого другого) будет залогом повышенных шансов к выживанию и распространению его генов в популяции.

Но здесь необходимо уловить еще пару важных моментов.

Обратимся к истории человечества. И зададимся вопросом, когда человек как биологический вид получил явное эволюционное преимущество? Очевидно, что это произошло тогда, когда он научился обмениваться информацией с помощью языка, в котором заключались символы-описания.

(Конечно, некоторые специалисты уточнили бы, что важным переходным этапом было и освобождение рук для более сложных операций с другими объектами окружающего мира. Но язык, как система передачи данных; а более того, рожденная с его помощью символьная система, которой оперирует мозг, по моему мнению, все же является более мощным антропогенным фактором. В целом же и язык, и прямохождение с освобождением рук, и всеядность, и социальность — это взаимные катализаторы эволюционного процесса развития интеллекта).

Ученые предполагают, что развитие сложного языка началось около 50 тысяч лет назад. И за эти 50 тысяч лет или примерно 2500 поколений человечество совершило самый мощный скачок в развитии; очевидно, больший, чем за предыдущие миллионы лет существования вида Homo. Существует много теорий происхождения языка, однако самой правдоподобной кажется теория постепенного развития языка в устойчивых социальных группах с распределенными среди индивидов специализациями. В этом случае каждый индивид воспитывался для выполнения определенной социальной роли в связи с чем возникала естественная необходимость в углублении объема знаний и воспитании. Кроме того, от эволюции человек получил в подарок развитую гортань а с ней и новые возможности для воспроизведения сложных звуков.

Из интересного, можно отметить, что мозг человека верхнего палеолита был крупнее современного примерно на 10% и возможно, потенциально обладал большими возможностями. Тем не менее, люди в верхнем палеолите не намного превзошли своих диких родственников. Можно резюмировать, что как инструмент, мозг полезен лишь в определенных условиях. Этим «определенным условием» является его социализация. Иначе говоря, каждому мозгу для достижения своих наилучших качеств необходим курс социальной дрессировки, — воспитание в обществе себе подобных существ и научение системе передачи информации, языку.

Почему это так? Вы все прекрасно знаете о примерах так называемых «диких детей» или «детей Маугли», — случаях, когда человеческий ребенок оказывался в раннем возрасте в изоляции от общества и фактически превращался в животное. Такие дети не восприимчивы к обучению и их невозможно перевоспитать, адаптировать для существования в обществе. Они не способны воспринимать нормы поведения, заложенные в человеческой культуре, так же как не могут оперировать логически теми операциями, которые человек использует в обычной жизни.

Главное понимание, которое следует выделить здесь в том, что наш мозг — не «умный» сам по себе. И не может стать «умным» по какому-то собственному желанию или разумению. Он становится «умным» лишь после успешного завершения процесса социального и культурного воспитания.

Между словами «умный» и «социально-адаптированный» мы можем поставить знак равенства, поскольку человек является существом социальным.

Из этого следует, что мозг человека, наш с вами, — это не биология, (хотя некоторые биологические предпосылки для его развития заложены изначально его природой); а в большей степени, наш мозг — это культура. Это набор символов, которыми оперирует человек с помощью языка, системы иерархии знаний, логики и норм поведения.

Итак, мы переходим к последнему и самому важному выводу.

Человек — это система символов

Человеческий мозг, как любая естественная система, очень любит упрощать и классифицировать для того, чтобы ему было чем оперировать в рамках неких заложенных «микропрограмм» логики и норм. Такие микропрограммы непрерывно в нас закладывает наше окружение.

Когда человек считает, что он находится в сознании и «думает», сознательная часть мозга оперирует символами — штампами: «Воровать плохо», «На красный — переходить нельзя», «Делать добрые дела — хорошо», «Летом нужно съездить в отпуск», и т. д. Этот рой различных «установок» регулирует наше поведение или создает видимость того, что регулирует; хотя на самом деле большая часть процессов мышления производится дефолт-системами мозга. (Кстати говоря, хотелось бы на этом месте поблагодарить известного исследователя человеческого мышления, создателя «Академии смысла» Андрея Владимировича Курпатова. В некотором роде вводная часть этой книги близка к выводам, высказанным в его научно-популярных трудах «Красная таблетка» и «Чертоги разума». К похожим выводам приходит и Ноам Хомский, говоря о роли языка не только как коммуникационной системы, но в значительной степени и системы организации процесса мышления. И если в первых своих работах (например, «Язык и мышление», М. 1972) он лишь вскользь затрагивает данную тематику, то в последние годы теория известного лингвиста приобретает все большую устойчивость. В частности, тезис о неотъемлемости языка и мышления Хомский употребляет в 2017 году в популярном видео диалога с Лоренсом Крауссом «Наука, Разум и Политика» на проекте «Origins»).

Итак, не будем подвергать сомнению, что наш мозг «любит» на все повесить ярлык и поставить на определенную полку для того, чтобы в нужной ситуации взять это с нужной полки и разобраться, что с этим ему нужно делать. «Подписав» все известные ему объекты нужными символами, он также делает это и для того, чтобы передать нужную информацию другому человеку; для того, чтобы получить то, что ему нужно с применением минимальных усилий. Информационная система человеческой классификации и логики, заложенная в естественном языке и применяемая в конкретном обществе позволяет человеку управлять поведением других людей. Наш язык ориентирован на то, чтобы реализовывать нужные нам задачи с помощью других людей. Наш язык удобен и универсален, поскольку он позволяет повесить ярлыки на большинство похожих вещей, но у каждого отдельного человека этот набор вещей будет своим.

Отсюда рождается и сложность восприятия языка, поскольку в некотором случае один человек говорит одно, другой понимает другое, а результат их последующих совместных действий получается третий, причем такой, который не ожидал ни первый ни второй. Но все же, это скорее исключение, чем правило.

Так мы подходим к понимаю, что такое человеческий язык и человеческая логика.

Чтобы избежать путаницы, я попробую дать наиболее простое определение термина «язык», в том контексте, который нам пригодится в дальнейшем на страницах этой книги.

Язык это система символов (или метасимволов), связанных между собой с учетом определенных правил, полученных в результате человеческого воспитания в отдельно взятой человеческой культуре.

Поэтому логика поступков людей различается в отдельных культурах или субкультурах. Например, оставить чаевые в ресторане — совершенно логично и естественно в США, но совершенно неприемлемо в Японии. Язык тесно связан (даже неразрывен) с человеческой логикой и культурой. Без языка и культуры нет логики так же, как логики нет без языка, (как системы символов). Поэтому любые попытки организации некой неязыковой логики — провальны. Поэтому неязыковые системы на основе искусственных нейросетей способны действовать только в рамках узкой и простой задачи: не врезаться в стену или препятствие, получить преимущество на игральной доске, найти сходство и различие в образе и т. д. Но язык и культура были накоплены человечеством не зря. Язык — это готовый шаблон правил, знаний и классификации, который просто глупо не использовать.

Я хотел бы еще раз акцентировать этот момент. Язык это не побочный эффект, не следствие, не убогий родственник который ходит за интеллектом и просит у него милостыню. Язык в наиболее общем смысле и является всем сосредоточением человеческого фактора который есть в человеке, как в биологическом существе. Язык и является воплощением интеллекта. Ничто другое кроме языка, системы знаний и культуры не рождает интеллект. Невозможно быть интеллектуальным немым, рожденным в пещере, и построить с нуля теорию струн или даже сконструировать телегу, если до этого ты не получил «готовых» необходимых знаний и навыков при помощи языка, системы символов. Либо тебе придется эволюционировать сотни и тысячи поколений, действуя методом проб и ошибок, и попутно изобретать собственный язык с собственной логикой. Но зачем это делать, если он уже есть?

Как же мы можем использовать естественный язык, систему символов в конструировании искусственного интеллекта? Наша основная задача сегодня может состоять в том, чтобы выбрать правильный алгоритм обработки данных, получаемых из естественного языка, а также, получить системы правил, по которым эти данные будут обрабатываться. С этой целью и затевалась данная работа.

Возвращаясь к нашему первому вопросу, задумаемся, что же представляет собой человеческое мышление? А точнее, какими единицами мы оперируем, когда рассуждаем о тех или иных вещах? Это — самое важное, что нам следует выяснить. (Причем, с учетом тематики повествования, нам нет необходимости строить модель, в точности повторяющую действия мозга; но нам нужно реализовать «в железе» систему, которая будет повторять логику модели, принятой в человеческой культуре).

Когда мы сидим за столом, и например, читаем эту конкретную книгу, с ее обложкой, названием, содержанием, толщиной, весом и фактурой страниц, что ответим мы на вопрос, чем мы занимаемся? В первую очередь мы ответим «Чтением»… «Я читаю эту книгу» — скорее всего скажете вы и покажете обложку для того, чтобы другой человек получил минимальное необходимое представление о конкретном предмете вашего занятия.

Но предположим, что ваш собеседник не видит вас, а вы не очень горите жаждой общения, тогда вы ответите просто «Я читаю». Что это дает для понимания другому человеку? Вероятно, он уже знает, что такое чтение и может представить себе даже вашу позицию за столом, вашу заинтересованность и эмоциональную вовлеченность и у него уже складывается часть комплекса представлений о вашем занятии. Вряд ли он представит, что вы обмотали себя скотчем или облили клеем для того, чтобы погрузиться в этот процесс. Но для того чтобы узнать более полную информацию, ему потребуется вероятно задать вопрос «А что ты читаешь?», что потребует от вас более подробного ответа, включающего описание автора, названия, и может быть пересказа темы или содержания книги.

Без каких-либо оговорок можно сказать, что ВСЕ вещи, с которыми мы сталкиваемся в материальном мире, — имеют частное, фактическое представление в виде конкретного предмета, и более общее, абстрактное понятие. Так, «стакан молока» — это конкретное явление более абстрактного понятия «Молоко», еще более абстрактного «Молочные продукты», которые в свою очередь входят в еще более абстрактное понятие «Продукты питания», и так далее. Так же вполне конкретный карандаш, обладающий некоторыми характеристиками твердости, цвета, толщины стержня, заточенности, наличия резинки и других интересных вещей входит в более абстрактные группы, которыми мы оперируем: «Карандаши», «Пишущие принадлежности», «Канцелярия», «Офисные предметы». Но разве вы не замечаете, как нас все время в глубине нашего сознания что-то останавливает в этом перечислении? Как будто меры абстракций в данном случае заканчиваются на «Офисных предметах»? Будто бы наш мозг говорит нам «Эй парень, такой группой абстракций я уже не оперирую, остановись».

Говоря о карандашах, кошках, мебели, технике и тому подобном мы всегда оперируем довольно простым набором абстракций, включающим в себя 2—3 уровня.

Но это совсем не говорит о том, что групп с более высокими уровнями абстракций не существует в нашем сознании; просто мы, как правило, не сталкивались с задачами, требующими таких операций.

Проблема состоит в том, что наш мозг не работает или очень плохо работает в направлении от частного объекта к общему. Так, говоря о карандашах, нам уже невозможно представить в какую группу объектов мы можем обобщить «Канцелярию». И немного поскрипя извилинами наш мозг выдает нам что-то в духе: бытовые предметы или неживые объекты. Но неужели это все, на что способен наш мозг?

Из этого отступления мы можем сделать главный вывод:

Любой частный объект или группа объектов входит в круг более обобщенного понятия о более крупной группе объектов и разделяется на уровни детализации по каким-либо признакам. Но принцип обобщения не работает в человеческом мозге «снизу вверх», от набора частных объектов к общим. Тем не менее, он легко работает «Сверху вниз», от общего к частному, и это легко доказать.

Отталкиваясь от этих параметров, мы можем сформулировать принцип работы, выполняемой нашим мозгом: это обобщение, сравнение, и классификация объектов предметного (и непредметного) мира. Так мы пришли к базовому понятию мышления в его фундаментальном, исходном значении.

Очевидно, что человеческий мозг, несмотря на всю его невероятную сложность, ежедневно совершает массу простых логических операций, двумя базовыми из которых являются обобщение и сравнение.

Прочие операции мозга занимаются распознаванием образов, запоминанием и присвоением дополнительных свойств объектов.

В чем же это может нам помочь?

Вы можете не поверить, но для того, чтобы разобраться в технологии познания, нам понадобятся достаточно средние навыки и довольно скромные представления об окружающем нас предметном (и непредметном) мире.

Следующая глава займется подробной доработкой этого вопроса.

Глава 1. Эврика!

Многие из вас играли когда-то в одну занимательную игру. Существует множество ее вариаций, но в виде одной из них она называлась «Отгадай животное». Смысл заключался в том, что один из игроков загадывает некий предмет (или животное, или понятие), а второй — пытается его угадать, задавая простые вопросы, на которые можно дать ответ «Да» или «Нет».

Помнится в далеком детстве я сталкивался в одной популярной книге по программированию с примером такой игры, в виде простой программы на паскале и бейсике.* (1. Очков В. Ф., Хмелюк В. А., От микрокалькулятора к персональному компьютеру, М.: Изд-во МЭИ, 1990).

Каждый новый объект там хранился в бинарном «дереве» ответов, «поворачивая» на каждой ветке ответного алгоритма «влево» на ответ «Да» или «вправо» на ответ «Нет». Здесь я процитирую авторов книги:

«В этой игре человек задумывает животное (предмет, явление), которое компьютер должен отгадать, задавая альтернативные вопросы, разбивающие множество выдумок человека на две части. Машина как бы взбирается на двоичное дерево, ветви которого (альтернативные вопросы при ответе человека (да-нет) раздваиваются. На ветвях «висят» ответы на вопросы.

Программа самообучающаяся, т.е., машина сама «выращивает» дерево вопросов и ответов, которое хранится в двух литерных массивах В (вопросы) и О (ответы) и в одном числовом Р (логические переходы, ведущие к ответу).» (с. 165)

Игра на самом деле занимательная, но имеет ряд недочетов: бинарное дерево не идеально для построения требуемого классификатора, подобного тому, что находится от природы у нас в мозге.

Тем не менее, мысль об игре в животные не давала мне покоя долгое время, и я часто возвращался к ней спустя многие годы. И в один замечательный день, (если быть точнее, ночь) все элементы этой головоломки встали на свои места.

Вспомните, как вы начинаете игру в качестве угадывающего?

Чаще всего, вашими первыми вопросами будет вроде «Это живое»? «Это животное»? «Это человек»? и другие, очень общие вопросы. То есть, интуитивно, мы отсекаем от невероятно большого количества объектов материального мира ее значительную часть, для того, чтобы сократить поиски. В результате планомерного отсечения лишнего, наступает момент, когда число определяемых объектов сужается до класса, содержащего всего несколько предметов, и заканчивается на верном варианте.

Приведу пример. Мы начинаем в качестве угадывающего.

— Это живое?

— Нет

— Это можно взять в руки?

— Да

— Этим мы пользуемся каждый день?

— Да

— Это предмет гигиены?

— Нет

— Это предмет одежды?

— Нет

— Это твердое?

— Да

— Это элемент компьютера?

— Нет

— Это тяжелое?

— Нет

— Это телефон?

— Да

Конечно, задуманный объект был не очень сложным, поэтому мы отгадали его всего за 9 попыток. И конечно, отгадывающий хитрил, действуя на основе интуиции, переключаясь на самые популярные группы объектов. Но попробуйте сами, и вы откроете самое интересное, — то, что практически любой объект, или предмет, или понятие из реального мира можно отгадать, задав от 10 до 22 вопросов. Это правило действует так или иначе, в зависимости от степени разветвленности объектных классов, с которыми мы имеем дело.

И я задумался вот над чем. А если мы сохраним каким-то образом в компьютере при описании каждого предмета реального мира его «геном», «генетический код», хранящий информацию обо всех предыдущих классах, о каждой переходной ветке на этом дереве бытия?

Таким образом, у меня возникла идея о классификаторе ВСЕГО, любого предмета или объекта, понятия, животного или явления. Если мы сможем «нарисовать» эту топографическую карту в мозге машины, то проблема разгадки механизма мышления будет решена.

Конечно же визуально классификатор будет выглядеть как дерево со множеством ветвей. Но это дерево совсем не похоже на бинарное.

В первую очередь я нарисовал наверху слово

ВСЕ

Что собственно обозначает «все сущее», «всю вселенную со всем содержимым». Если бы я был буддистом, то назвал бы этот объект Аум или Ом, — звук, появившийся перед началом вселенной.

И вниз от него две ветки — Неживое и Живое. (Рис. 1)

Пусть «ВСЕ» будет иметь название или код «А».

Рис. 1. Как можно начинать классификацию

Как вы думаете, что дальше? Как следующий объект может унаследовать признак предыдущей?

Может быть как-то так, как на рисунке 2?

Рис. 2. Как не стоит начинать классификацию

Или так, как на рисунке 3?

Бесплатный фрагмент закончился.
Купите книгу, чтобы продолжить чтение.
электронная
от 144
печатная A5
от 442