Самообучение и творчество бабочки состоит в том, что полезный опыт накапливается и на его фоне происходит постоянный случайный поиск нового поведения.
Случайность, приводящую к обнаружению нового поведения, можно трактовать, как неудачную попытку точно повторить то поведение, которое бабочка считает успешным, или как неточное воспроизведение успешного прежнего поведения. Оба варианта могут быть следствиями как случайных нарушений в памяти, так и неточного узнавания текущей ситуации.
Тестовая задача о "бабочке и цветке" демонстрирует не какой-то изысканный или очень эффективный алгоритм сознания, а принципиальную возможность нахождения правильного "разумного" поведения только на основе неясного внутреннего желания произвольной природы. Если через некоторое время вы заметите, что вероятность попадания бабочки на цветок больше, чем вероятность попадания в какую-то определённую назначенную вами другую точку окна, то это и означает, что бабочка уже узнаёт цветок, и стремится к нему, то есть, она ориентируется в пространстве.
Если сделать окно сразу большим, то, вероятно, бабочка никогда не научится находить цветок, так как будет мало случайного успешного опыта. Но может случайно повезти.
От чего зависит скорость обучения в этом примере? От успешного опыта. Можно помогать бабочке учиться, например, подставляя цветок с нужной стороны, чтобы она постепенно освоила весь необходимый набор движений. Но учтите, что способности бабочки ограничены. Она может достичь максимально возможного для неё мастерства в течение нескольких минут. И дальнейшее обучение больше ничего не даст. А можно ей вредить. И она никогда не научится.
Мозг живой бабочки, как и мозг кибер-бабочки "стремится повторить успех". Живая бабочка летит к цветку, потому что её привлекает запах. Этот запах ей нравится от рождения. Поэтому я не могу уверенно сказать, что она сознательно стремится к цветку. Во всяком случае, её сознанию каждую секунду помогает безусловный рефлекс на запах.
В рассмотренной тестовой задаче нет никаких прямых "физических" воздействий (вроде запаха) со стороны цветка на бабочку. Она не испытывает удовольствия от того, что видит цветок. Она летит к нему потому, что из своего опыта она знает, что получит удовольствие, когда коснётся цветка. Её привлекает не запах и даже не вид цветка, а знание (идея, понимание) того, что правильное поведение завершится удовольствием . Это чисто интеллектуальное стремление или условный рефлекс. Она сознательно стремится коснуться цветка, потому что использованный алгоритм не предусматривает автоматизации поведения. Эта бабочка осознаёт то, что она видит.
Совершенно правильные движения бабочки не приводят к немедленному успеху, так как требуется преодолеть некоторое расстояние до цветка, а бабочка не имеет органа восприятия расстояния. "Вид цветка" никак не изменяется по мере приближения к нему. Поэтому бабочка испытывает неуверенность. Кажется, что она делает "неоправданно" много случайных попыток улучшить своё поведение, которое, в результате, становится похожим на панику. "Кто мало видел - много плачет".
От смутного желания к осознаванию себя
Вообще-то можно построить систему, имитирующую разумное поведение, но не имеющую внутреннего мотива к поиску такого поведения. Пусть эффекторы точно исполняют поступающие от мозга команды. Если их поведение не устраивает разработчика, то происходит перекоммутация входных и выходных каналов, другие настройки мозга. Обычно, например, в практике нейронных сетей, эти настройки называют обучением. В такой системе ни мозг, ни отдельные нейроны или органы чувств не обладают самостоятельным творчеством или свободой выбора поведения. Поведение, как выходной сигнал, строго ассоциировано с входными данными. После обучения такая система представляет собой автомат, имитирующий разумное (с точки зрения человека) поведение. Хотя прогноз наблюдения не требуется, но он может использоваться для автоматизации процесса обучения.
Перед прогнозирующим механизмом системы можно поставить задачу получения не правильного прогноза, а определённого прогноза. Это выглядит так, будто сенсоры "стремятся" почувствовать что-то определённое. Для этого обучающий механизм, например, алгоритм перекоммутации межнейронных связей, должен иметь возможность и средства для синтеза нового поведения, которое обеспечит достижение этих определённых чувств. Только такой выгодный для системы субъективный прогноз может сделать её творческой и сознательной.
Чтобы система не распалась на отдельные "осознающие себя" подсистемы, все её средства прогнозирования и подбора поведения должны стремиться к общей цели: обеспечить "выгодный" прогноз определёнными сенсорами. Выгодный прогноз – это предвидение определённой положительной оценки (ощущения), которая присуща системе от природы или предусмотрена разработчиком. Творческая прогнозирующая система подчиняется этой задаче в ущерб объективному прогнозу. Такая система стремится повторить (правильно "предвидеть") своё успешное поведение, и выполняет небольшой случайный поиск нового поведения на фоне этого уже освоенного.
Основная проблема самообучения состоит в том, что обучающееся существо не знает, за что оно получает оценки (поощрения и наказания). Я предполагаю, что биологически эта задача решается так. Если существо чувствует себя хорошо, то есть все его желания удовлетворены, и состояние организма нормальное, то оно способно сохранить в памяти свои восприятия и поведение в течение некоторого времени. Если состояние организма ухудшается, то способности к запоминанию тоже ухудшаются. Поэтому поведение, которое приводит к нормальному или субъективно лучшему состоянию организма, запоминается лучше.
Если субъективно привлекательные ощущения достигаются слишком легко, в результате слишком простого поведения, то организм попадает в психическую зависимость, так как простое поведение быстро становится автоматическим и неподконтрольным осознаванию. В результате "сознательное" существо теряет свободу выбора других поведений, кроме тех, которые ведут к легко достижимой "эйфории".
Критерий успеха – удовлетворённое желание
У бабочки субъективное прогнозирование управляется "анализатором успеха". Его задача выявить и сохранить важную информацию (не объективную, не точную, а субъективно важную для удовлетворения желания), и попробовать достичь ещё большего успеха. Несмотря на загадочное название, это устройство выполняет простую функцию. Оно запрещает органам бабочки вспоминать неуспешный опыт. Но более важно то, что этот механизм объединяет алгоритмически независимые органы бабочки в единую систему с общими желаниями и согласованно исполняемыми целями. Благодаря этой централизации бабочка воспринимает себя как единое "Я", а не как колонию органов.
"Научное" определение информации состоит в том, что полное число состояний системы не несёт информации, а если какие-то "типы" состояний оказываются невозможными или наоборот, неизбежными, то появляется нетривиальная информация об этой системе. В пределе, если известно, что система находится в одном определённом состоянии, то информация о ней максимальна.
Между абстрактной "системой" и информационным сообщением есть принципиальная разница. Семантическое "сообщение" использует символы и правила, имеющие "приписанный" смысл. Мы приписываем важный для человека смысл природным явлениям, так как будто они тоже являются символами. "Полезное растение". Любое произведение искусства, машина или "закон природы" состоит для нас из элементов, имеющих символический смысл в рамках человеческой культуры. Мы обнаруживаем признаки целесообразности даже в расположении звёзд. Также и читатель "вчитывает" книгу. В информационном смысле 99% содержания книги находится в голове читателя. А символы, которые он видит, только вызывают в его сознании те или иные ассоциации.
Семантическая информация - это надстройка над сознанием. Поэтому она не может быть в основе создаваемой (новой) разумной системы. А научная информация, то есть возникновение смысла из хаоса, - это "физическое явление", которое позволяет "вырастить" разум из небольшого количества исходных смыслов "желаний".
То, что я называю самообучением или адаптацией - это "чистое творчество". Правила не известны. Естественно, нет и символов, над которыми могли бы действовать эти правила. Однако образы, а затем и некие символы могут быть изобретены творческим механизмом сознания, и применяться сознательным существом по мере накопления им жизненного опыта.
Зарождение семантики происходит на неосознаваемом уровне в сознании.
Механизм этого явления основан на том, что органы (сенсоры и эффекторы) имеют свою нервную систему и тоже могут обучаться. После того, как рука под детальным управлением мозга освоила до автоматизма какое-то новое движение, в её нервной системе возникают новые ассоциации для этого движения. В процессе творческого поиска мозг может найти упрощённые команды, активизирующие эти ассоциации и запускающие управление нужным движением. Так мозг переходит от детального управления к "общему". Появляется короткий "символ", содержащий информацию, приписанную ему нервной системой руки.