Анализ пакетов обработки экспериментальных данных SABR и BOOTSTRAP
Доклад студента 623 группы Грязнова А. А.
МОСКОВСКИЙ ФИЗИКО-ТЕХНИЧЕСКИЙ ИНСТИТУТ
(государственный университет)
Москва 2000
1. Введение.
Подводя итоги уходящего века трудно переоценить роль информации в развитии человечества. Одно лишь повышение скорости передачи данных позволило промышленности сделать огромный шаг вперёд, не говоря уже о пользе новых, более быстрых методах обработки информации. Но как говорится, есть и обратная сторона медали. Свобода слова, относительная простота донесения её до масс дали возможность не только влиять на мнение общественности, но и управлять большей её частью. Особенно ярко выражен этот процесс в России, где, например, благодаря блестяще проведенной PR-акции удалось за 7 месяцев «раскрутить» никому не известного прежде В.В.Путина до уровня президента. Таким образом, цивилизованному человеку просто необходимо уметь выделять только достоверную, не искажённую СМИ информацию из всего потока. Здесь мы сталкиваемся с серьёзной, остро стоящей проблемой – далеко не каждый ВУЗ может блеснуть своими курсами, помогающими студентам - «локомотивам», двигающим современную науку, правильно анализировать получаемую информацию. В Московском Физико-Техническом Институте (государственном университете), где в настоящее время обучается автор данной работы, Радкевичем И.А. читается именно такой курс. Этот курс позволил автору провести следующий ниже анализ двух пакетов обработки экспериментальных данных: SAPRа и BOOTSTRAPа.
Время неумолимо бежит вперёд, человечество развивается. Всё более широкое применение находят компьютеры – электронные вычислительные машины (ЭВМ). Они не только позволяют производить сложнейшие расчёты, анализировать данные, но и становятся незаменимыми помощниками в быту. Более того, уже почти не осталось сфер деятельности человека, где ЭВМ не нашла бы себе применение. Означает ли это, что в перспективе компьютер станет выполнять всю работу человека, принимать за него решения? Над ответом на этот вопрос бьются величайшие умы человечества.
На мой взгляд, Министерство Образования США не ошиблось, назвав XXI-вое столетие веком интеллекта. Действительно, бурное развитие человечества в XX веке было обусловлено, прежде всего, повсеместным внедрением машин. Как известно, это резко снизило себестоимость работ и дало мощный толчок развитию промышленности. Сейчас же, на рубеже веков, стало ясно, что дальнейший прогресс за счёт увеличения потребления энергоресурсов невозможен! Люди, считающие запасы полезных ископаемых Земли неисчерпаемыми, ошибаются. Хотелось бы заметить, что мировых доказанных запасов природного газа хватит лишь на 60 лет, а нефти и того меньше – на 40 лет. Конечно, внимательный читатель может вспомнить, что атом “неисчерпаем”, но запасы топлива, на котором работают современные АЭС, довольно скудны. Уже сейчас большинство стран отказалось от строительства новых АЭС. Более того, в настоящее время матушке-земле уже с трудом удается прокормить огромную популяцию человека. Изложенные выше факты свидетельствуют о том, что прогресс человечества в XXI-вом веке тесно связан с развитием интеллекта.
Зачастую можно услышать ошибочный тезис, что возможности ЭВМ безграничны. На мой взгляд, это заблуждение связано с “порабощением” компьютером человека. Он, кажется, забыл, что окружающий его мир прекрасен. Но ведь помимо компьютера существует ещё искусство, природа, любовь, наконец. Не понятно, почему человек ещё не осознал, что ЭВМ – это всего лишь тупая счётная машина, умеющая складывать и умножать числа, хотя и очень быстро. Любой компьютер без соответствующего программного обеспечения является лишь никому не нужной грудой железа. Он способен только беспрекословно выполнять инструкции человека. Таким образом, искусственный интеллект, созданный на базе ЭВМ, никогда не существовал, никогда и не появится, а каждая новая статья о его появлении является очередным большим обманом, преследующим чисто коммерческие цели.
Компьютер стал неоценимым помощником при обработке большого количества информации, проведении физического эксперимента. Простота же общения дала возможность неквалифицированному исследователю принимать участие в серьёзных научных проектах. Именно для него, по-видимому, и были созданы пакеты обработки экспериментальных данных SABR и BOOTSTRAP, позволяющие находить зависимость физических величин по экспериментальным данным с большой достоверностью не только при неизвестном законе распределения, но и при слабой достоверности исходных данных. Для человека со слабым пониманием сущности самого проекта такие программы просто незаменимы – требования к знаниям человека сведены к минимуму. Может быть, именно с созданием “умных” программ связано появление большого количества лже-теорий? Не секрет, что по количеству открытых лже-резонансов сейчас Россия опережает все страны. Даже такой известнейший институт, как ОиЯИ успел выпустить ряд работ, ошибочность которых может легко доказать любой самый захудалый физ-тех. И таких примеров превеликое множество! Таким образом, нельзя рассматривать компьютер как панацею и ко всему программному обеспечению, наделённому якобы “искусственным” интеллектом, следует относиться скептически.
Анализ пакетов обработки экспериментальных данных.
а) SABR.
Перейдём к SABRу. Уже возможность пакета находить зависимости величин по экспериментальным данным максимально достоверно при неизвестном законе распределения последних настораживает. Но ведь величина может быть распределена нормально, биномиально или по степенному закону, наконец. Очевидно, каждому случаю соответствует своя зависимость. Можно, конечно, предположить, что программа сама проведёт анализ экспериментальных данных и сможет установить истинный закон распределения. Но это, согласитесь, в корне противоречит принципам не точных наук, перед которыми, прежде всего, ставится задача подтверждения теорий и предположений. Здесь же получается, что для доказательства одних теорий используются совершенно другие, зачастую не имеющими ничего общего с действительностью. Противоречие! Дальше – больше. Утверждение авторов программы о возможности получения достоверных результатов при слабой надёжности, не говоря уже об отсутствии некоторой части исходных данных, вообще можно оставить без комментария. Любой человек, находящийся в здравом уме, знает, что результат работы адекватен, прежде всего, исходным условиям. Поэтому, если на входе у SABRа не достоверные данные, то и на выходе получится, по-украински говоря, брехня. Чудес не бывает! Даже если бы и действительно существовала программа с возможностями, якобы существующими у SABRа, то это привело бы к революции не только в физике, но и в экономике, медицине, да и во всех прикладных науках, чего пока не произошло.
b) BOOTSTRAP.
Также, хотелось бы сделать некоторые замечания относительно одного из новых методов статистической обработки ограниченных выборок, известного под названием метода BOOTSTRAPа.
Метод BOOTSTRAPа заключается в том, что одну реальную выборку из генеральной совокупности с помощью ЭВМ тиражируют в большом количестве экземпляров, а затем из полученного массива случайным образом делают необходимое (весьма большое) число новых выборок, которые затем уже анализируют.
Первое, что сразу и удивляет и настораживает, так это необходимость тиражировать реальную выборку. Действительно, не легче было бы просто составить новую выборку из элементов, случайным образом «вытащенных» из реальной выборки? На мой взгляд, обе процедуры полностью эквивалентны. Только этот факт заставляет задуматься, не является ли BOOTSTRAP так называемым «лохотроном»? Далее, авторы метода утверждают, что
При помощи BOOTSTRAPа удаётся избавиться от предположения о гауссовом распределении.
BOOTSTRAP способен по единственной выборке оценить всевозможные изменчивости выборок из генеральной совокупности так, как будто бы имеется массив реальных выборок.
Для этого метода справедливы те же рассуждения, что и для SABRа. Однако хотелось бы показать парадокс этих заявлений и несколько иным способом, тоже не опираясь на математический аппарат и, таким образом, не апеллируя к глубоким познаниям читателя.
Давайте вспомним последние президентские выборы и представим себе, что занимаемся сбором общественного мнения накануне выборов. Если верить авторам BOOTSTRAPа, то мы можем с большой достоверностью определить итоги предстоящих выборов опросив, скажем, всего 1000 человек. Но впоследствии, очевидно, составляя выборку длинною 146 миллионов (население России), мы получим не что иное, как мнение лишь той самой малой «кучки» людей, опрошенных первоначально. Действительно, согласно теории вероятности, да это, впрочем, и так очевидно, вероятность элементам реальной выборки быть «вытянутыми» одинакова для всех элементов. Как следствие, каждый элемент и будет «вытянут» приблизительно определённое число раз, что и обуславливает полученный результат. Надеюсь, мои доводы оказались убедительными.
3. Заключение.
Таким образом, SABR и BOOTSTRAP – это большой обман, преследующий, скорее, коммерческие цели, чем научные. Надеюсь, приведённые выше доводы подтверждают мой тезис. В качестве заключения хотелось бы ещё раз отметить, что компьютер не является панацеей, и дальнейший прогресс человечества возможен, в первую очередь, лишь за счёт развития интеллекта, а не совершенствования компьютера (или программного обеспечения для него).
Список литературы
Лекции профессора Радкевича И. А. за 2000г. Весенний семестр.
Радкевич И.А. Организация и планирование научных исследований. - М.: Ротапринт МФТИ, №146, 1986.
Статистика BritishPetroleum за 1997 год.