Смекни!
smekni.com

Метод Монте-Карло (стр. 1 из 2)

ПЛАН

1. Теоретическая часть

Метод Монте-Карло

2. Практическая часть

Задача 2

Задача 3

1. Теоретическая часть

Метод Монте-Карло

Датой рождения метода Монте-Карло принято считать 1949 г., когда американские ученые Н.Метрополис и С.Улам опубликовали статью «Метод Монте-Карло», в которой систематически его изложили. Название метода связано с названием города Монте-Карло, где в игорных домах (казино) играют в рулетку — одно из простейших устройств для получения случайных чисел, на использовании которых основан этот метод.

Специальный метод изучения поведения заданной статистики при проведении многократных повторных выборок, существенно использующий вычислительные возможности современных компьютеров. При проведении анализа по методу Монте-Карло компьютер использует процедуру генерации псевдослучайных чисел для имитации данных из изучаемой генеральной совокупности. Процедура анализа по методу Монте-Карло модуля Моделирование структурными уравнениями строит выборки из генеральной совокупности в соответствии с указаниями пользователя, а затем производит следующие действия:

Для каждого повторения по методу Монте-Карло:

1. Имитирует случайную выборку из генеральной совокупности,

2. Проводит анализ выборки,

3. Сохраняет результаты.

После большого числа повторений, сохраненные результаты хорошо имитирует реальное распределение выборочной статистики. Метод Монте-Карло позволяет получить информацию о выборочном распределении в случаях, когда обычная теория выборочных распределений оказывается бессильной.

ЭВМ позволяют легко получать так называемые псевдослучайные числа (при решении задач их применяют вместо случайных чисел); это привело к широкому внедрению метода во многие области науки и техники (статистическая физика, теория массового обслуживания, теория игр и др.). Метод Монте-Карло используют для вычисления интегралов, в особенности многомерных, для решения систем алгебраических уравнений высокого порядка, для исследования различного рода сложных систем (автоматического управления, экономических, биологических и т.д.).

Сущность метода Монте-Карло состоит в следующем: требуется найти значение а некоторой изучаемой величины. Для этого выбирают такую случайную величину X, математическое ожидание которой а:

(1)

Практически же поступают так: производят п испытаний; в результате которых получают п возможных значений X, вычисляют их среднее арифметическое

(2)

и принимают х в качестве оценки (приближенного значения) а * искомого числа а:

(3)

Поскольку метод Монте-Карло требует проведения большого числа испытаний, его часто называют методом статистических испытаний. Теория этого метода указывает, как наиболее целесообразно выбрать случайную величину X, как найти ее возможные значения. В частности, разрабатываются способы уменьшения дисперсии используемых случайных величин, в результате чего уменьшается ошибка, допускаемая при замене искомого математического ожидания а его оценкой а *.

Отыскание возможных значений случайной величины Х (моделирование) называют «разыгрыванием случайной величины». Изложим лишь некоторые способы разыгрывания случайных величин и укажем, как оценить допускаемую при этом ошибку.

Оценка погрешности метода Монте-Карло

Пусть для получения оценки а * математического ожидания а случайной величины Х было произведено п независимых испытаний (разыграно п возможных значений Х) и по ним была найдена выборочная средняя

, которая принята в качестве искомой оценки: а* =
. Ясно, что если повторить опыт, то будут получены другие возможные значения X, следовательно, другая средняя, а значит, и другая оценка а*. Уже отсюда следует, что получить точную оценку математического ожидания невозможно. Естественно, возникает вопрос о величине допускаемой ошибки. Ограничимся отысканием лишь верхней границы допускаемой ошибки с заданной вероятностью (надежностью)
:

(4)

Интересующая нас верхняя граница ошибки

есть не что иное, как «точность оценки» математического ожидания по выборочной средней при помощи доверительных интервалов. Поэтому воспользуемся результатами, полученными ранее, и рассмотрим следующие три случая.

1. Случайная величина Х распределена нормально и ее среднее квадратическое отклонение

- известно. В этом случае с надежностью у верхняя граница ошибки


(5)

где п — число испытаний (разыгранных значений X); t значение аргумента функции Лапласа, при котором Ф(t) ==

/2,
— известное среднее квадратическое отклонение X.

2. Случайная величина Х распределена нормально, причем ее среднее квадратическое отклонение

неизвестно. В этом случае с надежностью
верхняя граница ошибки

(6)

где п — число испытаний; s «исправленное» среднее квадратическое отклонение, t находят по таблице значений ty == t{

,n}.

3. Случайная величина Х распределена по закону, отличному от нормального. В этом случае при достаточно большом числе испытаний (n > 30) с надежностью, приближенно равной

, верхняя граница ошибки может быть вычислена по формуле (5), если среднее квадратическое отклонение
случайной величины Х известно; если же
-неизвестно, то можно подставить в формулу (5) его оценку s «исправленное» среднее квадратическое отклонение либо воспользоваться формулой (6). Заметим, что чем больше п, тем меньше различие между результатами, которые дают обе формулы. Это объясняется тем, что при п —>
распределение Стьюдента стремится к нормальному. В частности, при п=--100,
=0,95 верхняя граница ошибки равна 0,098 по формуле (5) и 0,099 по формуле (6). Как видим, результаты различаются незначительно.

Замечание. Для того чтобы найти наименьшее число испытаний, которые обеспечат наперед заданную верхнюю границу ошибки

, надо выразить п из формул (5) и (6):

2. Практическая часть

Задача 2

Исходя из статистических данных о деятельности торгового предприятия, с помощью регрессионной зависимости вида

Y = a*Х + b

установить связь между потерями на рекламу (X) и объемом реализации (Y).

2.1. Вычислить параметры зависимости a и b методом наименьших квадратов.

2.2. Оценить соответствие построенной зависимости статистическим данным.

Вариант 7 x 109 107 108 111 106 105 104
y 234 235 236 237 238 239 240

Выполнение задания

Для выполнения заданий используем пакет электронных таблиц Excel.

2.1 Блок исходных данных формируется в первых двух столбцах (A3:B9).

2.2 Вводится гипотеза, что между фактором Х и показателем Y существует линейная стохастическая зависимость

= a · X +b

Оценки параметров a и b парной регрессии вычисляются по формулам


За блоком исходных данных находится блок промежуточных расчетов.

Для нахождения произведения

в ячейку C3 вводится формула =A3·B3. Далее копируем полученную формулу в другие ячейки столбца C. Значения
вычисляем в столбце D.

Для определения сумм столбцов используем кнопку автосуммирования на панели инструментов ∑. После установления курсора на ячейку A10 нажимаем ∑ на панели инструментов, выделяем диапазон ячеек А3:А9, нажимаем Enter. Введенная формула копируется в необходимые ячейки 10-ой строки. Средние значения X, Y вычисляются в ячейках D11, D12 с использованием встроенной статистической функции СРЗНАЧ ():