Межфакультетская лаборатория статистических методов
Эту лабораторию создал один человек — А.Н. Колмогоров. Деятельность Андрея Николаевича, разумеется, выходила далеко за рамки любой конкретной науки (обозначенной определенным номером) и в этом смысле должна называться скорее общекультурной, чем строго научной (хотя в данном случае слово «дилетант» абсолютно неприменимо). В наше время как научную, так и подобную более широкую деятельность не могут поддерживать только друзья или меценаты: необходимо привлекать государственное финансирование.
В любом государстве (в дореволюционной России и затем в Советском Союзе в особенности) финансирование науки в значительной мере определяется расчетом на возможность использовать ее в военных целях. Существует такое мнение: Сталин лишь потому приказал выстроить высотное здание Московского университета, что незадолго до этого над Хиросимой и Нагасаки были взорваны американские атомные бомбы.
В наше время можно свободно сказать что угодно, и это обязывает к большей взвешенности в мыслях и выражениях. Глубинные мотивы вождя и последующих руководителей страны были все же иными: военная потребность рассматривалась как важнейшая, но в принципе преходящая, а наука считалась постоянной истинной целью человечества. Иначе нужно было бы создавать не архитектурный ансамбль, а минимально необходимые учебные помещения в бомбоубежище, и незачем было бы становиться большим ученым с помощью марксизма в языкознании1. В сущности, мотивы общечеловеческие сродни мотивам тех греков и римлян, которые истинное предназначение человеческой жизни видели в философии.
На рубеже 1950-х и 1960-х гг., когда закладывались основы будущей колмогоровской лаборатории, государство сделалось если не правовым, то хотя бы регламентированным пусть негласными правилами: личная безопасность для ни в чем не повинного человека была практически гарантирована. До диссидентского движения 1970-х гг., равно как и до общегосударственного экономического краха 1980-х гг., было еще далеко. Королев успешно осуществлял запуск первого спутника и первый космический полет человека, Сахаров не менее успешно испытывал варианты водородной бомбы, а политическое руководство страны, опираясь на всю эту силу, тем не менее проводило относительно мирную внешнюю политику. Таким образом, лаборатория Колмогорова возникала, пожалуй, в обстановке наибольшего экономического и политического благополучия за все время существования Советского Союза.
Мотивы самого Андрея Николаевича в данном случае представляются простыми и ясными: в благодарность за создание почти идеальных возможностей для научной и преподавательской работы принести возможную пользу народному хозяйству путем внедрения в практику статистических методов. Как в древние времена каждому князю положено было владеть уделом, а позже дворянину деревней с крепостными, так и теперь каждому академику положено иметь институт или хотя бы лабораторию, тем более если он хочет трудиться на благо народного хозяйства.
Сначала лаборатория ютится в небольшом помещении. Работает там молодой блистательный Яша Синай, ему помогают две девушки — Шурочка и Тамарочка. Яша составляет таблицы для расчета планов выборочного контроля. Эту проблему следует рассмотреть в некоторых деталях, чтобы понять, почему в таком, казалось бы, простом вопросе о принесении пользы народному хозяйству нельзя обойтись без Василия Васильевича с его глубинной психологией.
Сама по себе идея выборочного контроля проста и разумна и первоначально не требует ни математики, ни глубинной психологии. Нельзя же в самом деле перемерить все шарики для всех миллионов подшипников, которые изготавливаются для народного хозяйства (если бы мы проверили все шарики, это был бы сплошной контроль). Из каждой партии шариков берут небольшую часть и измеряют только их, а в простейшем случае просто определяют, укладывается ли каждый из отобранных шариков в допуски.
Если дефектных шариков среди отобранных нет или мало, то всю партию принимают, а если много — забраковывают.
Однако если мы попытаемся сказать, что означает «мало» или «много», мы неизбежно усложним дело. Во-первых, нужно уметь сказать, какая доля p0 дефектных деталей в партии для нас вообще допустима. Это очень трудный вопрос: математик от него отказывается и считает, что это должен сделать технолог. Если последний это сделает, то возникает более понятная для математика задача: пусть истинная доля дефектных изделий в партии равна p, тогда требуется узнать (путем исследования выборки из партии), превосходит или не превосходит p установленный порог p0.
Если сосредоточиться на таком понимании задачи выборочного контроля, то математик, желающий принести пользу народному хозяйству, должен теперь в доступной для технолога форме объяснить, какие вероятностные характеристики выборочного контроля представляют практический интерес и как их рассчитывать. Он начинает с того, что имеется партия из N изделий, причем D = Np из них дефектны (число N известно, число D неизвестно), а из партии наудачу берутся n изделий, в которых проверка устанавливает d дефектных. Понятно, что нужно назначить некоторый порог d0: такой, что партия принимается, если d не превосходит d0, и бракуется, если превосходит.
Совокупность чисел (N, n, d0) называется планом выборочного контроля. Нужно как-то соотнести свойства плана выборочного контроля с первоначальным замыслом о том, что партия принимается, если доля дефектных изделий в ней не превосходит p0, и бракуется в противном случае. Однако достаточно простого и ясного способа такого соотнесения не существует, поскольку единственное, о чем математик может говорить, — это вероятности ошибок первого и второго рода.
Ошибка первого рода состоит в том, что мы ошибочно забракуем такую партию, которую нам хотелось бы принять. Иными словами, доля дефектных изделий не больше p0, но число дефектных изделий в выборке больше d0. Ошибка второго рода возникает тогда, когда доля дефектных изделий во всей партии на самом деле больше p0, но в выборке дефектных изделий случайно оказалось не больше d0. Для подсчета вероятностей этих ошибок и пытался составить таблицы Яша Синай. Но что это за таблица? Ведь эти вероятности зависят от четырех чисел N, n, d0, p, так что получается таблица с четырьмя входами. Таблица с тремя входами представляет собой толстый том, а с четырьмя — практически невозможна2.
Допустим, что математик свой вклад в народное хозяйство сделал — таблицы составлены.
В таком случае какие открываются возможности для технолога? Для каждого плана выборочного контроля (N, n, d0) он может насладиться значениями двух функций от неизвестной доли дефектных изделий в партии — значениями вероятностей ошибок первого и второго рода. Какой же план контроля он выберет? Тут надо пояснить, что задача с одним порогом различения p0 вообще нехороша, т.к. отличать по выборке значение, чуть меньшее p0, от значения, чуть большего p0, трудно и вряд ли необходимо. Технолог дает два числа p0 < p1 такие, что партия принимается при p < p0 и бракуется при p > p1. Если технолог имеет достаточно разумные основания для выбора этих порогов, то знание вероятностей ошибок первого и второго рода может принести ему некоторую пользу. Однако он должен еще иметь способ сопоставить величины этих ошибок с объемом выборки n: понятно, что при увеличении объема выборки можно достигнуть малых вероятностей ошибок, но где нужно остановиться? Соображения минимизации расходов приносят мало проку: допустим, стоимость контроля одного изделия известна, но как определить в деньгах потери от ошибок первого и второго рода (ведь это опять завяжется с выбором порогов, и все начнется сначала)? Главная работа для математика еще впереди.
Часто представляется целесообразным путем исследования сравнительно небольшой выборки сразу отсечь те случаи, когда доля дефектных изделий в партии существенно больше (или существенно меньше) того или иного порога. Сначала мы рассматриваем одну выборку. Если в ней дефектных изделий очень мало, то принимаем партию, если очень много — бракуем, а если некоторое промежуточное количество, то берем еще одну выборку (обычно большего объема, чем первая). Стоит ли составить таблицы для двухвыборочных, трехвыборочных и т.д. планов контроля, а также указать способ выбрать из них наилучший? В общем, анализ сценария по составлению и практическому использованию таблиц планов выборочного контроля наводит на грустные размышления. Положение математика, ответственного за составление таблиц, таково, что судьба учеников платоновской Академии (либидо которых подавлялось путем ограничения питания и сна) представляется в сравнении райским блаженством. Вообще-то трудно представить себе такой режим питания и сна, который подавлял бы либидо, но не снижал интеллектуальные возможности. У Андрея Николаевича Колмогорова речь шла о другом: скорее о сублимации либидо в направлении научной эффективности. Он умел задать своим ученикам и сотрудникам такую превосходную выволочку, какой, видимо, не умел задавать Платон. Впрочем, Яша Синай хотя и не составил таблиц, но, кажется, был освобожден от этой формы трудового воспитания. Через довольно много лет эти таблицы частично составили другие люди3.
Теперь поговорим о другом участнике сценария практического использования выборочного контроля — технологе, инженере ОТК. Понятно, что практические свойства таких планов формулируются в далеких от практики терминах, которые далеки от ясности. На практике эти вещи реализовать было непросто. В результате малопонятных процессов коллективной психологии решено было пойти по пути платоновского «Государства» (если даже не «Законов»). По тому же кругу пошло внедрение в практику статистических методов.