В аналитических и экспериментальных исследованиях проблема статистической репрезентативности выборки оказывается второстепенной в сравнении с необходимостью обеспечить качественное представительство изучаемых рыночных и социальных объектов.
Рассмотрим следующий пример. В изучении образа жизни населения некоторого города мы, следуя правилам дескриптивного обследования, хотим обеспечить представительство всех групп населения соответственно их пропорциям в составе генеральной совокупности с отклонением ±5% от истинного распределения. Такая выборка, представительная в качественном отношении, будет также и статистически репрезентативной, но следует решить, нужно ли это.
Если мы хотим изучить в статистических показателях особенности условий и образа жизни каких-то определенных групп населения, репрезентативная выборка должна быть заменена целевой, в которой численность каждой интересующей нас группы будет достаточна для более основательного анализа. Такая выборка, будучи качественно представительной в отношении целей исследования, не является статистически репрезентативной в отношении генеральной совокупности.
Во многих случаях необходимы именно целевые выборки. Особенно это важно в исследованиях экспериментального плана.
Численность (объем) выборки зависит от уровня однородности или разнородности изучаемых объектов. Чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы. Но степень однородности социального объекта зависит, в сущности, от того, насколько детально мы намерены его исследовать. Практически любой, самый «элементарный» объект оказывается чрезвычайно сложным. Лишь в анализе мы представляем его как относительно простой, выделяя те или иные его свойства. Чем более основательным и детальным будет анализ, чем больше свойств данного объекта мы намерены принять во внимание в их сочетании, а ,не изолированно, тем больше должен быть объем выборки.
Для решения такого рода задач как раз и необходимы целевые аналитические выборки. В них учитывается не только структура изучаемой совокупности, но и ограничения, накладываемые на объем выборки целями исследования, глубиной анализа проблем.
Используя статистический критерий Стьюдента, можно рассчитать объем выборок в зависимости от заданного уровня доверительного интервала ошибки вывода. Чем меньше объем сравниваемых подвыборок (пусть это будут ветераны-одиночки и семейные), тем больше должно быть различие каждой пары сопоставляемых статистик (например, процентные различия оценок условий быта теми и другими). Если численность сравниваемых подвыборок неодинакова, за базу определения допустимой ошибки следует брать наименьшую подвыборку.
В зависимости от объема подвыборки существенность процентных различий определяется таблицей:
Объём подвыборок по их численности | Значимая разность в % при ошибке не больше 5 % | Объём подвыборок по их численности | Значимая разность в % при ошибке не больше 5 % |
50100150200 | 201411,510 | 30050010005000 | 86,34,52 |
Авторы приведенных расчетов отмечают, что выборки на уровне 500 человек позволяют анализировать таблицы сопряженности с 4 признаками из трех градаций каждый, а выборки в 1000 единиц расширяют возможности уверенного анализа до таблиц с 6 признаками из пяти градаций. Все это при условии обеспечения доверительного интервала, не превышающего 5% статистически значимой ошибки.
Общее правило таково: объем выборки при заданном уровне доверительного интервала должен быть не менее чем пК единиц наблюдения, где п — объем подвыборки по столбцу, а К — число столбцов.
Объем выборки зависит также от уровня доверительного интервала опустимой ошибки, каковая, как уже говорилось, задается целесообразной точностью итоговых обобщений: от повышенной до ориентировочной. Однако здесь имеются в виду так называемые случайные ошибки, связанные с природой любых статистических погрешностей. Именно они и вычисляются как ошибки репрезентативности вероятностных выборок.
В. И. Паниотто приводит следующие расчеты репрезентативной выборки с допущением 5-процентной ошибки.
Объем генеральной совокупности | 500 | 1000 | 2000 | 3000 |
Объем выборки | 222 | 286 | 333 | 350 |
Объем генеральной совокупности | 4000 | 5000 | 10000 | 100000 |
Объем выборки | 360 | 370 | 385 | 398 |
Для совокупности более 100000 выборка составляет 400 единиц. Если же иметь в виду генеральные совокупности численностью от 5 тыс. и больше, то, по расчетам того же автора, можно указать величины фактической ошибки выборки в зависимости от ее объема, что для нас весьма важно, памятуя, что величина допустимой ошибки зависит от цели исследования и необязательно должна приближаться к 5-процентному уровню.
Объем выборки, если генеральная совокупность ³ 5000 | 25 | 45 | 100 | 123 | 156 | 204 | 400 | 625... |
Фактическая ошибка при данном объёме выборки, % | 20 | 15 | 10 | 9 | 8 | 7 | 5 | 4 |
Наряду со случайными возможны ошибки систематического характера. Они зависят от организации выборочного обследования. Это разнообразные смещения выборки в сторону одного из полюсов выборочного параметра.
Объем, выборки определяется аналитическими, задачами исследования, а ее репрезентативность — целевой установкой программы. Именно программа задает образ необходимой генеральной совокупности для проведения выборки. Будет ли это все население или особые его структурные образования, все элементы изучаемого объекта или только выделяемые по заданным программой критериям, генеральную совокупность составляют все единицы, определенного в программе объекта.
Теперь следует обеспечить равную их вероятность попадания в выборочную совокупность.
При небольших по численности генеральных совокупностях применяют случайную бесповторную выборку, где обеспечивают равную вероятность попадания в исследование всех ее единиц по полному их списку из генсовокупности. Имея полный список работников предприятия (например, 2000 человек) и определив объем выборочной совокупности (например, в 2000 человек), устанавливаем шаг выборки делением первого на второе (2000:200) и получаем шаг отбора — каждый 10-й из списка. Здесь важно не допустить систематической ошибки из-за отсутствия в списке, скажем, какого-то подразделения, например, работающих в филиале предприятия.
При больших генеральных совокупностях, как это имеет место в опросах населения, используют многоступенчатый отбор по районам, т. е. крупным структурным составляющим генеральной совокупности: регионы, типы поселений, кварталы города. На каждой ступени отбора следует обеспечить требования представительности населения, т. е. обоснованно отобрать регионы так, чтобы не было смещения по какому-то важному параметру (например, по этно-национальному). То же самое и на последующих ступенях отбора. В конечном счете отбор производится опять-таки систематически с установленным шагом отбора по списку граждан (из списков избирателей или иных), списку хозяйств на селе, путем •посещения каждой, скажем, 20-й квартиры в списке квартир каждого 50-го дома выделенного квартала города.
Многие обстоятельства усложняют проблему расчета ошибки и нередко могут привести к тому, что формально-статистически репрезентативная выборка окажется качественно непредставительной.
Итак, качество выборки зависит от трех условий:
от меры однородности социальных объектов по наиболее существенным для исследования характеристикам;
от степени дробности группировок анализа, планируемых по задачам исследования;
от целесообразного уровня надежности выводов из предпринимаемого исследования,
Очень часто малоопытный маркетолог не улавливает разницы между проблемой ошибки репрезентативности выборки и ошибки вывода из данного конкретного распределения в рамках выборочной совокупности.
Пусть выборка достаточно репрезентативна и ошибка по тому или иному параметру выборки незначительна. Оценка уровня достоверности вывода по каждому конкретному распределению остается при этом проблемой самостоятельного анализа (Приемы расчета разнообразных ошибок вывода рассматривает Ю. В. Кемнчц, который подчеркивает, что формально-статистические методы расчета ошибок вывода должны предваряться «инженерным» (т. е. содержательным. — Р. У.) изучением распределений.
8. Общие требования к программе
Составление программы — необходимое условие успешности всей работы. На рис. 2 показана принципиальная последовательность действий маркетолога в процессе разработки программы, а на рис. 3 — развертка блоков программы. Программа выполняет две важнейшие функций: научно-познавательную и научно-организационную. Первая состоит в обеспечении теоретико-методической целостности исследования, вторая обеспечивает эффективное сотрудничество участников исследовательского коллектива, разделение труда между ними ради достижения общего научного и научно-практического результата. Значение этой второй функции нельзя недооценивать, так как именно научная программа обязывает коллектив в единую работоспособную и продуктивную исследовательскую организацию.
Вместе с тем программа выполняет и внешние функции: она фиксирует место данного исследования в общем процессе развития научного и научно-практического знания, является необходимым условием оптимального планирования научных исследований данного научного учреждения, научного сообщества в целом, в системе координации научных исследований в нашей стране.