Анализ медико-биологических данных с помощью Microsoft Excel иСПП STADIA 6.2
Реферат выполнила аспирант кафедры биохимии и биотехнологии Ли Ирина Арсентьевна
Министерство образования Российской Федерации
Дальневосточный государственный университет
2002
В развитых странах практически любое решение: политическое, финансовое, техническое, научно-исследовательское и даже бытовое решение принимается только после всестороннего анализа данных. Поэтому изучение прикладной статистики и методов анализа данных является неотъемлемым компонентом образования на всех уровнях, а компьютерные пакеты для аналитических исследований и прогнозирования являются настольным рабочим инструментом любого специалиста, так или иначе связанного с информационной сферой.
Известно, что окружающий нас мир характеризуется постоянной изменчивостью, порождающей разнообразие возможностей и свободу выбора. Однако тот, кто серьезно думает о перспективах своей деятельности, обязательно будет накапливать информацию об окружающем мире, пытаясь выделить закономерности из случайностей.
Именно таким мощным и гибким инструментом отсеивания закономерностей от случайностей и является аппарат математической статистики.
Для современной науки характерно применение точных математических методов в самых различных областях. Точность и уровень той или иной области человеческих знаний часто определяется степенью использования соответствующим разделом науки математических методов.
Эволюционная теория Ч. Дарвина, явилась по существу первой эволюционной теорией, которая привнесла в исследования вероятностный дух. Анализ взаимозависимости между такими исходными понятиями эволюционной теории, как изменчивость, наследственность и отбор, оказался бы несостоятельным без того, что сейчас называется вероятностным стилем мышления. Сегодня исследование проблем организации, функционирования, взаимодействия и эволюции живых систем уже немыслимо без привлечения идей и методов теории вероятностей, математической статистики и других разделов математики .
Характерной особенностью математизации биологии в наши дни является стремительный рост спроса на такие методы эмпирического материала, которые обеспечивают комплексный подход к познанию живых организмов. В исследовательской работе не всегда учитывается принцип единства и взаимосвязанности явлений в природе. Ярче всего это проявляется при организации наблюдений и экспериментов по принципу единственного фактора, которому многое жертвовалось: вводились различные ограничения и оправдывались существенные упрощения, разрабатывались искусственный схемы исследований и т.д. В результате допускалась методологическая ошибка: игнорировался принцип единства живой природы. Известно, что упущения методологического характера нельзя исправить никакими методами, в том числе и математическими. Принцип единственного фактора вошел в биологию по объективным причинам, среди которых первостепенное значение имеет факт, что человек не может непосредственно анализировать одновременное взаимодействие многих факторов.
Такие математические методы, которые разработаны с всесторонним учетом принципа единства живой природы и возможности практической их реализации с использование программного обеспечения, является достижением в области постановки и анализа биологических исследований. Однако, опыт показывает, что и в век вычислительной техники лучших успехов достигают те специалисты, которые умеют не только использовать обработанную информацию, но также уяснили сущность применяемых методов. Это предохранит от механического их использования, которое рано или поздно приводит к нелепым или даже абсурдным выводам.
Математическая статистика – раздел математики, посвященный математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов. Математическая статистика исходит из предположения, что наблюдаемая изменчивость наблюдаемого мира имеет два источника. Один из них действие известных причин и факторов. Они порождают изменчивость, закономерно объяснимую. Именно эти изменения и вызывающие ее факторы обычно представляют интерес у исследователя, ищущего, в первую очередь, причинные связи явлений.
Однако большинство природных и общественных явлений обнаруживают изменчивость, которая не может быть целиком объяснена закономерными причинами. В таком случае прибегают к концепции случайной изменчивости, которая в данном контексте означает «подчиняющийся законам вероятности». И если предположение о таком характере явлений справедливо, то оно позволяет делать надежные выводы (достоверность которых контролируется) из данных, которые зачастую противоречивы, искажены ошибками, ненадежны и т.д. Без привлечения статистических понятий в таких случаях невозможно судить о точности и обоснованности выводов, но и вообще об их адекватности.
Практика накопила большой опыт того, в каких ситуациях приемлемы представления о случайной изменчивости. Для наиболее ходовых из таких ситуаций разработаны математические модели. Наиболее важные и употребительные модели отражены в компьютерных статистических пакетах. Программное воплощение теоретических схем бывает весьма разнообразным, равно как и возможности и производительность реализуемых алгоритмов, а также удобство использования и работы с пакетом.
Кроме основного ядра, в той или иной форме представленного в большинстве пакетов общего назначения, многие из них уделяют предпочтительное внимание отдельным разделам математической статистики и могут содержать менее традиционный или даже новый, оригинальный материал по этим разделам.
Даже в самых конкретных биологических исследованиях основной интерес представляют сведения, относящиеся не к индивидуальному объекту, а к целой группе или некоторому статистическому среднему объекту. Необходимость использования статистических методов в биологических и медицинских исследованиях связана в первую очередь с тем, что свойства биологических объектов обычно значительно варьируют в пределах популяции, а физиологические и другие параметры одной особи испытывают флуктуации во времени.
Традиционно тесные связи между биологической проблематикой и собственно математической статистикой, уже давно позволили выделить рассматриваемую область прикладной статистики в отдельную дисциплину – биометрию.
Биометрия – область научных знаний, охватывающая планирование и анализ результатов количественных биологических экспериментов и наблюдений методами математической статистики.
Современный количественный эксперимент включает в себя самостоятельное математико-статистической исследование, которое начинается со статистического планирования эксперимента, то есть организации его постановки, и завершается статистической обработкой полученных результатов. Поэтому биометрия находит себе все более широкое общебиологическое применение, ибо задачи, которые она решает – планирование экспериментов и анализ их результатов, - составляют основу экспериментальной работы в любой частной области биологии.
Биометрия строится на строгом математическом фундаменте, но этим не ограничивается.
Построение биометрии идет по четырем основным разделам:
Отбор из громадного арсенала математических методов таких, который могут помочь биологам в их текущей работе по наблюдению, преобразованию живой природы;
Модификация отобранных математических методов в соответствии со специфическими особенностями биологических объектов и процессов
Разработка новых биометрических методов, требуемых современным развитием биологии, но еще не имеющихся в арсенале общей математики. Например, расчет показателей наследуемости и повторяемости;
Унификация терминологии и символики. В общей математике нет единой системы терминов и символики, имеется большое разнообразие в названиях и обозначениях по каждому показателю. При создании биометрической терминологии большинство терминов заимствуется. Но не всегда математические термины пригодны в биологии. Например, такое биологическое явление, как неодинаковость объектов в группе, неизбежное их различие в математике обозначается многими терминами, совершенно не соответствующими сущности этого явления: «изменчивость», «рассеяние», «колеблемость», «разброс». Поэтому в биометрии все они заменены одним общим термином «разнообразие».
Опираясь на такие особенности ЭВМ, как быстродействие, способность хранить большие объемы информации, предоставление по использованию прикладных программ, существование разнообразных форм выдачи результатов вычислений, расширились возможности биометрии, она стала более доступной. Биометрия основывается теперь не только на таких математических дисциплинах, как теория вероятностей и математическая статистика, но на информатике и программировании на ЭВМ. Это позволяет говорить о современной биометрии как о компьютерной.
Стандартные статистические методы включены в состав популярных электронных таблиц, таких как Excel, Lotus 1-2-3, QuattroPro, а также в математические пакеты общего назначения, например Mathcad, Maple и др. Однако гораздо большими возможностями обладает специализированное программное обеспечение – статистические программные продукты (СПП).
Международный рынок насчитывает более 1000 пакетов, решающих задачи статистического анализа данных в среде операционных систем Windows, DOS, OS/2.