В идеале все точки должны располагаться по диагонали матрицы; это показывает, что на местности и в базе данных зафиксирован один и тот же класс. Ошибка пропуска возникает тогда, когда точки класса на местности неправильно зафиксированы в базе данных. В матрице
Таблица 1
Матрица классификации класса В равно сумме
Класс на местности | Класс в БД | ||||
А | В | С | 0 | Всего | |
А | 12 | 7 | 3 | 3 | 25 |
В | 3 | 10 | 3 | 2 | 18 |
С | 3 | 5 | 15 | 1 | 24 |
0 | 4 | 4 | 4 | 21 | 33 |
Всего | 22 | 26 | 25 | 27 | 100 |
записей в столбцах А, С и О строки В (числу точек, относящихся на местности к классу В, а в базе данных - к другим классам). Ошибка добавления(ложного класса) имеет место в случаях, когда в базе данных зафиксирован класс, которого нет на местности, например, для класса А - это сумма записей в строках В, С и О столбца А (соответствует числу точек, неправильно отнесенных к классу А в базе данных).
Для обобщения матрицы соответствия используют такой показатель достоверности классификации, как количество правильно классифицированных точек, расположенных по диагонали матрицы (в %). На самом деле это число может быть случайным. Чтобы учесть этот факт часто при обобщении результатов используют так называемый индекс к каппа Коэна, вносящий поправку на случайность. Он вычисляется по формуле:
K=(d-q)/(N-q) (1)
где d - число случаев правильного получения результата (сумма значений, стоящих на диагонали матрицы соответствия); q - число случайных результатов, вычисляемое через число случайных результатов в столбцах пс и истинных в строках пг матрицы соответствия. N - общее число точек. Для абсолютно точных результатов (все N точек на диагонали) каппа равна 1, а при чисто случайном попадании - О. В приведенном примере
q= (22x25/100 + 26x18/100 + 25x24/100 + 27x33/100) = 25,09; K= (58-25)/(100-25) = 0,44;
показатель достоверности классификации равен 44%, что меньше значения, полученного по диагональным элементам (58%).
Неопределенность атрибутов каждого элемента растра постоянна для каждого из представленных классов объектов, а позиционная неопределенность постоянна для всего растра - фиксируется один раз для всей карты.
Для социальных данных основной источник неточности в атрибутах - недоучет данных. Например, при проведении переписи в некоторых районах и по некоторым социальным группам недоучет может быть очень высоким (>10%).
2.7.10.Логическая непротиворечивость, полнота, происхождение
Эти элементы качества данных относятся к базе данных в целом, а не к объектам, атрибутам или координатам.
Логическая непротиворечивость связана с внутренней непротиворечивостью структуры данных, с топологическим представлением данных, что означает наличие исчерпывающего списка взаимоотношений между связными геометрическими представлениями данных без измерения хранимых координат пространственных объектов. Она обычно заключается в ответах на вопросы: замкнуты ли полигоны, нет ли полигонов без меток или с несколькими метками, есть ли узлы на всех пересечениях дуг. Логические противоречия могут быть связаны с проблемами согласования информации и географических границ при совмещении данных из разных источников.
Полнота связана со степенью охвата данными множества объектов, необходимых для представления реальности или отображения на результирующей карте (все ли соответствующие объекты включены в базу данных?). Она зависит от правил отбора объектов или явлений, генерализации и масштаба.
Происхождение включает сведения об источниках данных, времени сбора данных, точности источников и цифровых данных, организации, которая их собирала, об операциях по созданию базы данных (как кодировались данные и с какого исходного материала, как происходила их обработка). Обычно эта информация содержится в специальных файлах метаданных.
2.7.11.Особенности интеграции разнотипных данных
Новые виды и типы цифровых данных требуют разработки методов их совместного использования, оценки пригодности для создания ГИС и составления карт. Создание проблемно-ориентированных банков географических и картографических данных и знаний способствует не только накоплению и обмену информацией, но и повышению качества и достоверности результатов, получаемых ГИС. Особенно возрастает роль таких банков для интеграции, пространственного и тематического согласования информации.
Проблемы интеграции данных особенно остро встали в связи с широким использованием уже существующих цифровых карт, содержащихся в разнообразных базах пространственных данных и распространяемых по телекоммуникационным сетям. Они могут быть слоями проблемноориентированных ГИС, представлять результаты компьютерного дешифрирования аэро и космических снимков, цифрового моделирования объектов или явлений. Информация относительно их происхождения, методов создания, точности и достоверности часто отсутствует или недоступна. Совокупность цифровых данных о пространственных объектах, составляющих содержание баз географических данных ГИС, по существу, еще не является цифровой картой. На картах, созданных на основе данных дистанционного зондирования, "пиксельные" разрешение и генерализация могут не соответствовать показателям картографической точности и генерализации для выбранных масштаба и проекции. Особенно сложна интеграция данных, представляемых на карте условными знаками, из-за их внемасштабности и уникальности.
Технология создания цифровых карт часто определяется временными, не устоявшимися, разрозненными, не всегда профессионально составленными инструкциями и техническими заданиями, разработанными производителем или заказчиком работ, ведомственными инструкциями. Все чаще появляются в публикациях сообщения об ошибках в цифровых картах, а иногда об их полной непригодности к использованию или ненадежности как источников данных.
При традиционном (бумажном) создании карт разнотипные данные применяются давно и методы их совместного использования хорошо разработаны. Современное техническое и программное обеспечение позволяет на основе любых доступных данных создавать сколь угодно сложные по содержанию карты и делать их легко доступными для использования и модификаций. Но часто это делается без учета картографических традиций, в то время как доверие к цифровым картам велико. Решение проблем интеграции данных при создании и использовании цифровых карт лежит в области разработки инфраструктуры пространственных данных (на национальном, межгосударственном уровнях), четкой структуры метаданных и картографически обоснованного применения ГИС-технологий при работе с разнотипными данными.
Под формированием инфраструктуры пространственных данных подразумевается разработка механизма их обмена и накопления (доступность, стоимость, система стандартов на данные и обмен ими, мета данные), а также определение единой - базовой - пространственной информации, к которой, в первую очередь, следует отнести геодезическую основу, рельеф, гидрографию, транспортную сеть, административные границы.
Преимущество геоинформационных методов заключается в возможности оценить пригодность данных для совместного использования и осуществить их интеграцию на основе выполнения пространственного анализа с помощью ГИС-технологий. Однако основное правило при интеграции информации таково: качество данных должно быть определено скорее во время получения данных, чем при попытке применить эти данные. Тогда указанные технологии могут существенно облегчить их корректировку для поставленной задачи.
Основные проблемы, возникающие при совместном использовании разнотипных данных: отображение положения границ в разных цифровых источниках, временные параметры данных и способ отражения структуры геосистем.
Хорошим технологическим приемом интеграции разнотипных данных произвольных источников может стать создание специализированных экспертных систем. Их задача - выполнение оценок качества и пригодности таких данных, опирающееся на три базовых составляющих системы: метаданные, логические процедуры, учитывающие характер проявления основных источников возможных ошибок в цифровых пространственных данных, ГИС-технологии, реализующие традиционные и современные приемы совмещения информации для создания БД.
2.8.ТЕХНИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ГИС
2.8.1.Требования к техническому и программному обеспечению ГИС
Стратегию создания любой ГИС определяют функции, которые она будет выполнять. Кроме традиционных - сбор, хранение, обработка и передача информации, ГИС должны обладать функциями, способствующими сочетанию сложившихся ранее и новых геоинформационных методов решения географических задач.
Процесс применения ГИС-технологий для пользователя ГИС включает:
поиск, сбор, оценку и осмысление особенностей пространственных данных, представляемых в цифровой форме;
определение состава и тематического содержания пространственной информации, необходимой для решения поставленной задачи, в сочетании с вопросами определения системы координат, в которой создается основа базы данных, структуры и модели данных, методов и средств цифрования и хранения данных, оценки их точности и достоверности;