Сходные явления, информация о которых хранится в базе данных, определяются как типы объектов - любая группа сходных явлений, которые должны иметь одинаковую форму хранения и представления, например, дороги, реки, высоты, растительность; тем самым обеспечивается основа для формирования общего атрибута явлений. Каждый тип объектов должен быть точно определен, это помогает выявить перекрывающиеся категории данных, вносит ясность в содержание базы данных.
Основные элементы базы данных. Для цифрового представления типов реальных объектов необходимо выбрать подходящую форму объектов, являющихся представителями первых (кодами) в базе пространственных данных. Их классификация может быть основана на представлении пространственной размерности:
точка - объекты, имеющие положение в пространстве, но не имеющие длины (0-мерные);
линия - объекты, имеющие длину, они состоят из двух и более 0-мерных объектов (1-мерные);
полигон - объекты, имеющие длину и ширину, они ограничены, по крайней мере, тремя 1-мерными объектами (отрезками) (2-мерные);
объемная фигура - объекты, имеющие длину, ширину и высоту или глубину, они ограничены, по крайней мере, четырьмя 2-мерными объектами (3-мерные).
Такие объекты хорошо отражают тип пространственной локализации реальных объектов. Они могут быть объединены в классы, например, множество точек для представления множества городов.
Пространственные типы объектов БД могут группироваться в слои, именуемые также покрытиями или темами. Один слой представляет один тип объектов или группу концептуально взаимосвязанных типов объектов. Например, слой может включать только отрезки водотоков, или же водотоки, озера, береговую линию и болота. Возможны самые разные варианты системы слоев, как и модели данных. Некоторые базы пространственных данных создаются путем объединения всех объектов в один слой.
Одни и те же географические явления можно представить в разных масштабах и с разной точностью. Переход от одного представления к другому достаточно сложен, например, переход от мелкого масштаба (1:250 000) к крупному (1:10 000). Поэтому часто встречаются базы данных, содержащие множественные представления одних и тех же явлений. Это неэкономно, но избежать этого пока не удается, ибо соответствующие методы перехода еще недостаточно разработаны.
2.7.5.Объектно-ориентированные и реляционные структуры БД
В преобладающем большинстве ГИС используются реляционные базы данных, поддерживаемые такими СУБД как dBASE , INFO ,ORACLE, INFORMIX и т.п. Такие БД позволяют разработчикам ГИС разделить проблему управления пространственными данными на две части: как представлять геометрию объектов и топологию пространственных объектов (вектор или растр) и как работать с атрибутами этих объектов. Для этого годятся реляционные СУБД, а управляемые ими модели данных иногда называют геореляционными моделями. Основные их преимущества таковы:
нет необходимости хранить атрибуты с пространственными данными, но они всегда могут содержаться где-нибудь в системе или поставляться, например, по сети;
атрибуты могут быть изменены или удалены без изменения пространственной БД;
коммерческие реляционные СУБД стандартны и могут управляться стандартными запросами;
хранение атрибутивных данных в реляционных БД не противоречит основным принципам слоев в ГИС;
атрибуты могут быть привязаны к пространственным единицам и представлены разными способами.
В последнее время, особенно в разработках фирмы ESRI, большое внимание стало уделяться четвертому типу СУБД - объектно-ориентированному (здесь этот термин имеет отношение только к структуре БД и языку программирования, а не объекту как реальности). Ее применение направлено на снижение объемов хранимой информации и времени последовательного поиска в БД. В ГИС такие структуры применяются, когда появляется необходимость управления сложными реальными объектами более разумным способом, чем простыми точками, линиями и полигонами, а также модификации БД при оверлее полигонов.
В объектно-ориентированных БД требуется, чтобы географические данные были определены как совокупности элементов. При этом они характеризуются серией атрибутов и параметров их поведения, которые определяют их пространственные, графические, временные, текстовые/численные размерности. Примерами таких элементов могут служить участок железной дороги и связанное с ним здание вокзала, участок трубопровода с серией ответвлений разного диаметра и т.п. Такая структура позволяет унифицировать хранение геометрии и атрибутов при отображении взаимосвязанных объектов.
2.7.6.Организация и форматы данных
Для хранения цифровых пространственных данных, позиционной и атрибутивной их составляющих в БД применяют различные структуры, которые связаны в основном с векторным или растровым представлениями географических объектов. Способы компьютерной реализации этих представлений носят, соответственно, названия векторный и растровый форматы.
В векторном формате, в котором пространственные объекты представляются точками, линиями и полигонами, позиционная составляющая или геометрия обычно хранится в одном файле в виде индексированных записей: индекс кодирует объект (соответственно, точечный, линейный или полигональный), а запись состоит из набора пар или троек координат, число которых в записи соответствует типу объекта: 1 -для точки, n - для линии или полигона. Чтобы отличить записи для линий и полигонов их либо кодируют разными типами индексов, либо для полигонов в последней записи повторяют координаты первой точки полигона.
Значения атрибутов часто упорядочивают в виде таблиц атрибутов. В реляционных моделях БД каждая клетка таблицы отражает значение одного из признаков определенного объекта. В зависимости от способа отражения временная форма фиксируется в одной таблице атрибутов данного объекта или в нескольких таблицах для различных временных этапов. Таблица отражает тематическую и, отчасти, пространственную формы информации.
В растровом формате геометрия и атрибуты хранятся в одном файле: записи в нем организованы по строкам или столбцам растра, номера которых кодируют систему координат, а каждое число в записи кодирует уникальное значение атрибута, относящегося к одной ячейке растра (пикселу).
Сопоставление векторного и растрового форматов. Основные проблемы, обсуждаемые при выборе растрового или векторного форматов - это отображение реальности, точность координат, скорость аналитической обработки, потребности в объеме памяти, отражение характерных признаков явлений.
Обработка данных. Данные в растровых форматах обрабатываются быстрее при решении таких аналитических задач, как наложение (оверлей), определение соседства, выполнение логических запросов. Для определения взаимного положения объектов и их анализа в большинстве случаев требуется лишь сравнить содержание соответствующих ячеек растра в различных слоях БД с применением простейших условных операторов.
При построении векторной топологии приходится многократно выполнять однотипные вычисления и логические проверки, например, для нахождения точек пересечения отрезков линий, составляющих контуры объектов. Сложные алгоритмы необходимы и при наложении полигонов, для выявления ложных ("паразитных") полигонов. Эти обстоятельства удлиняют время обработки данных, запросов пользователей.
Хранение данных. Простейший метод хранения растровых данных требует 1-2 байтов памяти для каждого пиксела независимо от величины им представляемой, и в этом аспекте он не эффективен. В некоторых системах хранения существуют ограничения на число строк и столбцов. На практике применяются различные методы сжатия информации; наиболее распространенным из них является групповое кодирование, при котором степень сжатия зависит от пространственной изменчивости данных. Однако в некоторых случаях группового кодирования упаковка и распаковка данных дает лишь небольшое преимущество по сравнению с их поячеечным хранением.
Для хранения простых полигонов в векторном формате требуются небольшие объемы памяти; в общем случае необходимый ее объем зависит от сложности объектов, от того, что хранится вместе с координатами, а также от точности координат (одинарная или двойная). В целом векторные системы используют меньший объем памяти по сравнению с растровыми системами, графическое разрешение которых сопоставимо с векторными.
Растровые базы данных привлекают простотой организации, быстротой многих операций; они особенно привлекательны для специалистов в области дистанционного зондирования, привыкших оперировать пикселами при обработке информации, а также при представлении первичных и систематизированных данных о высотах рельефа. Растровый файл легко получить путем сканирования фотоотпечатков или бумажных карт. С другой стороны, во многих случаях растровый подход ведет к потере деталей. Растровые данные различных источников могут иметь разный размер элементов, ориентацию, положение, проекцию. В случае их совместного использования необходим процесс интерполяции информации из одной системы элементов растра в другую. При этом переход к элементам большего размера относительно безопасен, переход к меньшим элементам чреват большими неприятностями.
Хорошие результаты дает использование систем, в которых растровый и векторный анализ могут осуществляться параллельно с использованием функций преобразования (конвертирования) форматов. Такие системы позволяют, например, осуществить наложение векторной карты участков с различным типом использования земель на снимок для более точного его дешифрирования, а затем снимок использовать для корректировки векторной карты ареалов растительности.
Обменные форматы данных. Совместное использование разных источников данных (как векторных, так и растровых) связано с еще одним понятием формата данных - шаблоном представления их в файлах данных. Некоторые из них приняты государственными организациями как стандарты, другие определяются распространителями данных и разработчиками программных средств как внутренние форматы. Обилие таких форматов и уже накопленных данных делают чрезвычайно важной проблему разработки специальных обменных форматов и способов их конвертирования. Многие современные ГИС-пакеты представляют широкие возможности для конвертирования внутренних форматов, как в обменные, так и форматы других пакетов.