Многообразие характеристик и видов баз данных порождает многообразие классификации. Рассмотрим основные виды классификации.
По технологии обработки данных базы данных подразделяются на централизованные и распределенные.
Централизованная база данных хранится в памяти одной вычислительной системы, к которой подключены несколько других компьютеров.
Распределенная база данных состоит из нескольких, возможно пересекающихся или даже дублирующих друг друга частей, хранимых в различных ПК компьютерной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базой данных (СУРБД).
По способу доступа к данным базы данных подразделяются на базы данных с локальным доступом и базы данных с удаленным (сетевым) доступом.
Системы централизованных баз данных с сетевым доступом предполагают различные архитектуры подобных систем:
· файл-сервер. Согласно этой архитектуре в компьютерной сети выделяется машина- сервер для хранения файлов централизованной базы данных. Файлы базы данных могут быть переданы на рабочие станции для обработки: ввода, корректировки, поиска записей. При большой интенсивности доступа к одним и тем же файлам производительность системы падает. В этой системе сервер и рабочие станции должны быть реализованы на достаточно мощных компьютерах.
· клиент-сервер – архитектура, используемая не только для хранения файлов централизованной базы данных на сервере, но и выполняющая на том же сервере основной объем работы по обработке данных. Таким образом, при необходимости поиска информации в базе данных рабочим станциям - клиентам передаются не файлы данных, а уже записи, отобранные в результате обработки файлов данных. Такая архитектура позволяет использовать маломощные компьютеры в качестве рабочих станций, но обязательно в качестве сервера используется очень мощный компьютер.
Прежде чем создавать базу данных, с которой вам придется работать, необходимо выбрать модель данных, наиболее удобную для решения поставленной задачи.
Модель данных - совокупность структур данных и операций их обработки.
С помощью модели данных могут быть представлены объекты предметной области и взаимосвязи между ними. Модели данных, которые поддерживают СУБД, а, следовательно, и сами СУБД делят на:
· иерархические;
· сетевые;
· реляционные.
Иерархическая база данных (рис. 4), в основу которой положена разветвленная структура с элементами подчиненности.
К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь.
Узел - это совокупность атрибутов данных, описывающих некоторый объект. Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне.
Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д. уровнях. Количество деревьев в базе данных определяется числом корневых записей. В каждой записи базы данных существует только один (иерархический) путь от корневой записи.
Узлы
Рис. Структура учебной дисциплины (иерархическая база данных)
Несмотря на кажущуюся целесообразность, для получения ответов на некоторые запросы в иерархической модели требуется выполнение большого числа операций. Например, чтобы узнать о практических занятиях по всем дисциплинам БЮИ требуется просмотреть все записи «Практическое занятие», имеющиеся в данной базе.
Сетевая (полносвязная) база данных. В сетевой структуре базы данных при тех же основных понятиях иерархической базы данных: узел, уровень, связь - каждый элемент может быть связан с любым другим элементом.
Реляционная база данных, в основу которой положена реляционная информационная система. Реляционная структура базы данных ориентирована на организацию данных в виде двумерных таблиц, называемых еще реляционными таблицами.
Каждая реляционная таблица обладает следующими свойствами:
· каждый элемент таблицы - один элемент данных;
· все столбцы в таблице однородные, т.е. все элементы в столбце имеют одинаковые характеристики и свойства;
· каждый столбец имеет уникальное имя;
· одинаковые строки в таблице отсутствуют;
· порядок следования строк и столбцов может быть произвольным.
Понятие реляционный (relation – отношение) связано с разработками известного американского специалиста в области баз данных Э. Кодда. В основу реляционной базы данных положено понятие алгебры отношения и реляционного исчисления.
Реляционный подход к построению базы данных предполагает отображение реальных объектов (явлений, событий, процессов) в виде информационных объектов или объектов предметнойобласти. Информационные объекты описывают реальные с помощью совокупности взаимосвязанных реквизитов.
Отношения представлены в виде таблиц, строки которых представляют записи, а столбцы – атрибуты отношений – поля. Если значение поля однозначно определяет соответствующую запись, то такое поле называют ключевым.
Имеется возможность связать две реляционные таблицы, если ключ одной таблицы ввести в состав ключа другой таблицы (рис. 5).
Так, если ключом таблицы книга будет выбран «№ в каталоге», то такую таблицу можно связать, например, с таблицей «Список библиотечного фонда». В этой таблице кроме полей, определяющих оценки по дисциплинам сессии, обязательно должно быть поле «№ в каталоге». Таким образом, между этими таблицами может быть установлена связь по этому ключевому полю.
Информация, введенная в одну реляционную таблицу, может быть связана с одной или несколькими записями другой таблицы
|
Ключи
Связи между таблицами
Рис. 5. Структура библиотеки (реляционная база данных)
.
Реляционная база данных является объединением нескольких двумерных таблиц, между которыми установлены связи.
Между записями двух таблиц могут быть установлены следующие основные виды связей:
· один к одному - эта связь предполагает, что в каждый момент времени одному экземпляру информационного объекта А соответствует не более одного экземпляра информационного объекта В и наоборот; например, начальник курса – курс;
· один к многим - эта связь предполагает, что одному экземпляру информационного объекта А соответствует 0, 1, 2 или более экземпляров объекта В, но каждый экземпляр объекта В связан не более чем с 1 экземпляром объекта А, например, начальник курса – курсант;
· многие к многим - эта связь предполагает, что в каждый момент времени одному экземпляру информационного объекта А соответствует 0, 1, 2 или более экземпляров объекта В и наоборот, например, учебная дисциплина - курсант.
Одни и те же данные могут группироваться в таблицы различными способами, т.е. возможна различная форма наборов отношений взаимосвязанных информационных объектов.
При этом должен выполняться принцип нормализации:
· в одной и той же таблице не может находиться повторяющихся полей;
· в каждой таблице ключ должен однозначно определять запись из множества записей;
· значению ключа должно соответствовать исчерпывающая информация об объекте таблицы;
· изменение значения любого не ключевого поля не должно влиять на информацию в других полях.
В последние годы подавляющее большинство баз данных являются реляционными и практически все СУБД ориентированы на такое представление информации. Рассмотрим реляционную СУБД Access, которая входит в пакет MSOffice.
MicrosoftAccess создана на основе реляционной модели базы данных и предназначена для создания быстрых, эффективных баз данных, применяемых в быту и бизнесе. Кроме того, она способна подключаться к другим базам данных, создавая для вас широкий фронт работы с данными, независимо от того, где они находятся.
Рассмотрим основные элементы окна Access и команды для выполнения типовых операций, которые во многом повторяют уже знакомые вам команды Word и Excel.
При работе с СУБД Access на экран выводятся типовое окно WINDOWS-приложения, состоящее из рабочего поля и панели управления (Рис. Внешний вид окна СУДБ MicrosoftAccess).
Строка менюсодержит основные режимы программы. Выбрав один из них, вы получаете доступ к ниспадающему подменю, содержащему перечень входящих в него команд. В результате выбора некоторых команд ниспадающего меню появляются дополнительные подменю.
Вспомогательная область управления включает:
· строку состояния;
· панели инструментов;
· линейки прокрутки.
В строке состояния (статусной строке) вы найдете сведения о текущем режиме работы программы, имени файла текущей базы данных и т.п. Панель инструментов (пиктографическое меню) содержит определенное количество кнопок (пиктограмм), предназначенных для быстрой активизации выполнения определенных команд меню и функций программы. Чтобы представить на экране области таблицы базы данных, форм или отчетов, которые на нем в настоящий момент не отображены, используют вертикальную и горизонтальную линейки прокрутки.