СОДЕРЖАНИЕ
1.Введение ст. 2
2.Файловая система FAT ст. 2-3
3.Файловая система FAT32 ст. 3-8
3.1. Поиск данных файла ст. 3-4
3.2. Поиск свободного места ст. 4-5
3.3. Работа с каталогами и файлами ст. 5
3.4. Кэширование ст. 5-6
3.5. Быстродействие накопителя ст. 6-7
3.6. Размер кластера ст. 7
3.7. Вывод ст. 8
4.Файловая система NTFS ст. 9-25
4.1. Физическая структура NTFS ст. 9-26
4.2. Дефрагментация NTFS ст.16-19
4.3. Программный RAID ст. 19
4.4. Шифрующая файловая система (EFS) ст. 19-22
4.5. Влияние различных факторов на быстродействие NTFS ст. 22-25
4.6 Вывод ст. 25
5.Список использованной литературы. ст. 26
1.Введение.
В настоящее время существует множество файловых систем. Для начала необходимо разобраться, что же такое файловая система? И что же такое файл? Файловая система – это способ организации файлов на диске. Наиболее распространены такие файловые системы, как FAT, FAT32, NTFS, Linux Ext2, Linux Swap. Каждая операционная система (далее ОС) использует свою файловую систему. Например, для Linux это Linux Ext2 и Linux Swap, для DOS, Windows 95/98/ME, Windows NT/2000/XP – FAT, для Windows 95 OEM release 2/98/ME/NT/2000/XP – FAT32 и для Windows NT/2000/XP – NTFS.
В файловых системах FAT, FAT32, NTFS файлы хранятся в, так называемых, кластерах. Кластер – это минимальная единица распределения в файловых системах FAT, FAT32, NTFS. Один кластер состоит из фиксированного числа дисковых секторов. Причем, при помощи специальных утилит размер кластера можно задавать самому. Кластер не может быть по размеру меньше, чем один дисковый сектор (в большинстве современных винчестеров - 512 байт). Если провести обзор файловых систем, то можно выяснить их плюсы и минусы.
2.Файловая система FAT.
Файловая система FAT (File Allocation Table) использовалась во всех версиях ОС Ms-DOS, а также в OS/2 (в версиях 1.0 и 1.1) и первых релизах Windows 95. Указанная файловая система вполне удовлетворяла требованиям своего времени в основном благодаря тому, что сама по себе очень компактна и проста. Благодаря этому она с легкостью использовалась на гибких носителях. Для хранения файла в FAT может использоваться один или несколько кластеров. Каждому кластеру диска в таблице FAT соответствует отдельная запись, которая либо указывает на следующий кластер файла, либо содержит метку конца файла. В составе каждого каталога хранятся имена входящих в него файлов. Вместе с именем файла хранится указатель на первый кластер этого файла. Помимо этого в каталоге хранится дата создания файла, его размер и атрибуты. Атрибуты могут указывать на то, что файл является скрытым, зарезервированным для использования операционной системой, требует архивирования (резервного копирования) или предназначен только для чтения. Казалось бы, при такой организации хранения данных, система должна быть достаточно быстрой и надежной.
Давайте же рассмотрим ее недостатки. Самый первый и главный недостаток, с которым мы сталкиваемся при использовании FAT – это слишком сильная ограниченность максимального размера тома FAT. Цифра 16 в названии FAT 16 означает, что таблица размещения файлов FAT идентифицирует записи, соответствующие дисковым кластерам, при помощи 16-разрядных чисел. Таким образом, в таблице можно разместить не более 65 536 записей (2 в 16-ой степени). А если учитывать то, что максимальный размер кластера – 32 Кбайта, то выходит, что максимальный раздел дискового тома - 2 Гбайта. Естественно, что эта система не удовлетворяет современным винчестерам, имеющим объемы в десятки гигабайтВторой недостаток заключается в том, что для хранения всех файловых атрибутов система FAT использует всего 1 байт! Много ли можно поместить в один байт? Следовательно, просто не
представляется возможности хранить данные о правах доступа к файлу, о его владельце и т.д. Недостаток номер три – при использовании большего размера тома мы вынуждены использовать больший размер кластера. Однако, в FAT один файл занимает как минимум один кластер. Например, при размере кластера в 32 Кбайта мы имеем файл, размером 2 Кбайта – в результате файл занимает весь кластер, и мы теряем 30 Кбайт. Таким образом, получается, что физически файл занимает не 2, а все 32 Кбайта! Четвертый недостаток – сведения о физическом расположении файлов хранятся в одном месте – таблице размещения файлов FAT. Это приводит к следующему:
- увеличивается вероятность повреждения и потери всей информации;
- снижается скорость поиска, т.к. для поиска определенного файла нужно
обработать всю таблицу.
Подводя итог вышесказанному, можно сделать вывод, что использовать FAT в настоящее время неэффективно. Но стоит заметить, что FAT создавалась довольно давно и удовлетворяла требованиям того времени.
3.Файловая система FAT 32.
Эта файловая система пришла на смену FAT, начиная с Windows 95 OEM release 2. Основное ее отличие от FAT заключается в том, что таблица размещения файлов FAT идентифицирует записи, соответствующие дисковым кластерам, при помощи 32-разрядных чисел. В соответствии с этим максимальное количество записей становится равным 4 294 967 296 (2 в 32-ой степени). Следовательно, существенно увеличивается максимальный размер тома (до 2 Тбайт). Но в остальном система осталась практически такой же. Однако необходимость работать с огромными по размеру томами и документами прямо указывает на недостатки FAT 32. Итак, рассмотрим их по порядку.
Поиск данных файла.
В данной подглаве рассматривается именно поиск информации. Доступ к самим данным (фрагментированы они или нет) здесь уже не рассматривается, так как этот процесс одинаков для всех систем. Речь идет о тех лишних действиях, которые придется выполнять системе перед доступом к реальным данным файлов. Этот параметр влияет на скорость доступа к произвольному фрагменту файла, показывает насколько сильно сама файловая система
страдает от фрагментации файлов. И FAT 32 показывает себя здесь не лучшим образом. Из-за большой области самой таблицы размещения будет испытывать огромные трудности, если фрагменты файла разбросаны по всему диску. Дело в том, что таблица размещения файлов (FAT) представляет собой мини-образ диска, куда включен каждый его кластер. Для доступа к фрагменту файла в системе FAT32 (как и в FAT) приходится обращаться к соответствующей частичке FAT. Если файл, к примеру, расположен в трех фрагментах - в начале диска, в середине, и в конце - то в системе FAT нам придется обратиться к фрагменту FAT также в его начале, в середине и в конце. Если в FAT, где максимальный размер области FAT составляет 128 Кбайт, это не составляет проблемы (вся область FAT просто хранится в памяти, или же считывается с диска целиком за один проход и буферизируется), то в FAT32, которая имеет типичный размер области FAT порядка сотен килобайт (а на больших дисках - даже несколько мегабайт), это составляет достаточно серьезную проблему. Если файл расположен в разных частях диска - это вынуждает систему совершать движения головок винчестера столько раз, сколько групп фрагментов в разных областях имеет файл, а это очень и очень сильно замедляет процесс поиска фрагментов файла. Следовательно, FAT32 испытывает огромные трудности, вплоть до чтения лишних сотен килобайт из области FAT, если файл разбросан разным областям диска. Работа с внушительными по размеру файлами на FAT32 в любом случае сопряжена с огромными трудностями - понять, в каком месте на диске расположен тот или иной фрагмент файла, можно лишь изучив всю
последовательность кластеров файла с самого начала, обрабатывая за один раз один кластер (через каждые 4 Кбайт файла в типичной системе). Стоит отметить, что если файл фрагментирован, но лежит компактной кучей фрагментов - FAT32 всё же не испытывает больших трудностей, так как физический доступ к области FAT будет также компактен и буферизован.
Поиск свободного места.
Эта операция производится в том случае, если необходимо создать файл с нуля, либо скопировать его на диск. Поиск места под физические данные файла зависит от того, как хранится информация о занятых участках диска. Этот параметр влияет на скорость создания больших файлов (при создании малых файлов разница в скорости различных файловых систем практически незаметна). Также влияет на сохранение или создание больших
мультимедийных файлов, копирование больших объемов информации и т.д. Этот параметр показывает, насколько быстро система может найти место для записи на диск новых данных и какие операции для этого придется ей проделать. Как уже указывалось выше таблица размещения файлов FAT как бы мини-образ диска, куда включен каждый его кластер. Следовательно, чтобы системе на основе FAT 32 (как впрочем, и FAT 16) определить, свободен данный кластер или нет, ей необходимо просмотреть одну запись в FAT, соответствующую этому кластеру. Размер одной записи в FAT 32 составляет 32 бита. Для поиска свободного места на диске может потребоваться просмотреть почти весь FAT, а он в свою очередь может достигать нескольких Мегабайт (!!!), что ведет к катастрофическому замедлению работы. Поэтому для нахождения свободного метода применяются методы оптимизации, в результате чего достигается приемлемая скорость. Одно можно сказать наверняка - поиск свободного места при работе в DOS на FAT32 - катастрофический по скорости процесс, поскольку никакая оптимизация невозможна без поддержки хоть сколь серьезной операционной системы.
Работа с каталогами и файлами.
Каждая файловая система выполняет элементарные операции с файлами: доступ, удаление, создание, перемещение и т.д. Скорость работы этих операций зависит от принципов организации хранения данных об отдельных файлах и от устройства структур каталогов. Этот параметр влияет на скорость любых операций с файлом, в том числе на скорость любой операции доступа к файлу, особенно в каталогах с большим числом файлов (несколько тысяч). FAT 32 имеет очень компактные каталоги, размер каждой записи которых предельно мал. Более того, из-за сложившейся исторически системы хранения длинных имен файлов (более 11 символов), в каталогах систем FAT используется не очень эффективная и на первый взгляд неудачная, но зато очень экономная структура хранения этих самих длинных имен файлов. Работа с каталогами FAT производится достаточно быстро, так как в подавляющем числе случаев каталог (файл данных каталога) не фрагментирован и находится на диске в одном месте. Единственная проблема, которая может существенно понизить скорость работы каталогов FAT - большое количество файлов в одном каталоге (порядка тысячи или более). Система хранения данных - линейный массив - не позволяет организовать эффективный поиск файлов в таком каталоге, и для нахождения данного файла приходится перебирать большой объем данных (в среднем половину файла каталога). Из выше сказанного видно, что FAT 32 не может эффективно работать с каталогами, содержащими большое количество файлов.
Кэширование.
Очень многие данные современных файловых систем кэшируются или буферизируются в памяти компьютера, что позволяет избежать лишних операций физического чтения данных с диска. Для достаточно высокопроизводительной работы системы в кэше приходится хранить
следующие данные:
- данные о физическом местоположении всех открытых файлов. Это, прежде всего, позволит обращаться к системным файлам и библиотекам, доступ к которым идет буквально постоянно, без чтения служебной (не относящейся к самим файлам) информации с диска. Это же относится к тем файлам, которые исполняются в данный момент - т.е. к выполняемым модулям (.exe и .dll) активных процессов в системе. В эту категорию попадают также файлы
системы, с которыми производится работа (прежде всего реестр и виртуальная память, различные .ini файлы, а также файлы документов и приложений);
- данные о свободном месте диска - т.е. та информация, которая позволит найти место для сохранения на диск новых данных.
В случае, если этот базовый объем информации не будет доступен прямо в оперативной памяти, системе придется совершать множество ненужных операций еще до того, как она начнет работу с реальными данными. И тут перед нами встает вопрос: каким же объемом свободной оперативной памяти надо располагать, чтобы эффективно работать с файловой системой? FAT 32 имеет очень мало данных, отвечающих за организацию файловой системы
(как, впрочем, и FAT 16). Из служебных областей можно выделить саму область FAT (если в FAT 16 она не могла превышать 128 Кбайт, то в FAT 32 на томах порядка 5-10 Гбайт область FAT может занимать объем в несколько Мбайт). Это, пожалуй, единственный внушительный объем данных FAT 32, надежно кэшировать который не представляется возможным. Каталоги FAT очень компактны и редко занимают более одного кластера. Следовательно, на кэширование фрагментов области FAT, отвечающих за местоположение рабочих файлов, необходимо несколько Мбайт свободной оперативной памяти, что довольно таки немного по сравнению с той же NTFS. Однако лично я бы не стал использовать FAT 32 на дисках, объемом более 30 Гбайт, так как сама таблица FAT будет иметь просто огромный размер. Оптимальный вариант для использования FAT 32 – машины с малыми и средними винчестерами (до 10 Гбайт) и машинами, имеющими менее 64 Мбайт оперативной памяти. На остальных машинах лучше использовать NTFS.
Быстродействие накопителя.
Итак, влияют ли физические параметры вашего накопителя на быстродействие файловой системы? Да, влияют. Не сильно, но влияют (в данном случае не имеются ввиду отличия ATA-66 от ATA-100, а возможность файловой системы использовать те или иные плюсы винчестеров). Рассмотрим параметры винчестеров, влияющие на быстродействие системы:
- Время случайного доступа (random seek time). Благодаря простоте
организации файловой системы FAT 32 (и FAT 16), для доступа к системным
областям на типичном диске не приходится совершать много движений
головками диска, что является достаточно большим плюсом в пользу FAT.
- Наличие Bus Mastering. Bus Mastering – специальный режим работы драйвера и контроллера, при использовании которого обмен с диском происходит без участия процессора. В настоящее время большинство IDE-контроллеров идут с системой Bus Mastering. Конечно такая система будет работать немного быстрее, но на быстродействие FAT она сказывается не очень сильно, в отличие от NTFS.
- Кэширование чтения и записи на уровне жестких дисков (объем буфера HDD - от 128 Кбайт до 1-2 Мбайт в современных дорогих дисках) - фактор,
который будет более полезен системам на основе FAT. Системы FAT,
конечно, получат некоторый плюс, от кэширования записи на физическом
уровне, всерьез принимать размер буфера винчестера при оценке
быстродействия файловой системы не стоит.
Подводя итоги, снова получим, что FAT 32 лучше покажет себя на более
медленных винчестерах, чем та же NTFS. Это в очередной раз наталкивает
на мысль об устаревании FAT как файловой системы вообще.
Размер кластера.
Размер кластера можно задать практически произвольно (от 512 байт до 32
Кбайт). Больший размер кластера – это практически всегда большее
быстродействие. Особенно размер кластера влияет на системы FAT 32. Дело
в том, что увеличивая размер кластера, скажем в 2 раза, мы сокращаем
область FAT в те же 2 раза (в связи с тем, что уменьшается количество
кластеров на диске). В свою очередь сокращение области FAT в несколько
раз даст заметное увеличение быстродействия, так как объем системных
данных файловой системы сильно сократиться, следовательно, уменьшается и время, затрачиваемое на чтение данных о расположении файлов, и объем
оперативной памяти, необходимый для буферизирования этой информации.
Типичный размер кластера для FAT 32 также составляет 4 Кбайта, и
увеличение его до 8, а то и 16 Кбайт будет достаточно разумным с точки
зрения быстродействия для больших винчестеров (10 и более Гбайт). Не
смотря на повышение быстродействия, повышение размера кластера не
пройдет безнаказанно. Напомню, что в FAT один файл занимает минимум один кластер. Для примера, пусть у нас будет файл, размером 2 Кбайта. При
размере кластера в 4 Кбайта, мы потеряем всего 2 Кбайта, а при размере
кластера в 16 Кбайт, потеря составит уже 14 Кбайт. Поэтому не нужно,
слишком увлекаться увеличением размеров кластера, потому как увеличение
быстродействия скажется на свободном месте.
Вывод.
К какому же выводу можно прийти, проанализировав все выше написанное? Для начала необходимо рассмотреть все плюсы и минусы файловой системы FAT 32.
FAT – плюсы:
1.Не требуется большое количество оперативной памяти для эффективной
работы с ней.
2.Быстрая работа с малыми и средними каталогами.
3.Диск совершает в среднем меньшее количество движений головками (в
сравнении, например с NTFS).
4.Достаточно эффективно работает на медленных дисках. Не требовательна к
системам Bus Mastering.
5.Быстрый доступ к данным на маленьких по объему винчестерах.
6.Малый размер файла каталога позволяет практически всегда оставлять его
не фрагментированным.
FAT – минусы:
1.Катастрофическая потеря быстродействия с увеличением фрагментации,
особенно для больших дисков.
2.Сложности с произвольным доступом к большим (~10% от объема винчестера и более) файлам.
3.Очень медленная работа с каталогами, содержащими большое количество
файлов.
4.Одного байта явно недостаточно для хранения атрибутов файла, из-за
этого нет возможности хранить данные о правах доступа к файлу, его
владельце и т.д.
Вывод напрашивается сам собой. FAT 32 как система уже отжила свое. Она
показывает себя только на машинах с небольшими дисками и объемом ОЗУ
менее 64 Мбайт. При лучшей машине гораздо удобней будет использовать
NTFS как с точки зрения быстродействия, так и с точки зрения надежности.
FAT 32 просто-напросто продлила жизнь файловой системе FAT, не более
того.