5. Информация, данные методы.
До настоящего времени не существует единого мнения, что такое информация. Так, С.А.Христочевский (2001) считает, что для человека существенно прежде всего содержание, смысл сообщения, сигнала, а для ПК смысловой аспект безразличен. В связи с этим смысловой аспект сообщения – это и есть информация. Все технические системы имеют дело с данными, представленными в том виде, который реализован аппаратными и программными средствами этих систем. Следовательно, при взаимодействии человека с техническими системами необходимо обеспечить преобразование (трансформацию) информация – данные, данные – информация.
Иными словами, можно сказать, что в ПК информация всегда представляется с помощью данных, кодирующих ее по какому-то правилу. В процессе решения задачи нужно обязательно иметь в виду следующие этапы преобразований:
· исходная информация – данные;
· данные – данные (то есть обработка данных по какому-то алгоритму);
· данные – выходная информация.
Совершенно иной взгляд на информацию предлагает С.В.Симонович (2000). По его мнению информация – продукт взаимодействия данных и адекватных методов. Из этого следует:
1. Информация – динамический объект. Она существует только в момент взаимодействия данных и методов. Все прочее время она пребывает в состоянии данных. Следовательно, информация существует только в момент протекания информационного процесса. Все остальное время она содержится в виде данных.
2. Одни и те же данные в момент потребления могут поставлять разную информацию в зависимости от степени адекватности взаимодействующих с ними методов.
Пример. Для человека, не владеющего китайским языком, письмо из Пекина дает минимум информации. Использование адекватных методов – максимум информации.
3. Данные являются объективными, поскольку это результат регистрации объективно существующих сигналов. В то же время методы являются субъективными.
В основе искусственных методов лежат алгоритмы. В основе естественных методов лежат биологические свойства субъектов информационного процесса. Следовательно, информация возникает и существует в момент диалектического взаимодействия объективных данных и субъективных методов.
По мнению А.Н.Макаровой (1998) наряду с информацией в информатике используется термин «данные».
Данные – признаки или записанные наблюдения, которые какой-то причине не используются, а только хранятся. Как только данные начинают использоваться для уменьшения неопределенности появляется информация.
Пример: продаются диски с базами данных: номера телефонов, фамилии их владельцев пр. – это данные. Если нужно найти конкретный номер телефона конкретного человека – обращаемся в базу и находим нужное. Это – информация.
6. Меры информации и данных
При оценке информации различают три аспекта: синтаксический, семантический и прагматический.
Синтаксический аспект связан со способом представления информации вне зависимости от ее смысловых и потребительских качеств и рассматривает формы представления информации для ее передачи и хранения (в виде знаков и символов). Данный аспект необходим для измерения информации. Информацию, рассмотренную только в синтаксическом аспекте, называют данными.
Семантический аспект передает смысловое содержание информации и соотносит ее с ранее имевшейся информацией.
Sп - тезаурусная мера получателя; Ic - семантическое количество информации.
Прагматический аспект передает возможность достижения цели с учетом полученной информации.
где P0 - вероятность достижения цели до получения информации; P1 - вероятность достижения цели после получения информации; Iп - прагматическое количество информации; а > 1.
Виды информации:
1. Научная информация (наиболее полно отражает объективные закономерности природы, общества и мышления);
2. Информация управления:
а) производственная, связанная с управлением людьми;
б) техническая, связанная с управлением техническими объектами.
Также классификация информации может производиться по областям применения:
а) политическая;
б) техническая;
в) педагогическая;
г) физическая;
д) экономическая и др.;
2. По назначению:
а) массовая;
б) специальная.
Для измерения информации используются два параметра
· объем данных;
· количество информации.
В чем различие этих мер? Объем данных оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту.
Количество информации отражает меру смыслового содержания информации.
Объем данных в сообщении измеряется количеством символов (разрядов). В двоичной системе счисления единица измерения – bit (бит).
Для измерения объема данных эту единицу предложил Клод Шэннон.
Бит – наименьшая единица объема данных в двоичном коде.
Термин bit – это аббревиатура, состоящая из двух английских слов (binary digit) – двоичная цифра.
Идея использования лишь двух символов для кодирования информации стара, как мир. Барабаны африканских бушменов передают сообщения в виде комбинации звонких и глухих ударов. Азбука Морзе также представляет собой пример двухсимвольного кодирования информации (точки и тире).
Двоичное представление чисел – не единственная альтернатива десятичной системе счисления. Древняя вавилонская арифметика основана на числе 60, а в привычках и языке англосаксов мы обнаруживаем следы двенадцатеричной системы счисления, которая когда-то господствовала на Британских островах: 12 месяцев, два 12 часовых периода в сутках. Но победила десятичная система.
Процедура отображения - преобразование информации в вид, удобный для восприятия человеком.
Практически всегда основой кодирования чисел в современной ЭВМ является двоичная система счисления.
Системой счисления называется способ записи чисел при помощи ограниченного числа символов (цифр).
Позиционной системой счисления называется система счисления, при которой число, связанное с цифрой, зависит от места, которое она занимает.
В двоичной системе счисления используется только две цифры: 0 и 1. Бит – очень маленькая единица. Чтобы закодировать один символ, например, английскую букву "а", нужно 8 символов:
01000001 – а | 01000010 – в |
01000011 – с | 01000100 – d |
01000101 – e | 01000110 – f |
1 байт = 8 бит
1 Кбайт = 210 = 1024 байт
1 Мбайт = 210 = 1024 Кбайт
1 Гбайт = 210 = 1024 Мбайт
Пример. Перевести в десятичную запись число (10000111)2. Перевести в двоичную запись число 89. Сложить в двоичной записи эти два числа, результат перевести в десятичную запись.
Решение:(10000111)2 =1·27 + 1·22 + 1·21 + 1·20 = 128 + 4 + 2 + 1 = (135)10,(89)10 = 1·26 + 1·24 + 1·23 + 1·20 = (1011001)2,
10000111
+ 1011001
11100000,
(11100000)2 =128+64+32=(224)10
Для измерения смыслового содержания информации (количества информации ) наибольшее распространение получила тезаурусная мера.
Тезаурус – совокупность сведений, которыми располагает пользователь или система.
В зависимости от соотношений между смысловым содержанием информации и тезаурусом пользователя изменяется количество семантической информации, воспринимаемой пользователем и включаемой им в дальнейшем в свой тезаурус.
Максимальное количество семантической информации потребитель приобретает при согласовании ее смыслового содержания со своим тезаурусом, когда поступающая информация понятна пользователю и несет ему ранее неизвестные сведения. По этому вопросу очень четко писал академик И.П.Павлов "… однако во всякий момент требуется известное общее представление о предмете для того, чтобы было, на что цеплять факты, чтобы было с чем двигаться вперед, для того, чтобы было, что предполагать для будущих изысканий."