- решение задачи ранжирования документов выборки по значимости – по наибольшему соответствию инфопортрету выборки количества значимых тем и их ранга в рассматриваемом документе;
- корректирование полученных инфопортретов;
- сравнение инфопортрета документа с инфопортретами рубрик, с отсечение малохарактерных инфопортретов.
Информационно-аналитическая система «Астарта» предназначена для компаний и организаций, которым необходимо автоматизировать и кардинальным образом повысить эффективность сбора, обработки и анализа неструктурированной информации, получаемой из Интернета, печатных материалов, СМИ и т.д. Программное решение базируется на технологии «Евфрат» и предназначено для сбора, обработки и анализа неструктурированной информации, получаемой из Интернета, печатных материалов СМИ и других источников.
К недостаткам данных систем можно отнести следующее:
- неудобный для работы интерфейс;
- отсутствие достаточно полного словаря для процесса классификации информационных сообщений;
- отсутствие необходимых для эффективной работы функций формирования рекомендаций для принятия решений и отчетов.
Таким образом, учитывая возможности и недостатки существующих систем, необходимо разработать систему, которая предоставляла бы следующие возможности:
- создание информационной базы для автоматизированного процесса классификации статей по категориям рубрикатора;
- загрузка информационных сообщений СМИ в информационную базу;
- обработка текстовой и цифровой информации с использованием метода нечеткого поиска;
- классификация информационных сообщений с использованием метода ранжирования;
- возможность оперативной корректировки структуры рубрикатора и словаря;
- формирование рекомендаций для принятия решений;
- формирование отчетов.
2 ОБЩЕСИСТЕМНЫЕ РЕШЕНИЯ
2.1 Пояснительная записка к техническому проекту
Полное наименование системы: Автоматизированная интеллектуальная система классификации информационных сообщений средств массовой информации (СМИ). Условное обозначение: АИС «Классификатор».
Заказчик: Управление информационных и аналитических технологий аппарата администрации Тульской области (УИАТ ТО), отдел технологий отображения информации (ОТОИ).
Разработчик: студентка Тульского государственного университета факультета Экономики и права кафедры Автоматизированных информационных и управляющих систем группы 730211 Жиренкова Ирина Юрьевна.
Плановые сроки начала и окончания работы по созданию системы:
- начало работ: 1 сентября 2006 года;
- окончание работ: 1 декабря 2006 года.
Разрабатываемая АИС «Классификатор» предназначена для обеспечения более удобной, эффективной и качественной работы консультанта ОТОИ, связанной с обработкой информации и присвоение ей классифицирующих атрибутов.
Целью создания системы является автоматизация процесса классификации информационных сообщений СМИ. Система позволит освободить человека от необходимости рутинной работы по отслеживанию необходимой информации, принадлежащей к той или иной рубрике, а также сократить время на их обработку.
АИС «Классификатор» включает в себя следующие подсистемы:
1) подсистема ведения информационной базы;
2) подсистема обработки информационных сообщений СМИ;
3) подсистема настройки параметров;
4) подсистема классификации информационных сообщений СМИ.
Подсистема ведения информационной базы должна выполнять следующие функции:
1) формирование информационной базы;
2) добавление записи;
3) изменение записи;
4) удаление записи;
5) сохранение записи.
Подсистема обработки информационных сообщений СМИ должна выполнять следующие функции:
1) открытие списка текстовых файлов в каталоге;
2) открытие файла;
3) считывание строки из файла;
4) запись информационных сообщений СМИ в базу;
5) закрытие файла.
Подсистема настройки параметров должна выполнять следующие функции:
1) определение каталога с файлами;
2) настройка расширения файлов с исходными данными;
3) настройка параметров классификации.
Подсистема классификации информационных сообщений СМИ должна выполнять следующие функции:
1) поиск записей по различным ключам словаря с помощью метода нечеткого поиска;
2) классификация сообщений по результатам поиска;
3) формирование рекомендаций для принятия решений;
4) формирование отчетов.
Информационное обеспечение организовано в соответствии с принципами развития, совместимости, стандартизации и унификации.
Входными данными являются:
- информационные сообщения СМИ;
- параметры классификации;
- рубрикатор тем;
- словарь.
Выходными данными являются результаты классификации информационных сообщений СМИ.
Выходными документами являются:
- отчет по результатам классификации;
- отчет по обработанным сообщениям СМИ.
АИС «Классификатор» была разработана в среде программирования BorlandDelphi 7.0, основным инструментом которого является ObjectPascal. На магнитных носителях сведения о сообщениях хранятся в виде базы, которая разработана в системе MSAccess. Сами информационные сообщения хранятся в файлах на жестком диске. Программное обеспечение реализовано с помощью модульного принципа и функционирует независимо от аппаратной части.
Для функционирования АИС «Классификатор» разработан комплекс технических средств, включающий в себя ПЭВМ на базе процессора IntelCeleron с тактовой частотой 2 ГГц, клавиатуру, мышь, монитор SVGA, 2 Гбайт на жестком диске, 512 Мбайт оперативной памяти (RAM), операционную систему WindowsMe, 2000, XP.
Для ввода системы в эксплуатацию необходима персональная ЭВМ с набором периферийных устройств рабочего места. Также необходимо провести ознакомление консультанта ОТОИ с принципами работы данной системы.
2.2 Описание схемы организационной структуры управления информационных и аналитических технологий аппарата администрации Тульской области
Руководит управлением информационных и аналитических технологий аппарата администрации Тульской области начальник управления. В непосредственном подчинении у начальника находится заместитель начальника управления. У заместителя в подчинении определенное количество подразделений (отделов). Схема организационной структуры управления информационных и аналитических технологий приведена на рисунке 2.1.
ОТОИ осуществляет свою деятельность в сфере управления процессами создания и внедрения передовых информационных технологий и в сфере управления вопросами графической обработки и отображения информации.
Основными задачами и функциями отдела являются:
- участие в подготовке управленческих решений (нормативно-правовых актов губернатора и администрации Тульской области) в сфере информатизации;
- участие в организации информационного взаимодействия федеральных и региональных органов власти, органов местного самоуправления путем отработки технологии изготовления и распространения информационных и информационно-правовых электронных и печатных бюллетеней и сборников;
- подготовка справочных, информационных и аналитических материалов в целях повышения информированности и компетентности представителей органов власти;
- сбор и обработка информации о деятельности органов исполнительной власти, аппарата администрации Тульской области, органов местного самоуправления региона в целях создания государственных информационных ресурсов;
- техническое, информационное, лингвистическое, организационное участие в наполнении сайта (портала) администрации Тульской области, включая разработку интернет-страниц;
- подготовка предложений по применению в органах исполнительной власти новых технических средств и компьютерных технологий ввода, обработки и отображения графической, текстовой, гипертекстовой, аудио- и видеоинформации;
- подготовка информационных материалов для публикации в федеральных изданиях.
В целях организации информационного обмена между структурными подразделениями областной администрации, муниципальными образованиями области и органами власти регионов экономического Центра России
осуществляется выпуск информационно-правового периодического издания «Вестник администрации Тульской области», периодических электронных бюллетеней «Опыт регионов» и «В Туле и области».
Подготовка этих материалов включает в себя разработку тематики и композиционной структуры каждого выпуска, стилистическое и техническое редактирование материалов.
Основополагающими принципами организации выпуска информационных материалов являются:
- соответствие задачам, решаемым местными органами власти;
- оперативность и достоверность предоставляемой информации;
- читабельность выпускаемых материалов (техническая грамотность, доходчивость изложения, лаконичность).
Необходимо автоматизировать работу консультанта, который от Центра правительственной связи (ЦПС) по Тульской области регулярно получает объемный массив информации, основанный на публикациях СМИ различных регионов. Перед специалистом департамента стоит задача переработать его до читабельного объема и удобной для пользователей формы.
Должностная инструкция консультантаотдела технологий отображения информации
1. Эффективно организует служебную деятельность во взаимосвязи с государственными органами и органами местного самоуправления Тульской области, государственными и муниципальными служащими Тульской области, организациями, гражданами.
2. Владеет современными средствами, методами и технологией работы с информацией и документами.
3. Владеет оргтехникой и средствами коммуникации.