Смекни!
smekni.com

Проектирование информационной системы фильтрации от спама почтового сервера ОАО Ростелеком (стр. 2 из 5)

Чтобы представить всю сложность спам-технологии, приведем пример типовой спам-машины, характерной для 2005 года:

- набор из 10-20 тыс. затрояненных машин (зомби-сеть);

- скрытый обмен информацией (например, через чаты);

- автоматическое скачивание обновлений ПО;

- многократная посылка письма до тех пор, пока оно не пробьет черные списки и защиту вообще;

- многократная посылка одного и того же письма с разных IP для противодействия черным спискам;

- автоматическая модификация писем при посылке (в том числе и картинок).

Вывод:

Спамеры используют массу ухищрений — это и мутирующие тексты и картинки (модификация писем или картинок на лету для борьбы с сигнатурными фильтрами), и порча текста для противодействия лексическим фильтрам («про белы», «то.ч.ки», «удвоеения», «заmены» букв, невидимые хвосты слов, мелкий шрифт, светло-серое по бледно-серому, таблицы стилей, HTML-трюки), и высокая скорость рассылки (простое письмо, рассылаемое быстрее, чем реагируют сигнатурные фильтры) и т.д. и т.п. Короче говоря, происходит непрерывное развитие информационных технологии в заранее не предсказуемых направлениях. В связи с этим будет происходить развитие само спама и методов борьбы со спамом.

Будущее средств фильтрации лежит в создании профессиональных средств фильтрации электронной почты. Данные средства будут базироваться на синтезе всех существующих методов фильтрации и на постоянном обновлении технологий. Для фильтрации будет использоваться совокупность следующих технологий: лингвистический анализ (эвристики); текстовые сигнатуры; графические сигнатуры; анализ технических заголовков; анализ графики; анализ отправителя; детекция массовости; анализ URL в письме.

Средства фильтрации будут интегрированы с антивирусными решениями и получат сильную обратную связь с пользователями, чтобы реагировать на новые виды спама в режиме реального времени. Существует множество методов фильтрации электронной почты.

1.2 Методы фильтрации электронной почты

Есть множество решений фильтрации электронной почты, но опишу два основных метода защиты почтового сервера от спама:

1) защита от поступления спама на этапе получения почтовым сервером

2) «отделение спама» от остальной почты уже после получения почтовым сервером.

При первом метода наиболее популярны такие способы как использование DNS Black List (DNSBL), greylisting и различные timeouts при отправке почты; использование различных технических средств, таких как проверка существования пользователя, на отправляющей стороне (callback), проверка «правильности» отправляющего сервера такими методами как наличие записи в реверсной зоне DNS, легальности имени при установке SMTP-сессии (helo), проверка SPF записи (для работы этого в DNS записи о хосте используется соответствующая запись о легальных серверах отправителей).

При анализе содержимого письма наиболее популярны такие методы как проверка по различным алгоритмам, таким как поиск особых ключевых слов рекламного характера или на основе теоремы Байеса. Алгоритм на основе теоремы Байеса содержит в себе элементы теории вероятности, изначально обучается пользователем на письма которые, по его мнению, являются спамом и в дальнейшем отделяет по характерным признакам сообщения, в которых содержится спам.

Итак, рассмотрим более подробно 2 метода фильтрации электронной почты такие как:

- черные списки

- серые списки или грейлистинг

- aильтрация почты по ключевым словам

- запрос на подтверждение

- статистическая фильтрация

Черные списки. Почтовые и IP-адреса, с которых рассылается спам, вносятся в черные списки и блокируются на уровне провайдеров или самим пользователем. Широко используются такие списки, как списки «открытых релеев» и «открытых proxy» и различные списки динамических адресов которые выделяются провайдерами для конечных пользователей. Благодаря простоте реализации использование этих black-листов производится через службу DNS.

И этот метод в силу ряда причин становится все менее эффективным, зато приводит к нарушению целостности Сети, когда вполне добропорядочные пользователи теряют возможность вести свою переписку.

Серые списки или грейлистинг. Принцип действия серых списков (Greylisting) основан на тактике рассылки спама. Как правило, спам рассылается в очень короткое время в большом количестве с какого-либо сервера. Работа серого списка заключается в намеренной задержке получения писем на некоторое время. При этом адрес и время пересылки заносится в базу данных серого списка. Если удалённый компьютер является настоящим почтовым сервером, то он должен сохранить письмо в очереди и повторять пересылку в течение пяти дней. Спам-боты, как правило, писем в очереди не сохраняют, поэтому спустя непродолжительное время, прекращают попытки переслать письмо. Экспериментальным путём установлено, что в среднем время рассылки спама составляет чуть больше часа. При повторной пересылке письма с этого же адреса, если с момента первой попытки прошло необходимое количество времени письмо принимается и адрес заносится в локальный белый список на достаточно длительный срок.

Фильтрация почты по ключевым словам. Эффективность этого метода очень низка, поскольку требует больших затрат на создание и поддержание базы ключевых слов. Кроме того, спамеры постоянно изобретают новые и новые способы обойти подобные фильтры. Например, в русскоязычных письмах используется прием подмены русских букв латинскими, сходными по написанию (а, е, В, у и так далее).

Запрос на подтверждение. Прежде чем показать письмо получателю, генерируется запрос его отправителю: подтвердите, что вы действительно писали сообщение такому-то и такому-то. Если отправитель подтверждает факт написания письма, он признается "неспамером" и его адрес вносится в белый список. С этого момента почта от него к получателю проходит без проблем. Но этот метод фильтрации также не лишен очевидных недостатков. Во-первых, он доставляет массу неудобств "неспамерам"; во-вторых, многие спамеры уже вполне способны генерировать письма-подтверждения, что сводит на нет достоинства данного способа фильтрации, и приводит к еще большему увеличению паразитного трафика.

Статистическая фильтрация. Самыми перспективными, на сегодняшний день выглядят решения, основанные на статистической фильтрации входящей почты. В основу их работы положена теорема Байеса (Bayes), которая оценивает вероятность наступления какого-либо события исходя из статистики совершения этого же события в прошлом. Например, если пользователь встретил слово телемагазин в девяти спамерских посланиях и лишь в одном "чистом" письме, то у него появляется возможность оценить, с какой вероятностью следующее письмо, содержащее слово телемагазин, будет являться спамом.

Вышеперечисленные методы позволяют отсеивать около 90% спама еще на этапе доставки в почтовый ящик. Уже доставленную почту можно разметить средствами анализа содержимого письма, например, используя программу spamassassin. Данный продукт позволяет на основе особых алгоритмов добавлять в заголовки письма соответствующие строки, а пользователь, на основе почтовых фильтров в почтовом клиенте, может отфильтровать почту в нужные папки почтовой программы.

Разумеется, существуют и другие способы защиты от спама, наиболее действенными, к сожалению на данный момент являются превентивные меры, такие как не доставлять свой реальный E-mail на сайтах, форумах и досках объявлений, используя для подобных нужд временные адреса, которые в последствии можно удалить, в случае необходимости публикация e-mail на сайте вместо текста использовать графическое изображение и тому подобные меры.

Кроме того, для каждого отдельно взятого человека спам становится источником постоянного раздражения. Интернет-пользователи вынуждены начинать свой рабочий день с уничтожения вороха ненужной рекламы, свалившейся в их ящики. И, как это часто бывает, чистка ящиков от спама приводит к удалению нужной корреспонденции, затерявшейся среди невостребованных писем.

Вывод:

Разумеется, интернет-сообщество не сидит, сложа руки, пытается бороться со свалившейся на его голову напастью. С этой целью изобретаются и постоянно совершенствуются все новые и новые средства фильтрации спама. И хотя пока что в этой борьбе побеждают спамеры, некоторые разработки уже серьезно им препятствуют. Так что, рано или поздно, спамеры не смогут доставлять свою корреспонденцию столь массово как сегодня, и их бизнес перестанет быть сверхприбыльным. Это - вопрос времени и желания отдельных пользователей всерьез оградить себя от получения невостребованной почты.

Все разработчики современных почтовых клиентов встраивают в свои продукты различные спам-фильтры. Возможно, в течение пяти ближайших лет необходимость в этом и отпадет. А пока, рассказывая о почтовых клиентах, приходится подробно останавливаться на описании встроенных в них антиспамерских механизмов. В данной под главе были просмотрены такие методы как: черные списки, серые списки или грейлистинг, aильтрация почты по ключевым словам, запрос на подтверждение, статистическая фильтрация. Они позволяют отсеивать около 90% спама. Статистическая фильтрация сама перспективная на сегодняшний день. Так как в основу их работы положена теорема Байеса.


II СИСТЕМА ФИЛЬТРАЦИИ ЭЛЕКТРОННОЙ ПОЧТЫ ОАО «РОСТЕЛЕКОМ»

2.1 Характеристика деятельности предприятия ОАО «Ростелеком»

ОАО «Ростелеком» — национальный оператор связи. Компания оказывает услуги на основе собственной транспортной телекоммуникационной сети протяженностью около 150 тыс. км. на всей территории России. «Ростелеком» обеспечивает передачу основной доли междугородного и международного трафика, а также работу наземной сети телевизионных и радиовещательных каналов. Крупнейшим акционером компании «Ростелеком» является ОАО «Связьинвест», владеющее 50,67% голосующих акций.