BarabukОпишу очень примерно, т.к. ни разу сильно не углублялся в тему борьбы со спамом.
Как известно спам рассылается сразу миллионам пользователей, одновременно. Текст самого спама (предложение товара, например), естественно, в каждом письме один и тот же. Кто ж будет для каждого адресата менять? Интеллектуальные спам фильтры постоянно анализируют письма со спамом и формируют так так называемые сигнатуры спама - последовательности или цепочки символов, слов, фраз, по которым можно идентифицировать, что письмо - спам (аналогично антивирусным базам, только здесь анализируется текстовая информация, а там бинарный код). Например: "Увеличение ч..на на 50см"
или "Приобретайте нашу суперхренорезку" и т.д.
Соответственно, когда приходит письмо, спам фильтр сверяется со своими базами сигнатур (могут быть локальными или публичными, доступными, например, по подписке или нахаляву
). В настройках спам фильтра выставляется так называемый порог - процент совпадения содержимого письма с сигнатурами спама в базе. Если порог превышен, то письмо помечается как спам. (например, "Увеличение ч..на на 50см" очень похоже на "Увеличение ч..на на 60см", и если у спам фильтра есть сигнатура первой фразы, то на вторую он тоже скорее всего сработает)
Что нам (им) дает включение в текст письма левого куска какого-то произведения, не относящегося к письму никаким боком?
Во-первых, затрудняется работа спам-фильтров по формированию сигнатур спама. Ведь при массовых рассылках очень просто к своему тексту добавлять разные куски левого текста, не меняя при этом сути спамового сообщения, которое идет сверху и сразу бросается в глаза. Следующая рассылка с другим куском левого текста будет будет иметь для спам фильтра совершенно другую сигнатуру, т.к. процентное содержание "полезного текста" и левого куска в письме может отличаться как 1 к 100, или даже больше. Соответственно, даже если спам фильтр проиндексировал прошлый спам, новый он не заметит.
Во-вторых вытекает из во-первых
- "полезный" спамовый кусочек текста про суперхренорезку, который возможно проиндексирован спам-фильтром, успешно "прикрывается" куском "Воины и Мира", который может быть в сто раз больше. Спам-фильтр не срабатывает, т.к. порог совпадения не превышен.
Это один из способов, которых на самом деле множество.