De acordo com as Leis 12.965/2014 e 13.709/2018, que regulam o uso da Internet e o tratamento de dados pessoais no Brasil, ao me inscrever na newsletter do portal DICAS-L, autorizo o envio de notificações por e-mail ou outros meios e declaro estar ciente e concordar com seus Termos de Uso e Política de Privacidade.


Spam - Como reduzir seu impacto

Colaboração: Rubens Queiroz de Almeida

Data de Publicação: 05 de Janeiro de 2004

Eu recebo cerca de 1500 mensagens por dia. Um monte são mensagens de erro da Dicas-L e uma grande parte são as famosas mensagens não solicitadas (spam), contos do vigário, etc.

Eu usava o procmail para filtrar isto, com regras que eu mesmo fazia. Consegui fazer que chegassem até a minha caixa postal cerca de 100, das quais 80 eram puro lixo.

Já conhecia o bogofilter (http://bogofilter.sourceforge.net) mas não havia configurado para meu leitor de emails. Li parte da documentação e a instalação foi extremamente simples. Basta pegar o programa, compila-lo e treina-lo. O treinamento é feito passando mensagens de spam para o programa e, com a prática, ele vai aprendendo a diferenciar mensagens legítimas de lixo puro.

Como eu já vinha coletando há algum tempo as minhas mensagens de spam, o treinamento foi bem fácil. O meu arquivo de lixo tem 11MB, aproximadamente 1200 mensagens.

Então:

  • Para treinar o programa:

      bogofilter -s < spam.archive
    
  • É claro que a taxa de erro inicial é pequena, mas mesmo assim, o programa às vezes erra. Neste caso, para instruir o bogofilter de seus erros:

      bogofilter -n < notspam
    

Eu continuo usando o procmail. Para fazer com que o procmail invoque o bogofilter antes de processar as mensagens, inclua em seu arquivo .procmailrc as seguintes linhas:

  :0HB:
  * ? bogofilter -u
  spam

A minha surpresa, mais de 95% do lixo do spam já foi direto para onde devia, para o lixo. Fantástico!

O que não é lixo eu salvo na pasta notspam e depois rodo o comando

  bogofilter -n < notspam

para corrigir os erros. Usuários mais antigos do bogofilter me disseram que a taxa de acertos fica próxima de 100%.

O bogofilter pode funcionar diretamente com o servidor de email (MTA) evitando que os usuários tenham que tomar suas próprias providências. O cliente de email do Mozilla já vem com esta funcionalidade disponível, basta ativá-la e usá-la. As possibilidades são enormes. Para saber mais recomendo que leiam com atenção a documentação.

Eu estou disponibilizando também, para quem precisar, o meu arquivo de spams, em http://www.dicas-l.com.br/download/spam.archive.gz. É um arquivo compactado de cerca de 5MB. Quem tiver algo do tipo e quiser compartilhar comigo para tornar o treinamento inicial do bogofilter mais eficaz, por favor me avise.

Adicionar comentário

* Campos obrigatórios
5000
Powered by Commentics

Comentários

Nenhum comentário ainda. Seja o primeiro!


Veja a relação completa dos artigos de Rubens Queiroz de Almeida