Ã€ mort le spam !

ConnaÃ®tre son ennemi

Pour mieux combattre un ennemi, il faut bien le connaÃ®tre. Quel est l'objectif d'un spammeur (nom donnÃ©e aux personnes qui envoient du spam) ? C'est trÃ¨s simple : il veut attirer notre attention. J'ai retenu deux grandes catÃ©gorie de spam : vente d'un produit et publicitÃ© pour un site internet.

Dans la premiÃ¨re catÃ©gorie, je ne peux m'empÃªche de citer le Â« Enlarge your penis Â» et autre Â« Viagra Â». Je reÃ§ois rÃ©guliÃ¨rement des offres promotionnelles pour la suite bureautique Microsoft Officeâ€¦ ce qui me fait toujours sourire car j'utilise OpenOffice (alternative libre et gratuite) depuis plusieurs annÃ©es. Le plus incongru Ã©tait une offre pour acheter un drapeau amÃ©ricain. J'avais reÃ§u cette proposition juste aprÃ¨s la chute des deux tours jumelles.

La seconde catÃ©gorie est un effet pervers du leader en matiÃ¨re de moteur de recherche : Google. BriÃ¨vement, le classement d'un site internet dÃ©pend en trÃ¨s grande partie du nombre de fois qu'il est citÃ© dans d'autres sites internets. Pour monter dans le classement, il faut donc augmenter le nombre de citations. Pendant un moment, des sites internets fantÃ´mes ont Ã©tÃ© crÃ©e pour gonfler les classements. Mais rapidement, Google s'est aperÃ§u de la supercherie et a dÃ©veloppÃ© un outil de dÃ©tection contre cette astuce.

Une autre maniÃ¨re d'Ãªtre citÃ© par d'autres sites internetsâ€¦ est tout simplement d'aller sur des sites internets et de ce citer soi-mÃªme. Ceci semble tout Ã fait immoral mais fonctionne malheureusement Ã merveille. Je ne serai pas en train de vous parler de spam sinon :-)

Enfin, pour expliquer l'ampleur du phÃ©nomÃ¨ne, c'est trÃ¨s simple : l'envoi de spam a un coÃ»t Â« nul Â». Je veux dire par lÃ qu'Ã part rÃ©diger le texte, installer et configurer un logiciel de spam, il n'y a que de la bande passante qui est consommÃ©e. Le coÃ»t d'un spam Ã©lectronique en comparaison de celui d'une publicitÃ© papier est vraiment dÃ©risoire.

Combattre les courriels non sollicitÃ©s

La premiÃ¨re approche pour combattre le spam Ã©tait basÃ©e sur la blacklist (liste noire de bannissement). Elle fonctionnait au dÃ©but quand le phÃ©nomÃ¨ne Ã©tait mineur. Mais aujourd'hui c'est une peine perdue : il est beaucoup trop facile aujourd'hui d'envoyer une courriel avec une adresse fictive, de cacher son identitÃ©, de gÃ©nÃ©rer des adresses ou des noms de serveurs alÃ©atoires qu'il est vain de vouloir en faire une liste exhaustive.

Rassurez-vous, je pense que le problÃ¨me du spam par courriel est en grande partie rÃ©solu. Les deux outils les plus efficaces sont les filtre bayesiens et le greylisting.

Filtres bayesiens

Le principe est un outil autonome qui va trier le bon grain du mauvais grain. Sa grande qualitÃ© est qu'il apprend au fur et Ã mesure. Au dÃ©but, il faut lui apprendre Ã faire la diffÃ©rence entre un spam et un courriel non-spam (qu'on appelle ham).

Le client de courriel Thunderbird, par exemple, intÃ¨gre d'une maniÃ¨re trÃ¨s Ã©lÃ©gante un filtre bayesien au sein de son interface. La majoritÃ© des clients de courriel peuvent utiliser un tel filtre.

Malheureusement les spammeurs n'ont cesse de rechercher des nouvelles astuces pour contourner les filtres. La derniÃ¨re nouveautÃ© est de gÃ©nÃ©rer un texte alÃ©atoire et d'y associer une image en piÃ¨ce jointe qui contient l'information principale. Le texte est composÃ© de mots courants et biaise donc les filtres bayesiensâ€¦

Je centralise mes courriels sur un serveur OVH. Ce dernier propose SpamAssassin (filtre anti-spam utilisant l'infÃ©rence bayesienne), outil trÃ¨s efficace qui n'a dÃ©tectÃ© qu'un seul faux-positif (courriel marquÃ© spam alors que ce n'est pas le cas) en deux ans d'utilisation. J'ai dÃ©cidÃ© le mercredi 27 septembre 2006 de supprimer purement et simplement les spams dÃ©tectÃ©s par OVH. Ras le bol des spams !

Greylisting

Le second outil que je veux vous prÃ©senter nÃ©cessite d'avoir un serveur de courriel (appelÃ© Â« serveur SMTP Â»). Je ne vais pas vous expliquer comment le mettre en place, car je ne sais pas vraiment le faire, mais simplement en expliquer le principe.

L'idÃ©e est de se baser sur une whitelist (liste blanche) des serveurs autorisÃ©s Ã nous envoyer des courriels. Sauf que constituer manuellement une telle liste est un travail Ã©reintant et donc inefficace. Le greylisting fait vivre la whitelist en refusant les serveurs inconnus. Sauf qu'un serveur respectant les standards (ce qui est loin d'Ãªtre le cas des serveurs des spammeurs) va retenter sa demande de relayage de courriel aprÃ¨s 15 minutes. Le courriel sera finalement dÃ©livrÃ© mais avec un retard de 15 minutes lors du 1er envoi. Les envois suivant ne seront pas retardÃ©s.

Ã€ ce que j'ai entendu, pas moins de 90% du spam est bloquÃ© Ã la source avec une telle mÃ©thode. Le grand avantage est qu'il ne nÃ©cessite quasiment aucune ressource processeur ou mÃ©moire et qu'il Ã©radique le spam au niveau du serveur et non pas au niveau du client. Le boÃ®te de courriel du client ne sera donc pas surchargÃ©e.

Spam dans les forums, wikis et blogs

Internet a Ã©voluÃ© doucement d'un espace fermÃ© (non Ã©ditable) Ã un espace ouvert (Ã©ditable). Les premiers espaces d'Ã©changes furent les livres d'or qui permettaient de dÃ©poser un message au webmestre, souvent pour le fÃ©liciter de son travail. Aujourd'hui, l'ouverture est partout : de trÃ¨s nombreux forums de discussions, sites webs Ã©ditables par les visiteurs (wikis) dont le plus cÃ©lÃ¨bre est WikipÃ©dia, commentaires des blogs et articles, etc.

Une premiÃ¨re protection a Ã©tÃ© de demander aux visiteurs de se fidÃ©liser en crÃ©ant un compte personnel. Ceci est souvent vu comme une atteinte Ã la vie privÃ©e car il faut renseigner son adresse de courriel, son surnom et parfois bien plus (date de naissance, nom rÃ©el, adresse, pays, etc.). Pour ma part, je ne donne jamais ma vraie identitÃ©, je donne en gÃ©nÃ©ral des informations totalement alÃ©atoires. Par contre, je renseigne une adresse de courriel poubelle justement pour Ã©viter le spam, mais une adresse qui existe rÃ©ellement pour recevoir mon mot de passe. Je donne ma vraie identitÃ© qu'aux sites de confiance tel que WikipÃ©dia.

Une seconde protection, trÃ¨s contraignante, est de devoir saisir quelques lettres et chiffres dessinÃ©s dans une image. Ceci n'arrÃªte pas les spammeurs car des outils de reconnaissance de caractÃ¨re trÃ¨s douÃ©s existent. Du coup, les images sont trÃ¨s dures Ã dÃ©chiffrer : texte dÃ©formÃ©, couleurs peu contrastÃ©es, etc.

En pratique, ces deux protections (crÃ©ation de compte et image alÃ©atoire) sont efficace mais laissent tout de mÃªme passer une partie du spam.

Une troisiÃ¨me approche, que j'ai dÃ©couverte rÃ©cemment, est maligne et trÃ¨s efficace. Comme je l'expliquais auparavant : le spammeur cherche Ã nous attirer vers son site internet. Et bien, c'est tout simple : il suffit d'interdire le droit de citation de site internet ! Mais pour Ã©viter qu'un visiteur ne puisse citer un site internet pertinent, il ne faut pas Ãªtre trop radical. Le juste milieu est d'interdire les adresses dÃ©butant par Â« http:// Â». J'ai dÃ©couvert cette approche dans Trac 0.10 (outil de gestion de projet complet).

Las de supprimer manuellement les spams dans les commentaires de mon blog, j'ai modifiÃ© DotClear pour reproduire ce comportement. AprÃ¨s avoir interdit les trackbacks (qui apparemment ne servent qu'aux spammeursâ€¦), les commentaires contenant "http://" ou "https://" sont dÃ©sormais rejetÃ©s. Lisez mon correctif anti-spam pour DotClear 1.2.

Le mot de la fin

Ce texte est long mais j'en avais gros sur la patate. J'espÃ¨re qu'ensemble nous arriverons petit Ã petit Ã diminuer l'impact du spam. Allez, quand je serai motivÃ© j'expliquerai comment surfer sur internet sans Ãªtre noyÃ© dans la publicitÃ© ;-)

Commentaires

1. Le dimanche 19 novembre 2006 à 15:36, par Monique

Bonjour,

Je fais une nouvelle tentative de commentaire (voir le billet sur mon blog Webatou).

Amicalement,
Monique

2. Le dimanche 19 novembre 2006 à 15:45, par Monique

Ah, il semble que les caractÃ¨res interdits le soient aussi dans le champ "Site Web"... qui doit mÃªme rester totalement vide :-(

Comme je ne peux donner aucun lien, le billet dont je parle s'intitule "Spam, note de service".

Amicalement,
Monique

3. Le dimanche 19 novembre 2006 à 16:25, par haypo

Il est possible d'insÃ©rer des liens, mais sans le prÃ©fix http ou alors en l'Ã©crivant diffÃ©rement :-)

PTTH://www.haypocalc.com/ ou www.haypocalc.com

4. Le lundi 16 juillet 2007 à 18:26, par jeanlouis.pouget@orange-ftgroup.com

jeanlouis.pouget@orange-ftgroup.com
Je veux des SPAM

Ajouter un commentaire

Les commentaires pour ce billet sont fermés.

Blog Haypo

Ã€ mort le spam !

ConnaÃ®tre son ennemi

Combattre les courriels non sollicitÃ©s

Filtres bayesiens

Greylisting

Spam dans les forums, wikis et blogs

Le mot de la fin

Trackbacks

Commentaires

Ajouter un commentaire

Calendrier

Rechercher

Catégories

Archives

Liens

Syndication

« septembre 2006 »
lun	mar	mer	jeu	ven	sam	dim
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30