Initiation au fuzzing

Le fuzzing est un outil de test logiciel qui consiste Ã injecter des donnÃ©es incorrectes pour rechercher des erreurs dans un programme, plus particuliÃ¨rement dans le but de trouver des failles de sÃ©curitÃ©. Aujourd'hui (en 2007), cette mÃ©thode est extrÃªmement efficace ! Disons que globalement, aucun programme ne rÃ©siste au fuzzing : ils finissent tous par montrer des faiblesses (qui se manifeste la plupart du temps par un plantage) dans un temps plus ou moins court.

Mon expÃ©rience du fuzzing

J'avais lu beaucoup de rapports de fuzzing montrant clairement de grosses faiblesses dans quasiment l'ensemble des logiciels testÃ©s. Mais je n'y croyais qu'Ã moitiÃ©, il fallait que je le vois de mes propres yeux. J'ai alors Ã©crit un programme de fuzzing pour mon projet Hachoir. Durant deux semaines j'ai continuellement corrigÃ© des bugs plus ou moins critiques. Comme quoi, la technique fonctionne trÃ¨s bien !

J'ai ensuite adaptÃ© mon programme de fuzzing pour tester d'autres applications. J'ai testÃ© sur la suite Image Magick (manipulation de photos)... que je suis arrivÃ© trÃ¨s rapidement Ã faire planter. J'ai isolÃ© deux cas critiques : pour une image XCF de 80 Ko, Image Magick allouait 1 Go de mÃ©moire (ce qui est Ã©norme), et pour une image TGA, Image Magick consommait toute la puissance du processeur (100% du CPU) durant plusieurs minutes (je n'ai pas eu la patience de mesurer le temps exact). J'ai tentÃ© de rapporter le bug mais je n'ai eu aucun retour.

Je me suis alors senti poussÃ© des ailes et je me suis senti invinsible :-) Tant qu'Ã faire, allons tester un Ã©lÃ©ment de sÃ©curitÃ© ! J'ai choisi au pif l'anti-virus ClamAV... que j'ai rÃ©ussi assez rapidement Ã mettre Ã genoux. Un document Word forgÃ© prend 2 Go de disque dur et l'ensemble du processeur pendant plusieurs minutes. J'ai rapportÃ© le bug qui a Ã©tÃ© classÃ© comme critique et sera corrigÃ© dans la prochaine version.

Ã‰criture du programme de fuzzing

En pratique, pour Hachoir, Image Magick et ClamAV : je suis parti de fichiers valides (le format dÃ©pendant de l'outil testÃ©) que j'ai ensuite tronquÃ© et/ou j'y ai insÃ©rÃ© des octets alÃ©atoires. Je passe alors ce fichier forgÃ© au programme testÃ©. Cette algorithme est celui du programme Â« mangle.c Â» Ã©crit par le belge Ilja van Sprundel que j'ai rÃ©Ã©crit en Python. J'ai ensuite ajoutÃ© d'autres opÃ©rations comme modifier plusieurs octets Ã la fois, incrÃ©menter/dÃ©crÃ©menter un octet, insÃ©rer des valeurs spÃ©ciales, etc.

Ce qui me fait peur, c'est que globlament mon programme de test reste extrÃªnement simple et pourtant j'arrive Ã faire planter trÃ¨s rapidement (moins de 5 minutes) tous les programmes que j'ai testÃ©s. Je n'ose mÃªme pas imaginer ce qu'on pourrait dÃ©couvrir avec des programmes beaucoup plus intelligents. Et justement, l'Ã©tÃ© dernier des confÃ©rences ont prÃ©sentÃ© des logiciels de fuzzing utilisant des algorithmes gÃ©nÃ©tiques ainsi qu'une grammaire dÃ©diÃ©e au fuzzing. Le but Ã©tant, en gros, d'arriver le plus profondÃ©ment possible dans le programme cible. Ils utilisent un dÃ©bogueur dÃ©diÃ© ainsi qu'un outil permettant de mesurer la couverture du code (quantitÃ© de code exÃ©cutÃ© dans le programme cible).

Je pense qu'en couplant un fuzzing avec un outil comme Valgrind, on pourrait crÃ©er des outils beaucoup plus intelligents car on connaitrait la couverture du code mais Ã©galement les erreurs d'accÃ¨s mÃ©moire.

Le fuzzing Ã©tant assez nouveau pour moi, je ne saurai conseiller un site web en particulier. En attendant, suivez les liens donnÃ©s sur la page Fuzzing de mon wiki. Je la ferai vivre au fur et Ã mesure des mes recherches.

lun	mar	mer	jeu	ven	sam	dim
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Blog Haypo