Imposer des limites arbitraires

Durant mes essais de fuzzing, j'ai compris assez vite qu'espÃ©rer Ã©crire un programme parfait n'est qu'un idÃ©al. PlutÃ´t que de corriger les erreurs, je pense qu'il vaut mieux Ã©crire du code tolÃ©rant aux erreurs. Je veux dire par lÃ que le programme continuera Ã fonctionner mÃªme si une procÃ©dure Ã©choue.

Utiliser les exceptions

On peut utiliser pour Ã§a le couple try/except en Python. Exemple trivial :

value = (...)
try:
   print "Date : %s" % datetime.datetime.fromtimestamp(value)
except ValueError:
   print "Date invalide (%r) !" % value

Mais le fuzzing mÃ¨ne souvent Ã une situation d'Ã©puisement (monopolisation) des ressources : votre programme va manger tout le temps processeur, toute la mÃ©moire, remplir le disque dur, utiliser toute sa pile, etc. J'ai alors cherchÃ© comment dÃ©tecter ces situations de crise. D'ailleurs elles ne doivent pas Ãªtre vue comme critiques mais normales et il faut les avoir Ã l'esprit en Ã©crivant un programme. Effectivement, les ressources sont limitÃ©es : il faut apprendre Ã partager.

Limiter la mÃ©moire

Sous Linux, on peut utiliser resource.setrlimit(RLIMIT_AS, ...). Si la mÃ©moire totale dÃ©passe max_mem, une exception MemoryError est Ã©mise par Python.

J'ai implÃ©mentÃ© une fonction limitedMemory() qui va limiter temporairement la mÃ©moire : lire memory.py d'hachoir_core. L'erreur apparait si la mÃ©moire grossit de la quantitÃ© d'octets indiquÃ©e. Il suffit alors d'utiliser Â« try: limitedMemory(maxmem, ...) except MemoryError: ... Â».

Limiter le temps processeur

Pour Ã©viter que le programme reste bloquÃ© au mÃªme endroit pendant un temps excessif (cas typique : une boucle infinie), il faut pouvoir appeler une fonction avec une durÃ©e maximale. Sous Linux, on peut utiliser au choix : time.alarm() ou resource.setrlimit(RLIMIT_CPU, ...). Ã€ noter que pour la seconde solution, les pauses (time.sleep()) et le temps passÃ© dans le noyau ne sont pas pris en compte : il vaut donc mieux utiliser une alarme. Une alarme dÃ©clanche un signal SIGALRM alors que RLIMIT_CPU va gÃ©nÃ©rer un signal SIGXCPU.

J'ai implÃ©mentÃ© les deux mÃ©thodes dans la fonction limitedTime(sec) : lire timeout.py d'hachoir_core.

Lorsque c'est possible, il vaut mieux utiliser des fonctions offrant dÃ©jÃ cette fonctionnalitÃ© comme par exemple la fonction select().

Limiter la pile

En testant dpkg, j'ai rÃ©ussi Ã le planter avec Â« COLUMNS=10000000 dpkg -l Â». AprÃ¨s investigation, il s'est avÃ©rÃ© que l'erreur venait de la libc (chose qui semblait impensable Ã mes yeux). En creusant encore, j'ai vu que vfprintf() utilisait massiment la pile pour Ã©crire la sortie de dpkg (qui configure stdout pour ne pas utiliser de tampon).

Bref, j'ai cherchÃ© Ã voir s'il Ã©tait possible d'attraper l'erreur Â« Ã©puisement de la pile Â». Et bien sÃ»r que oui : c'est possible ! Par contre, quand la pile est hors-service, hors de question d'utiliser printf() ou autre fonction succeptible de rÃ©utiliser la pile. Linux permet d'utiliser une pile dÃ©diÃ©e aux gestionnaires de signaux. Ah lÃ lÃ , il est quand mÃªme fort ce systÃ¨me d'exploitation, hein !

Les fonctions clÃ©s sont sigaltstack() pour crÃ©er une pile dÃ©diÃ©e Ã notre gestionnaire de signal, sigaction() pour appeler notre fonction quand le signal SIGSEGV est Ã©mis, setjmp()/longjmp() pour quitter le code boguÃ© et revenir Ã la Â« borne de sauvegarde Â» (renseignÃ©e par setjmp()).

En rÃ©unissant tous ces Ã©lements (try/except, limiter la mÃ©moire, temps et pile), je pense qu'on peut commencer Ã Ã©crire des programmes robustes. Bien sÃ»r, rien ne vaut un audit minutieux du code source.

lun	mar	mer	jeu	ven	sam	dim
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Blog Haypo