Hachoir 0.3 et les méta-données
Par haypo, mardi 30 mai 2006 à 01:54 :: Python :: #13 :: rss
Hachoir est un projet que je développe depuis maintenant sept mois et qui a pour objectif de pouvoir visualiser le contenu d'un fichier binaire. Le cœur est maintenant bien avancé et de très nombreux formats de fichier sont supportés (21 formats allant de l'image JPEG au système de fichier EXT2 en passant par la musique MP3).
Un petit mois après la sortie de la version 0.2, voici la version 0.3 du Hachoir. Celle-ci sent le code mûr et commence enfin à servir à quelque chose :-) En particulier, la fonction « extraction des méta-données » vaut le détour. Elle permet d'afficher la taille d'une image, le codec d'une vidéo, la fréquence d'acquisition d'une musique, et bien plus encore ! J'ai découvert moi-même des informations sur des fichiers que j'avais sur mon disque dur, comme par exemple le logiciel utilisé pour encoder une vidéo, ou encore des commentaires d'une musique (fichier MP3).
Hachoir ne possède pas encore d'interface graphique. Enfin, la version 0.1 avait une interface Gtk2, mais là je préfère me concentrer sur la bibliothèque bas-niveau. Hachoir ne fonctionne donc qu'en mode texte (avec une interface monochrome en ncurses pour Linux).
Pour installer le Hachoir, téléchargez ez_setup.py et installez-le via « sudo python ez_setup.py » (si vous ne l'avez pas encore). Ensuite, il suffit de taper « easy_install hachoir ». Reportez-vous au site internet du Hachoir pour les détails de l'installation. Si je ne trompe pas, seul Python 2.4 est nécessaire.
Vous pouvez maintenant explorer vos fichiers binaires avec la commande « hachoir fichier ». Par défaut, la profondeur d'exploration est limitée à 3 pour rendre l'affichage plus rapide : utilisez « hachoir --max-depth=0 fichier » pour visualiser l'ensemble du fichier.
Pour extraire les méta-données, utilisez « hachoir --metadata fichier ». Exemple :
$ hachoir --metadata TAMPOPO.AVI Video: - size: 608x336 pixels - duration: 1 hour(s) 59 min - depth: 24 bits/pixels - codec: "divx" - rate: 23 frame/sec - producer: Nandub v1.0rc2 Audio: - sample/sec: 48.0 KHz - channel: 2
Les prochaines évolutions se feront au niveau de la détection automatique du charset du texte et la possibilité d'éditer un fichier (c'est un gros chantier ça !).
Pour plus d'informations, consultez le site internet du Hachoir.
Commentaires
1. Le lundi 7 avril 2008 à 12:06, par Florian SAUCIER (chez LE moteur de recherche pour le mail)
2. Le mardi 12 octobre 2010 à 10:45, par gucci shoes
Ajouter un commentaire
Les commentaires pour ce billet sont fermés.