Convertisseur OpenOffice
Converti un open document (.ods, .odt, .odp, etc.) en format texte brut ou XML.
Télécharger:
évidemment à mettre dans le même dossier ...
Voilà cette idée m'est venue en parcourant le livre <<Python par l'exemple>>, où se trouvait une petite fonction permettant de supprimer le balisage XML des fichiers OO.O.
J'ai amélioré la fonction et développé une petite GUI pas très ergonomique mais qui fonctionne.
Les documents OO.o sont donc uniquement des fichiers zip contenant un fichier content.xml en plus d'autres. On utilise simplement une expression régulière afin de supprimer les balises XML et grâce à " ".join() on remplace les trous par des espaces.
Ce qui est pas mal (je trouve ;-) ) c'est que la GUI filtre automatiquement les fichiers .od? du dossier courant. On pourrait éventuellement la rendre modifiable pour y insérer une adresse manuellement.
Sinon les Scrollbar c'est pas trop ça ... :-)
Pour faire de même avec des fichiers .doc il faudrait le module PyWin32 afin de faire appel à Word et de lui demander d'enregistrer le texte en texte brut. Beaucoup moins drôle.
évidemment à mettre dans le même dossier ...
Voilà cette idée m'est venue en parcourant le livre <<Python par l'exemple>>, où se trouvait une petite fonction permettant de supprimer le balisage XML des fichiers OO.O.
J'ai amélioré la fonction et développé une petite GUI pas très ergonomique mais qui fonctionne.
Les documents OO.o sont donc uniquement des fichiers zip contenant un fichier content.xml en plus d'autres. On utilise simplement une expression régulière afin de supprimer les balises XML et grâce à " ".join() on remplace les trous par des espaces.
Ce qui est pas mal (je trouve ;-) ) c'est que la GUI filtre automatiquement les fichiers .od? du dossier courant. On pourrait éventuellement la rendre modifiable pour y insérer une adresse manuellement.
Sinon les Scrollbar c'est pas trop ça ... :-)
Pour faire de même avec des fichiers .doc il faudrait le module PyWin32 afin de faire appel à Word et de lui demander d'enregistrer le texte en texte brut. Beaucoup moins drôle.







