Il y a quelque temps, j’ai cherché s’il était possible d’utiliser LibreOffice pour créer des documents Markdown mais je n’ai rien trouvé. L’idée était de créer un document avec un éditeur de type Word ou Writer, puis de l’enregistrer au format .md, mais pas de solution jusqu’à récemment lorsque Microsoft a sorti un outil pour faire quelque chose de similaire, et son nom est MarkItDown.
Qu’est-ce que MarkItDown ?
MarkItDown est une bibliothèque Python qui peut être installée sur votre système ou dans un environnement virtuel. Après l’installation, l’utilisation brute ou de base nécessiterait l’écriture de quelques lignes en Python, que vous trouverez ci-dessous. Mais ce n’est pas la seule façon de l’utiliser.
Pour installer MarkItDown il suffit de taper cette ligne de code :
pip install markitdown
L’API est aussi simple que cela à utiliser :
from markitdown import MarkItDown
markitdown = MarkItDown()
result = markitdown.convert(« test.xlsx »)
print(result.text_content)
La première ligne importe la bibliothèque, la deuxième crée un objet compatible, la troisième effectue la conversion (vers un fichier nommé text.xlsx dans l’exemple) et la quatrième imprime le résultat sur la console.
De plus, comme expliqué sur GitHub, il peut être rendu compatible avec des LLM tels que ChatGPT, tout cela au goût du consommateur et en fonction de ses connaissances.
Si le code n’est pas la meilleure solution pour vous, le développeur Matt Palmer a créé un site web pour vous faciliter la tâche. Bien qu’il soit en anglais, il est très simple à utiliser. En bas de la page, on trouve la liste des fichiers pris en charge : PDF, PPTX, DOCX, XLSX, images, audio, HTML et fichiers texte. Il suffit de faire glisser un fichier dans la boîte et d’attendre que la magie opère.
La conversion est correcte et vous pouvez toujours copier le texte brut généré puis le coller dans un fichier texte et l’enregistrer avec une extension .md. Pour le visualiser, sous Linux, nous pouvons utiliser des logiciels comme outils comme Typora, Visual Studio Code, HEP, Ghostwriter, Gedit, Iotas, UpNotes … et bien d’autres éditeurs compatibles Markdown.
Conclusion
Bien que l’outil ait été créé par Microsoft, Il peut y avoir quelques ratés. Pour obtenir les meilleurs résultats, il faut utiliser les bonnes options comme par exemple pour mettre un # Titre 1 ou un ## Titre 2, il faut le sélectionner dans les options de Word ou de Writer. Il en va de même pour les listes ordonnées ou non, les liens, les images… Si, au lieu d’utiliser les bonnes options, vous sélectionnez un texte et le mettez en gras et en plus grand, Markdown ne fonctionne pas comme cela et vous risquez de ne pas obtenir le résultat attendu.
Cependant, il s’agit d’un outil officiel de Microsoft, qui peut être la meilleure option pour convertir les fichiers pris en charge en Markdown.