Vous êtes ici : Accueil » Logiciels »

Télécharger Wikipédia en entier

wikipedia

Wikipédia est considéré par beaucoup (parfois à tord) comme l’Encyclopédie de référence sur le web, l’équivalent de nos bonnes vieilles grosses encyclopédies en 36 volumes peu pratique à utiliser. Plus besoin de stocker des kilos de bouquins sur nos étagères et de passer en revue les sommaires de chaque volume de l’encylo pour trouver la réponse à notre question … réponse qui était parfois dépassée quelques mois à peine après son impression.

Télécharger Wikipédia en entier

Wikipédia Hors-Ligne

Mais si le contenu de Wikipédia est accessible sur une simple recherche en ligne, qu’il est gratuit, ne prend pas de place et est tenu à jour beaucoup plus rapidement il a un petit inconvénient qui peut s’avérer assez pénible : il dépend d’une connexion web en bon état de fonctionnement. Une panne de box/modem ou un soucis chez votre hébergeur et plus moyen d’aller pomper consulter les informations tellement nécessaire au travail scolaire à rendre.

La solution serait donc de pouvoir récupérer le contenu de l’encyclopédie en ligne directement sur son ordinateur pour la consulter n’importe quand facilement. Et c’est possible puisque le site met à disposition des outils pour le faire. Ce qui est mit à disposition ce n’est pas juste le contenu des articles (même si c’est sans doute ce qui intéresse le plus les gens) mais aussi tout l’historique des éditions de pages, des discussions, les versions localisées, les pages utilisateurs, etc. le tout aux format XML ou SQL. Il est même possible de ne récupérer que le contenu autour d’une thématique particulière pour éviter de tout devoir importer.

Pour récupérer les pages concernées il suffit de se rendre sur la section des dumps de la version française et de sélectionner la mise à jour voulue (généralement ce sera la dernière date en bas) et ensuite de sélectionner le type de données à télécharger. Juste les articles (sans les discussions, utilisateurs, modèles, …) ce sera le fichier nommé pages-articles.xml.bz2 (autour des 2 gigas en taille). A noter que les images et la plupart du contenu multimédia n’est pas inclus dans l’archive (pour des raisons de droits d’auteur) et que l’ensemble du contenu français est mit à jour 1 ou 2 fois par mois.

Télécharger Wikipédia en entier

Une fois que vous avez ça en local il faut encore pouvoir le lire (le format étant un peu particulier, .zim) et à cet effet le logiciel Kiwix est le plus connu. Non seulement ce dernier est gratuit et open source mais il vous permet aussi de lire d’autres contenu hors-ligne et est disponible pour Windows, Mac ou Linux. Cerise sur le gâteau Kiwix propose un téléchargement du logiciel avec une pré-indexation des fichiers .zim (comptez un certains temps de download ça fait tout de même plus de 9 gigas).

Lorsque vous avez téléchargé l’archive voulue et que le logiciel est installé il suffit de lancer ce dernier et d’ouvrir un nouveau document en la personne de l’archive. Vous pourrez alors lire directement Wikipédia en local sans avoir besoin de connexion et dans une interface qui ressemble assez à un navigateur classique. Ce qui peut aussi être pratique lorsqu’on a besoin du site mais que l’on veut empêcher toutes tentations d’aller surfer ailleurs (il suffit de débrancher le câble et on est tranquille).

Kiwix permet également d’autres options comme de pouvoir prendre des notes, ouvrir plusieurs onglets simultanés, exporter les pages au format PDF ou HTML, indexer le contenu pour des recherches plus rapide, etc.

Screencast Kiwix (en espagnol)

Exporter des pages précise Wikipédia
Télécharger Kiwix

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>