Indexation des fichiers de L’ANSD

datahub

 

 

OKFSn a lancé il y a quelques mois un projet pour indexer les documents produits
par l’ ANSD (Agence Nationale de la statistique et de la Démographie) du SÉNÉGAL.
Ce projet vise dans un premier temps à créer un moteur pour référencer automatiquement les publications mensuelles de l’ANSD sur le DATAhub (http://datahub.io/).
La première phase a été finalisée avec (548) datasets référencés en quelques jours .
La seconde phase est en cours d’élaboration. Il s’agit de faire du scrapping pour extraire les données pour une exploitation à grande échelle .Au final, nous allons recueillir un lot de données structurées basé sur ses différentes publications et qui sont accessibles sous un format exploitable par des machines (CSV)
Le but de ce projet est de permettre un accès aux données contenues dans ces publications et une réutilisation facilitée de ces informations .
La problématique était que ces données sont disponibles sous format PDF et donc difficilement réutilisables .
Vous pouvez joindre la mailing liste disponible ici  http://lists.okfn.org/mailman/listinfo/okfn-sn  pour participer à ce projet .