Quelques Moteurs : Filespump - BeeMP3 - Dilandau - 911tabs - 123people - Buscatube

DBpedia, la base de donnée partagée…

Avant-propos : Ceci est le premier article rédigé par un invité sur Usearch. Il s’agit de Tommy, aussi connu sous le pseudo TheBigBoss, créateur du blog Peperuka pour sa femme. Peperuka a 2 particularité : il est tenu par des belges directement depuis le Kenya ou ils vivent. De vraies tranches de vie, un blog coloré, beaucoup de photos … bref un endroit bien dépaysant ( et un peu flippant quand ça parle d’attaque de fourmis ou pire d’araignée ^^ ).

Beaucoup de webmasters vous le diront : l’un des problèmes majeurs auquel ils sont confrontés lors de la création de sites Internet ou d’applications web est le manque de base de données.

Si vous êtes vous-même un webmaster, vous avez surement déjà perdu votre temps à remplir vos propres bases de données de données récupérées à droite à gauche, genre les « villes de France de plus de 20 000 habitants » ou tous les « albums rock des années 70 ». De plus, il faut constamment garder la base de données à jour, ce qui est vraiment un travail de titan…
dbpedia_logo.jpg

Heureusement, depuis juin 2007, une nouvelle application est en train de révolutionner la manière dont on peut rechercher et utiliser des données. DBpedia est en effet une base de données « open source » basée sur les catégories et mots clés de Wikipedia – une des plus grandes encyclopédie disponible sur le Net avec plus de 2.5 millions d’articles, le tout en 250 langues – et son but principal est de combler ce manque de données gratuites dans la toile mais aussi de développer les technologies (et principalement le « Web sémantique ») pour effectuer des recherches dans ces bases et/ou faire interagir et partager les données récupérées.

Pour faire court, DBpedia vous permet donc de faire des recherches avancées sur la structure de Wikipedia – comme par exemple, toutes les « stades de foot de France » ou les « musiciens classique italiens du 18ème siècle » ou tous les « lieux se trouvant à proximité de la Tour Eiffel » – pour récupérer les résultats et les publier sur votre site. Avec DBpedia vous pouvez trouver des données sur plus de 2.5 millions de « choses », y compris 80 000 personnes célèbres, 293 000 lieux géolocalisés, 62 000 albums de musique, 36 000 films, pour un total de plus 218 millions de données.

Tellement de données, que vous pouvez même effectuer une recherche pour obtenir les « joueurs de football portant le numéro 11 dont le club a un stade d’une capacité supérieure à 40 000 sièges et né dans un pays de plus de 10 millions d’habitants »…

Comment inclure ses données dans votre site ??
Si vous avez besoin d’une tableau énumérant les villes de France, les musiciens africains, les jeux Amiga des années 90s ou tout autre donnée, vous pouvez vous-même générer le tableau en effectuant une requête dans la base de données DBpedia… De plus, le grand avantage à ne pas oublier, votre tableau sera automatiquement mis à jour lorsque la page est modifiée sur Wikipédia

Comme tous les API, il existe plusieurs méthodes pour exécuter des requêtes à l’aide de plusieurs modules/applications et consécutivement, le format du produit peut varier également (voir cette page pour un descriptif et exemple des différentes méthodes utilisables – http://wiki.dbpedia.org/OnlineAccess?v=31g (en anglais))… mais si vous avez déjà des connaissances de base du XML et/ou JSON et autres API déjà disponibles, alors réaliser une requête sur DBpedia ne sera pas très dur. Et pour les plus avancés, le format par défaut de DBpedia est RDF, un format qui permet de partager les données entre multisites sur le web sémantique et d’obtenir toutes les ressources disponibles sur la toile pour une mot clé et/ou une page particulière (voir tutorial http://www4.wiwiss.fu-berlin.de/bizer/pub/LinkedDataTutorial/ (en anglais)) et ce à l’aide d’un navigateur sémantique comme DISCO (http://www4.wiwiss.fu-berlin.de/bizer/ng4j/disco/ (en anglais))

Enfin, on finit par un exemple sympa créé par un français qui nous explique comment interroger DBpedia (comme obtenir les capitales européennes), récupèrer les données et les utiliser dans GoogleMap pour automatiquement les insérer sur la carte. Le site est vraiment sympa, il a trois exemples très utiles et le tout est téléchargeable gratuitement (http://www.lespetitescases.net/dbpedia/). De plus, il a une longue explication répartie sur 5 articles sur comment utiliser DBpedia et la puissance du RDF.

En effet, RDF est très puissant et il semblerait que de plus en plus de base de données seront partagées et parallèlement, de plus en plus de « Framework » verront le jour sur la toile… La preuve, vous pouvez à l’aide d’autres sites de partage de liens (Linked Data) du web sémantique obtenir automatiquement les critiques ou les prix des derniers livres (http://sites.wiwiss.fu-berlin.de/suhl/bizer/bookmashup/index.html) ou bien taguer automatiquement vos fichiers MP3 (http://www.magic-tagger.com/eng/index.php). Encore mieux, le superbe Flickr Wrappr (http://www4.wiwiss.fu-berlin.de/flickrwrappr/), un petit module qui vous retournera les images pour un mot clé défini… Sa particularité, il prend votre mot clé, interroge Wikipédia pour obtenir les différentes catégories, homonymes, etc., mais aussi la location (longitude/latitude) pour ensuite lancer une requête sur Flickr en utilisant Flickr API.

Conclusion, une nouvelle ère pour la recherche partagée s’annonce… A surveiller de près !!

Site officiel de DBpedia
http://wiki.dbpedia.org/

Interview en français de Iván Herman (W3C) sur le web sémantique et le format RDF
http://www.journaldunet.com/developpeur/itws/060608-itw-w3c-herman.shtml

Quelques navigateurs pour le web sémantique
Disco, Tabulator, OpenLink RDF, Objectviewer ou Zitgist Data Viewer.

Un site expliquant presque tout sur le RDF, DBpedia et comportant quelques modules (comme FlickrWrappr)
http://www4.wiwiss.fu-berlin.de/

Autre base de données partagées et gratuites
http://www.twine.com/ – Twine – Un peu de tout
http://openstreetmap.com/ – OpenStreetMap – Données géographiques
http://freebase.com – Freebase – Un peu de tout
http://opentick.com/ – OpenTick – Données financières
http://numbrary.com/ – Numbrary – Nombres
http://www.swivel.com/ – Swivel – Un peu de tout
http://www.jigsaw.com/ – Jigsaw – Contact business

Merci à TheBigBoss pour cet article très intéressant !


© Copyright 2007-2014, All Rights Reserved - Sitemap - Privacy PolicyremonterTop