Breadcrumbs
Accueil / DBpedia, la base de donnée partagée…DBpedia, la base de donnée partagée…
Avant-propos : Ceci est le premier article rédigé par un invité sur Usearch. Il s’agit de Tommy, aussi connu sous le pseudo TheBigBoss, créateur du blog Peperuka pour sa femme. Peperuka a 2 particularité : il est tenu par des belges directement depuis le Kenya ou ils vivent. De vraies tranches de vie, un blog coloré, beaucoup de photos … bref un endroit bien dépaysant ( et un peu flippant quand ça parle d’attaque de fourmis ou pire d’araignée ^^ ).
Beaucoup de webmasters vous le diront : l’un des problèmes majeurs auquel ils sont confrontés lors de la création de sites Internet ou d’applications web est le manque de base de données.

Heureusement, depuis juin 2007, une nouvelle application est en train de révolutionner la manière dont on peut rechercher et utiliser des données. DBpedia est en effet une base de données « open source » basée sur les catégories et mots clés de Wikipedia – une des plus grandes encyclopédie disponible sur le Net avec plus de 2.5 millions d’articles, le tout en 250 langues – et son but principal est de combler ce manque de données gratuites dans la toile mais aussi de développer les technologies (et principalement le « Web sémantique ») pour effectuer des recherches dans ces bases et/ou faire interagir et partager les données récupérées.
Pour faire court, DBpedia vous permet donc de faire des recherches avancées sur la structure de Wikipedia – comme par exemple, toutes les « stades de foot de France » ou les « musiciens classique italiens du 18ème siècle » ou tous les « lieux se trouvant à proximité de la Tour Eiffel » – pour récupérer les résultats et les publier sur votre site. Avec DBpedia vous pouvez trouver des données sur plus de 2.5 millions de « choses », y compris 80 000 personnes célèbres, 293 000 lieux géolocalisés, 62 000 albums de musique, 36 000 films, pour un total de plus 218 millions de données.
Comment inclure ses données dans votre site ??
Si vous avez besoin d’une tableau énumérant les villes de France, les musiciens africains, les jeux Amiga des années 90s ou tout autre donnée, vous pouvez vous-même générer le tableau en effectuant une requête dans la base de données DBpedia… De plus, le grand avantage à ne pas oublier, votre tableau sera automatiquement mis à jour lorsque la page est modifiée sur Wikipédia
Enfin, on finit par un exemple sympa créé par un français qui nous explique comment interroger DBpedia (comme obtenir les capitales européennes), récupèrer les données et les utiliser dans GoogleMap pour automatiquement les insérer sur la carte. Le site est vraiment sympa, il a trois exemples très utiles et le tout est téléchargeable gratuitement (http://www.lespetitescases.net/dbpedia/). De plus, il a une longue explication répartie sur 5 articles sur comment utiliser DBpedia et la puissance du RDF.
En effet, RDF est très puissant et il semblerait que de plus en plus de base de données seront partagées et parallèlement, de plus en plus de « Framework » verront le jour sur la toile… La preuve, vous pouvez à l’aide d’autres sites de partage de liens (Linked Data) du web sémantique obtenir automatiquement les critiques ou les prix des derniers livres (http://sites.wiwiss.fu-berlin.de/suhl/bizer/bookmashup/index.html) ou bien taguer automatiquement vos fichiers MP3 (http://www.magic-tagger.com/eng/index.php). Encore mieux, le superbe Flickr Wrappr (http://www4.wiwiss.fu-berlin.de/flickrwrappr/), un petit module qui vous retournera les images pour un mot clé défini… Sa particularité, il prend votre mot clé, interroge Wikipédia pour obtenir les différentes catégories, homonymes, etc., mais aussi la location (longitude/latitude) pour ensuite lancer une requête sur Flickr en utilisant Flickr API.
Conclusion, une nouvelle ère pour la recherche partagée s’annonce… A surveiller de près !!
Site officiel de DBpedia
http://wiki.dbpedia.org/
Interview en français de Iván Herman (W3C) sur le web sémantique et le format RDF
http://www.journaldunet.com/developpeur/itws/060608-itw-w3c-herman.shtml
Quelques navigateurs pour le web sémantique
Disco, Tabulator, OpenLink RDF, Objectviewer ou Zitgist Data Viewer.
Un site expliquant presque tout sur le RDF, DBpedia et comportant quelques modules (comme FlickrWrappr)
http://www4.wiwiss.fu-berlin.de/
Autre base de données partagées et gratuites
http://www.twine.com/ – Twine – Un peu de tout
http://openstreetmap.com/ – OpenStreetMap – Données géographiques
http://freebase.com – Freebase – Un peu de tout
http://opentick.com/ – OpenTick – Données financières
http://numbrary.com/ – Numbrary – Nombres
http://www.swivel.com/ – Swivel – Un peu de tout
http://www.jigsaw.com/ – Jigsaw – Contact business
Mots-clefs :DBpedia, invité, sémantique, wikipédia
Découvrir d'autres moteurs dans ce genre ?

