Rétrobrouillon (2013) – Et si on tuait RAMEAU ?

L’espace de 24h, j’ai rêvé que je tuais RAMEAU.

Au cours d’une journée sur l’évolution des catalogues, organisée par le CNFPT, a été évoqué le travail de la BBC pour son site Nature.
Grâce aux avancées du Web de données, la BBC a créé un site qui agrége des informations de différentes sources. Aucune information n’est créée nativement par du personnel de la BBC. Le site n’est pourtant pas qu’une affaire de machine et un regard critique humain est porté sur les données agrégées. Par exemple, une grande partie de l’information provient de Wikipédia. Si l’info ne paraît pas pertinente au BBCien, il la corrige ou la complète dans Wikipédia. Il enrichit ainsi l’information pour l’ensemble de la communauté.

cf leur FAQ :

By incorporating content from Wikipedia we can offer good quality background information across the breadth of natural history content, while focusing on bringing unique content online.

Wikipedia is licenced under the GNU Free Documentation Licence, which means not only is there no licensing cost to the licence fee payer for this text, but it is also freely available to all our users to use and share in turn. At the BBC we are not only using the content that is already published on Wikipedia, but also improving those articles and creating new ones where none exist. This should improve bbc.co.uk, Wikipedia and any other site that uses Wikipedia.

google_kgOn ne débattra pas ici de la fiabilité de Wikipédia. L’encyclopédie collaborative en ligne est au coeur du système de Knowledge Graph de Google (la partie qui s’affiche maintenant à droite quand vous faites une recherche), Google a estimé que l’information primaire qu’elle transmet à ses utilisateurs pouvaient provenir de là, et nos usagers pour la grande majorité commencent leurs recherches dans Google. Mon usager est dans Google, Google aime Wikipédia, j’aime Google et j’aime Wikipédia. D’ailleurs je suis moi-même internaute, pour 90% des questions que je me pose je cherche sur Google et je clique sur l’info Wikipédia . Les 10% qui restent correspondent aux fois où je n’ai pas d’appareil connecté ou pas de connexion, dans ces cas-là j’appelle mon frère pour qu’il cherche pour moi dans Google, mais je vous filerai pas son numéro. Jetez moi des pierres.

Quel rapport avec Rameau, me demanderez-vous?

Au cours d’une pause j’ai papoté avec Marianne Cattlin, BnF, qui m’a parlé du projet HdA Lab qui a choisi d’utiliser les entrées des pages Wikipédia comme tag sémantique.

Les tags sémantiques sont constitués des entrées de Wikipédia et dotés de métadonnées, dont les URIs de DBpedia.org correspondant à ces entrées. Les données-clés extraites des articles de Wikipedia sont les infobox et les catégories. Les fonctionnalités de recherche et de navigation dans le corpus s’appuient sur le graphe de DBpedia. L’interface propose des fonctionnalités telles qu’une recherche par facettes, une carte heuristique, etc. ainsi qu’un enrichissement des résultats de recherche à l’aide d’extraits de Wikipédia (photos, définitions…).

Quitte à rêver à l'impossible... [photo par Katy Kristin, via Flikr, CC BY-NC-ND]

Quitte à rêver à l’impossible… [photo par Katy Kristin, via Flikr, CC BY-NC-ND]

L’idée est simple : les intitulés choisis dans l’encyclopédie collaborative l’ont été parce qu’ils sont les plus courants et parlent aux internautes, pourquoi faire compliqué quand on peut faire simple. L’objet transitionnel de RAMEAU, qui fait particulièrement râler les collègues d’IUFM SEF ESPE, est  bien un doudou dans Wikipédia
Parallèlement à ça, au cours d’une formation sur la gestion des fonds scientifiques le directeur adjoint de la médiathèque de la cité des sciences (Universcience) a évoqué l’indexation des fonds scientifiques et indiqué qu’ils travaillent actuellement à l’élaboration de leur propre thésaurus. Ils estiment que RAMEAU n’est pas adapté à un fonds aussi spécialisé et que le système d’indexation est trop complexe, inadapté aux méthodes de recherches des usagers. Ils ont donc choisi de s’orienter sur des descripteurs simples. Je n’en sais pas plus sur leur projet, ce n’était pas encore suffisamment développé chez eux pour que le thésaurus ait même un nom, et ce n’était pas le propos de la formation.

Pour en revenir à nos moutons. Rameau est compliqué. Même les bibliothécaires construisent les vedettes n’importe comment. Oui, mais non, pas tous, mais bon. Passez un coup de script Rameau ou d’Eppnator sur un lot de notices et je serais bien étonnée que vous ne trouviez pas un 606 mal foutu. Quant aux usagers, ha ha ha, essayez pour voir de me convaincre que Rameau est tout à fait adapté à leurs besoins et que bien sûr qu’ils s’en servent pour chercher par sujet.

Alors voilà. Si on disait que Rameau a fait son temps. Qu’il doit mourir. Et si par exemple on imaginait qu’à la place on utilisait les intitulés des pages Wikipédia correspondant au sujet dont traite notre document… Et là vous allez me dire qu’en BU on traite des thèses sur des sujets complexes, qu’il faut souvent demander la création de mots Rameau et même qu’à chaque fois il faut justifier de la demande de création en argumentant et en s’appuyant sur des documents. Et qu’une fois qu’on a fait tout ce boulot, il faut encore attendre que ce soit valider loin loin et dans longtemps longtemps. Et qu’une fois validé, ce mot Rameau, il servira à qui? Aux bibliothèques. Et puis c’est tout. Vous voyez où je veux en venir? Créer une notice (une page) pour intégrer au vocabulaire (à la base encyclopédique) un nouveau concept en justifiant de sa pertinence (en s’appuyant sur des sources fiables) et pour que ça serve à une communauté de bibliothécaires (ou, tiens, pourquoi pas, à la planète entière)… Vous voyez où je veux en venir?

S’il faut jouer les rabat-joie

– on voit bien dans l’article doudou qu’un doudou, ça peut être plusieurs choses. Comment indexer un document à l’aide d’un intitulé Wikipédia tout en garantissant qu’il n’y ait pas d’équivoque sur son contenu ? L’usager qui veut des renseignement sur le chant folklorique ne tient pas à trouver tout ce qui concerne les objets transitionnels
– techniquement, ce qui empêche aujourd’hui l’usager de notre catalogue de trouver des livres sur les objets transitionnels quand il fait une recherche sur les doudous, c’est l’inaptitude des SIGB à gérer des renvois et des liens. Alors gérer des tags sémantiques basés sur Wikipédia…
– on ne peut pas écrire des articles sur n’importe quoi dans Wikipédia, les Céciliidés devraient peut-être faire leurs preuves avant d’être acceptés par la communauté. Vous me direz, on ne peut pas créer des RAMEAU pour n’importe quoi non plus.

Voilà, j’ai fait un rêve fou aujourd’hui. C’est juste un rêve, parce que je ne suis pas spécialiste Rameau, que je n’ai jamais créé de page Wikipédia ou travaillé à la BBC. M’enfin si j’ai pu vous faire rêver un peu avec moi durant ces quelques minutes…

Cela dit à défaut de tuer Rameau, on pourrait imaginer ajouter à nos notice des URIs pointant vers les pages Wikipédia correspondantes? Ou intégrer systématiquement aux notices autorité Rameau les URIs Wikipédia? Ca aiderait à obtenir ça :

Doudou_peluche_Wikipédia

Publicités

4 réactions sur “Rétrobrouillon (2013) – Et si on tuait RAMEAU ?

    • Merci, le billet est intéressant!
      Mais au final, il me conforte dans mon scepticisme! Les bases de données, c’est une affaire d’expert, on aime bien rester entre soi et se targuer de posséder des savoirs supérieurs au commun des mortels.
      Il faut en connaître le mode d’emploi – différent pour chaque base – avec son vocabulaire, ses algorithmes opaques…
      Alors d’accord, disons que PubMed est une base spécialisée et qu’on peut légitimement exiger de ses usagers une certaine maîtrise de l’outil.
      Il me semble qu’il n’en va pas de même de nos catalogues, qui devraient être accessibles à tous types de publics et non pas être réservés à une poignée d’initiés.
      Le problème de Rameau, c’est aussi selon moi qu’il n’est même plus maîtrisé par les professionnels. On peut constater dans de nombreux cas que le vocabulaire utilisé est pauvre et imprécis.
      Cela dit, comme tout référentiel, il peut jouer un rôle dans la recherche par rebond et le regroupement thématique de ressources. Mais ça pourrait être Rameau ou autre chose…
      On en a parlé, dernièrement je me suis trouvé à chercher un document sur un sujet précis avec une étudiante. Par mot-clé dans le catalogue? Nope, résultats nuls. La recherche qui a permis de satisfaire l’étudiante, ç’a été la recherche plein texte dans Google Books.
      Non, vraiment, je suis un peu tombée en désamour avec Rameau.

      J'aime

  1. Pingback: Rétrobrouillon (2013) - Et si on tuait R...

  2. Pingback: Bibliothèques | Pearltrees

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s