idées pour un développement populaire du web sémantique

English version

Les principes d’émergence et d’intelligence collective ont démontré à plusieurs reprises — et parfois avec brio — leur capacité de porter des fruits intéressants sur la toile (Wikipédia, del.icio.us, Digg, Flickr et bien d’autres).  Maintenant, cela a peut-être bien déjà été proposé ailleurs — l’idée étant presque palpable dans l’air —, mais… il me semble que ce genre d’approche est tout à fait applicable au domaine du web sémantique.

Le web sémantique, annoncé depuis longtemps déjà, tarde à faire son apparition dans nos pratiques.  Tim Berners-Lee a lancé le terme en 2001 mais l’idée était là bien avant — dans le Guide du routard galactique de Douglas Adams, par exemple.  Je crois pour ma part que le web sémantique doit être émergent, doit être une construction collective afin qu’il ait les qualités requises pour entrer dans nos pratiques de communication.  Autrement, il ne serait encore que « des services qui se parlent entre eux ».

On constate que les microsyntaxes sur Twitter et compagnie ont un certain succès, voire un succès certain.  Elles sont de la sémantique à coup sûr.  Des utilisateurs sont prêts.  Que dis-je ?  Sans même considérer l’utilisation de petits symboles pratiques pour communiquer via certains médias sociaux (les hashags, slashtags, etc.), tous les êtres communicants de bonne volonté font de la sémantique — ou essaient.

Or, il m’apparaît que le web sémantique pourrait très bien émerger de nos pratiques de communication elles-mêmes.  Vous vous rappelez ce conte où il faut répéter trois fois le nom du génie pour qu’il sorte de la bague ?  Ça serait un peu la même chose…

Imaginez que vous aimeriez, je ne sais pas… une table en fer forgé pour votre jardin, rencontrer l’âme sœur, informer qui cela pourrait bien intéresser que vous allez jeudi de Montréal à Québec en voiture et qu’il vous reste de la place pour deux personnes…

un tableau de bord pour nos communications

Tout d’abord, je crois pertinent, à l’ère de la télécommunication intelligente, de se doter d’une sorte de tableau de bord personnel.  Tout pourrait partir de là — et y revenir.  Sur ce tableau de bord, vous pourriez faire, suivant le présent exemple, une entrée distincte pour chacune des choses souhaitées, entrée où le souhait en question serait formulé d’au moins deux façons différentes (par exemple, dans une autre langue) — davantage de façons si possible, histoire de donner un petit coup de pouce supplémentaire au phénomène d’émergence.  (Voyez-vous déjà pourquoi ?  Non ?  Continuez de lire…)

Pour l’aider encore plus en réduisant la quantité de formulations possibles à un sous-ensemble pratique, on pourrait faire comme si chaque formulation était précédée par « Je souhaite » (ou l’équivalent) et on continuerait, pour chaque formulation, par un verbe à l’infinitif, possiblement pronominal.

Cela donnerait, par exemple :

  • acquérir une table de jardin en fer forgé // avoir une table en fer forgé pour mon jardin // me greiller d’une table en fer forgé ; c’est pour mon jardin // get a wrought-iron table for my garden

Notes : « souhaiter acquérir » et « souhaiter avoir » ne sont pas strictement équivalents, mais, communicationnellement parlant, ils signifient tous deux une demande.  La double barre oblique sert évidemment de séparateur.  Pour simplifier, on laisse tomber les points de fin de phrase (« . ») et on utilise plutôt le « ; » pour séparer, si désiré, les formulations en plusieurs phrases.  Aussi, cela aiderait le processus d’émergence que chacune des formulations corresponde morceau à morceau avec les autres formulations données comme équivalentes.  Les morceaux d’une formulation donnée peuvent être constitués de parties non-contigües à l’intérieur de cette même formulation.

Le tableau de bord est utile entre autres parce qu’il vous permet de voir d’un seul coup d’œil l’ensemble de vos souhaits et de vous assurer régulièrement qu’ils sont encore d’actualité.  Ainsi, en ajoutant ou retirant des souhaits, il serait possible de naviguer avec assurance… communicationnellement parlant, bien entendu.

À partir d’un usage répandu de ce format simple il serait possible de faire émerger, grâce à des algorithmes que je me plais à nommer émergiciels, un répertoire sémantique qui comprendrait de plus en plus de nos formulations.

Pour bien aborder l’univers, utilisons bien l’universel.  Il est là, sous la surface des ruisseaux de nos voix et signaux, le voyez-vous qui scintille et miroite ?

un répertoire sémantique émergent

Les algorithmes, les émergiciels en question devraient se faire éventuellement très astucieux pour deviner correctement la correspondance entre certaines parties de texte, mais tout un tas de telles correspondances pourraient être devinées par des algorithmes pas si compliqués.  Et du plus simple on peut aller progressivement jusqu’au plus subtil.  Ça serait une œuvre en construction permanente qui grandirait et se transformerait.  L’acquis n’y serait jamais perdu.

Donc, dans la mesure où les formulations données comme équivalentes le seraient vraiment (et on peut le vérifier en demandant aux usagers de confirmer ou d’infirmer que telle ou telle formulation est bien équivalente à ce qu’ils veulent dire), des algorithmes relativement simples pourraient repérer les cooccurrences et inférer à partir de là, un peu comme dans le jeu Master Mind, ce qui, dans une formulation donnée, correspond à quoi dans une autre formulation.

Ces éléments de formulation repérés comme communicationnellement équivalents formeraient entre eux des chaînes, dont les maillons seraient eux aussi éventuellement confirmés comme équivalents ; ces chaînes se cristalliseraient donc en petits réseaux fortement interreliés, chacun comme une petite constellation très distincte des autres constellations.  Chaque constellation correspondrait à un élément de communication, un concept, comme « partager » ou « mouton ».  De nos communications, pourrait ainsi émerger un grand répertoire d’éléments communicationnels.

Dans ce répertoire, comme dans un dictionnaire ou une encyclopédie, il y aurait une entrée distincte pour chaque concept.  Il y aurait le concept d’arbre, le concept d’arbre à fruits, le concept de pommier, de voyage, de mouton, etc.  Ce serait comme une encyclopédie multilingue (éventuellement multimédia) qui pourrait aller jusqu’à se passer de définitions (quoique les définitions aussi sont des façons de dire…).  Éventuellement, pour chaque concept, il y aurait des images, de petits vidéos, des enregistrements audio, bien sûr les multiples façons de dire, d’écrire… bref, toutes les formes d’expression en usage.

Un tel répertoire permettrait en outre la traduction automatique de quantité de messages en quantité de langues.  Sans doute une telle entreprise pourrait aussi contribuer à l’apparition de nouvelles formes d’écriture, voire de langage ou de communication !

l’affaire de la collectivité

Ah, il manque encore un petit quelque chose à ce système.  Avec la catégorisation libre (free-tagging ou folksonomy en anglais), la catégorisation des choses est devenue clairement l’affaire de la collectivité.  Il dépendra d’un volontariat tout similaire pour catégoriser, les uns à l’aide des autres, nos éléments de communication.  « Pommier » fera partie de la catégorie « arbre à fruit » ; ils feront tous deux partie de la catégorie « arbre », etc.  De « libres  généralisations », comme nous avons vu avec l’assimilation « avoir » – « acquérir », seraient à ce moment-là opportunes.

De même qu’un élément de communication peut en catégoriser un autre, une catégorie d’éléments de communication peut répondre, être une réponse adéquate à une autre catégorie d’éléments de communication, par exemple, celle des « offres » (disponibilités, talents, etc.) à celle des demandes (besoins, souhaits, conditions).  Ce genre d’informations, fournies par des sémanticiens volontaires, des free-ontologizers, donneraient une base à l’automatisation de moult communications pertinentes.

Parmi les catégories auxquelles il pourrait être utile d’associer de telles notions de dialogue, il y aurait, par exemple : les demandes, les offres, les savoir-faire, les talents, les intérêts, les disponibilités, les coordonnées spatiales, les itinéraires, les rayons d’action, les lieux de rencontre préférés et toutes sortes d’autres sortes d’informations.

transparence, décentralisation, universalité

La réalisation d’un tel web sémantique émergent peut débuter sans même avoir à régler d’abord l’épineuse question de la vie privée si tout est fait dans la transparence.  Beaucoup, déjà, peut être dit au grand jour (sans parler de ce qui le doit) et des options de privauté consensuellement approuvées — encore par émergence, donc — pourraient toujours apparaître par la suite.  Cela dit, si les options de privautés sont bien pensées et implémentées dès le départ, pourquoi ne pas en profiter ?  Le projet Diaspora, en chantier actuellement et promis pour septembre 2010 me paraît prometteur en ce sens.  D’une manière ou d’une autre, l’apparition d’un système de communication universel amènera nécessairement en ce monde une dose appréciable de transparence.

L’information pourrait donc être partout, décentralisée, disséminée sur les différents tableaux de bord ; le répertoire sémantique, lui, émergerait de la moisson de toutes ces informations et de notre libre catégorisation de cette moisson.

Les outils de recherche eux-mêmes pourraient être complètement décentralisés.  Chaque tableau de bord pourrait échanger de l’information avec les tableaux de bords de vos voisins dans un rayon de tant de kilomètres.   Ces outils de recherche pourraient consulter un répertoire sémantique émergent tel que celui décrit ici (parmi d’autres lexiques et ontologies) pour déterminer ce qui est une réponse adéquate à quoi.  Et sur votre tableau de bord apparaitraient aussi bien sûr les résultats, c’est-à-dire les entrées d’autres usagers repérées comme répondant à vos entrées.

Ce répertoire communicationnel émergent — sémantique, d’éléments… ?, je ne sais plus comment l’appeler, mais nous devrons certainement lui trouver un nom — car ce sera peut-être ce que nous aurons un jour de plus universel… après l’univers lui-même !

construire plus fluidement le monde

L’existence d’un outil que nous construirions nous-mêmes, tant que nous sommes, pour ainsi dire brique par brique, qui nous comprendrait et que nous comprendrions, qui placerait vraiment nos bien-êtres et le développement de nos rêves en priorité, un tel outil pourrait bien faire une grande différence dans ce monde.  Du fait que cet outil existerait, existerait aussi une plus grande possibilité de créer et de vivre de façon radicalement émergente et fluide.

Les structures sociales pourraient nous ressembler davantage, être plus claires, plus logiques, plus diversifiées, nous encombrer moins — apparaître par libre association, du simple fait qu’on les souhaite de façon convergente… et disparaître quand on ne les souhaite plus.

Est-ce dire que je prône un individualisme à tout crin ?  Non, car bien que je mette l’individu au-dessus de la culture, je pense que la solidarité doit être encouragée le plus possible.  (D’ailleurs il faudra penser à une procédure pour formuler des souhaits pour ceux qui ne le peuvent pas !)  On a d’autant envie de se donner à la collectivité qu’on a réellement un rôle à y jouer, qu’on peut réellement y avoir de l’influence et y naviguer.  Et comme la vraie solidarité est toujours volontaire, il faut commencer par pouvoir construire le monde suivant nos volontés à tous et pas quelque structure pré-établie.  J’élaborerai dans un autre billet avec d’autres idées, celles-ci concernant ce que pourrait être un système économique de bon aloi.

Tous les problèmes ne se résoudraient pas comme par magie avec un web sémantique populaire.  Mais la magie de la communication serait enfin au service de chaque personne et elle pourrait — je le souhaite — apporter tellement de clarté et de fluidité qu’elle deviendrait l’instrument de prédilection pour participer à la construction du monde.

8 comments so far

  1. fredofromstart on

    J’aimerais avoir noir sur blanc vos critiques, commentaires et questions afin de pouvoir y répondre et éventuellement améliorer ma proposition.

  2. Julie Martineau on

    Bonjour Frédéric,
    Je crois que ce serait utile d’exemplifier davantage à quoi ça pourrait ressembler, un tel système, pour pouvoir passer de la théorie à la pratique. Comment procéder, étape par étape, pour y arriver?

  3. Vincent Blouin on

    D’abord, je ne crois pas que tu aies à te positionner en opposition au web sémantique, comme lorsque en parlant du web sémantique, tu dis : que des services qui se parlent entre eux. Je pense que tu devrais plutôt vouloir créer une application qui s’inscrive dans le web sémantique. Je pense comprendre ton souhait à travers l’application « Machine à souhaits » ; tu veux que toute la puissance du web sémantique soit utilisée à répondre aux souhaits des individus et intrinsèquement des sociétés. C’est un bon projet je trouve mais qui ne va pas du tout à l’encontre du web sémantique. T’y opposer, même légèrement, ne fait qu’affaiblir ta position.

    Secondement, ne prétend pas que la compréhension du langage naturel par des machines est facile. Si tu affirmes que c’est facile, tu dois fournir ces algorithmes en retour ou du moins en donner des indices. Parce que je pense que les docteurs et chercheurs en informatique qui dévouent leur vie à la compréhension du langage naturel, n’ont pas encore réussi à faire en sorte que les machines comprennent le sens des phrases, même avec un ensemble de phrases ou/et morceaux de phrases synonymes. Un langage a été créer pour faciliter la tâche des moteurs d’inférence : OWL. Le langage naturel a été mis de côté au profit de la mathématique logique. Dans l’effort de créer ce web intelligent, il existe des moteurs d’inférences. Ceux-ci utilisent la mathématique logique pour aider l’ordinateur à comprendre la signification du contenu du web. Pourquoi ? Parce que c’est justement ce que l’on trouve actuellement dans le web, du langage naturel, et que c’est justement en réponse à ce web que a été créer des technologies telles que RDF, RDFS, OWL et SWRL.

    Enfin, le web sémantique aide à la compréhension du langage naturel🙂
    Par exemple si quelqu’un en entrain d’écrire Je veux voyager … L’ordinateur pourrait s’attendre à ce que le prochain mot soit soit un lieu ou une date etc. Enfin si l’usager termine sa phrase par « Je veux voyager demain », l’ordinateur pourrait vérifier si « demain » est l’instance d’un lieu ou d’une date puisque ce sont les deux types de concepts suivant auxquels il s’attendrait. Ensuite en puisant dans les ontologies et les bases de connaissance accessible à la machine, l’ordinateur pourrait enfin trouver que demain réfère à ex: 24 juin 2010. Finalement l’ordinateur pourrait comprendre que Je, (l’usager courant ex : Vincent Blouin) veut voyager le 24 juin 2010. Si selon l’ontologie accessible à l’ordinateur, voyager implique avoir un moyen de transport, l’ordinateur pourrait, s’il en a les droits, accéder à ma liste de moyens de transports accessibles. Si je n’ai que un vélo de répertorier dans cette liste d’objets personels et que auparavant, j’ai signaler que je souhaite réparer mon vélo, l’ordinateur pourrait me suggérer la liste de personnes qui souhaitent réparer des vélos dans mon entourage, selon mon budget s’il le connaît, selon mon horaire et celles des autres, toujours s’il connaît ces informations. Tout cela en se fiant aux ontologies et faisant appel à différents services web.

    Sinon, pour le reste, il y a pleins de points sur lesquels on s’entend dans ton texte😀.

  4. fredofromstart on

    @Vincent Blouin :

    D’abord, je suis bien content de savoir qu’on s’entend sur le fond :).

    Oui, je savais que la formule « que des services qui se parlent entre eux » en ferait réagir quelques-uns ;) C’est que le web sémantique d’aujourd’hui nous apparaît le plus souvent à nous, simples mortels, comme une espèce de machine patentée dans les rouages de laquelle on hésite à mettre le doigt. Ma proposition vise à ce que la « Machine à souhaits » nous appartienne parce que nous y aurions tous et toutes contribué (et pas seulement quelques technologues initiés, affiliés aux différents services — transports en commun, réparateurs de vélo, et cætera).

    Cela dit, loin de moi l’idée de vouloir me mettre à dos toute la communauté des développeurs du web sémantique ! Je vois l’entreprise que je propose comme une source renouvelable de formulations et de sens qui pourront être traduits en ontologies et présentés éventuellement comme des formulaires ou des suggestions d’auto-complétion. Je crois que mon approche et celle prise par le web sémantique jusqu’à présent sont les deux extrémités d’un même spectre ; la première fluide, extensible, émergente, la seconde formalisée, cristalisée, structurée.

    En ce qui concerne ta critique portant sur la grande difficulté de « décrypter » le langage naturel, je t’accorderai que la tâche est effectivement énorme. Le fait est cependant que ma proposition ne prétend pas à la compréhension du langage naturel en général. Au contraire, il s’agit ici d’une « élucidation assistée » d’informations présentées sous la forme du langage naturel. Le seul fait qu’il soit demandé d’exprimer d’au moins deux manières différentes le même contenu sémantique fait une énorme différence. Chaque formulation donnée comme équivalente donne de grands indices au système quant à la façon d’interpréter un souhait. Ensuite, il ne s’agit pas de texte pris au hasard. On sait en outre qu’il s’agit de souhaits, qu’ils commencent par un verbe à l’infinitif, qu’ils se rapportent à une personne en particulier et qu’ils concernent donc des actions individuelles concrètes et non pas n’importe quoi, comme la paix dans le monde ou que les oranges soient bleues.

    Bien sûr, les relations logiques entre les différents concepts sont une dimension importante, que j’ai abordée dans la section l’affaire de la collectivité. Je ne dis pas que le travail fait jusqu’ici avec RDF, OWL, et cætera est inutile, loin de là, je pense qu’il pourra très bien se greffer à la sémantique émergente (ou vice versa). Je soutiens seulement que la création d’ontologies est l’affaire de tous et pas seulement celle des informaticiens — et que, si on le réalise, le web sémantique ne s’en portera que mieux.

  5. […] c’est alors que ça a débloqué.  Le résultat en a été le premier article de ce blog : idées pour un développement populaire du web sémantique.  Juste l’idée.  Pas une ligne de code, pas une image, zéro design — et même pas de […]

  6. enkerli on

    Me fait penser au passage, dans l’étude du langage, du réductionnisme syntaxique de Chomsky à la sémantique formelle qui peut par la suite être étendue à la pragmatique communicationnelle (Wilson et Sperber, par exemple), puis vers l’analyse conversationnelle et finalement à la sociolinguistique. C’était la réaction de Robin Tolmach (Lakoff) à qui j’ai parlé d’une linguiste qui quittait progressivement la grammaire générative de «la langue comme système en soi» vers quelque-chose de légèrement plus émergent.
    D’autres approches le langage directement à partir des usages, tels qu’inscrits dans la vie sociale, et ne se penchent sur le détail du sémantique qu’après avoir débroussaillé un ensemble de questions liées aux contextes communicationnels. Ethnographie de la communication (Dell Hymes) et linguistique variationniste (William Labov). Sans oublier la théorie de la performance (Richard Bauman) et le modèle de Roman Jakobson sur les fonctions de la communication.
    Donc, pour utiliser la distinction de Saussure, certains vont de la langue vers la parole, d’autres vont de la parole à la langue.

    En fait, il y a probablement une même distinction à faire dans le cadre du développement Web. Ceux qui «comprennent le social» (Twitter est justement un bon exemple, dans ce cas précis) tiennent en compte l’aspect «parole», la «langue» émerge des usages. Ceux qui rêvent d’un système algorithmique autonome, sans intervention humaine explicite (Google) peinent parfois à sortir du système en soi (langue) pour aller vers la fluidité des usages (paroles). Le «Web social», comme le décrit @SebPaquet, démontre l’importance d’ajouter à la linguistique computationnelle des années 1980 une approche sémiotique des années 1960.

  7. fredofromstart on

    Merci à Sébastien Paquet, qui a mentionné mon article dans son blog http://emergentcities.sebpaquet.net/ (voir : Blueprints for Networked Cocreation: 1. Intentcasting). C’est une série très intéressante à propos de l’émergence de nouvelles façons de faire les choses. De grandes choses, comme des entreprises ou des sociétés. Je la trouve particulièrement pertinente en ces temps de conflagrations qui se déchaînent tous azimuts.

    Je recommande de commencer par l’article du bas en montant, dans l’ordre que ça a été écrit.


Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :