Common Tag Standard : un standard sémantique pour le tagging

Le web sémantique vient à se concrétiser par plusieurs projets, en ce moment. Le projet Common Tag met sur le tapis le gros problème des tags. Les tags peuvent, en effet, s'écrire de manière différente pour une même signification.

Au lieu de considérer le marquage comme la pose d’un mot-clé sur une ressource, avec tous les problèmes connus que cela comporte (homonymie, ambiguité, synonymie, langues multiples), on considère que derrière le tag (le libellé en langage naturel, une chaine de caractères) se cache un concept qui lui peut être défini de façon formelle dans l’univers RDF, typiquement défini par une URI décrite dans un vocabulaire contrôlé.

Si la signification des tags est unifié et que leur format est standardisé ; on peut imaginer des relations facilités entre deux services.

Sur le site de Common Tag, on peut lire que le format a été développé pour dépasser les limitations du tagging et pour aider tout le monde, les utilisateurs finaux, les éditeurs, et les développeurs, à mieux profiter de leurs contenus. Avec Common Tag, le contenus est taggué avec un concept unique et bien défini. Tout ce qui se rapporte à Saint Malo est taggué avec le concept de Saint Malo, et tout ce qui se rapporte à une orange est taggué avec l’orange en tant que fruit. Common Tag donne également accès à des métadonnées utiles qui définissent chaque concept et décrivent comment les concepts sont liés les uns aux autres. Les métadonnées pour le tag Nicolas Sarkozy indiquent par exemple qu’il est président de l’Etat Français et qu’il est marié à Carla Bruni Sarkozy.

Problème récurrent, le multilinguisme, mais ceci n'empêchera pas les avancées. Fabrice Epelboin complète son article par un dernier commentaire :

Avec Common Tag, comme le souligne Hubert, la véritable innovation provient avant tout de la stature des acteurs réunis autour du projet Common Tag, c’est une étape importante d’un point de vue Biz, même si ce type de projet n’est pas une première, celui ci à infiniment plus de chances de survivre que les autres précités.
Il ne faut pas perdre de vue non plus qu’à ce jeu, en face, il y a essentiellement OpenCalais de Reuters, c’est donc à une confrontation Yahoo! & friends vs. Reuters & le monde de l’information (et par extension, des média) à laquelle nous avons à faire. Si le web de demain est sémantique, c’est une bataille majeure qui est en train de se mener. Si la sémantique est juste un truc de geeks excités, c’est juste un truc parmi d’autre. Inutile de vous dire de quel coté je penche. Le fait que Reuters investisse lourdement le secteur me conforte dans mon opinion.