Le référentiel de classement

Parmi les fonctions essentielles d'une bonne Gestion Documentaire (Open Source ou propriétaire) il faut définir un référentiel de classement soit un ensemble structuré de mots clés ou d’expressions. On parle aussi de « vocabulaires » métiers.

Lexique

Il s’agit d’une liste des termes utiles dans un contexte donné et organisé le plus souvent par ordre alphabétique. Il est parfois possible d'en donner une définition.

Plan de classement

Un plan de classement est un ensemble de termes hiérarchisés logiquement les uns par rapport aux autres. Il s’agit du référentiel utilisé pour réaliser des classements physiques (papier ou autres). Dans notre solution FlexiGED ces termes permettent de définir des profils documentaires ou facettes (voir plus bas). Dans un usage électronique, il devient possible d’affecter plusieurs termes du plan de classement à un même document, ce qui donne autant de « clés » pour le retrouver. Une catégorisation multiple donc.

Thésaurus

En plus de la structure logique et hiérarchique du plan de classement, le thésaurus introduit plusieurs notions permettant d’enrichir l’utilisation du référentiel documentaire. Le thésaurus est un ensemble de termes parfaitement définis, sur lequel on s’appuie dans un domaine d’application particulier.

Utilisation des référentiels

Les objectifs principaux des référentiels de classement visent à faciliter l’usage de la base documentaire, notamment en réduisant le bruit et le silence lors de recherche ou d’autres types d’exploitations.
La navigation par arborescence permet à l’utilisateur de retrouver un document selon une logique hiérarchique, voire plusieurs logiques hiérarchiques différentes.
Nous parlerons alors de « facettes ». Pour illustrer, c’est comme si on proposait à l’utilisateur les mêmes objets (le fonds documentaire) selon plusieurs points de vue (les facettes).

Dans FlexiGED chaque utilisateur dispose de sa propre arborescence non plus de documents mais de filtres de recherche, selon ses besoins et ses habitudes de travail. AU lieu d'une arborescence unique et figée et qui ne correspond pas forcément aux besoins de tous, on propose ainsi des vues personnalisées (les facettes).
Ainsi, si un contenu est référencé, catégorisé selon /Europe/France/Paris, mais également selon /Etablissements/Restaurants/Trois-Etoiles, l’utilisateur pourra parvenir à ce contenu par une navigation correspondante à la logique (ou « facette ») géographique, ou bien à la logique (ou « facette ») gastronomique. Cette approche est très puissante, puisqu’elle propose à chaque utilisateur une vision et une exploitation de la base documentaire qui correspond à son usage.

Gestion multi référentiels

Dans un contexte professionnel, on est souvent amené à présenter une même information à différents publics. On doit parfois gérer plusieurs ensembles de vocabulaires contrôlés. Par exemple : une liste de mots-clés et une liste d’unités organisationnelles.
La gestion de multi référentiels impose de gérer certains cas complexes tels que les homonymies, les liens entre référentiels, etc. La plupart des applications GED étudiées disposent d’un seul référentiel de classement complexe (lorsqu’elles en disposent), il est donc important de valider la cohabitation de plusieurs référentiels si ce point est important dans votre contexte projet.

Outil de recherche

Les relations des référentiels peuvent être utilisées de différentes façons par le moteur de recherche.

Expansion de requêtes

Une exploitation possible de référentiels riches est de permettre la définition de l’environnement sémantique d’un terme. Certains moteurs de recherche sont ainsi capables « d’étendre la recherche » automatiquement en utilisant les relations indiquées dans le référentiel.
Par exemple, en indiquant automatiquement avec un « OU booléen » qu’une recherche faite sur le terme « voiture » concerne également tout ce qui parle de « automobile », de « bagnole »... Ainsi, tous les documents qui contiennent ces termes seront effectivement dans les résultats de recherche (réduction du silence).
Le moteur peut également étendre la requête par proximité sémantique, par exemple entre pêcheur, bateau, poisson...
Les « expanseurs » de requête peuvent également reposer sur des analyseurs syntaxiques ou sémantiques, qui construisent automatiquement des dictionnaires de correspondance à partir de l’analyse des documents indexés.

Suggestion à l’utilisateur

L’analyse des mots-clés du référentiel trouvés dans les fiches des réponses à une requête donne une autre occasion d’exploiter les référentiels existants.
Par exemple, en proposant à l’utilisateur des termes proches de ceux trouvés le plus fréquemment dans les résultats de sa recherche.
Ce type d’utilisation est souvent plus riche lorsqu’on utilise un moteur syntaxique ou sémantique pour réaliser ces associations de mots-clés.

Représentation en cluster

Il s’agit ici de ranger un ensemble de documents selon une arborescence de mots-clés en rapport avec ces documents.
Lorsque le regroupement est fait à partir d’une liste préétablie de valeurs dans un ou plusieurs champs, on parle de catégorisation.
Le terme de cluster est généralement réservé aux solutions qui proposent un calcul dynamique basé sur l’analyse de termes présents dans les documents eux-mêmes.
Ce type de fonction est, par exemple, utilisé pour représenter des résultats de recherche sous la forme d’une arborescence structurée par thème ou par domaine. Ainsi, l’utilisateur verra immédiatement les thématiques représentées dans les documents trouvés et pourra, le cas échéant, préciser sa requête en ajoutant ou excluant certains termes du cluster.
La recherche est l’un des domaines ou l’énergie est la plus palpable, à la fois en terme d’innovation que d’attentes des utilisateurs. Les solutions, y compris open source, ne s’y trompent pas et propose de plus en plus de fonctions avancées sur cet aspect.

Référentiel de classement