Les fonctions d'une GED Open Source

fonctions ged open sourceNous listons ici les principales fonctions qu'on est en droit d'attendre d'une solution de GED Open Source.

Acquisition et numérisation

Tous les documents manipulés ne sont pas numériques. Il est donc important de disposer d'une chaîne de numérisation intégrée au cycle de vie des documents informatique.

Principe de la numérisation

Dans son sens le plus général, la numérisation est la transformation d'un élément réel en une suite de nombres permettant de le traiter informatiquement. 
Dans un cadre d'entreprise, la numérisation est souvent entendue comme la transformation d'un document papier (texte ou image) en document électronique.

L'acquisition peut s'effectuer par :

  • L'intégration de documents papiers existants : c'est, pour les documents papiers, la numérisation grâce à des scanners. Lorsque c'est possible et utile, les documents numérisés peuvent alors être triés via une technologie de RAD (Reconnaissance Automatique de Documents). Il est possible d'extraire des informations des images numérisées en mettant en œuvre une technologie de LAD (Lecture Automatique de Documents). Cette technologie peut utiliser des techniques d'OCR (Reconnaissance Optique de Caractères), de reconnaissance de codes à barres et d' ICR (Reconnaissance Intelligente de Caractères) comportant par exemple des règles de vérifications linguistiques sur les mots reconnus.

            Les documents papiers peuvent ensuite être détruits (soit parce qu'ils n'ont pas d'intérêt, soit parce que la valeur probante des copies électroniques est certaine) ou archivées. Attention cependant, pour ce qui est des archives publiques, la copie électronique de document n'autorise pas obligatoirement sa destruction…

  • L'intégration de documents électroniques existants : une autre famille de documents est constituée des documents électroniques comme les fichiers bureautiques, les fichiers PDF… Enfin, la dernière famille de documents intégrable est constituée des documents COLD (Computer Output To Laser Disc)  qui proviennent de systèmes d'éditique.
  • La production de documents électroniques : elle peut être le résultat d'une ou de plusieurs procédures gérées par différents agents de l'entreprise grâce à un logiciel d'informatique de groupe (groupware ou collecticiel). Le document peut aussi être obtenu par un logiciel d'informatique décisionnelle à partir d'un modèle disponible via l'outil.
  • L'échange de documents électroniques : il s'effectue lorsque deux organismes partenaires souhaitent partager des documents électroniques. Ils peuvent alors procéder à une interconnexion de leurs systèmes d'information par un dispositif d'EDI (Échange de Données Informatisé) moyennant le respect d'un même format de données normalisé.

Quel que soit le moyen par lequel le document intègre le système de gestion, il peut souvent passer par une chaîne de validation ou workflow afin d'aboutir à une version finale approuvée par les utilisateurs concernés. Le workflow lié à la validation d'un document est paramétrable et prend en compte les droits d'accès et les profils des utilisateurs du système ; il agit le plus souvent sur le statut, la version et la visibilité du document.

Objectifs de la numérisation

La numérisation ne peut pas être la copie exacte du document physique d'origine. Certaines des caractéristiques de ce document sont nécessairement perdues. 
Il faut plutôt considérer la numérisation comme l'extraction de la substantifique moelle d'un document. L'objectif final est de faciliter le traitement du contenu :

  • reconnaissance,
  • copie,
  • stockage,
  • indexation,
  • recherche.

Types d'éléments et procédés

Il est possible de numériser à peu près tous les éléments du monde réel, avec plus ou moins de précision et de possibilités de rematérialisation :

  • les textes et images peuvent être numérisés grâce à un scanner ou un appareil photo numérique,
  • les sons et vidéos peuvent être enregistrés à l'aide du matériel et des logiciels d'acquisition adéquats,
  • il existe même des scanners 3D qui permettent d'obtenir un modèle 3D d'un objet physique.

Formats d'enregistrement

Une fois numérisées, les données doivent être stockées pour pouvoir être utilisées. Les approches suivantes peuvent être considérées :

  • Le stockage des données numérisées brutes : cela permet de différer leur traitement, mais peut demander énormément d'espace de stockage. On privilégie ici les formats d'enregistrement sans perte (TIFF, WAV…),
  • le stockage des données traitées : on stocke par exemple le document PDF obtenu après traitement par reconnaissance de caractères. Si on souhaite effectuer d'autres traitements, il peut être nécessaire de renumériser l'élément physique,
  • le stockage de données numérisées compressées : on considère qu'une faible perte de données est acceptable pour économiser l'espace de stockage (formats JPEG, MP3…). 
    Quels que soient les fichiers considérés, il est recommandé d'opter pour des formats ouverts afin d'en assurer la pérennité.

Récupération des informations

Les données numérisées ne sont souvent pas exploitables telles quelles. 
Les documents texte sont souvent traités par un logiciel de reconnaissance de caractères. 
On peut également utiliser de la reconnaissance d'images. Certains logiciels de gestion de photographies permettent par exemple d'identifier les personnes présentes sur les photos avant leur stockage dans une banque d'images. 
Les sons peuvent passer par une étape de reconnaissance vocale.

Matériel nécessaire

Le matériel de numérisation est disponible dans toutes les gammes. Ainsi, les scanners vont du scanner à plat classique pour 50 € à des scanners ultra-rapides ou grand format dont le prix peut atteindre plusieurs milliers d'euros. 
Les besoins de l'organisation doivent donc être clairement définis pour dimensionner au mieux les investissements. 
Il faut parfois ajouter au matériel de numérisation pure, les logiciels de traitement des données numérisées.

Externalisation de la numérisation

La numérisation utilise du matériel et des logiciels coûteux. Elle nécessite aussi des procédures de vérification des documents numérisés. Les entreprises de taille réduite qui n'ont pas les ressources ou les moyens d'investir dans une solution de numérisation en interne peuvent préférer l'externalisation. 
Même si l'entreprise choisit d'opérer en interne, l'externalisation de la numérisation peut être intéressante lors de la mise en place d'une GED. Un prestataire dédié peut reprendre toutes les archives et les intégrer au système.

Classification des documents

Le principe d'une GED est de permettre la classification des documents selon des critères à définir cas par cas. Le système doit proposer des règles de tags, filtres et classification suffisamment flexibles pour permettre d'atteindre l'objectif.

Types de document

On définit des types de documents d'une GED comme on définit des types de contenus dans un CMS. Un type de document est définit par ses champs qui sont les métadonnées attachées au fichier. Un workflow de validation avec une gestion de droits complètent la définition du type de document. Dans certains cas on peut regrouper plusieurs fichiers en un seul document avec un seul jeu de métadonnées pour des recherches groupées.

Comme dans notre solution FlexiGED il est important que le jeu de métadonnées dépende du projet de GED à mettre en place. Nous parlons ici de données métiers propre à chaque projet. Il faut trouver le bon compromis entre la richesse d’informations, l’exploitation qui doit pouvoir en être faite, et la quantité de travail ou de développement que représente l’alimentation des métadonnées. En effet, s’il est parfois contre-productif d’obliger à saisir 15 métadonnées pour un document courant, certaines utilisations peuvent, au contraire, nécessiter des jeux de métadonnées importants.

Sans tomber dans la sur indexation (trop de métadonnées pour un type de document) ou l’indexation libre (nombre insuffisant de contrôles) la liste des métadonnées doit donc

  • permettre une indexation pertinente, qui reflète précisément les documents décrits tout en incitant les contributeurs à alimenter
  • couvrir l’ensemble des informations utiles à l’exploitation. La recherche bien entendu, mais également les processus et traitements appliqués aux documents tels que les alertes, la traçabilité, l’affichage…

Indexation manuelle

La notice (ou fiche) décrivant un document est souvent le premier point d’entrée des utilisateurs. C’est également ce formulaire qui est le plus utilisé par les contributeurs, puisqu’ils devront saisir de l’information.

Pour ce faire, et dans un souci d’ergonomie, de fiabilité et de productivité, les solutions de GED doivent faciliter la contribution, directement ou par le biais d’une intégration légère, par exemple :

  • copier/coller entre le document électronique et les métadonnées. Ceci est particulièrement pertinent lorsque le document électronique est issu d’une numérisation et qu’il est possible de le visualiser sur le même écran que la fiche d’indexation
  • aide à la saisie, dès que possible, par exemple :
    • des listes de contrôle qui permettent de fiabiliser le fond (sémantique) et la forme (orthographe notamment) de la saisie
    • des cases à cocher ou des boutons radio pour les choix multiples
    • des boîtes de dialogue adaptées aux tables des valeurs de référence (listes des choix possibles). Ceci pouvant aller de la simple liste déroulante, à des interfaces disposant d’une recherche avec autocomplétion ou d’une navigation (abécédaire, arbre) dans les valeurs de référence
    • suggestions pour un champ donné (cf « Induction de métadonnées »).

Indexation automatique et extraction de métadonnées

Il existe plusieurs modes d’extraction de métadonnées.

  • Récupération d’informations: Chaque fichier informatique est doté d’informations issues du système de gestion de fichiers. Certaines peuvent être pertinentes comme des métadonnées : le nom du fichier, les dates de création et de modification, sa taille, son emplacement… Les solutions de GED proposent de récupérer certaines de ces informations. Il est également possible, notamment dans le cadre d’une reprise d’historique, de les travailler de façon à reconstituer une indexation par mot clé, par exemple en décomposant l’emplacement ou la structure d’un nom sous forme d’une succession de termes qui serviront à l’indexation.
  • Extraction de données structurées: Certains formats de fichier disposent d’une structure lisible. C’est notamment le cas pour nombre de formats ouverts, ODF par exemple, mais également des formats MS Office, par le biais de leurs propriétés. Lorsque ces structures sont connues et documentées, il est possible d’utiliser des automates pour extraire les informations pertinentes directement depuis le fichier et les utiliser pour alimenter une fiche d’indexation.

 

Induction de métadonnées

Certaines solutions, les plus élaborées, permettent de déterminer automatiquement les métadonnées les plus pertinentes pour indexer un document.
Ce type d’induction de métadonnées est souvent réalisé par :

  • des outils de reconnaissance, qui retrouvent dans un document les chaînes de caractères présentes dans un référentiel pouvant être ajoutées à la notice
  • des outils statistiques, qui analysent les chaînes de caractères les plus présentes et donc potentiellement les plus représentatives
  • des outils sémantiques, capables d’extraire automatiquement les mots et expressions les plus pertinents, voire de reconnaître s’il s’agit de mot-clé, de date, du titre…

Ces différentes approches sont souvent combinées.
Les outils les plus évolués permettent, au prix d’une diminution de la pertinence d’indexation par rapport à l’indexation manuelle, de prendre en compte très rapidement, de très grandes quantités d’informations.

Partage des documents

Un des enjeux d'une GED est de permettre de partager un document, selon des droits à définir, sans duplication mais avec un contrôle de version et de suivi des modifications.

Contrôle de version

La gestion des versions d’un document est l’une des fonctions de la GED qui apporte un bénéfice important.
Généralement sans une Gestion Documentaire les utilisateurs se font des copies des fichiers qu'ils s'échangent par mail. La duplication sur le réseau et dans les différentes boites mail rend le suivi des version impossible.

La gestion des versions permet donc à la fois de tracer les évolutions d’un document, et, par un système de réservation (check-in/check-out), de garantir qu’un utilisateur ne puisse prendre la main sur un document et le modifier s’il est déjà en cours d’édition.

Réservation (check-in/check-out)

La réservation peut être implémentée de différentes façons, mais doit, dans tous les cas, garantir qu’un utilisateur qui fait une réservation verrouille le document jusqu’à la réalisation d’une condition. Cette condition est en général un check-in. On peut également envisager qu’un check-out soit libéré automatiquement au-delà d’un certain délai.

Techniquement, le check-out peut être réalisé automatiquement dès qu’un utilisateur ouvre un document et le check-in réalisé dès qu’il le ferme ; mais la réservation d’un document peut également impliquer que l’utilisateur sorte le document du système le temps de la modification et donc nécessiter un système déclaratif de la part de l’utilisateur.

Incrémentation des versions

En général, l’incrémentation des versions est un compteur automatique qui définit un numéro séquentiel à chaque version successive d’un document.
On peut également avoir des méthodes de calcul de l'incrémentation plus élaborées, par exemple pour prendre en compte les notions de versions mineures/majeures, ou des règles métiers préétablies, qui définissent la construction des numéros de version.
Dans tous les cas, l’historique des versions est conservé et il doit être possible de visualiser une version antérieure d’un document. Chaque modification de document doit donner lieu à une nouvelle version. Ces deux points sont essentiels pour la traçabilité globale du système de gestion documentaire.
Des règles de gestion particulières doivent pouvoir être déclenchées par rapport à des conditions issues du versionning, par exemple lors de la création d’une version majeure, ou selon le temps écoulé depuis la dernière version majeure ou encore selon l’identification des évolutions entre deux versions.

Recherches avancées

Bien sûr la classification sert avant tout à pouvoir retrouver les documents selon des critères personnalisés par utilisateur.

Achat comptabilité fournisseurs

Le processus « Achat – Comptabilité Fournisseurs » recouvre les différentes étapes de la demande d’achat au paiement, en passant par la commande d’achat et la facture fournisseur. Outre la dématérialisation de plusieurs documents dont la commande et la facture, le processus de validation d’un achat peut‐être fluidifié notamment avec la mise en place d’un Workflow.

De la demande d’achat à la commande d’achat

La commande d’achat est le résultat opérationnel d’une demande d’achat validée. Les critères de validation d’une demande d’achat sont multiples (pertinence, adéquation par rapport au budget, prix…) et impliquent plusieurs acteurs dans l’entreprise (hiérarchique, service achat, direction financière…). Chaque entreprise a ses propres règles de validation. L’utilisation d’un logiciel de Workflow fluidifie ce cheminement, avec par exemple des alertes générées lorsqu’un collaborateur ne valide pas dans le délai imparti.
Par ailleurs, une demande d’achat correctement constituée (bon article, bon fournisseur, bon prix …) facilite sa validation interne.

Dès que la demande d’achat reçoit son visa, elle est transformée en une commande pour être adressée au fournisseur selon le canal et le timing appropriés : un fichier PDF par e‐mail, un fichier EDI, un fax, un courrier postal, l’association d’un service de courrier ou de fax et de gestion des achats garantit de nombreuses économies.

Certaines entreprises utilisent aussi des plates‐formes d’E‐Procurement, qui couvrent les fonctions nécessaires au déroulement du processus vu ci‐dessus et offrent des fonctions complémentaires comme le sourcing de fournisseurs.

La facture fournisseur

La réception de la facture fournisseur engendre de nombreux traitements manuels : ouverture du courrier, circulation de la facture pour vérification, saisie dans la comptabilité fournisseur, établissement du bon à payer, paiement du fournisseur, archivage papier. Les pertes et erreurs fréquentes sont sources de litiges avec les fournisseurs. La dématérialisation de la facture fournisseur diminue considérablement ces litiges et accélère son traitement. Elle peut être réalisée grâce à la facturation électronique et/ou la numérisation de la facture papier. Les éléments nécessaires à la mise en oeuvre de la facturation électronique sont identiques à ceux décrits dans le chapitre concernant la facture client La majorité des factures fournisseurs étant reçues par courrier, la numérisation est la première étape vers la dématérialisation et l’automatisation du traitement des factures fournisseurs. La numérisation commence par le scan de la facture qui transforme la facture papier en une image dématérialisée. Elle s’effectue avec un scanner et un logiciel associé.

 

Archivages

La fin de vie d'un document correspond à son archivage qui peut même aller jusqu'à un archivage à valeur probante (coffre fort électronique)

Marketing

Dématérialiser le processus Marketing consiste à faciliter par le numérique la prospection pour générer de nouveaux clients et la fidélisation du parc de clients. La relation client riche de nombreuses actions générées via différents canaux : e‐mail, fax, téléphone ou courrier doit converger vers une plateforme numérique unique. Que ce soit dans les phases de prospection, de fidélisation ou d’après‐vente, l’entreprise souhaite, outre la traçabilité des différentes actions, garder une relation de confiance et de proximité avec ses clients. La GED et plus particulièrement la dématérialisation des processus marketing doivent aider à la fluidification, simplification et automatisation de ces tâches.

La prospection dans la GED

Comme évoqué ci‐dessus, la prospection exige une action régulière, associant les différents moyens mis à disposition pour communiquer avec les entreprises. Ces actions sont la plupart du temps chronophages et les ressources matérielles ou humaines nécessaires à leur réalisation peuvent être importantes. Pour éviter les pertes de temps lors de l’envoi d’un mailing courrier, une des pistes à envisager dans un processus de GED et de dématérialisation est l’externalisation : l’utilisateur crée son mailing, fait son publipostage avec la liste des destinataires puis lance son impression en sélectionnant une « imprimante virtuelle ». Une interface web s’ouvre alors et l’utilisateur peut choisir en ligne ses options d’envoi : type d’affranchissement ou d’enveloppe, couleur ou noir et blanc,
etc. L’impression, la mise sous pli, l’affranchissement et la remise en poste sont ensuite totalement automatisés et externalisés. Pour l’envoi de 500 courriers, cela peut représenter un gain de temps d’environ 2h30. En outre, la gestion des NPAI (N’habite Pas à l’Adresse Indiquée) est indispensable pour améliorer la qualité de la base de prospection. Elle doit être une fonctionnalité du service de courrier externalisé pour assurer l’efficacité et le ROI d’une action de prospection, tout comme la traçabilité qui aide les utilisateurs à suivre l’ensemble de leurs opérations. Lors du choix d’un prestataire de service courrier externalisé, il est intéressant également d’étudier les autres médias qu’il propose : e‐mail, fax, SMS afin de ne pas multiplier les fournisseurs pour les actions de prospection. Nous appellerons ce type de service « bureau de poste électronique privé » dans la suite du document.

La fidélisation dans la GED

Gagner un nouveau client est difficile, le conserver est donc un enjeu important pour les entreprises, qui doivent imaginer régulièrement des processus de fidélisation.
Dans la boîte à outils des actions de fidélisation client, on trouve deux éléments primordiaux : la base de données et le CRM où sont enregistrées les informations clés propres à chaque client : adresse, dernier achat ou encore secteur d’activité. Le CRM peut être vu comme un élément essentiel de la dématérialisation de la relation clients dans la GED. Ces renseignements ainsi que leur traçabilité améliorent les futurs échanges en les personnalisant en fonction du client.
Un mix de moyens dématérialisés et de moyens papiers, doit être utilisé pour garder un contact régulier. Un progiciel de gestion client complété par un bureau de poste électronique privé offre une meilleure personnalisation des moyens de communication. L’envoi d’un SMS et/ou d’un e‐mail, pour informer d’une promotion sur un produit susceptible d’intéresser
le client, est un exemple de cette complémentarité. Le numéro de mobile et l’e‐mail sont conservés dans le progiciel de gestion client (CRM), et l’envoi est réalisé grâce au bureau de poste électronique privé.

 

 

Workflows et cycle de vie

Un document est une pièce vivante qui subit des altérations par divers acteurs selon un workflow et des droits à définir.

A noter aussi la possibilité de s'interconnecter avec un CMS avec le format cmis 2024 et de façon générale la capacité de fonctionner avec d'autres produits ou systèmes existants.

784

Pour aller plus loin ...

  • Gestion des droits et accès dans une GED Open Source:

    La gestion des droits passe, le plus souvent, par l’association d’autorisations sur des éléments de la base documentaire. Ces autorisations permettent de définir un ensemble de droits pour un utilisateur ou un groupe d’utilisateurs.La gestion des droits passe aussi par une granularité des droits et contrôles d'accès des profils. Dans certains cas ils héritent des paramètres issus d'un annuaire LDAP en SSO.