veblog

liste de diffusion | contact

 accueil > archives > systèmes d'information > des systèmes pour gérer l'overdose d'information


liens associés

ailleurs sur le web
quelques systèmes coûteux de gestion d'information en réseau:
oracle IFS
instranet
documentum

Bruce Tognazzini (www.asktog.com) évoque certaines évolutions souhaitables des systèmes d'exploitation du futur, tout en regrettant qu'apple n'en soit pas l'initiateur.
"
apple squandering the advantage"

Futur des réseaux : Des systèmes pour gérer l'overdose d'information
et contribuer à partager la connaissance dans l'entreprise
page créée le 14 octobre 2000
réagir à cet article

résumé: les interfaces homme-ordinateur devront fortement évoluer pour aider les utilisateurs à gérer la masse des informations disponibles dans un système en réseau. Comment ? Voici quelques reflexions d'un utilisateur "de base" sur les systèmes d'exploitation du futur.

Les limites des systèmes d'exploitation actuels

Les principes des interfaces-utilisateur des ordinateurs actuels sont issus des travaux de Xerox et d'Apple au début des années 80, visant à rendre accessible l'ordinateur à des non spécialistes grâce à une innovation géniale : l'interface graphique à base de fenêtres et de manipulation d'objets graphiques (des icônes) par le biais d'un nouveau périphérique, la souris.

En revanche, la gestion des documents par ces systèmes d'exploitation a peu évolué par rapport à la génération précédente des systèmes d'exploitation "à ligne de commande", comme MS-DOS: les documents sont des "fichiers" contenus dans des "dossiers" correspondant au découpage en zones physiques d'un ou plusieurs périphériques de stockage.

Cette organisation était adaptée à l'informatique de l'époque: peu de mémoire, disques durs petits et chers, et ordinateurs purement individuels. Chaque utilisateur gérait en général un nombre assez restreint de documents "vivants", un nombre limité de types de fichiers différents, et ne partageait pas grand chose avec son voisin, tant les moyens du partage (l'échange de disquettes...) étaient rudimentaires.

L'apparition des réseaux locaux, puis l'accès à des réseaux de réseaux (intranets,extranets, internet...), et l'augmentation exponentielle des capacités individuelles et collectives de stockage, ont provoqué une inflation du nombre de fichiers auxquels chaque individu a accès. Comment gérer une telle masse d'information ? L'informatique "classique " trouve ici ses limites. Quelques exemples:

  • Vous avez sûrement vécu cette expérience: tenter de retrouver, sur votre machine , ou pire, sur celle d'un de vos collègues, un document auquel vous n'avez pas touché depuis plusieurs mois - Où est il ? comment s'appelait-il ? à quelle date approximative a-t-il été créé ? Parfois, retrouver un simple document peut prendre un temps précieux et non directement rentable... Les fonctions de recherche ajoutées aux systèmes actuelles sont trop rudimentaires pour être vraiment efficaces en toute circonstance.
  • Le document que vous lisez est il bien le document définitif, ou s'agit il d'une version de travail ? Qui en est l'auteur, qui l'a corrigé ?
  • Quel est ce format de fichier ? Pourquoi un document mac s'ouvre-t-il mal sur un PC ? Quel logiciel me permettrait de visualiser ce document ? pourquoi les différentes versions de word ne sont elles pas compatibles entre elles ? etc.... Les problèmes de format de fichier sont, d'expérience, la principale source de perte de temps (et donc de coût) en cas d'échange de document inter utilisateurs dans les structures qui n'ont pas "réfléchi" leur informatique en réseau.
  • qui a produit de l'information sur tel ou tel sujet ? Comment les savoirs sont ils capitalisés dans l'entreprise ?

Comment l'informatique et les systèmes d'exploitation ("OS") du futur pourraient ils nous aider à résoudre ces problèmes ?

Actuellement, les entreprises qui cherchent à gérer l'information de façon moderne sont obligées d'acheter des systèmes de gestion documentaire très coûteux pour espérer le résoudre, plus ou moins bien (Oracle Internet File system, Documentum, Instranet, etc...). De plus, ces systèmes étant complexes, elles doivent très fortement investir dans la formation et les changements culturels de leur société. Enfin, la liaison entre ces logiciels et les outils les plus classiques (word, excel, photoshop, etc...) n'est pas "naturelle" et pose donc des problèmes en utilisation quotidienne.

Cette approche, fondée sur l'ajout d'une couche logicielle lourde sur des systèmes d'exploitation dépassés, est fondamentalement mauvaise. C'est en amenant au niveau du système d'exploitation du réseau et de chaque machine, les fonctions de base destinées à faciliter la gestion de l'information, que l'on parviendra à valoriser la production documentaire de chaque structure. Voyons comment.


Le "file manager" doit mourir. Vive la base de données !

Aujourd'hui, pour retrouver un document, vous devez soit vous souvenir de son "emplacement" (disque dur local ou réseau/ dossier/sous-dossier/sous-sous dossier/ fichier) , soit vous souvenir vaguement d'un détail par rapport à ce document en priant pour que la fonction "rechercher" de votre système vous donne l'emplacement du bon document à partir de ce détail. L'utilisabilité de ce type de classement est faible car peu d'utilisateurs savent, intuitivement, définir une organisation efficace de l'arborescence de leurs dossiers, ou de bonnes règles de nommage de leurs fichiers. De plus, lorsque l'on aborde la dimension collective du stockage, deux utilisateurs différents n'ont jamais les mêmes conventions d'organisation de leurs fichiers: dans ces conditions, l'efficacité du partage documentaire est limitée.

Il faut en finir avec la métaphore de "l'emplacement" pour retrouver un document. Un document doit pouvoir être retrouvé par ses caractéristiques, sans que l'endroit où il se trouve physiquement sur un disque dur n'entre en ligne de compte: je dois pouvoir retrouver "une note sur la pollution atmosphérique, version initiale, écrite par mon collègue machin, vers le premier semestre 99, dans laquelle les mots clés "capteurs" et "alerte" ont de fortes chances de figurer".

Le management des fichiers doit donc être confié à une vraie base de données réseau et non à un gestionnaire d'emplacements de fichiers bâti sur le modèle d'une armoire à casiers. Le fonctionnement de cette base doit être transparent à l'utilisateur de base. Pour ce faire, quelques conditions doivent être remplies:

1- Les "données de description" attachées à chaque fichier (les spécialistes parlent de méta-données ou de données d'indexation) doivent être générées à la création du fichier, automatiquement lorsque cela est possible (nom du créateur, date de création, numéro de version du document, logiciel créateur, format,etc...) , et l'utilisateur doit être contraint de saisir les données non automatisables (titre du document, mots clés, type de document, etc...) au premier enregistrement du document, en répondant à des questions en bon français via un formulaire simple. Petite contrainte, certes, mais qui permet de gagner énormément d'efficacité par la suite.

Les données à renseigner doivent être les mêmes pour tout document produit par la structure, ce qui suppose qu'un modèle de description documentaire unifié soit créé et accessible pour tous les utilisateurs du réseau de l'entreprise. Certains éléments de ce modèle peuvent être standardisés, d'autres personnalisés en fonction des spécificités de chaque organisation. Tous les logiciels utilisés doivent se référer à ce modèle documentaire à l'enregistrement de tout fichier : le système d'exploitation doit être celui du réseau, pas une somme d'OS individuels auxquels quelques fonctions de partage de fichiers ont été maladroitement greffées.

2- Pour que les données soient collectives, les volumes de stockage doivent être collectifs. La notion de disque dur individuel n'a plus d'utilité dans une informatique en réseau. Un ordinateur, çà tombe en panne, çà se change, et aucune donnée ne doit être perdue pour cela. Les postes individuels ne devront conserver un disque dur que pour le stockage de fichiers temporaires nécessaires au fonctionnement de la machine, et pour la conservation de documents strictement personnels. cela devrait réduire le coût de chaque poste, et les stockages collectifs intègrent à moindre coût des fonctions de fiabilisation ("RAID") inaccessibles aux disques individuels.

3- Plus de stockage amovible dans un tel système. La disquette, le CD ROM ou la bande DAT n'ont que peu d'intérêt opérationnel dans une telle optique, sauf pour quelques sauvegardes journalières de documents particulièrement sensibles. Les stockages amovibles ne sont définitivement pas un bon moyen de stocker des informations dans l'optique de les rendre vivantes, puisqu'ils posent le problème de connaître "l'emplacement géographique" (sur quel support? Où est il rangé ?) de ces informations.

4- Si toutes les données non temporaires sont stockées de façon centralisée, la notion de poste individuel peut s'effacer derrière celle de "session utilisateur": quel que soit le poste d'où l'on travaille, on retrouve en s'identifiant ses fichiers, ses préférences, ses logiciels, ses droits d'accès, ses modèles, etc...

De nouveaux objets doivent apparaître, tous reliés entre eux

Les systèmes actuels ne gèrent que deux types d'objet: les "fichiers" et les "dossiers". De plus, ils ont une gestion particulièrement pauvre des objets composites, comme une page html contenant des images, ou texte word établi à partir de plusieurs contributions, et incluant des schémas créés dans photoshop. Actuellement, quand vous enregistrez ce document word, l'image se retrouve "prisonnière" du document sans qu'aucune indication ne permette d'en retrouver la source, le format originel, et les origines des différents textes source sont également perdues. Quant à connaître les contributeurs....

Il parait souhaitable que les futurs OS soient capables de gérer un fichier composite en conservant des "liens", des relations avec toutes les sources qui le composent, y compris si ces sources ont été altérées ou adaptées à leur nouvelle destination (par exemple, une image photoshop transformée en gif pour être intégrée à une page web) . L'utilisateur, dans son traitement de texte, devrait pouvoir retravailler l'image avec un logiciel adapté, et importer les modifications dans le document final. La conservation des liaisons entre les objets "pères" et "fils" ferait gagner un temps considérable lors de la réalisation de travaux répétitifs, ou de transformation de travaux anciens.

D'autres objets pourraient également faire leur apparition, comme les "albums", contenant des objets (ou des copies, ou des liens...) se rapportant à un sujet défini par l'utilisateur: par exemple, toute la production interne de l'entreprise sur les évolutions de son site web (études, notes de services, rapports statistiques, compte rendus de direction, maquettes, etc...). La fabrication de ces albums serait grandement facilitée par des fonctions de recherche appropriées.

Enfin, les objets ainsi créés (fichiers simples, fichiers composites, albums) doivent pouvoir faire l'objet d'un suivi de numéro de version ("versionning", anglicisme hideux...) automatisé, configurable en fonction de l'espace disque disponible, permettant de revenir en arrière en cas d'erreur, ou de gérer deux évolutions divergentes d'un même produit (deux projets concurrents établis à partir de sources identiques par exemple).

La fin des formats de fichiers propriétaires ?

Une telle gestion intégrée de fichiers de type composite nécessite que les différents formats de fichiers puissent s'imbriquer les uns dans les autres aisément. Les formats propriétaires, dont les spécifications changent avec chaque version de logiciel (ah, les fichiers .doc de word incompatibles d'une version à l'autre, quel bonheur...) sont inadaptés à cette évolution. Il faudra donc que les systèmes d'exploitation du futur gèrent de façon native des formats de description de données à la fois ouverts et aussi "universels" que possible. Dans cette optique, une gestion native, et transparente par le système du format XML et de ses dérivés parait être la meilleure solution. Les différents logiciels seraient contraints d'utiliser les modèles XML disponibles sur le réseau (et pourraient en rajouter) pour décrire les données qu'ils produisent et les transformation qu'ils leur font subir. (Pour en savoir plus sur XML, en français, suivez ce lien)

De meilleurs outils de recherche documentaire intégrés.

À l'explorateur windows ou au finder d'apple devront succéder des outils adaptés à la disparition du stockage "par emplacements" et créés pour gérer le repérage d'un document par ses caractéristiques, un peu sur le modèle des recherches progressivement resserrées d'altavista, mais en plus utilisable. Le meilleur type d'outil que j'aie vu fonctionner pour ce genre de recherche est Umap de la société Trivium, même si je n'aime pas son approche graphique. Ce type d'outil permet de retrouver une aiguille dans un océan documentaire en resserrant progressivement le périmètre des recherches "à la volée" à partir de critères d'indexation proches du langage naturel. Toutefois, l'ergonomie de ce type d'outil de recherche reste à améliorer et à intégrer à l'OS pour en favoriser l'acceptation par de simples utilisateurs.

Certifier l'information: un problème clé.

Parmi les méta-données attachées à chaque document, une ou plusieurs devront permettre de gérer des "certificats de qualité de l'information" dont les règles de gestion (durée de vie, règles de prolongation, etc...) devront être strictement encadrées. Un système moderne devra permettre à l'administrateur des données de l'entreprise de définir des règles de péremption, d'archivage, ou au moins d'alertes permettant de favoriser une bonne tenue dans le temps de la qualité des informations présentes dans le réseau de l'entreprise: l'information que je lis est elle à jour ? est-ce la dernière version ? Qui en est responsable ? qui a le droit de modifier cette information ? puis-je réutiliser cette information ? Une information périmée doit elle être détruite ou archivée ? Comment distinguer les archives du reste ?...

Le système ne devra pas se substituer aux individus pour décider de la qualité d'une information mais devra donner des outils à la fois simples et puissants aux utilisateurs pour "faire le ménage" régulièrement. Le système pourra utilement intégrer des fonctions simples d'aide au "rating" (cotation qualitative) de l'information.

Si cette qualité de l'information n'est pas correctement gérée, alors la bonne information sera noyée sous le "bruit de fond" et les surcoûts induits par ce phénomène seront très élevés.

Conclusion

L'énumération de toutes les fonctionnalités ci-dessus peut faire peur et amener certains à se demander si un tel système ne tournerait pas à l'usine à gaz. Mais je pense au contraire que correctement conçus, de tels systèmes d'exploitation apporteraient une qualité de travail jusqu'ici inconnue des utilisateurs d'informatique, à condition que les fonctions les plus complexes (définition des modèles documentaires, des règles d'archivage, des règles de certification de l'information,etc...) soient centralisées et tenues par un petit nombre d'administrateurs hautement qualifiés. A contrario, les utilisateurs finaux disposeraient d'un grand nombre d'aides au classement automatisées et transparentes de l'information qui amélioreraient à coup sur grandement leur productivité.

Qui fera progresser nos systèmes d'exploitation dans cette voie ? Microsoft, Apple, Oracle, Be, Eazel-Linux ? ou un tel modèle heurte-t-il trop de conservatismes pour voir le jour ? Qui vivra verra. Et en attendant, j'en rêve.


contact: vincent@veblog.comliste de diffusion

©informations légales & vie privée

accueil - haut de page

statistiques par