|
Le
"file manager" doit mourir. Vive la base de
données !
Aujourd'hui,
pour retrouver un document, vous devez soit vous
souvenir de son "emplacement" (disque dur local ou
réseau/ dossier/sous-dossier/sous-sous
dossier/ fichier) , soit vous souvenir vaguement
d'un détail par rapport à ce document
en priant pour que la fonction "rechercher" de
votre système vous donne l'emplacement du
bon document à partir de ce détail.
L'utilisabilité de ce type de classement est
faible car peu d'utilisateurs savent,
intuitivement, définir une organisation
efficace de l'arborescence de leurs dossiers, ou de
bonnes règles de nommage de leurs fichiers.
De plus, lorsque l'on aborde la dimension
collective du stockage, deux utilisateurs
différents n'ont jamais les mêmes
conventions d'organisation de leurs fichiers: dans
ces conditions, l'efficacité du partage
documentaire est limitée.
Il
faut en finir avec la métaphore de
"l'emplacement" pour retrouver un document. Un
document doit pouvoir être retrouvé
par ses caractéristiques, sans que l'endroit
où il se trouve physiquement sur un disque
dur n'entre en ligne de compte: je dois pouvoir
retrouver "une note sur la pollution
atmosphérique, version initiale,
écrite par mon collègue machin, vers
le premier semestre 99, dans laquelle les mots
clés "capteurs" et "alerte" ont de fortes
chances de figurer".
Le
management des fichiers doit donc être
confié à une vraie base de
données réseau et non à un
gestionnaire d'emplacements de fichiers bâti
sur le modèle d'une armoire à
casiers. Le fonctionnement de cette base doit
être transparent à l'utilisateur de
base. Pour ce faire, quelques conditions doivent
être remplies:
1-
Les "données de description"
attachées à chaque fichier (les
spécialistes parlent de
méta-données ou de données
d'indexation) doivent être
générées à la
création du fichier, automatiquement
lorsque cela est possible (nom du
créateur, date de création,
numéro de version du document, logiciel
créateur, format,etc...) , et
l'utilisateur doit être contraint de
saisir les données non automatisables
(titre du document, mots clés, type de
document, etc...) au premier enregistrement du
document, en répondant à des
questions en bon français via un
formulaire simple. Petite contrainte, certes,
mais qui permet de gagner
énormément d'efficacité par
la suite.
Les
données à renseigner doivent
être les mêmes pour tout document
produit par la structure, ce qui suppose
qu'un modèle de description documentaire
unifié soit créé et
accessible pour tous les utilisateurs du
réseau de l'entreprise. Certains
éléments de ce modèle
peuvent être standardisés, d'autres
personnalisés en fonction des
spécificités de chaque
organisation. Tous les logiciels utilisés
doivent se référer à ce
modèle documentaire à
l'enregistrement de tout fichier : le
système d'exploitation doit être
celui du réseau, pas une somme d'OS
individuels auxquels quelques fonctions de
partage de fichiers ont été
maladroitement greffées.
2-
Pour que les données soient
collectives, les volumes de stockage doivent
être collectifs. La notion de disque
dur individuel n'a plus d'utilité dans
une informatique en réseau. Un
ordinateur, çà tombe en panne,
çà se change, et aucune
donnée ne doit être perdue pour
cela. Les postes individuels ne devront
conserver un disque dur que pour le stockage de
fichiers temporaires nécessaires au
fonctionnement de la machine, et pour la
conservation de documents strictement
personnels. cela devrait réduire le
coût de chaque poste, et les stockages
collectifs intègrent à moindre
coût des fonctions de fiabilisation
("RAID") inaccessibles aux disques
individuels.
3-
Plus de stockage amovible dans un tel
système. La disquette, le CD ROM ou
la bande DAT n'ont que peu
d'intérêt opérationnel dans
une telle optique, sauf pour quelques
sauvegardes journalières de documents
particulièrement sensibles. Les stockages
amovibles ne sont définitivement pas un
bon moyen de stocker des informations dans
l'optique de les rendre vivantes, puisqu'ils
posent le problème de connaître
"l'emplacement géographique" (sur quel
support? Où est il rangé ?) de ces
informations.
4-
Si toutes les données non temporaires
sont stockées de façon
centralisée, la notion de poste
individuel peut s'effacer derrière celle
de "session utilisateur": quel que soit le
poste d'où l'on travaille, on retrouve en
s'identifiant ses fichiers, ses
préférences, ses logiciels, ses
droits d'accès, ses modèles,
etc...
De
nouveaux objets doivent apparaître, tous
reliés entre eux
Les
systèmes actuels ne gèrent que deux
types d'objet: les "fichiers" et les "dossiers". De
plus, ils ont une gestion particulièrement
pauvre des objets composites, comme une page html
contenant des images, ou texte word établi
à partir de plusieurs contributions, et
incluant des schémas créés
dans photoshop. Actuellement, quand vous
enregistrez ce document word, l'image se retrouve
"prisonnière" du document sans qu'aucune
indication ne permette d'en retrouver la source, le
format originel, et les origines des
différents textes source sont
également perdues. Quant à
connaître les contributeurs....
Il
parait souhaitable que les futurs OS soient
capables de gérer un fichier composite en
conservant des "liens", des relations avec toutes
les sources qui le composent, y compris si ces
sources ont été
altérées ou adaptées à
leur nouvelle destination (par exemple, une image
photoshop transformée en gif pour être
intégrée à une page web) .
L'utilisateur, dans son traitement de texte,
devrait pouvoir retravailler l'image avec un
logiciel adapté, et importer les
modifications dans le document final. La
conservation des liaisons entre les objets
"pères" et "fils" ferait gagner un temps
considérable lors de la réalisation
de travaux répétitifs, ou de
transformation de travaux anciens.
D'autres
objets pourraient également faire leur
apparition, comme les "albums", contenant des
objets (ou des copies, ou des liens...) se
rapportant à un sujet défini par
l'utilisateur: par exemple, toute la production
interne de l'entreprise sur les évolutions
de son site web (études, notes de services,
rapports statistiques, compte rendus de direction,
maquettes, etc...). La fabrication de ces albums
serait grandement facilitée par des
fonctions de recherche
appropriées.
Enfin,
les objets ainsi créés (fichiers
simples, fichiers composites, albums) doivent
pouvoir faire l'objet d'un suivi de numéro
de version ("versionning", anglicisme hideux...)
automatisé, configurable en fonction de
l'espace disque disponible, permettant de revenir
en arrière en cas d'erreur, ou de
gérer deux évolutions divergentes
d'un même produit (deux projets concurrents
établis à partir de sources
identiques par exemple).
La
fin des formats de fichiers propriétaires
?
Une
telle gestion intégrée de fichiers de
type composite nécessite que les
différents formats de fichiers puissent
s'imbriquer les uns dans les autres
aisément. Les formats propriétaires,
dont les spécifications changent avec chaque
version de logiciel (ah, les fichiers .doc de word
incompatibles d'une version à l'autre, quel
bonheur...) sont inadaptés à cette
évolution. Il faudra donc que les
systèmes d'exploitation du futur
gèrent de façon native des formats de
description de données à la fois
ouverts et aussi "universels" que possible. Dans
cette optique, une gestion native, et transparente
par le système du format XML et de ses
dérivés parait être la
meilleure solution. Les différents logiciels
seraient contraints d'utiliser les modèles
XML disponibles sur le réseau (et pourraient
en rajouter) pour décrire les données
qu'ils produisent et les transformation qu'ils leur
font subir. (Pour en savoir plus sur XML, en
français, suivez
ce lien)
De
meilleurs outils de recherche documentaire
intégrés.
À
l'explorateur windows ou au finder d'apple devront
succéder des outils adaptés à
la disparition du stockage "par emplacements" et
créés pour gérer le
repérage d'un document par ses
caractéristiques, un peu sur le
modèle des recherches progressivement
resserrées d'altavista, mais en plus
utilisable. Le meilleur type d'outil que j'aie vu
fonctionner pour ce genre de recherche est Umap de
la société Trivium, même si je
n'aime pas son approche graphique. Ce type d'outil
permet de retrouver une aiguille dans un
océan documentaire en resserrant
progressivement le périmètre des
recherches "à la volée" à
partir de critères d'indexation proches du
langage naturel. Toutefois, l'ergonomie de ce type
d'outil de recherche reste à
améliorer et à intégrer
à l'OS pour en favoriser l'acceptation par
de simples utilisateurs.
Certifier
l'information: un problème
clé.
Parmi
les méta-données attachées
à chaque document, une ou plusieurs devront
permettre de gérer des "certificats de
qualité de l'information" dont les
règles de gestion (durée de vie,
règles de prolongation, etc...) devront
être strictement encadrées. Un
système moderne devra permettre à
l'administrateur des données de l'entreprise
de définir des règles de
péremption, d'archivage, ou au moins
d'alertes permettant de favoriser une bonne tenue
dans le temps de la qualité des informations
présentes dans le réseau de
l'entreprise: l'information que je lis est elle
à jour ? est-ce la dernière version ?
Qui en est responsable ? qui a le droit de modifier
cette information ? puis-je réutiliser cette
information ? Une information périmée
doit elle être détruite ou
archivée ? Comment distinguer les archives
du reste ?...
Le
système ne devra pas se substituer aux
individus pour décider de la qualité
d'une information mais devra donner des outils
à la fois simples et puissants aux
utilisateurs pour "faire le ménage"
régulièrement. Le système
pourra utilement intégrer des fonctions
simples d'aide au "rating" (cotation qualitative)
de l'information.
Si
cette qualité de l'information n'est pas
correctement gérée, alors la bonne
information sera noyée sous le "bruit de
fond" et les surcoûts induits par ce
phénomène seront très
élevés.
Conclusion
L'énumération
de toutes les fonctionnalités ci-dessus peut
faire peur et amener certains à se demander
si un tel système ne tournerait pas à
l'usine à gaz. Mais je pense au contraire
que correctement conçus, de tels
systèmes d'exploitation apporteraient une
qualité de travail jusqu'ici inconnue des
utilisateurs d'informatique, à condition que
les fonctions les plus complexes (définition
des modèles documentaires, des règles
d'archivage, des règles de certification de
l'information,etc...) soient centralisées et
tenues par un petit nombre d'administrateurs
hautement qualifiés. A contrario, les
utilisateurs finaux disposeraient d'un grand nombre
d'aides au classement automatisées et
transparentes de l'information qui
amélioreraient à coup sur grandement
leur productivité.
Qui
fera progresser nos systèmes d'exploitation
dans cette voie ? Microsoft, Apple, Oracle, Be,
Eazel-Linux ? ou un tel modèle heurte-t-il
trop de conservatismes pour voir le jour ? Qui
vivra verra. Et en attendant, j'en
rêve.
|