Articles

Est-il encore utile de structurer les données ?

Nous sommes régulièrement abreuvés de chiffres affolants quant aux données non structurées : doublement tous les deux mois, volume accrue dans toutes les entreprises… Mais pourquoi distinguer les données structurées des non structurées ? Quels sont les enjeux pour la DSI ? Est-ce la DSI qui est responsable des données non-structurées ?

Si l’on considère les retours d’informations des grands hébergeurs, 70% des données actuelles seraient des données non structurées. Cerise sur le gâteau, leur volume doublerait tous les deux mois !  Parallèlement,  les données structurées enregistreraient une croissance annuelle de seulement 4%.

Pour bien anticiper les conséquences de cette lame de fond, essayons de comprendre ce qui caractérise ces données.

Les données structurées

Elles sont manipulées par les applications de l’entreprise, notamment dans l’ERP. Ces données représentent les informations nécessaires au fonctionnement des processus métiers. Elles sont assemblées dans des bases de données qui structurent les enregistrements. On pourra trouver côte à côte dans la base : un nom, une date, un montant. Ces données sont restituées en tant qu’informations de gestion (lire ceci) à l’écran ou sur les documents issus des logiciels sous forme de documents structurés.

Les données non structurées

Plusieurs types de données constituent les données non structurées. Elles sont issues de la bureautique, de la messagerie, des fichiers multimédia, des documents scannées, des pages web… Si on les qualifie comme des données non structurées c’est parce qu’elles ne peuvent donner lieu à une représentation schématique, organisée. Ces documents sont cependant caractérisés par des métadonnées : date de création, nombre de mots, auteur, focus, compression …

Mais de quoi parle-t-on ?

Plutôt que de données structurées ou non structurées, il semble plus pertinent de faire le distinguo entre les documents issus de bases de données) et les documents issus de toutes les autres sources.
Alors, quel critère objectif retenir pour définir cette nature de données ? On pourrait retenir que tout ce qui provient des « traitements transactionnels » produit des données structurée. Depuis longtemps le DSI a notamment pour mission de trouver des solutions à cette évolution, les logiciels CRM répondent partiellement à ce besoin de structuration en permettant d’embarquer dans la BDD les emails envoyés et reçus, les documents échangés… D’une manière générale, tous les business process sont structurants car ils organisent les demandes de structuration de l’entreprise.

Quel est l’enjeu ?

Mettre en relation les données structurées avec les données non structurées devient une activité à part entière pour les projets de la DSI. Mais comment faire le lien ? De nombreux outils apparaissent. Ils sont porteurs de nouvelles problématiques quasi inexistantes pour les données structurées : le dédoublonnage, la rétention …

Aujourd’hui, des outils de « search » permettent de concilier ces deux types de sources et  ouvrent de nouvelles voies On pense notamment à Polyspot. Des approches étonnantes comme la plateforme Wolfram Alpha ou siri existent également. Elles parviennent à mettre de l’ordre dans les données non structurées présentes sur le Web ou dictées sur le smartphone.

Et demain ?

Les entreprises ayant tendance à sous-estimer ces évolutions, ce sont les DSI  qui doivent les anticiper et mettre en place de nouveaux modes de gestion et d’organisation des données.

Demain, il faudra continuer à organiser les données non structurées. Gageons néanmoins que de nombreux outils vont émerger pour automatiser davantage cette tâche.

Le Système d’Information, ça s’apprend !

Un Mode d’Emploi ? Mais pourquoi faire …

Antoine a trouvé en haut à gauche dans le troisième écran un « bout de pixel » sur lequel en cliquant on obtient le raccourci pour le monde suivant. Sixtine regarnit son porte-monnaie en appuyant sur la touche « CTRL » tu sais, là, au moment où… C’était il y a déjà dix ans, voire même plus…

Pour ma part, je cherche toujours le mode d’emploi … et je m’interroge encore sur l’intérêt des manuels utilisateurs, sur celui des aides en ligne…

L’Informatique relèverait-elle de l’intuition ou ne serait-elle qu’une science d’initiés, de geeks ? Doit-on enseigner de la même manière et les mêmes contenus à notre fameuse « génération Y », à nos « IT Natives » qu’aux générations précédentes ?

Des technologies évidentes ?

La banalisation des technologies pousse à penser que la science informatique relève de l’évidence. Le discours ambiant laisse augurer d’une distribution de données, éventuellement un jour de savoir, aussi simple et fluide qu’aujourd’hui celle d’électrons (Eventuellement fils d’Eole, Zéphyr, Borée, Euros ou Notos).

Et pourtant, il nous faudra toujours d’impressionnants experts. Mais surtout beaucoup travailler sur les usages… La différence essentielle entre électrons et Kilo Octets, c’est que ces derniers sont par essence porteurs de sens. Voilà, nous y sommes !

Le Système d’Information, c’est à la fois :

  • une affaire de bon sens, et le bon sens ne s’apprend pas,
  • un ensemble de concepts, de règles, de processus, de traitement et de mise à disposition des données. Ces éléments contribuent alors à « donner du sens » (bon ou mauvais, à ce stade…). Cela  s’apprend.

Les usages guident-ils les technologies, ou est-ce l’inverse ? Il semble toujours aussi primordial de jeter des ponts entre Technologies et Usages, entre les Informaticiens et les usagers du Système d’Information.

Il faut donc que les DSI puissent suivre des parcours de formation adaptés pour créer les bases d’un dialogue de qualité au sein de leurs organisations.

Un Système d’Information digne de ce nom, c’est tout sauf trivial…

Le Système d’Information, le Stonehedge de la Communauté

La vision ancestrale du système d’information est due au fait qu’il est souvent perçu comme un domaine réservé aux  « barbares » de la technique ! LES GEEKS

Pourtant, 99% de la communication en entreprise se fait par LE Système d’Information.

Des mails, aux demandes d’achat via les ERP, en passant par les informations clients via le CRM, tout est fait pour que le Système d’Information (qui synchronise l’ensemble des outils l’entreprise) soit le point central de ralliement de la communauté de l’entreprise

Et cette communauté s’étend désormais bien au-delà des collaborateurs. L’écosystème de l’entreprise est composé des équipes internes bien sur, mais aussi des clients, des fournisseurs, des partenaires, de ses « évangélistes » (personne mettant en avant la marque et la promouvant) et ses actionnaires.

Le Système d’information est le point central de regrouppement au même titre que Stonehedge l’était pour les peuples celtes. Il est en déconstruction et reconstruction permanente mais représente un lieu fort de réunion où l’assemblée transmet les idées, les directions de la société, et surtout les échanges entre ses membres. Il permet à des assemblées de se réunir par petit groupe et surtout de partager les connaissances avec l’ensemble des utilisateurs!

Sans lui vouer un culte, le Système d’Information mérite surement une image beaucoup plus évoluée que seulement technique. Et ce n’est pas pour rien que les entreprises qui réussissent le mieux, comme Google, Apple et Microsoft, lui vouent pratiquement un culte ….