I. C'est quoi, un « format » ?

Commençons par le commencement, aussi.

Vous utilisez un ordinateur, une tablette, un smartphone… tous utilisent des fichiers : texte, musique, image, vidéo…

Pour que ces fichiers puissent être « reconnus » et donc ouverts par vos logiciels préférés, il faut qu'ils aient un format : c'est ce qui permet à un logiciel d'interpréter les données brutes d'un fichier. Souvent, les formats des fichiers sont indiqués par leur extension : le suffixe (très souvent composé de trois lettres) apposé à la fin du nom du fichier : on identifie donc immédiatement le fichier « mapageweb.htm » comme un fichier en format HTML.

Il existe des formats spécifiques pour les images (par exemple JPEG, PNG, GIF, TIF, BMP), pour les textes sans mise en forme (ASCII, souvent indiqué comme TXT), pour les textes avec mise en forme (HTML, RTF, DOC), pour les pages prêtes à l'impression (PDF, PS), etc.

Mais tous les logiciels ne sont pas égaux face à l'ouverture et à la modification de ces différents fichiers…

II. Vous avez dit « interopérabilité » ?

C'est l'un des « gros mots » de l'informatique. La directive européenne 91/250/CEE du 14 mai 1991, concernant la protection juridique des programmes d'ordinateur définit l'interopérabilité en ces termes :

 
Sélectionnez
Considérant qu'un programme d'ordinateur est appelé à communiquer et à opérer avec d'autres éléments d'un système informatique et avec des utilisateurs ; que, à cet effet, un lien logique et, le cas échéant, physique d'interconnexion et d'interaction est nécessaire dans le but de permettre le plein fonctionnement de tous les éléments du logiciel et du matériel avec d'autres logiciels et matériels ainsi qu'avec les utilisateurs ;

Considérant que les parties du programme qui assurent cette interconnexion et cette interaction entre les éléments des logiciels et des matériels sont communément appelées « interfaces » ;

Considérant que cette interconnexion et interaction fonctionnelle sont communément appelées « interopérabilité » ; que cette interopérabilité peut être définie comme étant la capacité d'échanger des informations et d'utiliser mutuellement les informations échangées.

En France, pendant les débats au sujet de la loi DADVSI (Droits d'Auteurs et Droits Voisins dans la Société de l'Information, 2006), l'amendement 341 (hélas pas retenu par l'Assemblée Nationale) proposait ces définitions :

 
Sélectionnez
On entend par compatibilité la capacité de deux systèmes à communiquer sans ambiguïté.
On entend par interopérabilité la capacité à rendre compatibles deux systèmes quelconques. L'interopérabilité nécessite que les informations nécessaires à sa mise en œuvre soient disponibles sous la forme de standards ouverts.

La loi n° 2004-575 du 21 juin 2004 pour « la confiance dans l'économie numérique » définit ainsi l'ouverture des formats :

 
Sélectionnez
On entend par standard ouvert tout protocole de communication, d'interconnexion ou d'échange et tout format de données interopérable et dont les spécifications techniques sont publiques et sans restriction d'accès ni de mise en œuvre.

III. Les formats ouverts

Maintenant, vous savez ce que sont un format et l'interopérabilité. Normalement, une petite lumière vient de s'allumer dans votre tête : il y a un lien entre les deux ! Pour qu'un fichier puisse être lu partout, il faut qu'il utilise un format qui le permette…

D'après Wikipédia : « Un format de données est dit ouvert si son mode de représentation a été rendu public par son auteur et qu'aucune entrave légale ne s'oppose à sa libre utilisation ».

Cela veut dire que la façon dont le format stocke données et informations est publique, et que personne n'a défini de règles d'utilisation du type « y a que moi qui peux l'utiliser ».

À contrario, il existe des formats dits propriétaires. Ceux-là stockent le contenu du fichier d'une façon qui n'est pas rendue publique. Le seul moyen de lire correctement le fichier est donc d'utiliser le logiciel (souvent payant) associé. On peut ici citer le logiciel de bureautique Microsoft Word, qui utilise le format DOC. Vous allez me dire « mais LibreOffice le lit ! »

Non. Créez un document sous Word, mettez-le en forme et allez l'ouvrir sous Writer. Admirez…

En fait, cette pseudo-compatibilité est le résultat d'une rétro-ingénierie sur le format DOC. Mais elle est loin d'être parfaite, et un grand nombre d'incompatibilités subsiste…

En résumé : un format propriétaire impose au destinataire du fichier d'utiliser le même logiciel que l'auteur. Un format ouvert permet à ce même destinataire d'ouvrir le fichier, avec son logiciel habituel, en toute transparence et sans « altération » du contenu.

IV. Quelques raisons de ne PAS utiliser de formats propriétaires…

Il est bien entendu possible d'utiliser des formats propriétaires localement, ou au sein d'une communauté (travail collaboratif par exemple) qui aurait préalablement décidé d'utiliser un tel format. Mais dans le cadre d'un échange de fichiers, c'est déconseillé. Voici pourquoi…

IV-A. Prendre le risque que le destinataire ne puisse pas ouvrir le fichier

  • Un format propriétaire implique l'achat d'un logiciel spécifique capable de décoder l'information contenue dans les fichiers. L'échange de fichiers en format propriétaire présuppose donc que le destinataire possède le logiciel capable de lire ce format : tout utilisateur n'ayant pas les moyens de l'acheter ne sera jamais en mesure de lire ces fichiers.
  • Bien entendu, le logiciel peut être acheté. Mais cela ne suffit pas à assurer l'ouverture du fichier : une stratégie largement suivie par les entreprises de production de logiciels consiste à modifier progressivement les formats dont elles détiennent la propriété. Ceux qui veulent continuer à utiliser ces formats de fichier seront ainsi obligés à acheter les mises à jour du logiciel.
  • Une stratégie aux effets similaires (« Embrace and Extend ») consiste à adopter à l'origine des formats ouverts en les modifiant progressivement avec du code propriétaire, ce qui les rend peu à peu incompatibles avec les formats utilisés par d'autres logiciels et force de fait une conversion du format public originaire vers un format propriétaire.

IV-B. Contribuer à la diffusion de certains virus informatiques

  • La plupart des virus en circulation sont véhiculés par des fichiers échangés entre utilisateurs. Ces virus exploitent la vulnérabilité de certains logiciels ou des failles de sécurité de certains systèmes d'exploitation pour exécuter du code malicieux souvent à l'insu de l'utilisateur. La propagation des virus dans ce cas dépend du fait que la majorité des utilisateurs se servent de la même application et échangent des données directement dans le format natif (=propriétaire) de cette application. La plupart des virus sont ainsi non seulement spécifiques à la plateforme, mais aussi au logiciel utilisé. Souvent, abandonner une application et son format natif est suffisant à rendre un système immunisé contre une classe entière de virus (c'est le cas, par exemple, des virus véhiculés par des macros MS Word).
  • Utiliser des formats ouverts affaiblit l'impact global des virus et en décourage la diffusion: il est beaucoup plus facile de créer un virus en exploitant la vulnérabilité connue d'un logiciel en position dominante et le manque de conscience de la plupart des utilisateurs que de rajouter du code malicieux à l'intérieur d'un format qui peut être utilisé par un grand nombre d'applications et sur plusieurs types de plateforme.

IV-C. Prendre le risque de diffuser des informations personnelles et/ou confidentielles

  • Un format propriétaire encode des informations qui ne sont pas publiquement visibles. Seul le producteur du format ou le propriétaire du logiciel de lecture, détenant les clefs pour le décodage complet du format, est en mesure d'accéder à ces informations.
  • Souvent, au moment de l'enregistrement, le logiciel rajoute aux fichiers des informations qui ne sont pas accessibles à l'utilisateur commun, telles que le nom de l'utilisateur, le numéro de série du logiciel, le type de système d'exploitation, la machine sur laquelle l'utilisateur travaille, le dossier dans lequel le fichier se trouve, etc. Certaines de ces informations sont parfois codées de manière lisible à l'insu de l'auteur et deviennent ainsi complètement accessibles à tout le monde.
  • Diffuser des documents en format propriétaire signifie diffuser de l'information dont personne, hormis le propriétaire du logiciel de lecture, ne peut connaître exactement le contenu.

IV-D. Participer aux monopoles de certains géants de l'informatique

Ce problème ne se situe pas au niveau de l'utilisateur isolé, mais il concerne la communauté des utilisateurs. En diffusant des fichiers en format propriétaire, on force implicitement le destinataire à choisir le même logiciel utilisé par celui qui diffuse les fichiers. Le message qu'on communique implicitement lors de l'échange d'un fichier en format propriétaire est le suivant : « Sers-toi du même logiciel que j'ai utilisé ou tu ne pourras pas lire le contenu de ce fichier ». Cette pratique - la même qui se produit lorsque celui qui diffuse des fichiers assume sans justification que « tous les destinataires du fichier possèdent sûrement le même logiciel » - a une double conséquence :

  • premièrement, cette pratique impose et renforce l'utilisation de fait d'un format propriétaire comme format d'échange : ce qui signifie lier l'interopérabilité, l'accessibilité et la pérennité du contenu des fichiers aux choix politiques contingents du producteur de logiciel. Si ce-dernier décide un jour (ou se trouve obligé) d'arrêter le développement du logiciel de lecture/écriture du format considéré, tous les fichiers existants dans ce format deviendront automatiquement inutilisables : la spécification du format étant inaccessible, il sera impossible de récupérer le contenu de ces fichiers devenus obsolètes ;
  • deuxièmement, en imposant un monopole de fait, cette pratique limite fortement une concurrence équitable entre les producteurs de logiciels, concurrence qui représente la condition universellement reconnue pour le développement technologique, et affaiblit la pratique d'ouverture des spécifications de formats et la recherche de standards publics pour le développement de logiciels.

Bon, il y a aussi de bonnes raisons d'utiliser des formats ouverts, mais je vais m'arrêter là, hein.

V. Correspondances des formats de fichiers

Bah oui, parce que tout ce post ne servirait pas à grand-chose si je vous disais « n'utilisez pas le format MS PowerPoint pour envoyer une présentation par mail » si je n'y ajoutais pas « préférez plutôt le PDF ».

Vous pouvez trouver un peu d'aide sur Wikipédia en lisant cette page sur les correspondances formats ouverts/fermés, ou celle-ci sur les alternatives libres aux logiciels propriétaires.

Et puis si vous avez des questions, comme d'habitude, je suis prêt à y répondre.

Ah et à celui qui m'a dit que le format OpenDocument n'est « pas un vrai format parce que personne ne l'utilise », je tiens à signaler qu'il est quand même défini en tant que norme ISO, là encore cf Wikipédia.

Alors je vous encourage à utiliser des formats ouverts, et à en parler autour de vous !

VI. Liens utiles

La vision de R. Stallman : http://www.gnu.org/philosophy/no-word-attachments.html.

Quelques infos via la Free Software Foundation : http://www.fsf.org/campaigns/opendocument/reject.

Le site de l'AFUL : http://aful.org/gdt/interop.

Une liste plus complète (mais en Anglais) des inconvénients inhérents à l'utilisation de MS Word : http://www.goldmark.org/netrants/no-word/attach.html.

OpenFormats : http://www.openformats.org/frShowAll.