OpenDocument

Un article de Freepedia.

(Redirigé depuis ODT)

OpenDocument est un format ouvert de données pour les applications bureautiques : traitements de texte, tableurs, présentations, diagrammes, dessins et base de données bureautique. Il est basé sur le format créé pour les premières versions de la suite bureautique libre et gratuite OpenOffice.org, auquel il reste similaire.

Sommaire

Un format ouvert et standardisé pour la bureautique

L'importance stratégique d'OpenDocument vient de ce qu'il représente le premier effort de standardisation dans le domaine de la bureautique qui en était resté très longtemps éloigné, chaque application bureautique ayant auparavant son propre format non interopérable.

OpenDocument a ses origines dans le format XML utilisé pendant plusieurs années par Sun Microsystems / OpenOffice.org version 1.1.4 et inférieures. Bien qu'ouvert, ce format restait propre à cette suite. Un palier est franchi lorsque David Faure pour le projet KOffice annonce sa volonté à coopérer au sein de l'Organization for the Advancement of Structured Information Standards (OASIS) pour en faire un standard apte à être utilisé par toute application bureautique. Ils sont rejoints au sein de ce comité par des poids lourds comme Adobe, Corel et IBM. De grands clients comme Boeing, Intel, le National Archive of Australia, le New York State Office of the Attorney General ou la Society of Biblical Literature renseignent le comité technique sur leurs besoins.

En mai 2005, la version 1.0 de la spécification d'OpenDocument est approuvée par le comité de standardisation de l'OASIS.

Elle est disponible librement en téléchargement et est implémentable gratuitement par toute partie comme le précisent les termes de la licence.

Bien qu'OASIS ait changé sa politique pour autoriser les techniques sous brevets RAND dans ses standards, ceci n'affecte pas le groupe de travail OASIS OpenDocument qui est resté à l'ancienne politique de licence. OpenDocument est et restera implémentable librement et gratuitement.

Pour expliquer l'importance d'un format standardisé pour la bureautique, Tim Bray utilise toujours le même argument dans ses présentations : il pose cette question « Qui d'entre vous est sûr de posséder des documents qu'il voudra pouvoir accéder dans dix ans ?», puis cette autre « Qui d'entre vous est sûr d'utiliser la même application bureautique dans dix ans ? ». Lorsqu'il reçoit beaucoup de réponses oui à la première question, et peu à la seconde, il continue en disant « Bien, donc je vais vous parler d'OpenDocument… »

Adoption

Suivant KOffice et OpenOffice.org, de nombreux vendeurs expriment leur intérêt pour OpenDocument. Parallèlement, OpenDocument est repéré par des administrations comme l'État du Massachusetts ou l'Union européenne désirant bâtir leur infrastructure publique sur des standards ouverts.

Applications prenant en compte OpenDocument

  • AbiWord 2.4 importe les fichiers OpenDocument. L'export est prévu dans la série 2.4.x
  • eZ publish 3.6, avec l'extension OpenOffice
  • Knomos. Knomos est destiné à la gestion des flux de travail et des données à l'intérieur des cabinets professionels à orientation juridique.
  • KOffice version 1.4 annonce son adoption le 21 juin 2005.
  • OpenOffice.org (GNU/Linux, Mac OS X, Windows) en import à partir de la version 1.1.5. C'est le format par défaut dans la version 2.0 sortie fin octobre 2005. Du coup les applications et services basés sur OpenOffice.org reconnaissent également OpenDocument :
  • Scribus 1.2.2 sait lire les fichiers OpenDocument-Text et OpenDocument-Graphics
  • TextMaker 2005 beta [1]
  • Visioo Writer 0.5.2 [2]

Beaucoup estiment que Corel intégrera la prise en charge d'OpenDocument par Word Perfect, utilisé par 20 millions d'utilisateurs. Les arguments avancés sont la présence de Corel dans le comité OASIS et la réponse très favorable du groupe à la décision de l'État du Massachussets.

État du Massachusetts

OpenDocument est médiatisé en 2005 par une démarche de l'État américain du Massachusetts qui développe une vision d'une infrastructure publique basée sur les standards, ouverte, interopérable, concurrentielle et pérenne, en opposition à la situation actuelle où elle est déterminée par les applications utilisées. Cette démarche fait figure de précurseur, toutes les administrations étant confrontées aux mêmes défis, et a été par conséquent observée de près. Une partie essentielle de cette démarche consiste en l'évaluation et la sélection de formats de fichiers dans le domaine de la bureautique. Après une évaluation des différents candidats étalée sur huit mois et soumis à un intense lobbying de toutes les parties, il est décidé le 21 septembre 2005 :

  • que « Pour assurer le maximum d'interopérabilité, il est recommandé que les extensions propriétaires à tout format XML soient évitées. » ("To insure maximum interoperability, it is recommended that proprietary extensions to any XML specifications be avoided"). Ceci combiné à une politique de licence trop restrictive conduisent à rejeter le format XML de Microsoft Office, initialement accepté. Une clause subordonnant l'implémentation de ce format vise en effet explicitement à barrer la route à OpenOffice son principal concurrent, placé sous la licence GPL (source, confirmation par un employé de Microsoft).
  • de standardiser sur les formats texte, HTML, PDF (mise en page parfaitement conservée) et donc OpenDocument
  • que la migration vers le format OpenDocument doit se faire d'ici le 1er janvier 2007. ("Agencies will need to develop phased migration plans allowing them to configure existing applications to save office documents by default in the OpenDocument format with an implementation date of January 1, 2007. Any acquisition of new office applications must support the OpenDocument format natively.")

Bien que le format PDF appartienne à Adobe, il est accepté grâce à sa politique de licence très ouverte (ses spécifications sont publiques et de nombreuses sources sont mises à disposition librement par Adobe pour les développeurs tiers).

Cette décision a été présentée par de nombreux journalistes sous le titre aguicheur : « L'État du Massachussetts exclut Microsoft Office de son infrastructure ». Ceci est inexact ; la décision porte uniquement sur le format de données et Microsoft est aussi libre que les autres d'implémenter le format OpenDocument.

À ce sujet, Alan Yates a rédigé au nom de Microsoft une longue réponse à l'État du Massachussetts, expliquant en substance que Microsoft n'entend pas prendre en compte pour l'instant le standard OpenDocument.

Les concurrents de Microsoft, tels Tim Bray (co-inventeur du langage XML), le projet Koffice ou encore Sam Hiser ont sévèrement critiqué ce refus et l'argumentation qui l'accompagne. Selon eux, les raisons pour ne pas reconnaître OpenDocument seraient plus politiques que techniques. Microsoft refuserait d'avoir à affronter une concurrence basée sur les seuls mérites des applications respectives : fonctionnalités, rapidité, ergonomie, prix.

Union européenne

L'Union européenne dans une évaluation de différents formats bureautiques, a fait une évaluation favorable d'OpenDocument comme base d'un format standard pour l'échange de documents. La Commission européenne écrit notamment dans sa lettre finale d'évaluation d'OpenDocument :

Les nécessités de transparence et d'accessibilité dictent que les échanges d'informations publiques avec les gouvernements évitent de dépendre de technologies qui impliquent ou imposent un produit ou une plate-forme en particulier pour les affaires ou les citoyens.

Dans cette évaluation, la Commission européenne demande également que le format OpenDocument soit présenté au comité de standardisation ISO. Sun Microsystems et le comité OASIS ont accepté. Notons qu'OASIS est l'une des quelques organisations autorisée par l'ISO à proposer ses standards suivant la procédure « fast track » (accélérée), qui évite qu'un comité technique de l'ISO ait à dupliquer celui de l'OASIS.

L'Union européenne pourrait recommander à son tour OpenDocument une fois ce label obtenu.

Liens externes

(lire l'introduction et la fin de la page Information Domain)

Extensions de fichiers associées

Le format OpenDocument regroupe les formats suivants (avec les extensions de documents associées) :

Type de fichier Extension Type MIME
Texte formaté .odt application/vnd.oasis.opendocument.text
Tableur .ods application/vnd.oasis.opendocument.spreadsheet
Présentation .odp application/vnd.oasis.opendocument.presentation
Dessin .odg application/vnd.oasis.opendocument.graphics
Diagramme .odc application/vnd.oasis.opendocument.chart
Formule .odf application/vnd.oasis.opendocument.formula
Base de données .odb application/vnd.oasis.opendocument.database
Image .odi application/vnd.oasis.opendocument.image
Document principal .odm application/vnd.oasis.opendocument.text-master


Il existe également des modèles dans OpenDocument. Un modèle est constitué d'informations sur le formattage de documents (comme les styles) sans contenir eux-même de données.

Les modèles faisant partie de la norme sont :

Type de fichier Extension Type MIME
Texte formaté .ott application/vnd.oasis.opendocument.text-template
Tableur .ots application/vnd.oasis.opendocument.spreadsheet-template
Présentation .otp application/vnd.oasis.opendocument.presentation-template
Dessin .otg application/vnd.oasis.opendocument.graphics-template

Ces différents formats sont basés sur les formats ZIP et XML.

Description du format

Un format OpenDocument est une archive ZIP contenant un certain nombre de fichiers et de répertoires, ainsi qu'on peut le découvrir en renommant le fichier toto.odt en toto.zip et en cliquant sur le zip :

   Fichiers XML      Autres fichiers       Répertoires   
content.xml
meta.xml
settings.xml
styles.xml
mimetype
layout-cache


Basic/
META-INF/
Thumbnails/
Pictures/
Configurations2/

Le format OpenDocument soutient une forte séparation entre contenu, mise en page et méta-données.

content.xml

C'est le fichier le plus important, il contient le véritable contenu du document (excepté le contenu binaire telles les images qui sont stockées dans des fichiers séparés). La syntaxe tire son inspiration du HTML, et quoique bien plus complexe, est raisonnablement compréhensible par un humain entraîné :

<text:h text:style-name="Heading_2">Ceci est un titre</text:h>
<text:p text:style-name="Text_body"/>
<text:p text:style-name="Text_body">
   Ceci est un paragraphe. L'information de mise-en-page
   est stockée à part dans le style "Text_body" (Corps de texte).
   La balise vide text:p au-dessus correspond à un paragraphe
   vide, c'est-à-dire à un saut de ligne.
</text:p>

OpenDocument a été conçu pour permettre de convertir ses données depuis plusieurs formats propriétaires (de Corel, le .doc de Microsoft Office…). Il reconnaît donc les fonctionnalités habituelles des suites bureautiques : plusieurs niveaux de chapitres, listes, paragraphes numérotés, liens, Ruby, références, bookmarks, historique des changements… On y trouve également les mécanismes pour générer automatiquement les tables des matières, les index, les bibliographies…

Continuer à traduire http://en.wikipedia.org/wiki/OpenDocument#Content

styles.xml

Un fichier OpenDocument un ensemble d'objets décrits dans content.xml sur lesquels sont appliqués des styles définis dans le fichier style.xml.

Un style est une collections de propriétés à la fois structurelles et de mise en forme. Une utilisation courante d'une application prenant en charge OpenDocument comme OpenOffice.org consiste donc à alterner entre la rédaction de texte et l'application de styles sur celui-ci. L'interface d'OpenOffice.org présente le styliste, une palette consacrée à la gestion des styles.

Les styles s'appliquent sur toute sortes d'objets : paragraphes, cadres, pages, caractères, numérotations, etc. Les propriétés qu'ils définissent sont entre autre : le type d'un texte (standard, titre, note de bas de page, etc), les caractéristiques visuelles d'un texte (choix de la fonte, la taille, l'alignement, la couleur, etc), le type d'un compteur, l'ombrage d'une image, le nombre de colonnes d'une page, le sens d'écriture d'un cadre (par exemple, pour écrire du japonais à la verticale), etc. Les styles peuvent être créés pour toutes sortes d'usages, et même avoir des propriétés conditionnelles. Pour les usages ponctuels de mise en forme, des styles automatiques, dépourvus de sens sémantiques, sont générés par le programme. L'abus de ces styles automatiques est considéré comme une erreur d'utilisation et surcharge inutilement le document.

meta.xml

Ce fichier contient les méta-données associées au document.

Une liste de champs prédéfinis est indiqué par le standard : application, titre, description, sujet, mots-clés, auteur initial, auteur, imprimé par, date de création, date de dernière modification, date de dernière impression, durée d'édition, modèle utilisé, rechargement automatique, comportement url (??), langue, nombre d'éditions, durée totale d'édition, statistiques sur le document.

En anglais : Generator, Title, Description, Subject, Keywords, Initial Creator, Creator, Printed By, Creation Date and Time, Modification Date and Time, Print Date and Time, Document Template, Automatic Reload, Hyperlink Behavior, Language, Editing Cycles, Editing Duration, Document Statistics.

Un utilisateur (ou une application) peut rajouter ses propres champs à cette liste.

Un exemple de contenu :

<meta:creation-date>2003-07-22T15:15:11</meta:creation-date>
<dc:creator>Jean Dupont</dc:creator>
<dc:date>2005-06-29T22:02:06</dc:date>
<dc:language>fr-FR</dc:language>
<meta:document-statistic
      meta:table-count="6" meta:object-count="0"
      meta:page-count="59" meta:paragraph-count="676"
      meta:image-count="2" meta:word-count="16701"
      meta:character-count="98757"/>

Les balises <dc:…> sont repris du standard Dublin Core.

On trouve ici une constante du format OpenDocument à réutiliser systématiquement des standards ouverts XML quand ils existent, n'ajoutant son grain de sel que lorsque aucun standard existant ne peut fournir la fonctionnalité dont il a besoin.

Ainsi, outre Dublin Core pour les méta-données, OpenDocument utilise MathML pour les formules mathématiques, SVG pour les images vectorielles, SMIL pour le multimédia, XForms pour les formulaires, XSL-FO pour la mise en page, XLink pour les liens.

settings.xml

Contient des informations ne faisant pas partie du document en tant que tel, comme la position du curseur ou le zoom courant (100% par exemple).

Pictures/

Pour retrouver les images incluses dans un fichier OpenDocument, il suffit de le dézipper et on peut y accéder directement dans ce dossier Pictures/.

Une application prenant en charge OpenDocument y fait appel dans le fichier content.xml via une balise <draw:image> similaire à la balise HTML <img> :

<draw:image   
    xlink:href="Pictures/10000000000005E80000049F21F631AB.tif"
    xlink:type="simple" xlink:show="embed"
    xlink:actuate="onLoad"/>

La mise en page (hauteur, ancre…) se fait par une balise <draw:frame> contenant une balise <draw:image>.

Les images sont le plus souvent conservées dans leur format original (notamment pour les GIF, JPEG et PNG) mais les images bitmap (non compressées) sont converties en PNG pour diminuer la taille du fichier.

Basic/

Ce répertoire contient les scripts Basic éventuellement utilisés dans le document.

META-INF/manifest.xml

Ce fichier contient la liste des noms de fichiers (ainsi que leur type) présents dans l'archive.

mimetype

Ce fichier se résume à une ligne contenant le type MIME du document.

Une application implémentant OpenDocument n'a ainsi pas besoin de prendre en compte l'extension (.odt, etc.) du document. Celle-ci est néanmoins conservée pour une meilleure compréhension par l'utilisateur.

Voir aussi

Liens externes

Image:Symbole-ordinateur.png Portail Informatique - Accédez aux articles de Wikipédia concernant l'informatique.


Cet article est proposé pour devenir un « article de qualité » de l'encyclopédie.
Vous pouvez donner votre avis sur cette proposition.


Views
Outils personels
Boîte à outils
Autres langues
Autres Liens