PDF ou AFP ? XML ou XSL-FO ? Pourquoi pas du HTML5 ? Cet tribune vous présente les avantages et les inconvénients des formats standards utilisés lors des processus de traitements documentaires.

Tous bons, mais aucun n’est meilleur que l’autre!

Le sujet relatif aux types de fichier est très controversé. Quel format est le meilleur ? Il s’agit d’un grand débat. Tous ont leur utilité – les formats orientés page tels que l’AFP et le PDF, et les formats orientés contenu tels que XML et HTML. Ce qui compte réellement ce sont les scénarii que l’entreprise doit mettre en œuvre et l’architecture des processus documentaires qu’elle possède. Une opération nécessitant l’impression de seulement quelques centaines de pages par jour n’a pas de raison d’utiliser l’AFP.

C’est une tout autre histoire, lorsqu’il s’agit d’une entreprise qui imprime plusieurs millions de pages quotidiennement. Pour cela, l’utilisation de l’AFP est incontournable. Le format initialement développé par IBM est, de fait, un standard de fiabilité pour les productions d’impression haut volume. Et pour cause : l’AFP possède des caractéristiques que les autres ne possèdent pas. L’AFP, par exemple, offre la forme la plus avancée de contrôle et suivi de la production d’impression. Si le contenu est incorrect ou incomplet, un rapport contenant un message d’erreur est automatiquement généré. Ce n’est pas un hasard si, partout dans le monde, l’AFP est le format le plus utilisé pour les productions industrielles de factures, documents bancaires, polices d’assurances…

L’AFP pour la fiabilité de la production, haute performance & haut volume

L’AFP offre la possibilité d’affichage multipages, le contrôle des bacs d’impression, et l’impression simplex-duplex; en d’autres termes des caractéristiques essentielles pour l’impression haut-volume. Sa gestion des ressources, globale et flexible, ainsi que son flux de données compact fait de l’AFP un format favori. Les développeurs d’applications et de produits estiment qu’il s’agit d’une architecture bien conçue et bien documentée. Même les principaux concurrents tel que le PDF ne peuvent pas approcher la qualité de la gestion de l’impression qu’offre l’AFP – même avec l’utilisation de la norme PDF/VT qui ne reste qu’un simple compromis.

Pourtant, du fait de son importante compatibilité, le PDF avec toutes ses différentes spécifications est reconnu comme la norme internationale et s’est largement imposé comme format pour l’archivage longue durée (PDF/A) et la création de documents accessibles. Enfin c’est la spécificité de la situation qui dictera le choix entre AFP et PDF. Une entreprise qui souhaite ou qui nécessite un archivage longue durée d’importantes quantités de documents dans leurs mises en forme d’origine pourra choisir de les imprimer en PDF ou PDF/A, cela évitant la nécessaire conversion de l’AFP en PDF.

PDF et HTML5 ne sont pas concurrents

Quoi qu’il en soit l’AFP et le PDF s’en tiennent rigoureusement au format standard qu’est le format page, rendant le choix évident pour les traitements documentaires au format A4. Cependant aucun des deux ne fonctionne pour l’affichage Web ou sur les terminaux mobiles. C’est à ce moment que l’HTML5 entre en jeu. La norme du W3C est actuellement le format le plus intelligent pour la création et l’affichage de documents indépendamment de leur format ou de leur canal de distribution.

Il prend en charge : le reformatage, par exemple, de l’A4 à l’affichage sur smartphone ; la conversion de format orienté page au format orienté contenu ; l’extraction de métadonnées simples (incluant l’extraction des objets d’une facture); et la création de tables des matières et de listes d’index. De plus avec HTML5 même les éléments audiovisuels, les liens et les graphiques peuvent être intégrés. Ceci permet non seulement un traitement documentaire multicanal mais aussi la création de documents intelligents offrant une valeur ajoutée aux utilisateurs au-delà du simple affichage de texte.

Le développement d’HTML5 représente une avancée majeure en termes de fonctionnalités. La nouvelle version est devenue « la langue du Web » et peut être, avec relativement peu d’efforts, également utilisée comme format d’impression. Malheureusement, l’HTML5 et le PDF sont souvent perçus comme concurrents notamment lorsqu’il s’agit de préserver les informations structurelles. Cette hypothèse ne pourrait être on ne peut plus fausse. Après tout HTML5 est le plus petit dénominateur commun pour l’affichage multicanal et la production de documents sortants. Mais le PDF ne disparaitra pas. Bien au contraire : chaque format dépend de l’autre. Dans les processus de traitement documentaire par exemple, l’HTML5 peut être une étape préliminaire au PDF, puisque le PDF/A continuera d’être requis pour certains processus tels que l’archivage.

Mettre fin à la « guerre des religions »

Concernant le traitement documentaire multicanal, tôt ou tard, la discussion tournera sur un autre format qui gagne du terrain : XSL-FO. Ce langage de balisage basé sur XML possède un avantage majeur par rapport à HTML :il ne supporte pas uniquement la possibilité de créer des documents indépendants mais il possède aussi un certain nombre de fonctions sophistiquées de composition de page. XSL-FO est capable de générer des imprimés de haute qualité. Contrairement aux formats XHTML/HTML, particulièrement opportuns pour les applications de navigateurs, XSL-FO est notamment utilisé pour l’impression et l’archivage de documents comportant beaucoup de pages.

Cela positionne XML, langage de balisage certifié ISO, comme standard pour le transfert de données entre des applications spécialisées et les instances de traitement documentaire des entreprises. Les technologies XML sont désormais si avancées qu’il n’est nullement nécessaire de posséder des logiciels spécifiques d’extraction de données. Ceci s’applique également aux autres formats. Quel que soit le format de sortie : AFP, PDF, HTML5, ou XSL-FO, les solutions informatiques actuelles prennent en charge la plupart des formats modernes utilisés en output management ainsi il ne devrait y avoir aucune contrainte à ce qu’une entreprise élabore et mette en place une architecture globale prenant en charge tous les scénarios tout en contrôlant les coûts associés.

Il est temps de mettre un terme à « la guerre des religions » pour la quête du meilleur format. La décision est simple : le choix s’effectue selon la position stratégique de l’entreprise concernant son traitement documentaire. Quels canaux de communication seront impliqués et à quel niveau ? Quels sont les volumes attendus ? Quel sera l’évolution du ratio documents physiques/documents électroniques ? Les réponses à ces questions détermineront quels formats seront appropriés. Tous les formats ont des points forts et des faiblesses. Ce sont les scenarii d’application qui sont importants. Eux seuls déterminent la pertinence des formats employés pour le traitement documentaire d’une entreprise.

 

________
Philippe Filippi, Directeur Général Compart France