2004, l'année RSS ?

02/04/2004

Les deux dernières années furent certainement déterminantes en matière de XML. Son adoption dans de nombreux contextes en a fait une technologie pivot pour l’échange de données. Parallèlement, le phénomène weblog a connu un franc succès en 2003, et a permis de mettre en avant une technologie XML existante depuis 1999 : RSS.

Même si les sites Internet fournissant du contenu (sans distinction de genre) ont adopté rapidement le RSS après sa conception, son usage restait néanmoins restreint (technologie peu connue, nombre de fichiers RSS disponibles marginal, peu d’outils logiciels,…) . Depuis que chaque blogger (auteur d’un carnet diffusé sur internet ou weblog) peut fournir automatiquement un ou plusieurs fichiers RSS (simple fichier XML, désigné par les termes canal, flux ou encore fil) pour lister les derniers articles qu’il écrit, RSS a changé de dimension. Cette évolution s’est accompagnée d’un développement tous azimuts d’outils connexes. Il n’est effectivement plus possible de passer par une simple page Web pour synthétiser la masse considérable d’informations offerte par tous les canaux existants, comme cela pouvait être le cas lors du lancement de ce format par Netscape. Une page Web pouvait alors rassembler les cinq ou six canaux disponibles sur un domaine particulier. Désormais, avec la multiplication des sources d’information, il faut recourir à une application qui facilite la lecture.

Du logiciel de messagerie au navigateur Internet en passant par les portails ou les applications serveurs, lire des canaux RSS est vraiment simple. Il y en a pour tous les goûts, toutes les habitudes.

Certains clients de messagerie, comme bloomba, intègrent désormais, de façon native, un lecteur de canaux RSS et communique sur l’avantage de lire des nouvelles directement dans son logiciel. Evolution, un des clients les plus utilisés sous Linux, propose également un système de lecture de fils RSS. Outlook ne propose pas ce type de fonctionnalité, mais NewsGator s’intègre au logiciel de Microsoft et permet de palier ce manque. La firme de Redmond prévoit un support natif de RSS dans le framework Avalon de son nouveau système d’exploitation (il existe d’ailleurs une première application RSS pour Longhorn, qui a surtout valeur de test : Ocel). Le couplage Mail/RSS donne naissance à des solutions originales.rss.blogstreet.com propose un compte IMAP (uniquement en consultation) dédié aux flux RSS. Les dernières actualités émises par les fournisseurs de contenu que vous choisissez sont envoyées par mail. Vous pouvez ainsi les consulter avec votre propre outil de messagerie en ajoutant seulement une nouvelle configuration de compte mail. Plus classique, fastbuzz.com permet de lire les actualités au choix sur leur site Web ou via un courrier électronique envoyé à une fréquence donnée. A l’opposé, dodgeit.com vous permet de créer une adresse électronique et fournit le canal RSS associé. Ou encore MailFeed qui peut consulter votre boîte aux lettres (via POP ou IMAP) et vous générer un canal RSS de vos messages. Ainsi, vous consultez le flux RSS de vos mails. Si vous préférez nntp, le protocole des groupes de discussion, et les outils l’utilisant, nntp//rss répond au besoin. PubSub.com, quant à lui, fournit le service inverse : des mots clés permettent de créer un flux d’informations qui n’existent pas encore. PubSub sonde régulièrement les groupes de discussion et alimente ce flux avec les fils contenant des termes appropriés. Vous créez ainsi un canal prospectif.

Le monde des navigateurs Internet n’est pas en reste. La nouvelle version d’Opera 7.5 intègre une fonctionnalité de lecture des fils RSS. NewsMonster s’intègre à Mozilla ou Netscape et permet de souscrire à des canaux directement dans le navigateur. La présentation du contenu est basée sur la technologie XSLT et permet donc d’avoir une présentation vraiment personnalisable. Plusieurs plug-ins existent également pour FireFox (la version légère de Mozilla). Côté Mac, la nouvelle version d’OmniWeb (5) lit nativement les flux RSS. Enfin, Pluck est une barre d’outils pour Internet Explorer qui rassemble les canaux auxquels vous avez souscrit. Il affiche alors, dans la partie navigateur, le contenu de la nouvelle.

Bien sûr, il est possible d’utiliser un logiciel à part entière. Il existe une large palette d’outils (blogspace.com, ourpla.net ou 2rss.com fournissent des listes intéressantes) permettant de lire des canaux RSS sur votre système d’exploitation préféré. Ils apportent bien souvent de plus riches fonctionnalités que les plug-ins de navigateur ou de logiciel de messagerie. On trouve ainsi des applications classiques mais aussi des outils à usage plus général comme Desktop sidebar qui offre une barre d’outils s’exécutant sur le bureau Windows, permettant un accès rapide à vos flux RSS. Un autre outil intègre RSS comme technologie pivot : Gush. Il rapproche la messagerie instantanée et RSS. Outre les dialogues via Jabber et la lecture de canaux RSS dans le même logiciel, Gush vous permet de poster (ou de recevoir) des annonces à un ensemble ciblé de personnes, présentes dans votre liste de contacts. Lisez les annonces d’un groupe donné (collaborateurs par exemple) via un canal RSS et discutez-en via Jabber !

Si au contraire, vous souhaitez avoir accès à votre sélection d’informations (on pourrait parler de journal virtuel personnalisé) indépendamment de l’ordinateur et sans installer de logiciel, les sites Internet de syndication constituent la solution. Ils se nomment Meerkat, NewsIsFree, Syndic8 ou bloglines et proposent de créer un espace personnel gérant une liste de canaux RSS. Preuve que cette technologie est décisive, Yahoo! rattrape le train en marche. Depuis plusieurs années, chaque utilisateur des services du géant de l’Internet, peut créer un espace personnel modulable selon ses besoins, ses intérêts ; il s’agit bien sûr de Mon Yahoo!. Cette plate-forme intègre désormais (en version bêta) la lecture de canaux RSS et ne se contente donc plus des informations en provenance uniquement de Yahoo! Actualités. Il est donc possible d’enrichir son propre portail Yahoo! en spécifiant soit explicitement des canaux, soit en faisant une recherche dans la base de données RSS de Yahoo! (alimentée par un robot de recherche et/ou par la mise à jour explicite par les outils de publication RSS via des api RPC et REST).

L’éventail d’outils et de solutions dédiés à la lecture de canaux ne doit pas faire oublier les premières amours de RSS : la syndication de contenu . Consommateur de contenu pour le compte de votre propre site (le terme agrégateur est alors employé), ou producteur de flux RSS, chacun y trouvera son compte. Des technologies java (JSP , application Web , portlet ) au javascript (Meerkat, PrettyRSS) en passant par le php (magpierss, zFeeder), .NET (ASP, C#), python (feedparser, spycyroll ou rawdog), perl (XML::RSS) … il existe quantité de scripts ou d’API Open Source permettant d’intégrer très rapidement des informations issues de canaux RSS.

Mais l’offre logicielle autour de cette technologie a beau être importante, RSS n’échappe pas au problème classique d’Internet : comment localiser une source d’information que l’on ne connaît pas encore ? Une première solution consiste à naviguer sur les sites Internet (NewsIsFree, syndic8,…) répertoriant des milliers de canaux existant. Il est aussi possible de surfer sur différents sites Internet, de façon à repérer les icônes (oranges pour la plupart) estampillées XML ou RSS désignant les flux intéressants, et à copier/coller leurs URL dans votre logiciel préféré (cette manipulation fastidieuse pourra certainement être simplifiée par la création d’un nouveau protocole feed:// ou d’une extension du type MIME, permettant l’ajout d’un canal dans le logiciel de lecture en un seul clic). Ces techniques donnent de bons résultats, mais ne sont pas suffisantes. Le besoin de recherche par mots-clés est grandissant (le même besoin qui a vu le succès de Yahoo! ou Google pour chercher les pages disponibles sur le Web), d’autant que le nombre de canaux croit de façon exponentielle. Les moteurs de recherche permettent de trouver des informations traditionnelles de façon satisfaisante. Mais les moteurs de recherche RSS tels que blogdigger, feedster.com ou encore newstrove.com permettent de réaliser des recherches sémantiques en utilisant des métadonnées positionnées dans les fichiers RSS (les balises XML telles que , , ,… qui décrivent l’information elle-même). Ainsi le format XML de RSS prend tout son sens, et les moteurs de recherche sémantique tant attendus apparaissent (sur une portion encore limitée du Web). Le résultat est une liste de flux répondant à vos critères avec en prime un canal RSS correspondant à votre recherche. Vous pouvez alors faire une veille sur un sujet spécifié par une combinaison de mots clés. En souscrivant à ce nouveau canal, vous serez prévenu, lors d’une future consultation dudit canal, d’une information qui n’existe pas encore au moment de votre recherche, ce qui contraste radicalement avec l’utilisation des moteurs de recherche du Web existants (et rejoint le service fourni par PubSub sur la surveillance des groupes de discussion nntp).

Ainsi le moins que l’on puisse dire, c’est que RSS inspire ! De nouveaux services déclinent RSS à toutes les technologies ou à tous les concepts ! Vous consultez régulièrement le site de Télérama ou de l’Equipe, mais ceux-ci ne fournissent pas de canaux RSS officiels : NewsIsFree vous en fournit un. Une URL suffit à myrss.com pour créer des canaux RSS, dans différents formats, mis à jour quotidiennement… Enfin, rssgenr8 permet de créer des flux à partir d’une page html en se basant sur la présence de certaines balises prédéfinies. Et il y a fort à parier que tout type d’information aura sa déclinaison RSS. Par exemple, vous souhaitez être averti de tout nouvel ajout de logiciel dans la base de dmoz.org : xmlhub.com vous laisse définir des termes à surveiller et génère votre flux personnalisé.

Mais RSS peut s’appliquer à des domaines plus spécifiques encore, comme par exemple les notifications CVS. CVS est un serveur de gestion de configuration, permettant le travail collaboratif sur des projets. Il est courant de s’abonner auprès du serveur CVS pour recevoir un courrier électronique, lorsqu’un collaborateur a modifié un fichier. Cependant le nombre de courriers générés peut être gigantesque si le projet évolue fréquemment, et si beaucoup de personnes travaillent dessus. Pour éviter la surcharge de votre messagerie, cvs2rss permet de suivre les évolutions relatives au projet au même titre que tout autre actualité et votre logiciel de messagerie retrouve sa fonction première : le courrier (et non les notifications). Cet exemple illustre simplement le fait que ce format a convaincu nombre d’utilisateurs et tend à se répandre dans tout ce qui touche à la diffusion d’information, qu’elle soit technique ou informationnelle.

Certaines entreprises ont donc bien compris cet avantage et utilisent RSS comme outil stratégique en formulant leurs communiqués de presse à l’aide de flux RSS. Alors que la constitution d’un fichier d’utilisateurs désirant recevoir un mail sur les dernières nouveautés est longue, fastidieuse et coûteuse pour une entreprise, la diffusion de ces mêmes informations à travers un fichier unique est extrêmement plus efficace. En effet, pour un journaliste qui doit traiter une grande quantité de mails par jour, il est parfois difficile de distinguer une annonce intéressante d’un spam. Dès lors, la consultation d’un flux spécialisé permet d’avoir accès à l’information instantanément. La société fe77 se propose ainsi d’intervenir comme fournisseur de centre de presse et agit donc comme un intermédiaire entre les entreprises et les journalistes. Mais l’utilisation de RSS peut se faire également en interne. Un article très intéressant d’ Anne Chen, détaille comment la société Triple Point a mis RSS au coeur de son système d’information. Son représentant, qui a mis en place weblogs et RSS, estime que les diffusions interne et externe d’informations sont nettement plus efficaces via RSS que par courrier électronique. Quelle que soit la connaissance informatique des acteurs du système, la saisie via un weblog est très aisée, et l’information est relayée instantanément par le biais d’un canal RSS. Aucune connaissance technique du format n’est nécessaire. Concernant la diffusion d’informations, il existe d’ailleurs toute sorte d’initiatives. Par exemple, upcoming.org utilise RSS pour reporter des événements en tout genre. N’importe qui peut saisir un événement, le décrire et le classer. Les utilisateurs de ce groupe d’événements (par exemple dans la ville de Paris) disposent alors instantanément de l’information.

Enfin, comme la publicité est omniprésente sur le Web, il y a pas de raison que RSS y échappe. RSSAds propose d’ajouter des publicités dans les flux RSS. Serait-ce le signe de la véritable montée en puissance de ce format ?

En tout état de cause, nombreux sont ceux qui prédisent un avenir doré à RSS. D’aucuns déclarent la mort de la messagerie, en pensant que RSS est la réponse au problème de spam. De plus en plus de sociétés délaissent la traditionnelle lettre d’actualités et optent pour un canal RSS. Avec la venue des nouveaux virus qui surchargent les boîtes aux lettres, cette solution apparaît réellement satisfaisante. RSS permet de contourner un autre problème bien connu : celui des messages automatiques renvoyés par les abonnés absents et informant l’émetteur et les autres lecteurs de leur indisponibilité. Ces réponses génèrent un trafic tout aussi important qu’inutile. De plus, le canal RSS évite d’avoir à trouver des astuces ou de mal orthographier certains mots pour qu’ils puissent passer à travers les passerelles de sécurité qui rejettent systématiquement les messages contenant un mot catalogué comme indésirable. Ainsi, en remplaçant la lettre d’actualités classique par un canal RSS, l’utilisateur devient actif en sélectionnant les sujets qui l’intéressent et n’est plus à la merci d’un flot de messages plus ou moins contrôlé dont les procédures de désabonnement ne sont pas toujours aisées et immédiates (l’adresse mail n’est plus stockée chez le fournisseur de mail et n’est donc pas susceptible d’être diffusée à des entreprises tierces).

Cependant, cette vague d’enthousiasme ne doit pas occulter quelques aspects qui pourraient nuire à l’essor de ce format. Le premier concerne ni plus ni moins que son succès ! En effet, nombreux sont ceux qui s’inquiètent de la surcharge réseau que peut engendrer une consultation intensive des multiples canaux existants. Pour se tenir à jour d’un flux RSS, un logiciel va télécharger un fichier RSS donné à intervalle de temps donné, toutes les heures par exemple. Ainsi, le jeu des multiplications peut devenir effrayant (nombre de téléchargements dans la journée multiplié par le nombre d’abonnés). De plus, le trafic ainsi généré peut se révéler vraiment inutile si les canaux ne sont mis à jour qu’une seule fois par jour. Les solutions sont multiples, de l’intégration d’une donnée dédiée à la fréquence des mises à jour dans le flux, à l’implémentation pour le fournisseur et le client du GET conditionnel de HTTP. Steve Gillmor propose même d’utiliser conjointement RSS et un logiciel Peer-to-peer, comme BitTorrent. L’avantage ? distribuer un même flux sur de multiples sources. Plus un canal est populaire, plus il est réparti sur le réseau, ce qui évite donc la surcharge du site auteur du canal (d’autres voient dans cette association (BT/RSS), l’utilisation inverse, c’est-à-dire un moyen de se tenir informé des derniers fichiers disponibles en téléchargement…).

Deuxième zone d’ombre sur RSS : la multiplicité des formats, le manque de convergence vers un format précis, les guerres de chapelles… Même si RSS est devenu une technologie clef, il n’en demeure pas moins que cinq ans après la publication du premier format (et un riche historique), il n’existe toujours pas de standard ! En effet, sept formats se regroupent en deux familles (RSS 1.0 et RSS 2.0). Ces deux formats coexistent actuellement (voir graphique) sur Internet et ne sont pas compatibles. La version 1.0 (dont l’ancêtre est RSS 0.90) utilise les espaces de noms et RDF, tandis que RSS 2.0 (issu des versions 0.91, 0.92, 0.93 et 0.94) n’utilise qu’une version minimale de balises XML. Pire, le terme RSS n’est pas clairement défini : Really Simple Syndication pour certains, Rich Site Summary pour d’autres, ou encore RDF Site Summary. RSS cristallise des batailles de chapelles et de fortes personnalités, nuisant parfois au consensus. D’autant que les spécifications sont restées en dehors du circuit du W3C ou tout autre organisme de normalisation. Une recommandation au même titre que SVG ou MathML aurait sûrement assuré plus d’interopérabilité et freiné la multiplication des formats. Cette situation a engendré un nouveau projet. D’abord nommé Echo, Atom risque de précipiter les actuels formats RSS dans la désuétude. Atom est un projet très orienté weblog (et donc soutenu par les acteurs du marché, comme MovableType ou Google), et propose une partie centrée sur la syndication, comme RSS, mais aussi sur les moyens d’archiver, publier, éditer, des billets de journaux Web. Atom n’est pas encore arrivé à maturité mais déjà beaucoup d’outils offrent un support (tant au niveau de la production de canaux, que de la lecture) aux cotés de RSS, et ce format est d’ores et déjà soumis à l’IETF pour standardisation. Devant la rapide montée en puissance d’Atom, Dave Winer (l’auteur de RSS 2.0), après l’avoir sciemment ignoré, propose désormais une fusion des deux formats afin de progresser sur le concept et d’abandonner les querelles desservant les utilisateurs. L’auteur d’Atom, Sam Ruby, ne semble d’ailleurs pas opposé à une telle évolution.

Porté par la vague weblog, RSS s’est imposé comme une technologie indispensable dans la sphère des boulimiques de l’information (Chad Dickerson auteur sur le site d’informations techniques InfoWorld note d’ailleurs que la consultation de leurs flux RSS dépasse désormais celle de leur page d’accueil). Les éditeurs de logiciels (Open Source ou non) l’ont bien compris. En effet, il existe actuellement pléthore d’outils RSS. Chacun s’adaptant aux habitudes de ces consommateurs. D’aucuns prétendent même que RSS est une solution miracle à bien des problèmes, et prédisent la fin de la pollution quasi-quotidienne des boîtes aux lettres par les spams ou un dopage de la communication interne. Même si le format lui-même est houspillé, ce n’est finalement qu’un détail pour les utilisateurs. Le concept mis en exergue par RSS est tellement fondamental, il est si largement plébiscité qu’il s’imposera quel que soit son format. Les éditeurs de logiciels sont prêts ou se renforcent, à l’image de Sun Microsystems qui s’offre Tim Bray pour développer et maîtriser le phénomène syndication. Et si des entreprises comme Nokia ou Apple ouvrent des dizaines de canaux pour organiser et diffuser des quantités d’informations visant des publics différents, il y a fort à parier que d’autres suivront. Il semble donc, comme l’évoque Forbes, que 2004 soit l’année RSS. Ainsi en 2004, vous n’échapperez sans doute pas à la syndication !

Autres articles :

Autres articles sur xmlfr :

Et sur d’autres sites :