22 juillet 2017

Le Panda et le SIT, petite théorie de SEO touristique

Après deux jours de conférences et d’échanges à Deauville, pour la première édition du Forum du Tourisme Numérique, je reviens la tête pleine de fraîcheur et d’idées… mais aussi la tête occupée par une question récurrente : celle du Système d’Information Touristique des institutionnels et de son utilisation en référencement naturel. La question revient à chaque intervention sur le sujet tant le point est structurant pour les Comités et Offices de tourisme, et tant le sujet n’est pas forcément évident à trancher.

On va revenir tout d’abord sur la définition du SIT, le fameux Système d’Information Touristique, pour les béotiens qui accèderaient à ce blog. Le SIT est une grosse base de données, construite à l’échelle d’un département ou d’une région et qui liste l’ensemble des points d’intérêt (culturels – musées, châteaux… – ou pratiques – restaurants, hôtels…) sur l’ensemble de ce territoire. Elle contient de l’information brute et possède l’avantage d’être mutualisée sur l’intégralité de ce même territoire. C’est-à-dire que les Offices de Tourisme locaux, ou d’autres acteurs, peuvent en théorie la renseigner et en réutiliser les informations sur leurs propres outils Web. Une petite mine d’or.

Je reprends la dessous le schéma d’utilisation d’un SIT issu de chez Faire-Savoir, c’est finalement assez parlant :

Shéma de SIT, issu de chez Faire-Savoir

Seulement voilà. Cette mutualisation veut dire que sur un même territoire, Comité Régional, Départemental et Office de tourisme possèdent la même description du même hôtel. Et ces là que le bât blesse.

Google, dans ses dernières mises à jour et notamment depuis la sortie de « Panda » en 2011, condamne fortement les contenus de « mauvaise qualité », parmi lesquels les contenus dupliqués. C’est à dire qu’un contenu se retrouvant sur plusieurs site de la même façon est souvent jugé comme « moins pertinent » par le moteur. A raison ou à tort, la question n’est pas là. Google représente plus de 90% de la recherche d’information en France, ce que dit Google vaut donc loi de fait. Google Lex, sed Lex.

Vous l’aurez compris, la problématique du Système d’Information Touristique est donc complexe, et surtout au coeur de la stratégie de référencement naturel des territoires. Comment profiter d’un formidable outil de mutualisation du travail, sans pénaliser l’ensemble des acteurs qui l’utilisent ? Vaste débat.

Les solutions existent, elles sont mêmes assez nombreuses, mais elles ont toutes quelque part des aspects négatifs :

  • Renoncer à l’utilisation du SIT en référencement naturel, et se priver de son potentiel de ranking sur la long tail au profit d’un référencement très soigné des contenus éditoriaux plus qualifiés ?
  • Considérer que la région/le département a la primeure de l’utilisation de ce contenu et que les Offices n’ont pas de pertinence à l’utiliser pour le référencement, ce qui peut poser certaines questions « politiques » ?
  • Au contraire, considérer que les Offices sont prioritaires au vu de leur moyens et doivent utiliser les informations du SIT pour leur positionnement, laissant la région ou le département se dépatouiller avec des contenus plus riche ?

Comme vous pouvez le voir, chaque choix a forcément sa contrepartie à l’échelle d’un territoire. Mais ma solution préférée resterait toutefois la suivante :
Considérer que l’information du SIT, pour important qu’elle soit, n’a pas de valeur intrinsèque pour le référencement. Soyons honnêtes, en matière d’hébergement certains prestataires privés ont une capacité à enrichir l’information qui est sans commune mesure avec celle des institutionnels !
Non, la valeur des informations d’un SIT ne vaut que par son usage. Sa scénarisation pour ceux qui me connaissent. Pourquoi ne considérerait-on pas le SIT comme un gros pot de pâte à modeler destinée à remplir des pages moules qui seront elles des supports de référencement. La description d’un château ou d’un hôtel ne serait qu’une infime partie d’un contenu plus vaste, d’une page ou d’une rubrique présentant un pan de territoire. Les contenus utilisés non plus bruts, mais habillés, gagnent en valeur pour le référencement et se démarque du Mix effectué par les territoires voisins. Dans l’idéal, certains contenus peuvent être « surchargés » par les territoires pour se démarquer totalement de l’utilisation faite par les voisins !

Cette ébauche de réponse est elle satisfaisante ? Je n’en sais trop rien et il y a sans doute énormément de travail avec un territoire dans sa globalité pour arriver à un résultat acceptable et performant. Mais le jeu en vaut sans conteste la chandelle. Des volontaires ?

En attendant, pour ceux qui n’ont pu assister à ma conférence sur le référencement naturel et payant qui se tenait à Deauville mardi après-midi, le support de présentation est disponible ci-dessous, comme d’habitude :

En espérant se retrouver et 2014, toujours à Deauville, pour d’aussi belles rencontres !

 

A propos François Houste 418 Articles
Ange Gardien Numérique Ancien journaliste et chef de produit en hébergement digital. Aujourd'hui Directeur Conseil au sein d'une agence marketing. François travaille avec ses clients à mieux appréhender la révolution numérique et son impact sur le quotidien. Technophile, enthousiaste, nourri de web, de fun et de musique.

2 Comments

  1. Bonjour François et merci pour ce billet qui vient bien synthétiser votre intervention à Deauville.
    Cette problématique est effectivement un serpent de mer pour les responsables SIT. Comme bien souvent, difficile de savoir ce qui se cache sous le capot de Google et quels sont les effets du mystérieux algorithme sur notre référencement. Sait on précisément comment Google définit de son côté le duplicate content ? Quelles sont les caractéristiques des textes, les sites visés ? l’utilisation des balises de mise en forme sur ces textes peut elle avoir un effet « annihilant » sur le duplicate content ? Si vous avez des billes à ce sujet, je suis preneur. A ma connaissance quelques essais, conduits de manière assez empirique par des collègues CDT en 2012, ont permis d’arriver à la conclusion que le « partage » de ces offres SIT d’un site institutionnel à l’autre n’avait (pour le moment ?) pas réellement d’impact sur le référencement de nos pages. Cependant on est bien d’accord, mieux vaut anticiper un problème qui peut nous tomber dessus du jour au lendemain. On en revient invariablement à une même idée : produire du contenu de qualité, avec toutes les questions de ressources et de compétences que cela pose.
    Un petit commentaire que je ne peux m’empêcher de vous adresser sur la forme : je pense que c’est le bât qui blesse et pas le bas, bien que je n’en mette pas suffisamment pour avoir un avis expert sur la question ;-)
    Cordialement.

    • La question du « Dupplicate Content » est complexe, et bien entendu Google ne comunique pas de manière claire sur le sujet. Ce serait trop simple. Beaucoup trop… Ce qu’on sait c’est en revanche que le contenu duppliqué n’est pas qu’une question éditoriale, c’est également une question technique de conextualisation de l’information, d’uniformité du code HTML, de position des éléments dans la page… et que tout cela se calcule en « taux de similarité » entre différentes ressources… Vaste sujet.
      Et oui, la question des ressources et des compétences est centrales sur ce point, car l’éditorial demande du temps et un minimum de compétence éditoriale, mais je reste persuadé que le jeu en vaut largement la chandelle. J’en reviens au passage sur les mot de Claude Barnnwarth en plénière sur la « fin de l’exhaustivité ». Je pense que cette exhaustivité n’a plus de sens non plus en SEO pour les territoires…

      et pour le bas, il est corrigé ! Merci !

Les commentaires sont fermés.

Faire réfléchir, plutôt que faire réagir...