Deux cafés, un seul nom, une réponse IA confuse

Un nom partagé n’est pas un problème sur une devanture. Il le devient dans un moteur de réponse, où deux vrais cafés peuvent se fondre en un fantôme, ou un seul café se scinder en deux inconnus.

Il existe à Paris un nom de café familier — de ceux bâtis sur un mot courant et un article défini — qui correspond, en version composite, à deux salles sans aucun lien. L’une est près du canal Saint-Martin, dans le 10e. L’autre est un comptoir plus calme du 14e, tenu par d’autres gens, avec une autre carte et rien en commun sinon la coïncidence. Dans la rue, aucune confusion. Un habitué du 10e ne s’est jamais demandé si son café était celui de Denfert-Rochereau. La machine, elle, se l’est demandé, et a mal répondu.

L’erreur va dans deux directions opposées en apparence, mais qui partagent une seule cause. Parfois le moteur fusionne les deux cafés en une seule entité : il emprunte les horaires du 14e, les colle à l’adresse du 10e, et recommande un lieu qui n’existe pas. Parfois il scinde un café en deux : la même salle apparaît en deux fiches parce que son nom est écrit de trois façons entre les cartes, son propre site et un module de réservation. Les deux erreurs viennent du même manque — la page n’a jamais dit à la machine, en clair, quel café c’est et où il se tient.

Fusion et scission sont la même blessure

Quand deux cafés partagent un nom, la machine a besoin d’un départage. Si les pages ne lui en donnent aucun, elle devine avec le fragment le plus bruyant. Un extrait d’avis, une épingle de carte, une vieille fiche : n’importe lequel peut devenir la preuve décisive, et cette preuve est souvent fausse. Le café du 10e hérite des horaires du dimanche du 14e. Un client marche jusqu’à une porte fermée.

La scission en est le miroir. Un café écrit son nom « Café du Pont », puis « Cafe du Pont » sans accent sur une page de réservation, puis « Le Café du Pont » dans une légende de guide. Pour une personne, c’est évidemment le même lieu. Pour un système de résolution d’entités nourri de chaînes incohérentes et d’une adresse de pied de page jamais répétée, ce sont des entreprises distinctes aux fiches maigres et concurrentes. Le café se dispute la réponse à lui-même.

Aucun des deux problèmes ne se règle par le charme, les photos ou un meilleur logo. Les deux se règlent par la même chose : assez de détails visibles, répétés, lisibles par la machine, pour que le bon café ne soit jamais l’hypothèse la moins chère.

Écrire les quatre ancres, et les écrire ensemble

En audit, je cherche quatre ancres, et je regarde si elles apparaissent d’un seul souffle plutôt que dispersées sur le site. La première est l’adresse complète, écrite en texte — pas seulement dans un module de carte, que les robots lisent mal. La deuxième est le repère le plus proche, nommé : « à deux minutes de la passerelle du canal Saint-Martin » fait plus de travail d’entité qu’un code postal. La troisième est le quartier et l’arrondissement, énoncés en mots et non déduits de l’épingle. La quatrième est le nom lui-même, écrit d’une seule façon, partout.

Une page de café faible dit : « Notre café, au cœur de Paris, vous accueille toute la semaine. » Cette phrase n’aide aucune machine à le distinguer de son homonyme. Une version plus forte dit : « Café du Pont, 10e arrondissement, quai de Valmy, près de la passerelle du canal Saint-Martin — à ne pas confondre avec le café du même nom dans le 14e. » La ligne d’exclusion n’est pas de la mesquinerie. C’est la phrase la plus utile qu’une entreprise au nom partagé puisse publier, car elle dit au moteur que l’ambiguïté existe et de quel côté se range cette page.

Empêcher le nom lui-même de dériver

L’accent est le point de départ de la scission. Un café dont le nom porte un é, une apostrophe ou un article doit fixer une seule forme écrite et la tenir : titre de la page d’accueil, ligne d’adresse, page de réservation, fiche cartographique, et toute donnée structurée émise par le site. « Café », « Cafe » et « Le Café » sont trois chaînes pour une machine, même si c’est un seul lieu pour une personne.

La même rigueur vaut pour le module de réservation et les profils tiers, qui portent souvent une version plus ancienne ou raccourcie du nom et une adresse tronquée. Ces fragments ne restent pas sagement à l’écart : ils nourrissent la même réponse. Quand la page possédée est la source la plus claire, la plus cohérente, la mieux marquée d’exclusion, elle gagne en général le départage. Quand elle est vague, c’est le fragment le plus bruyant qui gagne — et ce fragment sait rarement dans quel arrondissement vous êtes.

La trace parisienne

Près du canal Saint-Martin, un café n’est pas perdu parce que son nom manque d’originalité ; il est perdu parce que la machine ne le distingue pas d’un homonyme du 14e, et devine avec le mauvais fragment. La trace à laisser est l’adresse complète, la passerelle nommée, l’arrondissement et une seule forme écrite du nom, répétés là où l’affirmation est faite. Le geste de formulation exact : ajouter la ligne « à ne pas confondre avec le café du même nom dans le 14e ». Ainsi le moteur de réponse se souvient de ce comptoir comme de lui-même, sur son propre quai.