'>

Est-il possible d'optimiser pour les requêtes Réécrit?

Un document de recherche publié récemment par Microsoft intitulé "Requête robuste réécriture utilisant les données de l'ancre" s'ouvre avec un aperçu historique des techniques de réécriture de requêtes qui ont été proposées au fil des ans.

Les moteurs de recherche réécrire les requêtes pour plusieurs raisons: leur objectif, bien sûr, est de fournir la meilleure information possible à un chercheur avec le minimum d'effort. C'est le «minimum d'effort" qui contribue le plus faux-positifs dans les résultats de recherche les plus, mais pour être honnête, nous ne pourrons jamais secouer lâche de faux positifs indépendamment du nombre de ressources et combien de temps un moteur de recherche jette à une requête.

ingénieurs de recherche sont confrontés à une tâche complexe. Ils doivent fournir une sorte de résultats aux utilisateurs dans environ une seconde parce que les utilisateurs se sentent frustrés et passer à autre chose si ils ne voient rien. Pas tous les utilisateurs, mais visiblement un grand nombre vont abandonner un outil de recherche s'ils ne sont pas heureux avec le temps de la performance (bien sûr, cela est vrai pour tous les sites Web).

En outre, de nombreuses requêtes sont soit ambiguë ou irréfutable. Une requête est ambiguë si deux ou plusieurs ensembles de documents distincts semblent être tout aussi pertinent pour la requête (par exemple "éponge", "recherche", "chien" - tous les mots qui sont associés à des contextes multiples). Une requête est irréfutable si le moteur de recherche n'a pas indexé tout contenu approprié qui correspond à la requête (par exemple, une preuve correcte écrit dans la langue Klingon réfutant le dernier théorème de Fermat - une impossibilité logique puisque le théorème a été démontré par Andrew Wiles et Richard Taylor en 1994 ).
The Searcher, l'éditeur et le Indexer parlent des langues différentes

Les chercheurs n'ont pas l'air "recherche enginese". Ils parlent leur propre idiome personnelle que les moteurs de recherche doivent interpréter. Comme un agent de commercialisation Web qui a besoin de prévoir comment les gens de recherche vous êtes à un double inconvénient: vous n'avez pas seulement parlent pas le langage du chercheur, vous manquez de ressources puissantes du moteur de recherche pour comparer une nouvelle requête à la fois l'index de recherche et le corpus requête.

Pourtant, il est de votre responsabilité de savoir ce que les gens recherchent et à mettre du contenu dans l'index qui correspond aux requêtes. La question de la commercialisation, cependant, est dont la langue devriez-vous adopter? Vous pouvez choisir sa langue (s) et espérer que le moteur de recherche correspond à votre contenu à leurs questions, ou vous pouvez choisir les indexeurs de la chercheurs de langue (s) et espérer que les chercheurs demandent requêtes qui doivent être résolus à travers des requêtes réécrites, ou vous pouvez choisir votre propre langue et espérer pour le mieux.

Stratégies pures de marketing de contenu sont construites sur la troisième option: vous créez le contenu et acceptez les matchs aléatoires entre les chercheurs et le contenu que les moteurs de recherche proposent. Ce système fonctionne assez bien mais ce n'est pas optimale au sens de cibler et de satisfaire des demandes spécifiques.
Probabilités désambiguïsant Grâce surcompensation

Une recherche typique de nom est un très bon candidat pour une requête ambiguë. Les gens qui partagent les noms des célébrités trouvent souvent leur propre contenu auto-édité est poussé hors de la première page de résultats de recherche par une pléthore d'articles et d'images sur les célébrités. Cette injustice inhérente n'est pas le résultat de la réécriture de requêtes autant que de l'indice et les algorithmes étant fortement influencé par la taille du document et le lien Corpi corpus.

Un corpus de documents est le corps de tous les documents qui sont vraiment pertinents pour un sujet précis. Prenez le musicien James Taylor, par exemple. Pratiquement la première page entière de Google et Bing sont dominées par des documents le concernant, même si il ya beaucoup d'autres gens appelés "James Taylor" (certains ont même appelé pour le musicien). Bien que la requête est ambiguë de la taille du corpus de documents sur le musicien de célébrité est si grande par rapport au corpus de documents pour toute autre James Taylor que les moteurs de recherche sont plus susceptibles d'identifier rapidement et associer le contenu sur le musicien avec un "james taylor" requête qu'avec n'importe qui d'autre. Dans ce cas, le corpus de liaison (tous les liens pointant vers des documents avec un texte d'ancrage y compris "James Taylor» ou variations) ajoute sans doute rien à la combinaison, mais il jette certainement les probabilités en faveur de montrer que les résultats pour le musicien.

Ainsi, pour améliorer ses chances d'être trouvé dans la première page de résultats de recherche pour "James Taylor", personne de ce nom autre que le musicien peut avoir à consacrer une quantité importante de contenu à lui pour participer à la sélection algorithmique et le tri . Alors que c'est injuste pour tous les autres James Taylor du monde, il s'agit d'une approche plus efficace que d'essayer de surclasser les principaux documents à travers égale pertinence.

D'autre part, dans un espace de nom plus congestionné où notabilité est plus équitablement réparti, la méthode préférée peut en fait être en concurrence sur la base du lien texte d'ancre. S'il ya plusieurs personnes de semblable "Fame" partageant le même nom, des liens jouent un rôle plus important parce que le document Corpi corpus sont plus égaux. Mon propre espace de nom, "michael martinez", a subi des changements importants au cours des dernières années. J'ai fait des liens à un certain nombre de sites internet sur le (ancien) Major League Baseball joueur Michael Martinez pour contrer une campagne de réputation hostile.

Lorsque, dans les années passées, il y avait quatre à six listes sur moi pour "michael martinez" (et je tenais généralement la première position) maintenant je vois habituellement seulement 1, parfois deux listes sur la page couverture pour moi, les autres sont pour la joueur de baseball, un musicien, certains éducateurs, etc L'écart est plus uniforme et reflète mieux la notabilité de la plupart des gens. Le joueur de baseball va probablement continuer à dominer le SERP à partir de maintenant (je ne suis certainement pas en train de faire quelque chose pour changer cela).
Remplacements anticiper et compenser pour

Nouveaux noms de marques produisent souvent des résultats de recherche impairs. Vous n'avez pas toujours besoin d'un espace de requête vide à traiter. Par exemple, si vous démarrez une nouvelle entreprise, vous pouvez choisir un nom de société qui est très similaire à (voire identique) de noms de sociétés utilisés précédemment. Les marques peuvent être tout aussi déroutant.
Just getting DISMAL TRAFFIC to your Website? Let's change all that. CLICK HERE to contact Reflective Dynamics...

Les moteurs de recherche n'ont pas trouvé suffisamment de documents et / ou des liens vers associent clairement un corpus de document spécifique avec le nom, et ils ne pourront jamais résoudre une requête de la marque complètement précision. Une des requêtes de noms de marques classiques qui donne des résultats bizarres est "adobe" (je dis "bizarre", mais les moteurs de recherche sont essentiellement correct à montrer ces résultats). Bing ne partage aucune information sur le matériau de construction adobe mais Google fait; Google, d'autre part, ajoute-t-listes pour Acrobat tm lecteur PDF d'Adobe.

Bing est plus certain que le chercheur veut connaître l'entreprise, Google couvre son pari et couvrant plusieurs sujets, dont l'un n'est pas lié aux autres. Les deux moteurs de recherche fournissent des listes de questions connexes, mais que le contenu ne satisfait pas à la requête "adobe" lui-même. Les moteurs de recherche ont décidé par eux-mêmes ce que l'utilisateur peut vouloir et ils régler ce problème.

Supposons que vous avez été invité à placer le contenu pour une utilisation sans rapport avec des "adobe" dans les résultats de recherche; cette utilisation ne sera pas causer de la confusion du consommateur sur l'entreprise ce n'est donc pas une violation de marque déposée. Quelle est la meilleure stratégie à adopter? Le document Corpi corpus à la fois pour l'entreprise et le matériau de construction sera énorme; le lien Corpi corpus devrait être de taille correspondante.

Dans ce scénario, vous auriez besoin de ressources considérables pour inspirer ou de contraindre d'autres personnes pour créer du contenu et des liens sur votre adobe, sinon, vous aurez besoin de se concentrer sur une requête modifiée. Mais pouvez-vous inciter les moteurs de recherche pour suggérer cette requête modifiée pour leurs utilisateurs, ou de substituer les résultats pour la requête modifiée pour leur requête ambiguë?

Que les nouveaux visages de la marque, quand il envahit un espace de requête établi, est une montée de recherche la reconnaissance de l'algorithme. La commercialisation de l'Internet a trois options:

    Intégrer de nouveaux contenus en document et le lien existant Corpi corpus
    Susciter l'intérêt dans un tout nouvel espace de requête (modifié)
    Utiliser les canaux externes pour soutenir une campagne populaire pour modifier le document et le lien Corpi corpus

Ajout de nouveaux documents et des liens vers existante Corpi corpus est le processus que j'ai dans le passé décrit comme «changer le cadre de référence» . Nous avons toujours dit que le moteur de recherche n'a que deux choses à travailler avec: contenu et des liens. Techniquement, il dispose également d'requêtes. Le cadre de référence pour une requête donnée est le combiné Corpi corpus de documents et liens associés à la requête spécifique.

Si nous choisissons de modifier le cadre de référence, nous montrons le moteur de recherche que l'ensemble du document n'est pas aussi clairement concentré sur le sujet que l'utilisateur perçoit. En quête gestion de la réputation que vous donnez le moteur de recherche plus d'options à choisir et donc il fait des choix différents.

Donc la question suivante, peut-on changer le cadre de référence pour les requêtes qui peuvent être réécrits par les moteurs de recherche? En clair, si les requêtes réécrit (modifiée) sont sensiblement proches des requêtes initiales il devrait y avoir un chevauchement important dans le document et lien Corpi corpus entre les requêtes - ils font tous partie de la même espace de requête .

Mais si les requêtes réécrites sont sensiblement différents des requêtes initiales puis différents ensembles de documents peuvent être sélectionnés (bien sûr, la requête peut être réécrite seulement parce qu'aucun des documents pertinents ont été trouvés dans l'indice).
Nous n'avons pas d'outils pour l'analyse des requêtes Réécrit

Le problème avec l'optimisation des requêtes réécrites, c'est que vous devez documenter manuellement. Et ce n'est pas tout à fait réalisable car les requêtes peuvent être affectés par la langue de l'utilisateur, l'emplacement, l'état de connexion, connexion, le système d'exploitation / plateforme, etc Combien de différents environnements que vous pouvez tester si vous avez besoin de savoir si les requêtes seront réécrits?

Et faire les moteurs de recherche indiquent toujours quand ils ont réécrit les requêtes pour les utilisateurs? Si non, vous devez développer un test raisonnablement fiable pour déterminer si une requête a été réécrit. Si le moteur de recherche est miséricordieux, il devrait indiquer qu'il affiche des résultats pour "Alpha requête" au lieu de "Beta requête".

La commercialisation de l'Internet doit connaître le sujet mieux que la fois le moteur de recherche et le chercheur pour finalement si l'entreprise va changer les résultats de la commercialisation doit changer le cadre de référence. Pour le moment, cela ne peut être fait péniblement par essai et erreur.

La motivation pour l'optimisation dans ce domaine peut être supérieure pour les commerçants qui mettent en place de nouvelles marques ou de promouvoir des personnes récemment importantes, mais toute campagne de marketing de recherche qui est sous-performant malgré la réalisation classement ciblées peut bénéficier d'une analyse des résultats de la requête dans le but de déterminer si réécriture de requêtes est à l'œuvre. Une requête réécrite peut complètement exclure les résultats de recherche les plus pertinents tout simplement parce que l'utilisateur ne se rend pas compte que le moteur de recherche a fait une hypothèse statistiquement significative.
Publié par Drupal Study