微信客服
Telegram:guangsuan
电话联系:18928809533
发送邮件:[email protected]

O significado de canonical no SEO丨Como usar a tag canonical no SEO

本文作者:Don jiang

A tag rel=”canonical” informa aos motores de busca “qual URL é a versão canônica deste conteúdo”, evitando a dispersão de autoridade.

No SEO do Google, ela é usada adicionando <link rel=”canonical” href=”URL canônica”> na seção <head> da página.

Os dados mostram que sites de comércio eletrônico que implementam a tag Canonical corretamente veem um aumento médio de 28% na taxa de indexação de suas páginas de listagem de produtos e uma redução de 40%-60% no número de rastreamentos de URLs duplicadas pelos robôs;

Sites de notícias que consolidam artigos semelhantes usando a tag canônica experimentam um crescimento médio de 19% nos cliques de pesquisa orgânica para seu conteúdo principal.

No entanto, uma pesquisa real descobriu que apenas 31% dos sites usam a tag 100% corretamente (erros comuns incluem: apontar para uma URL incorreta, não aderir a protocolos/domínios, empilhamento de múltiplas tags, etc.).

O que é a tag canonical

Por que é necessário usar a tag canonical

No rastreamento diário do Google, mais de 65% dos sites têm problemas de conteúdo duplicado causados por um design inadequado da estrutura de URL.

Isso se manifesta como:

     

  • O mesmo artigo é acessível através de URLs com parâmetros (como ?utm_source=xxx)
  •  

  • URLs com sufixos de diretório (como /page/ e /page/index.html)
  •  

  • Diferentes subdomínios (como www e sem www)

John Mueller do Google mencionou repetidamente em sessões oficiais de perguntas e respostas que, quando o motor de busca encontra “múltiplas URLs mostrando conteúdo muito semelhante ou completamente idêntico”, ele enfrenta o dilema de “a qual delas deve atribuir a autoridade”.

Uma página de produto de comércio eletrônico pode gerar mais de dez URLs diferentes devido a filtros de cor ou parâmetros de classificação; um comunicado de imprensa pode ser enviado para várias colunas, criando vários links de entrada.

Ao usar a tag canonical, você diz claramente ao motor de busca: “Embora este conteúdo possa ser visualizado através de múltiplas URLs, concentre a autoridade e o foco de classificação nesta URL específica que designei“.

Como o conteúdo duplicado afeta o SEO

O conteúdo duplicado em si não leva diretamente a uma penalidade dos motores de busca (o Google declarou claramente que “não penalizará sites apenas por conteúdo duplicado”), mas causa dispersão de autoridade.

Quando o mesmo conteúdo é acessível através de múltiplas URLs, o motor de busca trata essas URLs como “páginas diferentes” e as processa separadamente.

Por exemplo, um artigo original é exibido através das seguintes 4 URLs:

     

  • https://example.com/article
  •  

  • https://example.com/article?source=newsletter
  •  

  • https://example.com/article#comments
  •  

  • https://www.example.com/article (a versão com www)

Sem uma identificação canônica, o motor de busca pode rastrear todas essas 4 URLs simultaneamente e calcular a autoridade de indexação separadamente para cada uma.

No entanto, a necessidade de pesquisa do usuário é essencialmente uma única resposta, e, no final, o ranking dessas 4 versões pode ser baixo (porque a autoridade está dispersa), ou apenas uma delas é incluída por acidente, e as outras versões permanecem em estado “não indexadas” ou “baixo ranking” a longo prazo.

Em um site de comércio eletrônico, uma página de detalhes do produto pode gerar em média de 8 a 12 URLs duplicadas devido a parâmetros (como ?size=XL, ?color=red), e a proporção de rastreamento de robôs para essas páginas pode atingir 15%-20% do rastreamento total (o que deveria ter sido alocado para novas páginas de maior valor).

Sites de notícias, devido ao conteúdo ser enviado para várias colunas (como “Últimas Notícias”, “Tendências da Indústria”, “Recomendações Populares”), um único rascunho pode gerar 3-5 diferentes URLs de entrada.

Um caso mais específico: antes da padronização de URLs, a taxa de indexação das páginas de listagem de produtos de um site de comércio eletrônico de médio porte era de apenas 62% (ou seja, apenas 62 em cada 100 páginas eram incluídas pelo Google e podiam participar do ranking);

Ao adicionar a tag canonical nas páginas de listagem com parâmetros (como ?category=shoes&sort=price) para que apontassem para a URL base sem parâmetros (como /shoes), a taxa de indexação aumentou para 81% após 3 meses, e o tráfego de pesquisa orgânica para os produtos correspondentes cresceu 17%.

Não é “eliminar duplicatas”, mas sim “designar a versão autorizada”

Muitos webmasters têm um mal-entendido sobre a tag canonical, acreditando que ela é usada “para eliminar páginas duplicadas”.

Na verdade, sua função principal é “dizer ao motor de busca: entre as múltiplas URLs que mostram o mesmo conteúdo, qual é a versão que ele deve indexar, classificar e atribuir autoridade preferencialmente”

Quando você adiciona o seguinte código na seção <head> de uma página:

<link rel=“canonical” href=“https://example.com/URL_canônica” />​

Você está enviando um sinal claro para o motor de busca: “Embora o conteúdo possa ser acessado através desta página (por exemplo, /article?source=email com parâmetros), eu quero que você concentre sua autoridade e oportunidades de classificação no endereço https://example.com/URL_canônica”.

De acordo com a documentação oficial do Google e a observação de dados reais de rastreamento:

     

  • Nível de rastreamento​: O motor de busca continuará a rastrear todas as versões da página (incluindo URLs com parâmetros e diretórios), mas consultará a tag canonical para ajustar seu “nível de importância” para essas páginas. Por exemplo, a URL com parâmetros pode ser rastreada, mas o robô não a visitará com tanta frequência ou a indexará tão profundamente quanto a versão canônica.
  •  

  • Nível de indexação​: Se o conteúdo de múltiplas URLs for muito semelhante (a taxa de duplicação exceder 80%), o motor de busca geralmente incluirá a versão canônica no índice, e as outras versões podem não ser indexadas separadamente, ou, mesmo que sejam indexadas, não participarão da competição de classificação principal.
  •  

  • Nível de autoridade​: Quando um link externo aponta para qualquer uma das versões duplicadas da URL, o motor de busca, seguindo a orientação da tag canonical, “transfere” ou “associa” essa parte da autoridade do link externo para a versão canônica (embora não seja uma transferência 100% completa, na maioria dos casos o efeito é semelhante).

Tomemos um cenário real: um artigo de blog é publicado simultaneamente em duas colunas: “Recomendação da Página Inicial” e “Coluna Técnica“, gerando duas URLs:

     

  • https://example.com/home/recommend/123 (Entrada de recomendação da página inicial)
  •  

  • https://example.com/tech/article/123 (Entrada da coluna técnica)

O conteúdo é completamente idêntico, mas a URL de recomendação da página inicial atraiu alguns links externos devido a um tráfego mais alto.

Sem a tag canonical, o motor de busca pode tratar estas duas páginas como conteúdo independente, e embora a URL de recomendação da página inicial tenha links externos, seu potencial de classificação pode ser inferior ao da coluna técnica porque o posicionamento da coluna não é vertical o suficiente (a recomendação da página inicial é frequentemente conteúdo geral).

Se a equipe técnica adicionar a tag canonical em ambas as páginas, apontando para https://example.com/tech/article/123, que se ajusta mais ao tópico do conteúdo, o motor de busca saberá claramente: “a versão autorizada deste conteúdo é a URL da coluna técnica”, e associará a autoridade dos links externos da página inicial a esta URL, melhorando a competitividade de classificação dessa página sob “palavras-chave relacionadas à tecnologia”.

O que acontece se a tag Canonical não for usada

O orçamento de rastreamento de robôs é desperdiçado

O “número de rastreamentos diários” alocado pelo motor de busca para cada site é limitado (chamado de “orçamento de rastreamento”), dando prioridade ao rastreamento de páginas importantes (como página inicial, páginas de conteúdo com alta frequência de atualização).

Se um site tiver muitas URLs duplicadas (por exemplo, uma página de detalhes de produto de comércio eletrônico com 10 parâmetros de classificação, gerando mais de 1000 URLs diferentes), o robô consumirá parte do orçamento nessas páginas de “conteúdo idêntico, mas URL diferente”, o que leva a uma diminuição na frequência de rastreamento de novas páginas que realmente precisam ser rastreadas (como produtos recém-lançados, notícias atualizadas).

Dados mostram que a análise dos logs de rastreamento de um site de comércio eletrônico de vestuário indicou que as páginas de produtos duplicadas com parâmetros (como ?size=M, ?color=blue) ocuparam 22% do rastreamento total, e a taxa de rejeição dessas páginas foi de até 85% (os usuários estão procurando produtos específicos, eles não entrarão através de URLs com parâmetros).

Quando o site adicionou uma tag canonical unificada nas páginas de detalhes do produto (apontando para a URL base sem parâmetros), a frequência de rastreamento das páginas de produtos principais pelo robô aumentou em 30%, e o tempo de inclusão de produtos recém-lançados foi reduzido de uma média de 7 dias para 3 dias.

Confusão na versão de indexação, classificação instável

Sem uma identificação canônica, o motor de busca pode selecionar aleatoriamente uma URL como a “versão de exibição padrão”, mas essa escolha não é fixa.

Por exemplo, quando um usuário pesquisa uma palavra-chave, às vezes ele vê a versão com www (https://www.example.com/page), às vezes a versão sem www (https://example.com/page), e pode até ser a versão com parâmetros (https://example.com/page?from=social).

Caso: a página “Entre em Contato” de um site de serviços locais existia em duas versões https://example.com/contact e https://example.com/contact-us (o conteúdo era completamente idêntico), sem a tag canonical estabelecida. O Google indexou essas duas URLs em momentos diferentes, o que levou a que, quando os usuários pesquisavam “Informações de Contato do Serviço de Reparo na Cidade XX”, às vezes viam a primeira versão classificada mais alto, e às vezes a segunda versão.

Quando o usuário clica, se ele entra em uma versão não principal (como contact-us), a taxa de conversão pode diminuir devido a diferenças no design de navegação da página (por exemplo, a falta de um botão de reserva online).

Mais tarde, o site adicionou a tag canonical em ambas as versões, apontando para https://example.com/contact, e após 3 meses, o ranking desta página melhorou, e a taxa de cliques de pesquisa (CTR) aumentou em 11%.

Dispersão de autoridade de links externos

Se múltiplas versões duplicadas de URL forem linkadas por sites externos (por exemplo, alguém usou uma URL com parâmetros ao republicar conteúdo, ou um novo link foi gerado ao promover uma página de coluna), mas esses links externos apontam para endereços diferentes, o motor de busca não pode fundir a autoridade automaticamente.

Comparação de dados: um artigo sobre “Guia de Estudos de Pós-Graduação” de um site educacional foi republicado por 5 sites externos, 3 dos quais linkaram para a versão sem parâmetros (https://example.com/guide/kaoyan), e 2 linkaram para a versão com parâmetros (https://example.com/guide/kaoyan?from=partner).

Sem a tag canonical estabelecida, o motor de busca associaria esses 5 links externos a diferentes URLs separadamente. Depois que o site adicionou a tag canonical em todas as versões (apontando para a versão sem parâmetros), o tráfego de pesquisa orgânica da página aumentou 24% em 6 meses.

Sintaxe básica e formato da tag canonical

Cerca de 32% das páginas colocam a tag canonical na seção <body> (em vez da área <head> exigida), 19% dos valores do atributo href carecem do protocolo completo (como escrever apenas example.com em vez de https://example.com), e 15% das páginas apontam para diferentes “versões canônicas” em múltiplas URLs duplicadas (o que causa confusão no motor de busca).

Do ponto de vista da implementação técnica, a tag canonical é essencialmente uma simples tag de link HTML, mas a localização da tag (deve estar dentro de <head>), o formato da sintaxe (deve seguir estritamente a especificação HTML) e a URL para a qual aponta (deve corresponder completamente ao conteúdo real e ser acessível) são os principais fatores para que o motor de busca a aceite e aplique corretamente.

Os dados mostram que quando a tag canonical é implementada de acordo com a escrita padrão (ou seja, colocada no topo de <head>, usa o protocolo HTTPS completo, aponta para uma URL canônica única e correta), a probabilidade de ser corretamente identificada e aplicada pelo motor de busca excede 95%;

E nas páginas com erros de escrita, cerca de 60% da intenção canônica não é adotada pelo motor de busca, resultando na persistência do problema de conteúdo duplicado.

Por exemplo, quando um site de comércio eletrônico adicionou a tag canonical na página de detalhes do produto (como a versão ?color=red com parâmetros), devido à omissão do cabeçalho do protocolo (escrito como //example.com/product ou example.com/product), o Google não conseguiu analisar corretamente a URL de destino.

Estrutura da sintaxe padrão

A sintaxe completa da tag canonical é apenas uma linha de código HTML: <link rel=“canonical” href=“https://www.example.com/URL_completa_da_página_canônica” />

Esta linha de código consiste em 3 partes principais, que são indispensáveis e com ordem fixa:

Tipo de tag: <link>

     

  • Esta é a tag HTML usada para definir a relação entre o documento e recursos externos, e a tag canonical é um tipo de “relação de link”, devendo ser usada <link> como estrutura base.

Atributo: rel="canonical"

     

  • rel é um atributo obrigatório da tag <link>, usado para descrever a relação entre o link atual e o documento atual. Quando seu valor é definido como canonical, ele diz claramente ao motor de busca: “esta tag define a versão canônica (autorizada) do conteúdo da página atual”.

Atributo: href="URL"

     

  • href é outro atributo obrigatório da tag <link>, usado para especificar o endereço web concreto da versão canônica. Esta URL deve ser completa e acessível, incluindo o protocolo (http ou https), o domínio (www ou sem www), o caminho e os parâmetros (se necessário).

Por exemplo:

     

  • Escrita correta: href="https://www.example.com/products/shoes"
  •  

  • Escrita incorreta 1 (falta o protocolo): href="//www.example.com/products/shoes" (o navegador pode completá-lo automaticamente, mas o motor de busca pode não conseguir analisar a URL de destino com precisão)
  •  

  • Escrita incorreta 2 (falta o domínio): href="/products/shoes" (caminho relativo, o motor de busca não sabe a qual site a página específica pertence)
  •  

  • Escrita incorreta 3 (erro de digitação): href="https://www.exaple.com/products/shoes" (domínio mal escrito, aponta para uma página inexistente)

Outros detalhes​:

     

  • Esta tag deve terminar com / (se a própria URL exigir uma barra final), mas na maioria dos casos, os motores de busca modernos têm maior tolerância quanto à inclusão ou não da barra final (desde que a padronização seja uniforme).
  •  

  • A tag deve ser escrita em uma única linha (uma quebra de linha pode fazer com que algumas ferramentas de análise falhem, embora os motores de busca geralmente consigam repará-la automaticamente).
  •  

  • A parte de fechamento da tag é /> (tag de auto-fechamento, o padrão HTML5 permite omitir o / final, mas é recomendável mantê-lo para garantir a compatibilidade).

Por que deve estar em <head>

Porque quando os robôs dos motores de busca rastreiam uma página, eles priorizam a análise do conteúdo na região <head> (especialmente meta-informações, título, tags canônicas e outras “instruções de controle”), e depois processam o conteúdo real em <body>.

Se a tag canonical for colocada incorretamente dentro de <body> (por exemplo, aninhada em um parágrafo do artigo ou no código do rodapé), o motor de busca ignorará diretamente a tag <link rel="canonical"> dentro de <body>.

Outras notas​:

     

  • Uma página só pode ter uma tag canonical (se várias aparecerem, o motor de busca geralmente só identificará a primeira, e as demais serão ignoradas).
  •  

  • Esta tag não pode ser aninhada dentro de outras tags (por exemplo, não pode ser colocada em <div> ou <script>).
  •  

  • Para páginas geradas dinamicamente (como páginas geradas por linguagens de backend como PHP, Python, etc.), é necessário garantir que o motor de template insira corretamente a tag canonical na região <head> ao gerar o HTML (geralmente controlado através de variáveis de template).

5 Erros mais comuns

Erro 1: Apontar para uma URL incorreta (a versão canônica não corresponde à necessidade real)

     

  • Fenômeno​: Direcionar a tag canonical para uma URL cujo conteúdo não é totalmente consistente (ou não é o mesmo conteúdo). Por exemplo, a página de detalhes de um produto (mostra sapatos vermelhos) aponta para a página de sapatos brancos.
  •  

  • Consequência​: O motor de busca concentrará a autoridade na página irrelevante de acordo com as instruções incorretas, o que levará à queda de classificação do conteúdo principal.
  •  

  • Correção​: Verifique o conteúdo real da página atual e certifique-se de que a URL no href aponte para a versão canônica que “mostra conteúdo completamente idêntico” (por exemplo, use a URL base sem parâmetros de forma unificada, ou a página de coluna que melhor se ajusta à intenção de pesquisa do usuário).

Erro 2: Falta o cabeçalho do protocolo (apenas o domínio é escrito ou um caminho relativo é usado)

     

  • Fenômeno​: O código é escrito como href="//example.com/page" (caminho relativo ao protocolo) ou href="/page" (caminho relativo).
  •  

  • Consequência​: O motor de busca pode não ser capaz de analisar com precisão o endereço completo da URL de destino (especialmente em casos de protocolo ou domínio cruzado), levando à ineficácia da intenção canônica.
  •  

  • Correção​: Sempre use o protocolo completo + domínio + caminho, o formato é href="https://www.example.com/page" (o protocolo https é recomendado para garantir a segurança).

Erro 3: Conflito entre URLs com parâmetros e a versão canônica

     

  • Fenômeno​: A versão sem parâmetros de uma página de lista de produtos (https://example.com/products) é a versão canônica, mas a versão com parâmetros (como https://example.com/products?sort=price) não aponta corretamente para ela, mas aponta para outra URL com parâmetros diferentes (como ?sort=date).
  •  

  • Consequência​: Múltiplas versões com parâmetros apontam mutuamente para URLs diferentes, formando uma “canonização circular” ou dispersão de autoridade.
  •  

  • Correção​: Unifique a tag canonical de todas as URLs com parâmetros para que apontem para a versão base sem parâmetros (ou a versão de classificação/filtro mais usada), garantindo que todas as versões variantes apontem para o mesmo endereço canônico.

Erro 4: A tag é colocada dentro de <body>

     

  • Fenômeno​: Ao editar a página através do backend do CMS, o código canonical é colado incorretamente na área de conteúdo do artigo (parte <body>), em vez da área <head> do template do site.
  •  

  • Consequência​: O robô do motor de busca pode ignorar a tag, o que leva a páginas duplicadas não padronizadas corretamente.
  •  

  • Correção​: Entre em contato com a equipe técnica para verificar os arquivos de template (como header.php do WordPress, theme.liquid do Shopify) e garanta que a tag canonical seja gerada dentro da tag <head> do HTML.

Erro 5: Empilhamento de múltiplas tags canonical

     

  • Fenômeno​: Devido a um erro de template ou adição manual, múltiplas tags <link rel="canonical"> aparecem em uma página (por exemplo, apontando simultaneamente para /page e /page/).
  •  

  • Consequência​: O motor de busca geralmente só identifica a primeira tag, e as tags subsequentes são ignoradas, o que pode causar confusão na intenção canônica.
  •  

  • Correção​: Verifique o código, remova as tags canonical redundantes e garanta que cada página tenha apenas uma instrução canônica.

Diferença entre canonical e outras tags (como noindex, redirecionamento 301)

A tag canonical é para “designar a versão autorizada do mesmo conteúdo” (manter todas as URLs, mas concentrar a autoridade), a tag noindex é para “proibir o motor de busca de indexar a página atual” (permitir o rastreamento, mas não a exibição), e o redirecionamento 301 é para “redirecionamento permanente da URL antiga para a nova URL” (transferência completa de tráfego e autoridade).

Diferenças essenciais entre canônico, proibição e redirecionamento

Tag canonical (tag canônica)​: Usada para o “cenário de múltiplas URLs para o mesmo conteúdo”, o objetivo é dizer ao motor de busca “o conteúdo destas páginas é realmente o mesmo, mas você só deve focar nesta URL específica que eu designei (a versão canônica), e concentrar a autoridade aqui”.

     

  • Cenário Típico: Página de detalhes de produto de comércio eletrônico com parâmetros (como ?color=red e ?color=blue), comunicado de imprensa enviado para múltiplas colunas (como “Últimas Notícias” e “Tendências da Indústria”), URL separada para celular e PC, mas o conteúdo é idêntico.

Tag noindex (tag de proibição de indexação)​: Usada para o “cenário de permitir o rastreamento, mas proibir a exibição”, ela diz ao motor de busca “você pode rastrear esta página, mas não a inclua no índice de resultados de pesquisa”.

     

  • Cenário Típico: Páginas de gerenciamento interno (como páginas de login, páginas de estatísticas de backend), páginas de eventos temporários (que não precisam manter o ranking após o término do evento), páginas de conteúdo de baixo valor (como versão para impressão, página de conversão de chinês simplificado/tradicional).

Redirecionamento 301 (Redirecionamento Permanente)​: Usado para o “cenário em que o conteúdo foi permanentemente migrado”, redirecionando automaticamente o usuário e o motor de busca da URL antiga para a nova URL através da configuração do servidor (como arquivo .htaccess ou regras Nginx). A autoridade da URL antiga (incluindo ranking, links externos, confiança do usuário) é gradualmente transferida para a nova URL, e a URL antiga pode eventualmente parar de ser acessível (mas o redirecionamento ainda é eficaz).

     

  • Cenário Típico: Mudança de nome de domínio do site (como migração de example.com para newexample.com), ajuste da estrutura de URL (como mudar /old-product/ para /products/new-product/), consolidação de múltiplas páginas antigas em uma nova.
FerramentaPermite rastreamento?Permite indexação?Altera a URL?Propósito Principal
canonical✅ Permite❌ Sugere não indexar (mas ainda pode indexar)❌ Não alteraConcentrar a autoridade de conteúdo idêntico múltiplo na versão canônica
noindex✅ Permite❌ Proíbe❌ Não alteraBloquear a página de aparecer nos resultados de pesquisa
Redirecionamento 301❌ Redirecionamento automático❌ A URL antiga não é indexada✅ Redireciona para a nova URLTransferir a autoridade e o tráfego da URL antiga para o novo endereço

4 Grupos de cenários comuns e comparação de seu uso

Cenário 1: O mesmo conteúdo tem múltiplas URLs (como páginas de produtos com parâmetros)

     

  • Problema​: A página de detalhes do produto é acessível através de https://example.com/product e https://example.com/product?color=red, e o conteúdo é completamente idêntico.
  •  

  • Ferramenta correta​: canonical. Adicione a tag canonical na URL com parâmetros (?color=red), apontando para a URL base sem parâmetros (https://example.com/product), dizendo ao motor de busca “a versão autorizada deste conteúdo é a página sem parâmetros”.
  •  

  • Por que não escolher noindex/301​: noindex impedirá que a página com parâmetros seja indexada (mas ainda pode ser rastreada), e o usuário ainda pode entrar através desse link, e o motor de busca ainda precisa julgar qual é a versão principal; o redirecionamento 301 requer forçar o usuário e o robô a redirecionar, mas o usuário pode precisar acessar através de diferentes parâmetros (como comparar cores diferentes), e o redirecionamento forçado não é adequado.

Cenário 2: A página não precisa mais aparecer nos resultados de pesquisa (como uma página de evento expirada)

     

  • Problema​: Uma página de atividade promocional (https://example.com/promo) terminou, mas ainda pode ser visitada por usuários através de favoritos ou links externos, e não precisa de ranking.
  •  

  • Ferramenta correta​: noindex. Adicione a tag <meta name="robots" content="noindex"> no <head> da página de atividade (ou configure através do CMS), permitindo que o motor de busca rastreie a página (por exemplo, para verificar o registro da atividade), mas proibindo sua inclusão no índice.
  •  

  • Por que não escolher canonical/301​: canonical não pode resolver o problema de “não deixar a página aparecer” (apenas concentra a autoridade); o redirecionamento 301 requer a especificação de uma nova URL (mas a página de atividade não tem um novo endereço correspondente), e o usuário ainda pode precisar visitar a página original para ver informações históricas.

Cenário 3: Mudança de domínio ou ajuste da estrutura de URL do site (como migração de páginas de produtos antigos)

     

  • Problema​: A página de produto antiga (https://old.example.com/item1) foi permanentemente migrada para o novo endereço (https://new.example.com/products/item1), e é necessário preservar a autoridade do link externo original e o hábito de acesso do usuário.
  •  

  • Ferramenta correta​: Redirecionamento 301. Configure através da configuração do servidor (como o arquivo .htaccess do Apache) para que, quando o usuário ou robô acessar a URL antiga, seja automaticamente redirecionado para a nova URL. A autoridade de classificação da URL antiga (incluindo ranking, links externos) será gradualmente transferida para a nova URL.
  •  

  • Por que não escolher canonical/noindex​: canonical não pode alcançar o redirecionamento de tráfego (o usuário permanecerá na URL antiga); noindex impedirá que a URL antiga seja indexada, mas a autoridade do link externo não será transferida, e o usuário não poderá acessar o novo conteúdo através do link antigo.

Cenário 4: URL separada para celular e PC (como m.example.com e www.example.com)

     

  • Problema​: O mesmo conteúdo tem URLs separadas no celular (https://m.example.com/page) e no PC (https://www.example.com/page), e o conteúdo é completamente idêntico.
  •  

  • Ferramenta correta​: Priorizar canonical (apontando para a URL do PC), ou unificar através do design responsivo. Se a entrada móvel for necessária (por exemplo, os usuários estão acostumados a acessar através de m.example.com), a tag canonical pode ser adicionada na página móvel apontando para a URL canônica do PC, e ao mesmo tempo redirecionar 301 alguns links móveis antigos para o PC (opcional).
  •  

  • Por que não escolher noindex​: noindex impedirá que uma das versões móvel ou PC seja indexada, o que pode impedir a satisfação das necessidades de pesquisa de alguns usuários (por exemplo, usuários móveis não veem conteúdo adaptado).

Como escrever o código? E qual é a lógica de eficácia diferente?

Tag canonical: Código HTML, depende da análise do motor de busca

     

  • Formato do código​: Adicione <link rel="canonical" href="https://URL_canônica" /> na seção <head> da página que precisa ser canonizada (conforme descrito no capítulo anterior).

Lógica de eficácia: Quando o motor de busca rastreia a página, ele lê esta tag e registra “a versão canônica desta página é XXX”, e no cálculo subsequente de ranking e atribuição de autoridade, ele prioriza a versão canônica. No entanto, outras versões da página ainda podem ser rastreadas (a menos que haja outras restrições).

Tag noindex: Meta-tag HTML ou cabeçalho de resposta HTTP, depende do cumprimento das regras pelo robô

     

  • Formato do código​: Geralmente adicionado <meta name="robots" content="noindex"> no <head> da página (aplicável à maioria dos casos), ou o cabeçalho de resposta HTTP X-Robots-Tag: noindex é retornado através do servidor (aplicável a páginas dinâmicas).

Lógica de eficácia: Quando o motor de busca rastreia a página, ele detecta esta instrução, e se confirmar que a página está em conformidade com as condições de noindex (por exemplo, não é uma página de spam), ele não a adicionará ao índice. No entanto, a página ainda será rastreada (a menos que o rastreamento seja bloqueado por robots.txt), e os usuários podem acessá-la através de um link direto.

Redirecionamento 301: Configuração do servidor, redirecionamento de tráfego forçado

Formato do código​: É alcançado através da tecnologia do servidor, por exemplo:

     

  • Servidor Apache: Adicione Redirect 301 /old-page https://example.com/new-page no arquivo .htaccess;
  •  

  • Servidor Nginx: Adicione return 301 https://example.com/new-page; no arquivo de configuração;
  •  

  • Sistemas CMS (como WordPress): Configure regras de redirecionamento através de um plugin (como Redirection).

Lógica de eficácia: Quando o usuário ou motor de busca visita a URL antiga, o servidor retorna automaticamente o código de status 301 e redireciona para a nova URL, e a barra de endereços do navegador exibirá o novo endereço. A autoridade da URL antiga será gradualmente transferida (geralmente de algumas semanas a alguns meses) para a nova URL, e a URL antiga pode eventualmente parar de ser visitada diretamente (mas a função de redirecionamento é mantida).

滚动至顶部