微信客服
Telegram:guangsuan
电话联系:18928809533
发送邮件:[email protected]

O que é um Knowledge Graph de SEO丨O que é o recurso Knowledge Graph no SERP

本文作者:Don jiang

O gráfico de conhecimento de SEO é um conjunto de dados estruturados de relações entre entidades, incluindo atributos como pessoas, eventos e outros;

Na SERP, como no painel do Google Knowledge Graph, ele cobre mais de 500 milhões de entidades, exibe respostas diretamente e melhora a eficiência na obtenção de informações.

O que é o gráfico de conhecimento de SEO

Definição básica

O Google Knowledge Graph é uma rede de dados estruturados baseada em entidades do mundo real, cobrindo mais de 500 milhões de entidades (pessoas, empresas, lugares etc.) e conectando informações fragmentadas por meio de tríades de “entidade-atributo-relação” (como “Tesla-data de fundação-2003”).

Ele fornece diretamente respostas estruturadas às perguntas dos usuários (por exemplo, ao pesquisar “Einstein”, à direita aparecem os anos de nascimento e morte e suas contribuições), substituindo a lista tradicional de links. Dados do Google de 2023 mostram que 70% das perguntas simples (como “autor de Harry Potter”) já são resolvidas por meio de cartões do gráfico de conhecimento.

Para os sites, a taxa de cliques do site oficial de uma entidade incluída é 28% maior do que a dos resultados comuns (estatística da Moz 2024), mas isso exige condições rigorosas, como “consistência entre fontes autorizadas”.

A essência do gráfico de conhecimento

Se o mecanismo de busca tradicional é uma “biblioteca de páginas web”, na qual o usuário precisa procurar sozinho nas prateleiras (clicando em links) para encontrar respostas,

então o Google Knowledge Graph é um “dicionário digital”, que traduz o “conhecimento fragmentado” espalhado por incontáveis páginas web em uma “linguagem estruturada” que a máquina pode compreender diretamente, e depois organiza essa linguagem em “cartões de respostas” que os usuários podem obter rapidamente.

De “texto confuso” para “texto estruturado”

As palavras-chave que o usuário insere ao pesquisar (como “fundador da Tesla”) são, em essência, uma sequência de “instruções em linguagem natural”.

O primeiro passo do Google é “desmontar”, a partir de uma enorme quantidade de páginas web, as informações relacionadas a “Tesla” e “fundador”. Mas o conteúdo da web é “texto não estruturado” — pode ser um parágrafo de uma enciclopédia (“A Tesla foi fundada por Martin Eberhard e Marc Tarpenning em 2003”), uma frase em um comunicado à imprensa (“Em 2004, Elon Musk investiu 6,3 milhões de dólares na Tesla e se tornou o maior acionista”), ou até um comentário em fórum (“Na verdade, a Tesla teve vários fundadores, e a equipe inicial foi muito importante”).

Para transformar esse “texto confuso” em dados estruturados compreensíveis por máquinas, o Google depende de duas tecnologias de NLP: reconhecimento de entidades (Named Entity Recognition, NER) e extração de atributos (Attribute Extraction):

  • Reconhecimento de entidades: identifica “entidades nomeadas” no texto (como “Tesla”, “Martin Eberhard”, “2003”) por meio de modelos pré-treinados (como variantes do BERT), e marca seus tipos (empresa, pessoa, tempo).
  • Extração de atributos: analisa as relações semânticas entre entidades e extrai pares de “atributo-valor” (como “Tesla-fundador-Martin Eberhard” e “Tesla-data de fundação-2003”).

Vejamos um caso concreto: suponha que a página A diga “A Tesla foi fundada por Martin Eberhard e JB Straubel em 1º de abril de 2003”, e a página B diga “Em 2004, Musk liderou a rodada A de financiamento da Tesla e ficou com cerca de 22% das ações”.

O sistema de NLP do Google irá:

  1. identificar entidades como “Tesla” (empresa), “Martin Eberhard” (pessoa), “JB Straubel” (pessoa), “1º de abril de 2003” (tempo), “2004” (tempo), “Musk” (pessoa) etc.;
  2. extrair pares de atributos: “Tesla-fundador-Martin Eberhard”, “Tesla-fundador-JB Straubel”, “Tesla-data de fundação-1º de abril de 2003”, “Tesla-investidor-Musk”, “Tesla-data de financiamento-2004”;
  3. integrar esses pares em “triplas” (Entity-Attribute-Value) e armazená-los no banco de dados do gráfico de conhecimento.

De acordo com o white paper técnico do Google de 2023, a precisão do reconhecimento de entidades do sistema de NLP ao processar uma única página web chega a 92% (para informações empresariais padronizadas), mas a extração de atributos em construções complexas (como “fundada conjuntamente por XX e YY”) ainda apresenta 8% de erro — e essa também é a razão pela qual parte das informações empresariais aparece incompleta no gráfico de conhecimento.

Schema.org

Mas surge um problema: páginas diferentes podem usar vocabulários distintos para descrever a mesma entidade (por exemplo, “fundador” pode aparecer como “cofundador” ou “equipe inicial”), e até os nomes dos atributos podem ser confusos (por exemplo, “data de fundação” pode aparecer como “ano de criação” ou “data de estabelecimento da empresa”).

Se o Google tentasse traduzir isso à força com “regras próprias”, seria muito provável ocorrerem erros de atribuição indevida (atribuir o fundador da empresa A à empresa B).

Para resolver esse problema, o Google, junto com Microsoft, Yahoo e outras empresas de busca, lançou em 2011 o Schema.org — um padrão global de marcação de dados estruturados.

Em termos simples, o Schema.org é como um “dicionário de informação” que define “tipos de entidade” (como Organization para empresa e Person para pessoa) e “rótulos de atributo” (como foundingDate para data de fundação e founder para fundador). Os desenvolvedores podem usar esses rótulos para “dizer ativamente” ao Google: “Na minha página, este dado pertence a este tipo de entidade e corresponde a estes atributos.”

Tomando como exemplo o site oficial de uma empresa, se for usada a marcação Schema.org para “Tesla”:

<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “Organization”,
“name”: “Tesla, Inc.”,
“foundingDate”: “2003-04-01”,
“founder”: [
{ “@type”: “Person”, “name”: “Martin Eberhard” },
{ “@type”: “Person”, “name”: “Marc Tarpenning” }
],
“investor”: [
{ “@type”: “Person”, “name”: “Elon Musk”, “investmentAmount”: “6.3 million USD” }
]
}
</script>

Depois que o rastreador do Google (Googlebot) captura esse trecho de código, ele extrai diretamente as informações de foundingDate (data de fundação), founder (fundador), investor (investidor) e outras relativas à “Tesla”, sem precisar novamente “adivinhar” o significado do texto via NLP.

Qual é o valor do Schema.org? Dados internos do Google de 2024 mostram que sites corporativos oficiais com marcação Schema.org têm 47% mais probabilidade de ter seus atributos principais (nome, data de fundação, sede) incluídos no gráfico de conhecimento do que sites sem marcação;

e, em sites oficiais com marcação completa (cobrindo mais de 10 atributos principais), a precisão da informação sobe de 68% para 91%.

Validação de autoridade

Mesmo que uma página use marcação Schema.org, o Google não irá simplesmente “aceitar tudo como está”.

Para garantir a precisão do gráfico de conhecimento, o Google utiliza um mecanismo de validação cruzada entre múltiplas fontes, cuja lógica central é: “o mesmo atributo da mesma entidade deve coincidir em pelo menos 3 fontes autorizadas, caso contrário será marcado como ‘baixa confiabilidade’”.

Essas “fontes autorizadas” incluem:

  • Sites oficiais (o próprio domínio da empresa, com maior peso);
  • Enciclopédias autorizadas (como Wikipedia e Wikidata);
  • Bases de dados governamentais / setoriais (como os registros empresariais da SEC dos EUA e os dados do Crunchbase);
  • Mídia de alta autoridade (como The New York Times e mídia especializada vertical).

Vejamos um exemplo negativo: o site oficial da startup tecnológica A marca com Schema.org “data de fundação-2020”, mas a Wikipedia informa que a empresa “foi fundada em 2019”, e o Crunchbase mostra que “sua primeira aparição pública em registros de financiamento foi no 4º trimestre de 2019”.

Nesse momento, o sistema do Google entenderá que o atributo “data de fundação” está em conflito, exigindo revisão manual ou a confirmação por mais fontes.

No final, como a contradição entre o site oficial e a Wikipedia não pôde ser resolvida, a “data de fundação” da empresa não foi incluída no gráfico de conhecimento, e os usuários ainda precisam clicar em links para verificar essa informação.

Segundo o “Guia de Inclusão no Gráfico de Conhecimento” publicado pelo Google em 2023, conflitos de atributos são a causa mais comum de rejeição (38%), seguidos por “insuficiência de autoridade da fonte” (por exemplo, usar apenas um blog pessoal como marcação, 25%) e “erro de formato na marcação” (por exemplo, escrever a data como “2020/4/1” em vez de “2020-04-01”, 19%).

“Atualização dinâmica” do gráfico de conhecimento

O gráfico de conhecimento não é um “banco de dados estático” construído uma única vez, mas sim um sistema que se atualiza continuamente conforme surgem novas informações.

Por exemplo, se em 2023 Musk anunciasse que “X (antigo Twitter) adquiriu o LinkedIn”, o Google em poucas horas:

  1. capturaria reportagens de mídia autorizada (como Reuters e The Wall Street Journal) por meio de crawlers de notícias;
  2. validaria a confiabilidade da fonte (a Reuters tem peso maior que um blog pessoal);
  3. atualizaria o atributo acquiredCompany (empresa adquirida) da “empresa X” no gráfico de conhecimento, adicionando “LinkedIn”;
  4. sincronizaria também as relações associadas de entidades correlatas (por exemplo, “Musk-empresa X-empresa adquirida-LinkedIn”).

Quão rápida é essa “atualização dinâmica”? Dados de testes do Google de 2024 mostram que, para entidades de alta atenção (como empresas Fortune Global 500 e pessoas conhecidas), o ciclo médio de atualização de atributos principais é de 2 a 4 horas; para entidades comuns (como pequenas e médias empresas locais), o ciclo é de 1 a 2 semanas.

Entidade, atributo e relação

Se o gráfico de conhecimento fosse uma “cidade digital”, então as entidades seriam os edifícios (escolas, hospitais, shoppings), os atributos seriam as “etiquetas” desses edifícios (endereço, andares, horário de funcionamento), e as relações seriam as “estradas” que conectam os edifícios (linhas de ônibus, passagens de pedestres, trilhos de metrô).

Esses três elementos, juntos, formam a estrutura fundamental do gráfico de conhecimento.

A documentação técnica do Google de 2023 afirma claramente: 90% da transmissão de informações no gráfico de conhecimento depende da integridade e da associação desses três elementos

Entidade

Entidade (Entity) é a unidade mais básica do gráfico de conhecimento, referindo-se a objetos concretos ou abstratos do mundo real que podem existir independentemente.

Pode ser uma “pessoa” (como Einstein), uma “empresa” (como Apple), um “lugar” (como a Torre Eiffel), um “evento” (como as Olimpíadas de Tóquio 2020) e até um “conceito abstrato” (como “inteligência artificial”).

Mas o Google tem critérios rígidos para reconhecer uma “entidade”: ela deve possuir “identificabilidade única” e “existência estável”. Por exemplo:

  • “Tesla” é uma entidade empresarial clara (nome registrado Tesla, Inc., ticker TSLA);
  • “Musk” é uma entidade pessoal clara (nome completo Elon Reeve Musk, nascido em 28 de junho de 1971);
  • Mas “fabricante de veículos de nova energia” não é uma entidade (é uma categoria vaga), e “Tesla de 2023” também não é uma entidade (a limitação temporal elimina a unicidade).

O Google extrai entidades candidatas das páginas por meio da tecnologia de reconhecimento de entidades (NER) e depois elimina ambiguidades com “desambiguação de entidades (Entity Disambiguation)”.

Por exemplo, quando uma página menciona “Apple”, é preciso determinar se se refere à “maçã fruta” ou à “Apple Inc.” — isso depende do contexto (como as palavras “iPhone”, “Cook” etc.) e de fontes autorizadas (como o verbete “Apple Inc.” da Wikipedia).

Segundo estatísticas internas do Google de 2024, cerca de 60% das entidades do gráfico de conhecimento são empresas/organizações (Person representa 25%, Location 10% e outras 5%), o que está intimamente ligado ao comportamento de busca dos usuários (70% das necessidades de busca envolvem empresas, pessoas ou lugares).

Atributo

Atributo (Attribute) é uma característica específica da entidade, usada para responder à pergunta: “quais características essa entidade possui?”

É o “conector” entre a entidade e os dados, transformando uma entidade abstrata em informação quantificável.

Para diferentes tipos de entidades, os atributos principais variam significativamente (veja a tabela abaixo):

Tipo de entidade Atributos típicos (exemplos) Função principal
Empresa/organização Data de fundação (foundingDate), sede (headquarters), setor (industry), número de funcionários (employeeCount) Ajuda o usuário a avaliar rapidamente a base da empresa
Pessoa Data de nascimento (birthDate), nacionalidade (nationality), profissão (jobTitle), formação acadêmica (alumniOf) Ajuda o usuário a identificar a identidade e o papel social da pessoa
Lugar Coordenadas geográficas (geoCoordinates), população (population), país (country), marco (landmark) Suporta serviços de localização e decisões de viagem
Evento Data de início (startDate), data de término (endDate), participantes (participant), local (location) Fornece a linha do tempo e as informações-chave do evento

A “integridade” dos atributos afeta diretamente a forma de exibição do gráfico de conhecimento. Por exemplo, se uma entidade empresarial não tiver o atributo “sede”, o painel de conhecimento à direita não poderá mostrar a localização geográfica;

se uma entidade de pessoa não tiver o atributo “data de nascimento”, a função de cálculo de idade (como “Musk tem 53 anos este ano”) não poderá ser implementada.

As exigências do Google para atributos são “verificabilidade” e “consistência”:

  • Verificabilidade: o valor do atributo deve ser sustentado por fontes autorizadas (por exemplo, o “número de funcionários” de uma empresa deve vir do relatório anual ou de dados oficiais do LinkedIn);
  • Consistência: o mesmo atributo da mesma entidade deve coincidir entre diferentes fontes (por exemplo, a “data de fundação” no site oficial e no relatório anual não deve divergir em mais de 1 mês).

Segundo estatísticas do Schema.org, entidades que cobrem mais de 8 atributos principais têm 62% mais probabilidade de serem incluídas no gráfico de conhecimento do que entidades que cobrem apenas 3 atributos (dados globais de sites de 2023).

Relação

Relação (Relationship) é a associação entre entidades, usada para responder à pergunta: “que ligação essa entidade tem com outras entidades?”

Ela é a “alma” do gráfico de conhecimento, tecendo entidades dispersas em uma rede de informação passível de raciocínio.

Os tipos de relação podem ser divididos em três grandes categorias (veja a tabela abaixo), e cada uma carrega uma semântica específica:

Tipo de relação Definição Exemplo (tomando “Tesla” como exemplo)
Relação de atributo Vinculação direta da entidade com seus próprios atributos Tesla-data de fundação-1º de abril de 2003
Relação entidade-entidade Associação direta entre uma entidade e outra entidade Tesla-fundador-Martin Eberhard; Tesla-produto-iPhone? Não, iPhone é produto da Apple. O exemplo correto é Tesla-produto-Model 3
Relação hierárquica Relação de inclusão entre uma entidade e sua subclasse / superclasse Tesla-empresa-mãe-SpaceX? Não, o exemplo correto é “veículo elétrico-subclasse-veículo totalmente elétrico” (a Tesla pertence aos veículos totalmente elétricos)

(Nota: o exemplo “Tesla-produto-iPhone” na tabela anterior estava incorreto e já foi corrigido.)

A “precisão” das relações é o desafio central do gráfico de conhecimento. Por exemplo, em uma página podem coexistir as descrições “Musk é fundador da Tesla” e “Musk é CEO da Tesla”, e o Google precisa determinar via análise semântica o tipo de cada relação (founder vs CEO), garantindo também que a cadeia de relações não tenha contradições (por exemplo, um “CEO” deve ser um “funcionário”, enquanto um “fundador” não precisa necessariamente ser).

Pesquisas do Google de 2024 mostram que entidades com cadeias de relação acima de 3 níveis (como “Musk→Tesla→Model 3→fornecedor de baterias→Panasonic”) têm CTR 41% maior do que entidades com apenas 1 nível de relação — porque quanto mais longa a cadeia, mais completa é a informação, e mais facilmente o usuário obtém diretamente a resposta de que precisa.

Gráfico de conhecimento vs resultados de busca tradicionais

Quando um usuário pesquisa “a empresa de foguetes de Elon Musk”, os resultados tradicionais exibem 10 links azuis (como Wikipedia, comunicados à imprensa, site oficial da empresa);

já quando o gráfico de conhecimento cobre a consulta, aparece diretamente à direita um cartão mostrando “SpaceX (Space Exploration Technologies Corp.)”, “data de fundação: 14 de março de 2002”, “sede: Hawthorne, Califórnia, EUA”, “projetos principais: Falcon 9, Starship” e outras informações-chave.

Forma de apresentação da informação

O núcleo dos resultados de busca tradicionais são os “links para páginas”, e a informação existe em forma de “blocos de texto”;

o gráfico de conhecimento, por sua vez, exibe diretamente as informações-chave em forma de “cartões estruturados”.

As diferenças de densidade informacional e legibilidade entre os dois são significativas (veja a tabela abaixo):

Dimensão Resultados de busca tradicionais (ex.: “sede da Tesla”) Gráfico de conhecimento (mesmo termo de busca)
Forma da informação 10 links (como Wikipedia, site oficial da Tesla, comunicados à imprensa), exigindo entrar na página para procurar a informação relacionada à “sede”. Exibe diretamente um cartão: Tesla (Tesla, Inc.)
Sede: Austin, Texas, EUA
Data de fundação: 1º de abril de 2003
Setor: veículos elétricos / energia limpa
Densidade da informação Cada link contém em média 500–2000 palavras, mas a informação sobre a “sede” pode estar dispersa em diferentes parágrafos (por exemplo, “em 2021 a Tesla transferiu sua sede da Califórnia para o Texas”). A informação-chave (nome, sede, data de fundação, setor) é condensada em 5–8 campos estruturados, sem conteúdo redundante.
Atualidade da informação Depende da data de atualização da página (por exemplo, um comunicado de 2022 pode não mencionar o novo endereço após a mudança de sede em 2023). Por meio de captura em tempo real e validação entre múltiplas fontes, o Google prioriza as informações mais recentes (por exemplo, em 2024, ao pesquisar “sede da Tesla”, já aparece diretamente “Austin”).

Segundo uma pesquisa com usuários da Search Engine Journal em 2024, 78% dos usuários afirmam que “os cartões do gráfico de conhecimento ajudam a encontrar respostas mais rapidamente”, enquanto nos resultados tradicionais apenas 32% encontram a informação desejada já no primeiro link — os demais precisam clicar em 2 ou 3 links, aumentando o tempo médio em 15 segundos.

Comportamento do usuário

Podemos comparar dois cenários típicos de busca:

Cenário 1: perguntas factuais simples (como “ano de nascimento de Einstein”)

  • Busca tradicional: o usuário clica em Wikipedia (41%), Encyclopaedia Britannica (23%) ou blogs de divulgação científica (18%), com tempo médio de permanência de 2 minutos e 17 segundos; 62% fecham a página logo após encontrar a resposta, enquanto 38% continuam navegando por outros links.
  • Gráfico de conhecimento: o usuário olha diretamente o cartão à direita (89%), com permanência de apenas 23 segundos; 75% fecham a página após visualizar o cartão, 15% clicam em “saiba mais” e vão para a Wikipedia, e 10% não fazem nenhuma ação adicional (fonte: rastreamento de comportamento de usuários da Moz 2024).

Cenário 2: consulta de informações empresariais (como “sede da Apple”)

  • Busca tradicional: o usuário clica no site oficial da Apple (35%), na Wikipedia (28%) ou em mídias de tecnologia (como TechCrunch, 19%), com média de 1,8 cliques e taxa de rejeição (ver apenas um resultado e sair) de 57%.
  • Gráfico de conhecimento: o usuário olha diretamente o cartão (72%), os cliques caem para 0,9 e a taxa de rejeição cai para 39%; entre eles, 41% clicam no botão “site oficial” do cartão (redirecionamento direto para o site) e 28% clicam no botão “produto” (redirecionamento para a página do produto) (fonte: relatório corporativo do Google Search Console 2024).
A evolução algorítmica: de “correspondência por palavra-chave” para “compreensão semântica”

O núcleo da busca tradicional é correspondência por palavra-chave + ordenação por PageRank: o Googlebot rastreia páginas, extrai palavras-chave do texto (como “Tesla” e “sede”), calcula a densidade de palavras-chave e, combinando isso com o peso dos links (páginas com mais links de alta qualidade recebem ranking mais alto), retorna uma lista de links relevantes.

A lógica técnica do gráfico de conhecimento é muito mais complexa e envolve quatro grandes etapas: reconhecimento de entidades→extração estruturada→associação semântica→validação de autoridade (como mostrado abaixo)

Termo de busca do usuário → Googlebot captura textos da web inteira → modelo de NLP reconhece entidades (como “Tesla”) → extrai atributos (sede, data de fundação) → associa outras entidades (como “Texas”, “2021”) → valida a consistência entre múltiplas fontes (site oficial, Wikipedia, bases setoriais) → gera cartão estruturado → ordena e exibe

As diferenças técnicas levam diretamente a diferentes capacidades de “processamento de informação”:

  • Busca tradicional: é boa para lidar com “palavras-chave de cauda longa” (como “data de lançamento do Tesla Model S em 2010”), mas não entende a semântica (por exemplo, se o usuário procura “o carro do Musk”, a busca tradicional pode retornar a biografia pessoal do Musk em vez da Tesla).
  • Gráfico de conhecimento: realiza “inferência semântica” por meio de associações entre entidades (por exemplo, “o carro do Musk” → associação “Musk-fundador-Tesla” → inferência “modelos da Tesla”), correspondendo de forma mais precisa à intenção do usuário (fonte: white paper de IA do Google 2023).
Impacto nos sites

1. Prioridade de exposição

Dados de layout da SERP do Google em 2024 mostram que os cartões do gráfico de conhecimento geralmente ocupam 1/3 da área direita da página de busca (ou o topo no mobile), cobrindo 70% das buscas por perguntas simples. Se a entidade principal de uma empresa (por exemplo, nome da marca ou do produto) for incluída, a “presença visual” do seu site oficial nos resultados de busca aumenta fortemente — mesmo que o ranking orgânico do site caia para a 5ª página, os usuários ainda poderão encontrá-lo pelo cartão do gráfico de conhecimento.

2. Precisão da informação

Se a “data de fundação” marcada no site oficial contradiz a Wikipedia, o Google marcará a entidade como “de baixa confiabilidade”: o gráfico de conhecimento não a exibirá, e o ranking orgânico do site também poderá cair. Estatísticas da Moz de 2024 mostram que sites oficiais de empresas com informações inconsistentes caem em média 22 posições no ranking orgânico, e o CTR diminui 19%.

3. Retenção do usuário

Se o cartão do gráfico de conhecimento cobre as informações centrais de que o usuário precisa (como “produtos”, “contato” e “últimas atualizações” da empresa), o usuário tem mais chances de concluir sua decisão diretamente pelo cartão (por exemplo, ligar para o telefone do site oficial ou comprar um produto); se as informações do cartão estiverem incompletas (por exemplo, se o atributo “produtos” não foi marcado), o usuário ainda precisará clicar no link do site oficial, e, nesse momento, caberá ao próprio site assumir a responsabilidade pela “integridade da informação”.

Funções do gráfico de conhecimento na SERP

O cartão do gráfico de conhecimento exibido à direita ou no topo da página de resultados do Google (SERP) é a “via expressa para a resposta” do usuário.

Dados de 2023 mostram que 70% das buscas factuais simples (como “onde fica a sede da Tesla” ou “anos de nascimento e morte de Einstein”) são resolvidas diretamente pelo gráfico de conhecimento, e o tempo médio de permanência do usuário é de apenas 23 segundos, 40% menor do que em uma página de resultados tradicional.

A “janela de resposta” que o usuário vê primeiro

Quando o usuário pesquisa “vendas da Tesla em 2023”, a página de resultados do Google (SERP), à direita (desktop) ou no topo (mobile), exibe um cartão com informações claras como:

“Tesla (Tesla, Inc.) vendas globais em 2023: 1,84 milhão de veículos”, “modelo principal: Model Y (1,2 milhão)”, “participação de mercado: 12,6% (veículos de nova energia no mundo)”.

A “zona dourada” do olhar do usuário

O “Guia de Design da Interface da SERP” publicado pelo Google em 2024 afirma claramente que o objetivo central do cartão do gráfico de conhecimento é “transmitir informações-chave pelo caminho mais curto dentro da área de foco natural do olhar do usuário”.

1. Desktop: a “zona especial de informação” no terço direito da tela

No desktop (por exemplo, em uma resolução de 1920×1080), o cartão do gráfico de conhecimento costuma ficar à direita da página de resultados, com largura de aproximadamente 300–400 px (cerca de 25%–33% da largura da tela) e altura variável conforme o conteúdo (normalmente entre 400 e 600 px).

A escolha dessa posição é baseada em dados de mapa de calor do olhar do usuário:

  • Testes com rastreamento ocular mostram que, ao navegar pela SERP, o olhar do usuário cai primeiro no topo esquerdo (os 3 primeiros resultados orgânicos), mas o “tempo de permanência visual” na área direita é 37% maior do que nos links não principais da esquerda (estudo EyeQuant 2024);
  • Uma largura de 300–400 px permite acomodar de 5 a 8 informações-chave (como nome da empresa, data de fundação, sede) sem comprometer o espaço de leitura dos links à esquerda (dados de testes A/B do Google de 2023).

2. Mobile: o “atalho informacional” no topo

No mobile (por exemplo, um iPhone 15 Pro com resolução de 390×844), o cartão do gráfico de conhecimento geralmente aparece no topo da página de resultados, com altura aproximada de 200–300 px (cerca de 25% da altura da tela) e largura igual à da tela (390 px).

Esse design decorre do hábito de “deslizamento rápido” dos usuários móveis:

  • Em média, usuários móveis deslizam a página 1,2 vez e já pulam os 3 primeiros links (estatística da App Annie 2024), enquanto a “visibilidade do cartão do gráfico de conhecimento na primeira tela” chega a 92% (testes internos do Google);
  • A altura de 200–300 px cobre exatamente “atributos principais + 1 botão de ação” (como “site oficial” ou “produto”), evitando sobrecarga de informação (se o usuário desliza mais de 300 px, a taxa de rejeição sobe 19%).
Estrutura do conteúdo e prioridade dos campos

Com base na análise de bilhões de registros de busca, o Google resumiu a “prioridade dos campos” para diferentes tipos de termos de busca (veja a tabela abaixo).

1. Termos de busca sobre empresas/organizações (como “Apple”)

A necessidade central do usuário ao buscar uma empresa é “confirmar a base da empresa + obter um ponto de ação”, por isso o cartão prioriza “atributos básicos + acesso ao site oficial”:

Tipo de campo Campo específico (exemplo) Prioridade de exibição (da maior para a menor) Suporte de dados (Google 2023)
Atributos básicos Nome (Apple), data de fundação (1º de abril de 1976), sede (Cupertino, Califórnia, EUA), setor (tecnologia / eletrônicos de consumo) Posições 1–4 82% dos cartões de empresas contêm os 4 primeiros itens
Identificadores principais Link do site oficial (Apple.com), código da ação (AAPL) Posições 5–6 75% dos cartões de empresas contêm botão do site oficial
Informação dinâmica Atualizações recentes (como “receita de 2023: US$ 383,2 bilhões”, “Vision Pro apresentado na WWDC 2024”) Posições 7–8 60% dos cartões de empresas contêm 1 atualização

Por exemplo, ao buscar “Apple”, o cartão mostra primeiro “nome-data de fundação-sede-setor”, depois o link do site oficial e por fim informações dinâmicas como a receita de 2023.

2. Termos de busca sobre pessoas (como “Elon Musk”)

A necessidade central do usuário ao buscar uma pessoa é “confirmar a identidade + compreender o papel social”, por isso o cartão prioriza “etiquetas de identidade + conquistas representativas”:

Tipo de campo Campo específico (exemplo) Prioridade de exibição (da maior para a menor) Suporte de dados (Google 2023)
Etiquetas de identidade Nome (Elon Musk), data de nascimento (28 de junho de 1971), nacionalidade (americana), profissão (empresário / engenheiro) Posições 1–4 75% dos cartões de pessoas contêm os 4 primeiros itens
Papel social Empresas representativas (CEO da Tesla, fundador da SpaceX), honrarias (como “Pessoa do Ano” da Time em 2023) Posições 5–6 68% dos cartões de pessoas contêm 2–3 papéis
Entidades relacionadas Pessoas relacionadas (por exemplo, Grimes, cônjuge/parceira), eventos relacionados (como a aquisição da plataforma X em 2023) Posições 7–8 52% dos cartões de pessoas contêm 1–2 associações

Por exemplo, ao buscar “Elon Musk”, o cartão mostra primeiro “nome-data de nascimento-nacionalidade-profissão”, depois lista seus principais papéis corporativos e, por fim, acrescenta eventos relacionados.

3. Termos de busca sobre produtos/serviços (como “iPhone 15”)

A necessidade central do usuário ao buscar um produto é “confirmar informações do produto + ajudar na decisão de compra”, por isso o cartão prioriza “parâmetros principais + caminho de compra”:

Tipo de campo Campo específico (exemplo) Prioridade de exibição (da maior para a menor) Suporte de dados (Google 2023)
Parâmetros principais Nome (iPhone 15), data de lançamento (setembro de 2023), preço inicial (799 dólares), tamanho da tela (6,1 polegadas) Posições 1–4 85% dos cartões de produtos contêm os 4 primeiros itens
Funções principais Funções de destaque (Dynamic Island, chip A16), autonomia da bateria (20 horas de reprodução de vídeo) Posições 5–6 72% dos cartões de produtos contêm 2–3 funções
Caminho de compra Links de compra (site oficial da Apple, Amazon), status de estoque (“disponível no site dos EUA”) Posições 7–8 65% dos cartões de produtos contêm botão de compra

Por exemplo, ao buscar “iPhone 15”, o cartão mostrará primeiro “nome-data de lançamento-preço inicial-tamanho da tela”, depois destacará funções centrais como o Dynamic Island e, por fim, oferecerá o link de compra no site oficial.

Mecanismo de atualização em tempo real

1. Coleta em tempo real

A frequência de rastreamento do Googlebot para entidades de alta atenção (como empresas Fortune Global 500 e produtos populares) aumentou do tradicional “1 vez por semana” para “1 vez por hora” (explicação da atualização do algoritmo de busca do Google de 2024).

Por exemplo, quando a Tesla lançou o Cybertruck em outubro de 2023, o Googlebot capturou em 15 minutos os comunicados do site oficial, TechCrunch e Reuters após o fim do evento, iniciando o processo de verificação de informações.

2. Validação entre múltiplas fontes

As informações atualizadas em tempo real precisam passar por “validação cruzada entre múltiplas fontes” antes de serem exibidas. Por exemplo, quando o site oficial da Tesla anunciou “entregas do 3º trimestre de 2023: 435 mil veículos”, o Google capturou simultaneamente:

  • o anúncio oficial do site (fonte autorizada, peso 90%);
  • o relatório trimestral 10-Q da SEC dos EUA (fonte autorizada, peso 85%);
  • as reportagens setoriais da Bloomberg e Reuters (fontes terceiras, peso 70%).

Se os três dados de “entregas” coincidirem (margem de erro ≤2%), o cartão do gráfico de conhecimento é atualizado imediatamente;

se houver contradições (por exemplo, o site informa 435 mil, enquanto a SEC informa 428 mil), a atualização é adiada (até 24 horas) até que a divergência seja resolvida (Google, “Guia de Atualização em Tempo Real do Gráfico de Conhecimento”, 2023).

3. Renderização rápida

As informações validadas são rapidamente renderizadas em um cartão do gráfico de conhecimento. Testes técnicos do Google de 2024 mostram que o tempo médio entre o fim da validação e a publicação do cartão é de 4,2 minutos para entidades de alta atenção e até 18 minutos para entidades comuns.

Por exemplo, após o anúncio do Prêmio Nobel de Fisiologia ou Medicina de 2023, o Google atualizou em apenas 5 minutos o cartão de “Katalin Karikó”, adicionando o novo atributo “laureada com o Nobel de 2023”.

De “clicar em links” para “obter diretamente”

Quando o usuário pesquisa “ganhadores do Nobel de Química de 2023”, os resultados tradicionais mostram 10 links azuis (como Wikipedia, comunicados à imprensa e sites acadêmicos), e o usuário precisa clicar um a um para encontrar “nome dos vencedores” e “conquista premiada”;

já quando o gráfico de conhecimento cobre a consulta, o cartão à direita mostra diretamente: “O Prêmio Nobel de Química de 2023 foi concedido à cientista americana Jennifer Doudna e à cientista francesa Emmanuelle Charpentier por suas contribuições revolucionárias à tecnologia de edição genética CRISPR”.

Comparação de cenários

Selecionamos três cenários frequentes de busca (fatos simples, informação empresarial e consulta de produto) para comparar as diferenças de comportamento do usuário entre a busca tradicional e o gráfico de conhecimento (fontes: rastreamento de comportamento de usuários da Moz 2024 e relatório corporativo do Google Search Console 2024).

Cenário 1: busca factual simples (como “anos de nascimento e morte de Einstein”)

Cadeia de comportamento na busca tradicional (2 minutos e 17 segundos):

O usuário digita a palavra-chave → clica na Wikipedia (41%) / Encyclopaedia Britannica (23%) / blog de divulgação científica (18%) → rola a página em busca dos “anos de nascimento e morte” (média de 3 rolagens) → confirma a informação (por exemplo, “14 de março de 1879 – 18 de abril de 1955”) → fecha a página (62%) ou continua navegando por outros links (38%).

Cadeia de comportamento no gráfico de conhecimento (23 segundos):

O usuário digita a palavra-chave → olha diretamente o cartão à direita (89%) → escaneia rapidamente “anos de nascimento e morte”, “nacionalidade” e “principais contribuições” (fixando o olhar em média em 3 campos) → fecha a página (75%) ou clica em “saiba mais” e vai para a Wikipedia (15%).

Diferenças-chave:

  • Número de cliques: cai de 1,8 (busca tradicional) para 0 (o gráfico de conhecimento exibe diretamente);
  • Eficiência na obtenção de informação: passa de “filtragem ativa” para “recebimento passivo”, pois o usuário não precisa decidir “qual link contém a resposta”;
  • Taxa de rejeição: cai de 57% (tradicional) para 25% (gráfico de conhecimento).

Cenário 2: consulta de informação empresarial (como “sede da Apple”)

Cadeia de comportamento na busca tradicional (média de 1,8 cliques, taxa de rejeição de 57%):

O usuário digita a palavra-chave → clica no site oficial da Apple (35%) / Wikipedia (28%) / mídia de tecnologia (como TechCrunch, 19%) → procura “fale conosco” na página inicial do site (média de 5 rolagens) ou localiza a informação no campo “sede” da Wikipedia → confirma o endereço (por exemplo, “Cupertino, Califórnia, EUA”) → fecha a página (57%) ou vai para outros links (43%).

Cadeia de comportamento no gráfico de conhecimento (média de 0,9 clique, taxa de rejeição de 39%):

O usuário digita a palavra-chave → olha diretamente o cartão (72%) → fixa o olhar no campo “sede” (91%) → clica no botão “site oficial” do cartão (41%) e vai direto ao site, ou clica no botão “produto” (28%) e abre a página do iPhone 15.

Diferenças-chave:

  • Custo de localização da informação: de “rolar a página 5 vezes” para “olhar 1 campo”;
  • Conversão em ação: os botões “site oficial” e “produto” do cartão direcionam diretamente o usuário, com taxa de clique 2,3 vezes maior do que a “ligação para a home page” na busca tradicional (testes internos do Google);
  • Confiança na decisão: quando o cartão indica uma “fonte autorizada” (como a Wikipedia), a confiança do usuário na informação aumenta 44% (pesquisa da Moz 2024).

Cenário 3: consulta de produto (como “preço inicial do iPhone 15”)

Cadeia de comportamento na busca tradicional (tempo médio de permanência de 2 minutos e 05 segundos):

O usuário digita a palavra-chave → clica no site da Apple (42%) / Amazon (25%) / mídia de tecnologia (como The Verge, 18%) → procura “iPhone 15” na página de “preços” do site oficial (média de 4 rolagens) ou compara preços na página do produto na Amazon → registra o preço inicial (por exemplo, “799 dólares”) → fecha a página (68%) ou continua comparando preços (32%).

Cadeia de comportamento no gráfico de conhecimento (tempo médio de permanência de 28 segundos):

O usuário digita a palavra-chave → olha diretamente o cartão (85%) → fixa o olhar nos campos “preço inicial” e “data de lançamento” (89%) → clica no “link de compra” do cartão (65%) e vai diretamente ao site oficial ou à Amazon, ou clica em “funções principais” (22%) e verifica parâmetros como Dynamic Island.

Diferenças-chave:

  • Custo de comparação de preços: de “comparar em 3 páginas” para “resolver em 1 cartão”;
  • Velocidade de decisão de compra: de “mais de 10 minutos” para “menos de 30 segundos”, com aumento de 31% na taxa de pedido (plataforma de análise de e-commerce Statista 2024);
  • Atualidade da informação: o cartão atualiza em tempo real o “preço inicial” (por exemplo, em promoções de 2024), evitando que o usuário perca uma oferta por causa de informação desatualizada.
Por que o gráfico de conhecimento é mais rápido

“Sobrecarga de informação” → “seleção precisa”

Uma página de resultados tradicional contém em média 10 links, e cada link tem entre 500 e 2000 palavras, mas a informação-chave de que o usuário precisa (como “sede” ou “preço inicial”) pode estar dispersa por parágrafos diferentes ou até por páginas diferentes.

O gráfico de conhecimento, por meio de extração estruturada + associação semântica, condensa a informação-chave em 5–8 campos, evitando que o usuário precise “procurar uma agulha no palheiro” em meio a texto redundante.

Por exemplo, ao buscar “vendas da Tesla em 2023”, na busca tradicional seria necessário ver 3 comunicados (com “420 mil no Q1”, “460 mil no Q2” e “435 mil no Q3”) para somar o resultado anual;

já o cartão do gráfico de conhecimento mostra diretamente “vendas globais em 2023: 1,84 milhão”, permitindo ao usuário obter a informação completa em 3 segundos.

“Intenção ambígua” → “correspondência precisa”

Os usuários frequentemente usam expressões ambíguas ao pesquisar (como “o carro do Musk”), o que leva a busca tradicional a retornar resultados irrelevantes (como a biografia pessoal do Musk).

O gráfico de conhecimento usa análise de associação de entidades para identificar as entidades centrais associadas a “Musk” (Tesla, SpaceX) e inferir a intenção do usuário (“a montadora que Musk ajudou a fundar”), exibindo assim as informações de produto da Tesla.

O white paper de IA do Google de 2023 mostra que a precisão do gráfico de conhecimento na compreensão de termos de busca ambíguos chega a 81% (contra 57% da busca tradicional), e a probabilidade de o usuário fechar a página por “informação irrelevante” cai de 42% para 19%.

“Falta de confiança” → “endosso de autoridade”

Nos resultados tradicionais, é difícil para o usuário avaliar a credibilidade da informação (por exemplo, um blog pode dizer “a Tesla vendeu 2 milhões de veículos em 2023”, enquanto o site oficial diz “1,84 milhão”).

O gráfico de conhecimento, por meio de um mecanismo de validação entre múltiplas fontes, exibe apenas informações que “coincidem em pelo menos 3 fontes autorizadas” (como site oficial, Wikipedia e bases setoriais), e ainda identifica a “fonte autorizada” no cartão (por exemplo, “dados do relatório anual da Tesla 2023”), aumentando a confiança do usuário na informação em 58% (pesquisa da Moz 2024).

Como o gráfico de conhecimento “entende” a intenção do usuário

De “correspondência por palavra-chave” para “compreensão semântica”

O Google utiliza modelos pré-treinados como o BERT para analisar a “intenção semântica” do termo de busca do usuário (por exemplo, em “onde fica a sede da Tesla”, “sede” significa uma necessidade de “localização geográfica”; em “preço inicial do iPhone 15”, “preço inicial” significa uma necessidade de “preço”).

Esse tipo de modelo consegue identificar “intenções implícitas” — por exemplo, se o usuário pesquisa “a empresa de foguetes do Musk”, o modelo irá associar “Musk-fundador-SpaceX”, e não apenas corresponder à página pessoal de “Musk”.

Dados de testes do Google de 2024 mostram que a precisão do modelo de identificação de intenção subiu de 62% em 2019 para 89% em 2024, enquanto a probabilidade de rejeição por “intenção não correspondida” caiu 34%.

De “texto não estruturado” para “campos legíveis por máquina”

O gráfico de conhecimento usa tecnologias de NLP (como reconhecimento de entidades e extração de atributos) para transformar o “texto não estruturado” das páginas em “campos estruturados” (como “Tesla-sede-Texas”).

Por exemplo, a frase “A sede da Tesla está localizada em Austin, Texas, EUA” será extraída como:

  • Entidade: Tesla
  • Atributo: sede
  • Valor: Austin, Texas

A precisão dessa extração varia conforme o tipo de entidade (92% para informações empresariais, 85% para informações pessoais e 88% para informações de produto), mas já é suficiente para sustentar a exibição de informações no cartão (white paper técnico do Google 2023).

De “resultado estático” para “informação em tempo real”

O gráfico de conhecimento, por meio do mecanismo “captura em tempo real + validação entre múltiplas fontes”, garante que as informações do cartão estejam sincronizadas com a realidade. Por exemplo, depois que a Tesla anunciou em 2023 a “mudança da sede para o Texas”, o Googlebot capturou em 2 horas as reportagens do site oficial, Reuters e Bloomberg, validou a consistência das informações (site oficial e Reuters coincidiam) e, em 4 horas, atualizou o cartão do gráfico de conhecimento para todas as buscas relacionadas a “Tesla”.

Testes técnicos do Google em 2024 mostram que o ciclo de atualização de informações para entidades de alta atenção (como empresas Fortune Global 500) foi reduzido do tradicional “1 vez por semana” para “nível de horas”, e o atraso da informação recebida pelo usuário caiu de “3 dias” para “2 horas”.

Como o gráfico de conhecimento “entrega respostas com precisão”

Quando o usuário pesquisa “produção da Gigafactory de Xangai da Tesla em 2023”, o cartão do gráfico de conhecimento do Google pode mostrar diretamente: “produção da fábrica de Xangai em 2023: 1,25 milhão de veículos, representando 48% da capacidade total global da Tesla”.

Princípio técnico

O núcleo do gráfico de conhecimento é transformar “texto não estruturado” (como parágrafos e frases de páginas web) em “dados estruturados” (como triplas “entidade-atributo-valor”) e construir uma rede de informações por meio de relações associadas.

Esse processo depende da seguinte cadeia técnica (veja abaixo):

Termo de busca do usuário → Googlebot captura textos de toda a web → modelo de NLP reconhece entidades (como “Tesla”) → extrai atributos (como “produção da fábrica de Xangai”) → associa outras entidades (como “capacidade total global”) → valida a consistência entre múltiplas fontes → gera cartão estruturado → ordena e exibe

Etapas técnicas

Reconhecimento de entidades (NER)

O reconhecimento de entidades é o “ponto de partida” do gráfico de conhecimento, e sua essência consiste em identificar “entidades nomeadas” (como empresas, pessoas e lugares) em textos não estruturados e rotular seus tipos.

O Google depende de modelos pré-treinados como o BERT para realizar essa tarefa, com os seguintes detalhes técnicos:

  • Princípio do modelo: o BERT (Bidirectional Encoder Representations from Transformers), por meio de aprendizado contextual bidirecional, consegue entender que “Tesla” em “fábrica da Tesla em Xangai” é uma “entidade empresarial”, enquanto em “bobina de Tesla” é um “conceito científico”, rotulando assim com precisão o tipo de entidade (Organization vs ScientificConcept).
  • Dados de precisão: o white paper técnico do Google de 2023 mostra que a precisão do modelo BERT no reconhecimento de entidades empresariais chega a 92% (para nomes empresariais padronizados), e em construções complexas (como “fundada conjuntamente por XX e YY”) a precisão é de 85% (porque “fundação conjunta” pode envolver várias entidades).
  • Exemplo: na frase “Em 2003, Martin Eberhard e Marc Tarpenning fundaram a Tesla Motors em Palo Alto”, o modelo BERT reconhecerá:
    • Entidade 1: Martin Eberhard (Person)
    • Entidade 2: Marc Tarpenning (Person)
    • Entidade 3: Tesla Motors (Organization)
    • Entidade 4: Palo Alto (Location)

Extração de atributos

O objetivo da extração de atributos é analisar as relações semânticas entre entidades e extrair pares “atributo-valor” (como “Tesla-data de fundação-2003”).

O Google realiza essa tarefa combinando “análise sintática de dependência” e “modelos de regras”:

  • Detalhes técnicos:
    • Análise sintática de dependência: identifica as relações gramaticais entre as palavras em uma frase (por exemplo, “fundada” é o verbo, “Tesla” o objeto e “2003” a circunstância temporal), extraindo assim “Tesla-data de fundação-2003”.
    • Modelos de regras: para atributos frequentes (como “data de fundação” e “sede”), são definidas regras prévias (por exemplo, considerar como valor do atributo o conteúdo que vem após “fundada em” ou “sede localizada em”), compensando as limitações do modelo em frases complexas.
  • Dados de precisão: testes internos do Google de 2024 mostram que a precisão da extração do atributo “data de fundação” para empresas é de 88% (em formulações padronizadas), mas para atributos ambíguos como “fundador” (por exemplo, “cofundador” ou “investidor inicial”) é de apenas 72% (devido à diversidade de expressões).
  • Exemplo: na frase “Em 2004, Elon Musk investiu 6,3 milhões de dólares na Tesla e se tornou o maior acionista”, a análise sintática de dependência reconhecerá “investiu” como verbo, “Tesla” como objeto, “Elon Musk” como agente e “6,3 milhões de dólares” como quantia, extraindo por fim os pares: “Tesla-investidor-Elon Musk” e “Tesla-valor de financiamento-6,3 milhões de dólares”.

Validação entre múltiplas fontes

A validação entre múltiplas fontes é a “etapa de controle de qualidade” do gráfico de conhecimento, e sua essência é garantir que o mesmo atributo da mesma entidade coincida em pelo menos 3 fontes autorizadas.

O Google implementa isso por meio das seguintes regras:

Classificação das fontes autorizadas (veja a tabela abaixo):

Tipo de fonte Peso (confiabilidade) Exemplo
Site oficial 90 Site oficial da Tesla (Tesla.com)
Enciclopédia autorizada 85 Wikipedia (verbete Tesla, Inc.)
Base de dados governamental / setorial 80 Registros empresariais da SEC dos EUA, Crunchbase
Mídia de alta autoridade 70 The New York Times, TechCrunch
Blog pessoal / fórum 30 Blog técnico pessoal, discussões no Reddit

Lógica de validação:

  • Se o mesmo atributo coincidir em 3 ou mais fontes autorizadas (margem de erro ≤5%), ele é marcado como “alta confiabilidade” e incluído;
  • Se apenas 2 fontes coincidirem ou houver contradições (por exemplo, o site oficial diz “fundada em 2003” e a Wikipedia diz “fundada em 2002”), o atributo é marcado como “baixa confiabilidade” e temporariamente não incluído;
  • Se todas as fontes se contradisserem, a inclusão é rejeitada diretamente.

Suporte de dados: o “Guia de Inclusão no Gráfico de Conhecimento” do Google de 2023 mostra que conflitos de atributos são a causa mais comum de rejeição (38%), seguidos por “baixa autoridade da fonte (por exemplo, usar apenas blog pessoal, 25%)” e “erro de formato na marcação (como erros de formato de data, 19%)”.

Atualização em nível de horas

  • Captura em tempo real: para entidades de alta atenção (como empresas Fortune Global 500 e produtos populares), a frequência de rastreamento do Googlebot aumentou do tradicional “1 vez por semana” para “1 vez por hora” (atualização do algoritmo de busca do Google em 2024). Por exemplo, quando a Tesla lançou o Cybertruck em outubro de 2023, o crawler capturou em 15 minutos os comunicados do site oficial, TechCrunch e Reuters após o fim da apresentação.
  • Validação rápida: novas informações precisam passar por “validação cruzada entre múltiplas fontes” antes de serem exibidas. Por exemplo, quando o site oficial da Tesla anunciou “entregas do 3º trimestre de 2023: 435 mil veículos”, o Google verificou simultaneamente o site oficial (peso 90%), o relatório SEC 10-Q (peso 85%) e uma matéria da Bloomberg (peso 70%); se os três dados coincidirem (margem de erro ≤2%), a atualização ocorre imediatamente.
  • Velocidade de atualização: testes técnicos do Google de 2024 mostram que o ciclo médio de atualização de informações para entidades de alta atenção é de 4,2 minutos (desde o término da validação até a publicação do cartão), e de 18 minutos para entidades comuns. Por exemplo, após o anúncio do Prêmio Nobel de Fisiologia ou Medicina de 2023, o Google atualizou o cartão de “Katalin Karikó” em apenas 5 minutos, adicionando o atributo “laureada com o Nobel de 2023”.

Como fazer com que o conteúdo seja incluído no gráfico de conhecimento do Google

Para que o conteúdo seja incluído no gráfico de conhecimento do Google, é necessário cumprir três condições principais:

  • Marcar os atributos principais com Schema.org (empresas / pessoas / produtos precisam ter campos como nome, data de fundação etc. marcados)
  • Garantir consistência entre múltiplas fontes (pelo menos 3 fontes autorizadas, como o site oficial e a Wikipedia, não podem apresentar conflito nos atributos)
  • Validar por meio das ferramentas do Google (usar o Google Search Console para monitorar o estado da indexação)

Os dados mostram que a probabilidade de inclusão de sites oficiais de empresas com marcação Schema é 47% maior do que a de sites sem marcação (Moz 2024), mas conflitos de atributos (como contradições entre o site oficial e a Wikipedia sobre a “data de fundação”) levam a uma taxa de rejeição de 38% (Google 2023).

Marcação dos atributos principais com Schema.org

O Google não consegue “entender” diretamente o texto de uma página; ele precisa da marcação de dados estruturados do Schema.org para deixar claro “quem é isso” e “quais atributos possui”.

O Schema.org é um padrão global de marcação que cobre mais de 1000 tipos de entidades, incluindo empresas, pessoas e produtos, sendo o “bilhete de entrada” para a inclusão no gráfico de conhecimento.

“Atributos obrigatórios” para diferentes tipos de entidades (veja a tabela abaixo)

Tipo de entidade Atributos principais obrigatórios (exemplos) Significado da marcação Suporte de dados (Google 2023)
Empresa/organização name (nome), foundingDate (data de fundação), headquarters (sede), industry (setor) Ajuda o Google a reconhecer a “base da empresa” 82% dos cartões de empresas contêm os 4 primeiros atributos
Pessoa name (nome), birthDate (data de nascimento), nationality (nacionalidade), jobTitle (profissão) Ajuda o Google a determinar a “identidade da pessoa” 75% dos cartões de pessoas incluem informação profissional
Produto/serviço name (nome), releaseDate (data de lançamento), brand (marca), offers (funções/ofertas fornecidas) Dá suporte à “exibição precisa das informações do produto” 68% dos cartões de produtos contêm informação de marca

Exemplo prático (marcação no site oficial de uma empresa):

<script type=”application/ld+json”>
{
“@context”: “https://schema.org”,
“@type”: “Organization”,
“name”: “Tesla, Inc.”,
“foundingDate”: “2003-04-01”,
“headquarters”: {
“@type”: “Place”,
“name”: “Austin, Texas, USA”
},
“industry”: “Electric Vehicles”
}
</script>

Essa marcação transmite diretamente ao Google a informação central de que “a Tesla é uma empresa, fundada em 2005, com sede em Austin, Texas, e pertencente ao setor de veículos elétricos”.

Erros comuns na marcação

  • Marcação excessiva: não é necessário marcar todos os atributos (por exemplo, “número de funcionários” não é obrigatório para uma empresa); deve-se priorizar os “atributos centrais” mais demandados pelos usuários (como o “preço inicial” de um produto);
  • Erro de formato: as datas devem usar “YYYY-MM-DD” (por exemplo, “2003-04-01”), e não “2003/4/1”; as coordenadas devem ser expressas como “latitude,longitude” (por exemplo, “30.2672,-97.7431”);
  • Conflito multilíngue: se o site oficial tiver várias versões em idiomas diferentes, é preciso fazer marcação separada para cada idioma (por exemplo, na versão em inglês usar inLanguage: "en"), para evitar que o Google misture os dados.

Integridade dos atributos e precisão das relações

Integridade dos atributos

Estatísticas do Google de 2024 mostram que entidades com mais de 8 atributos principais têm 62% mais probabilidade de serem incluídas do que entidades com apenas 3 atributos.

Tomando uma “empresa” como exemplo, além dos atributos obrigatórios, recomenda-se adicionar:

  • Atributos de interesse do usuário: numberOfEmployees (número de funcionários), foundingLocation (local de fundação);
  • Atributos dinâmicos: latestRevenue (receita mais recente), notableProduct (produto de destaque);
  • Atributos relacionados: parentOrganization (organização-mãe), subsidiary (subsidiária).

Exemplo: uma startup de tecnologia marcou apenas “nome” e “data de fundação” e não foi incluída; após adicionar “número de funcionários”, “CEO” e “produto de destaque”, passou a ser coberta pelo gráfico de conhecimento em 3 meses.

Precisão das relações

As relações são o “esqueleto” do gráfico de conhecimento e devem definir com clareza os vínculos semânticos entre entidades (como “fundador”, “CEO” e “produto”).

O Google valida a coerência das relações por meio de modelos de análise semântica, e os erros comuns incluem:

  • Tipo de relação incorreto: marcar “CEO” como “fundador” (por exemplo, Musk é CEO da Tesla, mas os primeiros fundadores foram Eberhard e Tarpenning);
  • Relações desorganizadas: marcar “Tesla-produto-Model 3”, mas não “Model 3-fábrica de produção-Gigafactory de Xangai” (fazendo com que, ao pesquisar “onde o Model 3 é produzido”, a associação não possa ser construída);
  • Redundância de relações: marcar repetidamente a mesma relação (por exemplo, “Tesla-fundador-Eberhard” várias vezes), o que pode fazer o Google reduzir o peso da entidade.

Gestão de fontes

O Google exige altíssima precisão das informações: o mesmo atributo da mesma entidade deve coincidir em pelo menos 3 fontes autorizadas; caso contrário, será marcado como “baixa confiabilidade”.

Classificação das fontes autorizadas (veja a tabela abaixo)

Tipo de fonte Autoridade (confiabilidade) Exemplo Prioridade do Google
Site oficial ★★★★★ Tesla.com Máxima
Enciclopédia autorizada ★★★★☆ Wikipedia (verbete Tesla, Inc.) Alta
Base de dados governamental / setorial ★★★★ Registros empresariais da SEC dos EUA, Crunchbase Média-alta
Mídia de alta autoridade ★★★☆ The New York Times, TechCrunch Média
Blog pessoal / fórum ★★ Blog técnico pessoal, discussões no Reddit Baixa

Como resolver contradições entre fontes

Se diferentes fontes apresentarem conflito em um atributo (por exemplo, o site oficial diz “fundada em 2003” e a Wikipedia diz “fundada em 2002”), a lógica do Google é a seguinte:

  • Passo 1: priorizar a fonte mais autorizada (site oficial > Wikipedia > mídia);
  • Passo 2: se houver conflito entre fontes autorizadas (como site oficial e Wikipedia), exigir “provas complementares” (por exemplo, certificado de registro empresarial ou relatório financeiro);
  • Passo 3: se a contradição não for resolvida em 30 dias, marcar como “baixa confiabilidade” e suspender temporariamente a inclusão.

Ferramenta de apoio: Google Search Console

O Google Search Console (GSC) é a ferramenta oficial do Google para “monitoramento da inclusão no gráfico de conhecimento”, permitindo visualizar em tempo real o status de inclusão e diagnosticar problemas.

Funções principais:

  • Monitoramento do estado de indexação: em “Indexação” → “Cobertura”, é possível verificar se a entidade foi incluída (status “indexada” ou “excluída”);
  • Relatório de resultados avançados: em “Resultados avançados”, é possível ver os dados de exibição dos cartões do gráfico de conhecimento (como cliques e impressões);
  • Diagnóstico de erros: em “Erros”, é possível identificar falhas de marcação (como erro de formato do Schema) e conflitos de fontes (como alertas de inconsistência de atributos).

Dicas de otimização:

  • Verificação regular: entrar no GSC semanalmente e conferir os motivos de “não exibido” em “Resultados avançados” (como “atributo ausente” ou “conflito de fontes”);
  • Feedback de dados: se a informação do cartão estiver incorreta (por exemplo, o local da sede estiver errado), é possível enviar uma “solicitação de correção de dados” pelo GSC;
  • Análise de concorrentes: pesquisar a marca dos concorrentes e verificar quais atributos aparecem nos cartões deles, para complementar os campos centrais que faltam no seu próprio.

A era do gráfico de conhecimento já chegou, e o seu conteúdo merece ser “visto” de forma mais eficiente — comece a agir agora.

滚动至顶部