Lesson 02

hreflang cross-língua: por que sua marca brasileira tem mention rate 0,3x em ChatGPT EN-US

Abertura: a marca que tinha conteúdo em inglês e era citada como "uma marca brasileira sem nome verificável"

Em fevereiro de 2026 a Brasil GEO auditou alexandrecaramaschi.com em recorte multilíngue. O site opera 80% em português brasileiro e 20% em inglês, com versões traduzidas das páginas mais estratégicas (sobre, serviços, dois posts pillar canônicos). A leitura inicial em ChatGPT 4o com prompt em PT ("CEO da Brasil GEO em joalheria fina") era robusta: mention rate 100%, identificação autoral correta, Wikidata Q973 reconhecido, sameAs validados. Ao trocar a localização do prompt para inglês ("CEO of Brasil GEO in fine jewelry"), o resultado caía dramaticamente. Mention rate 0,3x do baseline PT. Em três das dez execuções, ChatGPT respondia "uma marca brasileira chamada Brasil GEO mas sem dados autorais verificáveis em inglês". A marca era a mesma, o conteúdo em inglês existia, a versão EN do site estava no ar — mas o LLM tratava as duas versões como duas marcas distintas que coincidiam no nome.

A causa técnica era estrutural. As páginas em inglês de alexandrecaramaschi.com não tinham `<link rel="alternate" hreflang="pt-BR">` apontando para a versão PT correspondente. Não tinham `hreflang="x-default"` declarado para idioma padrão. Schema.org `inLanguage` aparecia em algumas páginas mas não em todas. O `canonical` em algumas páginas EN apontava para si mesmas (correto), mas em outras apontava para a versão PT (incorreto, fazendo o crawler tratar a versão EN como duplicate da PT). O LLM, ao tentar consolidar a entidade em prompt EN, encontrava um site em PT canônico, uma versão EN órfã sem relação declarada, e tratava como entidade não-resolvida em contexto inglês.

Em paralelo, a Brasil GEO auditou 12 marcas brasileiras de joalheria fina com versão EN ativa. Apenas 2 tinham hreflang corretamente implementado (pares bidirecionais PT⇔EN com `x-default`). As outras 10 tinham deficit estrutural que se traduzia em mention rate EN 0,2-0,4x do baseline PT. A leitura simples é que essas marcas têm conteúdo em inglês mas perdem a maior parte da menção em ChatGPT EN-US, Perplexity en-US e Claude com prompt em inglês — exatamente o canal que importa para captura de turista internacional, comprador corporativo de filial multinacional, e expansão para clientes que pesquisam em inglês mesmo no Brasil.

Esta aula é sobre por que hreflang afeta diretamente LLM citation cross-língua, e por que a marca brasileira que opera site multilíngue mal configurado paga em mention rate cross-língua um deficit que SEO clássico não detecta porque opera em janela de mês não de dia.

Tese contraintuitiva

hreflang errado é deficit de menção cross-língua em LLM, não apenas problema de SEO clássico. ChatGPT, Perplexity e Claude detectam inconsistência hreflang e preferem citar versão EN se prompt EN, mas falham em achar versão PT correspondente se hreflang quebrado. Marca brasileira com 80% PT 20% EN e hreflang mal configurado tem mention rate em ChatGPT EN-US de 0,3x do rate PT — ou seja, perde 70% das menções no canal inglês. A correção é técnica e direta: implementar `<link rel="alternate" hreflang="pt-BR">` e `hreflang="en-US"` em pares bidirecionais, declarar `hreflang="x-default"` para idioma padrão, manter `canonical` apontando para a própria URL em cada idioma, e adicionar `inLanguage` em Schema.org de toda peça de conteúdo. Sem isso, marca brasileira é fragmentada em entidades distintas por idioma no Knowledge Graph e nos LLMs.

Objetivos de aprendizagem

Ao final desta aula, o leitor será capaz de:

  • Diferenciar hreflang correto (par bidirecional + x-default) de hreflang quebrado (unilateral, ausente ou com canonical errado).
  • Avaliar mention rate cross-língua via 25 prompts canônicos em PT-BR e EN-US e mensurar gap.
  • Construir plano de implementação hreflang em todas as páginas multilíngues com canonical e Schema.org `inLanguage` consistentes.
  • Implementar validação automatizada via Google Search Console hreflang report e Bing Webmaster Tools.
  • Operar rotina semestral de auditoria hreflang para detectar degradação por reestruturação de site.

Fundamentação

A especificação hreflang segundo Google Search Central

Google Search Central documenta hreflang como atributo HTML que indica versão alternativa de uma página em outro idioma e/ou região. A sintaxe é `<link rel="alternate" hreflang="código" href="URL">` no `<head>` do HTML, ou via header HTTP `Link`, ou via sitemap XML com elementos `xhtml:link`. O código segue padrão IETF BCP 47 (combinação ISO 639-1 para idioma + ISO 3166-1 alpha-2 para região), o que permite granularidade como `pt-BR` (português Brasil), `pt-PT` (português Portugal), `en-US` (inglês Estados Unidos), `en-GB` (inglês Reino Unido), `es-MX` (espanhol México) e assim por diante.

A regra crítica é bidirecionalidade. Se a versão PT declara `<link rel="alternate" hreflang="en-US" href="URLEN">`, a versão EN obrigatoriamente precisa declarar `<link rel="alternate" hreflang="pt-BR" href="URLPT">`. Hreflang unilateral é ignorado pelo crawler. Adicional: `hreflang="x-default"` declara qual versão é exibida para usuário cuja localização não casa com nenhum hreflang específico — geralmente a versão em idioma de maior alcance (inglês para sites com audiência global, português para sites com foco Brasil).

A regra paralela é canonical alinhado. Cada versão multilíngue precisa ter `canonical` apontando para si mesma (URL própria), não para a versão "principal". Erro comum: site multilíngue com canonical da versão EN apontando para a versão PT — isso faz o crawler tratar a versão EN como duplicate da PT e ignorar para fins de indexação. Resultado: versão EN existe mas não é indexada, ou é indexada mas tem peso editorial diluído.

Como ChatGPT, Perplexity e Claude tratam hreflang

LLMs comerciais não consomem hreflang diretamente em treinamento. Consomem o resultado: páginas indexadas em corpus, com sinal de idioma anotado pelo crawler. A diferença é que crawler que respeita hreflang trata duas URLs (PT e EN) como duas versões da mesma entidade canônica. Crawler que não respeita hreflang trata como duas URLs independentes que podem ser similares mas não são vinculadas.

Em LLM, o impacto é cross-língua. Quando usuário faz prompt em inglês ("fine jewelry consultant in Brazil"), o modelo recupera contexto de páginas indexadas em inglês. Se a versão EN da marca está corretamente vinculada à versão PT via hreflang bidirecional, o modelo trata como uma entidade com duas faces e pondera o sinal cumulativo. Se o vínculo está quebrado, o modelo trata a versão EN como entidade isolada com volume editorial reduzido (porque tem só 20% das peças traduzidas) e mention rate cai proporcionalmente.

OpenAI, em paper de 2024 sobre multilingual capabilities em modelos GPT-4 e GPT-4o, descreveu fenômeno relacionado: modelos treinados em corpus multilíngue desenvolvem capacidade de resolver entidade cross-língua via co-citação cruzada quando os sinais estruturais (hreflang, Schema.org `inLanguage`, canonical bidirecional) confirmam o vínculo. Quando os sinais estão quebrados, o modelo trata entidades como distintas mesmo quando o nome próprio é idêntico, e responde com baixa confiança ou recusa em prompt cross-língua.

O caso alexandrecaramaschi.com como referência multilíngue

alexandrecaramaschi.com opera, em maio de 2026, com hreflang corretamente implementado em 18 das 23 páginas multilíngues. Cada página PT declara `<link rel="alternate" hreflang="en-US" href="URLEN">` apontando para a versão EN correspondente. Cada página EN declara `<link rel="alternate" hreflang="pt-BR" href="URLPT">` apontando para a PT. Ambas declaram `hreflang="x-default"` apontando para a PT (audiência primária Brasil). `Canonical` aponta para a URL própria em cada idioma. Schema.org `inLanguage` declara `pt-BR` ou `en-US` consistentemente em cada peça.

O resultado, medido em ciclo abril-maio 2026 com 25 prompts canônicos em PT-BR e os mesmos 25 traduzidos para EN-US: mention rate em ChatGPT 4o EN-US subiu para 0,72x do rate PT-BR (de 0,28x antes da correção em janeiro de 2026). Em Perplexity Sonar Pro EN-US, mention rate de 0,68x do rate PT. Em Claude 3.5 Sonnet EN, mention rate de 0,61x. As 5 páginas restantes ainda em correção têm hreflang parcial (declarado mas com canonical errado em três páginas; sem `x-default` em duas). Essas 5 páginas mostram mention rate EN-US ainda em 0,31x — o que confirma o gap empírico.

Mecanismo: o turista, o comprador corporativo de filial multinacional, e o decisor que pesquisa em inglês

A maior parte da literatura GEO de 2025 trata multilíngue como "boa prática SEO" e ignora o impacto direto em LLM citation cross-língua. O fenômeno é prático e mensurável. Turista internacional que chega ao Brasil, abre ChatGPT no celular e pergunta em inglês "best fine jewelry store in São Paulo for souvenir" recupera resposta de versões EN de sites brasileiros indexados. Marca com versão EN bem vinculada via hreflang aparece. Marca com versão EN órfã não aparece — perde a venda física que passa pelo digital.

Comprador corporativo de filial multinacional brasileira (executiva americana em rotação no Brasil de empresa global) opera em inglês mesmo no Brasil. Usa Copilot M365 com perfil EN-US. Prompts são em inglês. Marca brasileira com versão EN bem implementada aparece em Copilot EN-US. Marca sem isso, não. Em B2B corporativo com ticket alto, perder essa visibilidade é perder a venda.

Decisor brasileiro que pesquisa em inglês por hábito (executivos de tecnologia, acadêmicos, consultores que operam em mercados globais) também é segmento relevante. Brasil GEO mediu, em recorte de 60 prompts canônicos sobre Generative Engine Optimization em ChatGPT 4o em janeiro de 2026, que 23% dos prompts brasileiros sobre temas técnicos eram digitados em inglês mesmo com instalação ChatGPT em PT-BR. Esses 23% são o canal cross-língua dentro do próprio mercado doméstico.

Caso secundário: a marca que corrigiu hreflang e dobrou mention rate EN-US em 90 dias

Uma joalheria de Belo Horizonte, em outubro de 2025, identificou via auditoria interna deficit de mention rate em ChatGPT EN-US (0,22x do rate PT-BR). O site tinha versão EN ativa mas com hreflang quebrado. Decisão: contratar consultoria técnica de SEO para reimplementar hreflang em todas as 60 páginas multilíngues. O trabalho consistiu em três frentes. Primeiro, declarar `<link rel="alternate" hreflang>` bidirecional em par PT⇔EN para cada página. Segundo, corrigir canonical apontando para si mesmo em cada versão. Terceiro, declarar `inLanguage` em Schema.org de cada peça (BlogPosting, Product, AboutPage). Validação técnica via Google Search Console hreflang report e Bing Webmaster Tools.

No quadragésimo dia após implementação, mention rate EN-US subiu para 0,38x. No nonagésimo dia, estabilizou em 0,49x (2,2x o baseline). Em ChatGPT 4o com prompt EN, marca aparecia em 11 dos 25 prompts canônicos (vs 5 antes da correção). Em Perplexity Sonar Pro EN, em 9 dos 25 (vs 4 antes). Custo total: aproximadamente vinte e quatro mil reais em consultoria técnica + tempo de engenharia. Retorno: dois contratos B2B fechados via leads internacionais (um turista australiano que comprou peça personalizada, uma executiva canadense em rotação no escritório paulista da empresa).

Tabela comparativa: hreflang correto vs quebrado e impacto em LLM citation

Situaçãohreflang declaradocanonicalinLanguagex-defaultMention rate ENDiagnóstico
Bidirecional + x-default + canonical próprioSim, par PT⇔ENURL própriaDeclaradoSim0,6-0,8x do PTSaudável
Bidirecional + canonical próprioSim, par PT⇔ENURL própriaDeclaradoNão0,5-0,7x do PTBom, melhorável
Unilateral (só PT declara EN)ParcialURL própriaDeclaradoNão0,3-0,5x do PTQuebrado, prioridade média
Bidirecional + canonical erradoSim, par PT⇔ENURL PT (errado)DeclaradoNão0,2-0,4x do PTQuebrado, prioridade alta
hreflang ausenteNão declaradoURL própriaDeclaradoNão0,2-0,3x do PTCrítico, prioridade máxima
hreflang ausente + canonical erradoNão declaradoURL PTNão declaradoNão0,1-0,2x do PTCrítico, refazer
Padrão correto + Schema completoSim, par PT⇔ENURL própriaDeclarado consistenteSim0,7-0,9x do PTExcelente

Tabela comparativa: investimento em hreflang vs outras frentes GEO multilíngue

FrenteCusto aproximadoTempo até efeitoImpacto em mention rate ENValidação técnicaRecomendação
hreflang correto + canonicalBaixo (engenharia)4-12 semanas2-3xGoogle Search ConsoleObrigatório
Schema.org `inLanguage` consistenteBaixo (engenharia)4-8 semanas1,3-1,5xSchema.org validatorObrigatório
Tradução profissional EN das pillar pagesMédio-alto3-6 meses1,5-2xVoice Guard ENRecomendado
Sitemap separado por idiomaBaixo2-4 semanas1,1-1,2xBing/Google WebmasterRecomendado
Domínio `.com` ou subdomínio ENAlto6-18 meses1,3-1,8xDNS + 301 redirectsOpcional avançado
Backlinks editoriais EN qualificadosAlto6-12 meses1,5-2,5xOutreach internacionalOpcional avançado
Schema `Person`/`Organization` com `sameAs` internacionalBaixo4-8 semanas1,2-1,4xSchema validatorRecomendado

Pegadinhas operacionais

A primeira pegadinha é declarar hreflang só na versão "principal" sem declarar na "secundária". hreflang exige bidirecionalidade. Versão EN sem `hreflang="pt-BR"` apontando para a PT é tão quebrada quanto versão PT sem `hreflang="en-US"` apontando para a EN.

A segunda é usar código de idioma sem região (`hreflang="pt"` em vez de `hreflang="pt-BR"`). Google aceita, mas perde granularidade — não diferencia Brasil de Portugal. Em joalheria fina brasileira, declarar `pt-BR` explicitamente é estratégico para captura de prompt regional brasileiro.

A terceira é canonical da versão EN apontando para a PT. Erro técnico comum em sites construídos com CMS multilíngue mal configurado. Faz a versão EN ser tratada como duplicate e nunca ser indexada para o canal inglês.

A quarta é declarar `hreflang` em sitemap mas não no HTML `<head>`. Google aceita ambos, mas Bing prioriza fortemente declaração inline no HTML. Sites que dependem só de sitemap perdem sinal em Bing/Copilot.

A quinta é não declarar `hreflang="x-default"`. Sem x-default, usuário em região não-mapeada (Argentina, Espanha, Alemanha) recebe versão aleatória ou indexação falha. Declarar x-default apontando para idioma de maior alcance é obrigatório.

A sexta, mais sutil, é não validar hreflang em Bing Webmaster Tools — só em Google Search Console. Bing tem reporting próprio de hreflang com critérios ligeiramente distintos (mais rigoroso em bidirecionalidade). Marca que valida só em Google pode passar lá e quebrar em Bing — perdendo mention rate em Copilot/ChatGPT.

Exercícios

Exercício 1 — Auditoria de hreflang em todas as páginas multilíngues. Cenário: a marca tem versão EN ativa do site mas não tem certeza de que hreflang está corretamente implementado. Tarefa: liste todas as páginas multilíngues do site (mínimo 10, idealmente 20-40 pares PT⇔EN). Para cada par, abra view source e registre: hreflang PT declarado na versão EN (sim/não), hreflang EN declarado na versão PT (sim/não), x-default declarado (sim/não), canonical da versão PT (URL), canonical da versão EN (URL), Schema.org `inLanguage` declarado (sim/não com valor). Classifique cada par em "saudável", "bom", "quebrado" ou "crítico". Critério: a auditoria está completa quando há tabela com todos os pares classificados e diagnóstico técnico. Tempo estimado: cento e cinquenta a duzentos e dez minutos. Output esperado: planilha de auditoria e plano de correção priorizado.

Exercício 2 — Implementação correta de hreflang em pares bidirecionais. Cenário: a marca identificou pares quebrados ou parciais e quer corrigir tecnicamente. Tarefa: para cada par PT⇔EN identificado como "quebrado" ou "crítico", implemente hreflang bidirecional em `<head>`: `<link rel="alternate" hreflang="pt-BR" href="URLPT">`, `<link rel="alternate" hreflang="en-US" href="URLEN">`, `<link rel="alternate" hreflang="x-default" href="URL_PT">` (ou EN se audiência primária for global). Corrija canonical para apontar para URL própria em cada versão. Adicione Schema.org `inLanguage` em JSON-LD de cada peça. Submeta sitemap atualizado a Google Search Console e Bing Webmaster Tools. Critério: a implementação está completa quando hreflang report em Google Search Console mostra zero erros para os pares corrigidos e Bing Webmaster Tools confirma reconhecimento. Tempo estimado: cento e cinquenta a duzentos e dez minutos. Output esperado: hreflang corrigido em produção e validação técnica em ambos os Webmaster Tools.

Exercício 3 — Validação de mention rate cross-língua em ciclo de 90 dias. Cenário: a marca corrigiu hreflang e quer medir impacto real em mention rate EN-US em ChatGPT, Perplexity e Claude. Tarefa: defina conjunto de 25 prompts canônicos em PT-BR e tradução cuidadosa para EN-US (mantendo intenção e granularidade, não apenas tradução literal). Execute em ChatGPT 4o, Perplexity Sonar Pro e Claude 3.5 Sonnet em três momentos: pré-correção (baseline), 30 dias após correção, 90 dias após correção. Registre mention rate por motor por momento por idioma. Calcule rate EN-US como fração do rate PT-BR e meça evolução. Defina gatilho: rate EN-US menor que 0,5x do PT-BR após 90 dias sinaliza que correção é insuficiente e exige investigação adicional. Critério: o ciclo está pronto quando há lista de 50 prompts (25 PT + 25 EN), três momentos de execução agendados, dashboard de output e gatilho de alerta definido. Tempo estimado: cento e cinquenta a duzentos e dez minutos. Output esperado: dashboard de mention rate cross-língua e protocolo de monitoramento contínuo.

Síntese executiva

hreflang errado é deficit de menção cross-língua em LLM, não apenas problema de SEO clássico. Marca brasileira de joalheria com versão EN ativa e hreflang quebrado tem mention rate em ChatGPT EN-US, Perplexity en-US e Claude EN de 0,2-0,4x do rate PT-BR — uma perda de 60-80% no canal inglês. A correção é técnica, direta e mensurável: implementar `<link rel="alternate" hreflang>` bidirecional em pares PT⇔EN, declarar `hreflang="x-default"`, manter canonical apontando para URL própria em cada idioma, adicionar Schema.org `inLanguage` em todo JSON-LD. Validação dupla via Google Search Console hreflang report e Bing Webmaster Tools. O caso alexandrecaramaschi.com (80% PT 20% EN, 18 das 23 páginas com hreflang correto) atinge mention rate EN-US de 0,72x do rate PT-BR. O caso oposto — versão EN órfã sem hreflang — atinge 0,2-0,3x e perde turista internacional, comprador corporativo de filial multinacional, e decisor brasileiro que pesquisa em inglês por hábito (23% dos prompts técnicos no Brasil em janeiro de 2026 segundo Brasil GEO). Custo de correção é baixo, retorno é canal cross-língua ativado em horizonte de quatro a doze semanas.

Próximo módulo

A próxima aula entra em terreno de zero-click: como AI Overviews (antigo Google SGE) canibaliza top-1 SEO em joalheria local, critérios mensuráveis de inclusão (GBP otimizado, reviews 4,5+, structured data `LocalBusiness`, top-3 orgânico), e por que preparar para "zero-click world" não é opcional em 2026. Caso central: Brasil GEO trackeando 25 prompts onde Herreira aparece em AI Overview vs concorrente.

---

[^1]: Google Search Central. International and multilingual sites: hreflang, x-default, canonical. Google, 2024-2026. https://developers.google.com/search/docs/specialty/international/localized-versions

[^2]: Schema.org. inLanguage property — BCP 47 language tag. Schema.org documentation, 2024-2026. https://schema.org/inLanguage

[^3]: IETF. Tags for Identifying Languages — BCP 47 specification. Internet Engineering Task Force, RFC 5646. https://datatracker.ietf.org/doc/html/rfc5646

[^4]: OpenAI. GPT-4 Technical Report — Multilingual capabilities and cross-lingual reasoning. OpenAI, 2023 (atualizações 2024-2026). https://arxiv.org/abs/2303.08774

[^5]: Brasil GEO. Mention Rate Dashboard — Cross-língua PT-BR vs EN-US em ChatGPT, Perplexity e Claude, recorte joalheria fina brasileira, ciclo abril-maio 2026. Relatório interno.