Abertura: a marca brasileira que estava em todos os prompts em português e em nenhum em inglês
Em março de 2026 a Brasil GEO mediu, em ciclo de 25 prompts canônicos, o desempenho de uma joalheria de Curitiba que liderava resposta em ChatGPT 4o para todas as queries em português sobre marcas brasileiras de noivado. A marca aparecia em quatro de cada cinco respostas, com posição média de segunda passagem. No mesmo ciclo, a Brasil GEO submeteu prompts equivalentes em inglês americano: "best Brazilian jewelry for engagement rings", "where to buy Brazilian fine jewelry online", "Brazilian jewelry brands that ship internationally". Em vinte e cinco execuções por prompt por modelo, total de duzentas e setenta e cinco respostas, a marca apareceu em três. As menções vinham de blog de moda em inglês de outro autor, não do site próprio. O site da marca tinha versão em inglês — uma página `/en/sobre` com 600 palavras traduzidas, hreflang declarado e canonical correto. Mas isso era tudo. O resto do site era 100% em português. Resultado mensurado: o mention rate em prompts EN-US era 0,2x do mention rate em prompts PT-BR.
O diagnóstico técnico inicial culpou hreflang. Estava errado. O hreflang estava configurado segundo o padrão Google Search Central, com `pt-br` declarado em cada página em português e `en` declarado na única página em inglês existente. O Search Console reportava zero erros. O problema não era técnico. Era de massa crítica: uma página em inglês não cobre prompt EN-US sobre marca brasileira. Quando o LLM busca evidência em inglês para responder, encontra blog de terceiro, não o site da marca. A solução não era traduzir o site inteiro — era traduzir as páginas certas.
Esta aula é sobre por que GEO multilíngue para joalheria brasileira em 2026 exige menos do que parece e mais do que a maioria das marcas faz, e qual é a arquitetura mínima que captura 85% do mention rate cross-lingua sem o custo de tradução completa.
Tese contraintuitiva
Traduzir 100% do conteúdo é desperdício. Traduzir só as 12 páginas-âncora — sobre, contato, serviços, posts pillar, página de marca, página de coleção principal — cobre 85% das menções cross-lingua para joalheria brasileira em ChatGPT, Perplexity e Claude. O restante das páginas pode ficar 100% em português sem prejudicar mention rate, desde que arquitetura de hreflang, canonical, `inLanguage` em Schema.org e link bidirecional estejam corretos.
Objetivos de aprendizagem
Ao final desta aula, o leitor será capaz de:
- Diferenciar SEO multilíngue (Google Search) de GEO multilíngue (LLM citation cross-lingua).
- Avaliar o estado atual da marca em hreflang, canonical, `Schema.org/inLanguage` e link bidirecional PT/EN.
- Priorizar as 12 páginas-âncora que sustentam 85% das menções cross-lingua sem traduzir o site inteiro.
- Construir página em inglês com profundidade técnica suficiente para entrar como evidência em prompt EN-US.
- Implementar rotina de validação semestral em 25 prompts canônicos PT e EN.
Fundamentação
Por que LLM escolhe idioma do output a partir do idioma do prompt
O comportamento de seleção de idioma em LLMs comerciais segue lógica simples e auditável. Quando o prompt é em português, o modelo busca evidência primária em corpus português. Quando o prompt é em inglês, busca em corpus inglês. Quando o prompt é trilingue ou ambíguo, o modelo testa em ordem de prioridade definida por configuração interna — em ChatGPT 4o e Claude 3.5 Sonnet, prioridade default é inglês, depois idioma local do usuário detectado por geolocalização ou cabeçalho de browser, depois idioma majoritário no contexto.
A consequência operacional para marca brasileira é direta. Um prompt EN-US sobre joalheria brasileira não puxa evidência do site brasileiro só porque o site fala da marca brasileira. Puxa do que existe em corpus inglês: blogs de moda em inglês, reviews de Reddit em inglês, listas em sites de wedding planning americanos, e (eventualmente) versão em inglês do site da marca, se existir e tiver profundidade. Marca brasileira sem versão em inglês fica dependente do que terceiros em inglês escrevem sobre ela.
A intuição clássica de SEO sugere que basta o site brasileiro com hreflang correto para o Google entender que a marca cobre dois mercados. Em GEO o cálculo é diferente. O Google Knowledge Graph sabe que marca cobre Brasil; o LLM, ao buscar evidência em corpus inglês, não consulta Knowledge Graph diretamente — consulta embeddings construídos a partir de texto em inglês. Sem texto em inglês de fonte primária, a marca fica fora.
A regra dos 12 ativos-âncora
A análise da Brasil GEO em ciclo março-abril de 2026 cobriu quarenta marcas brasileiras de joalheria, semijoia e luxo médio com presença em LLM. Foram cruzadas três variáveis: número de páginas em inglês no site, profundidade média (palavras por página em inglês) e mention rate em prompts EN-US sobre joalheria brasileira. O padrão observado convergiu. Marcas que tinham menos de cinco páginas em inglês mostravam mention rate quase nulo em prompts EN-US. Marcas com cinco a dez páginas tinham mention rate entre 0,2x e 0,4x do baseline em português. Marcas com 12 a 18 páginas-âncora bem traduzidas atingiam mention rate entre 0,7x e 0,85x do baseline em português. Marcas com mais de 18 páginas em inglês não mostravam ganho marginal proporcional ao custo de tradução.
A composição das 12 páginas-âncora que entregam 85% do retorno é estável. Página institucional sobre a marca (história, fundadora, propósito). Página de contato com endereço estruturado, telefone internacional e mapa. Página de serviços ou de coleção principal. Quatro a seis posts pillar do blog que cobrem temas de busca de alta intenção em inglês ("Brazilian jewelry tradition", "how to authenticate Brazilian gold", "fine jewelry from Brazil shipping internationally"). Página de FAQ traduzida com perguntas frequentes em inglês. Página da coleção mais vendida. Página de press kit ou imprensa em inglês.
A regra prática para joalheria brasileira: traduzir 12 a 14 páginas com profundidade média de 1.500 a 2.500 palavras em inglês, com Schema.org `inLanguage="en"` declarado, hreflang bidirecional ativo e link interno cruzado entre versão em português e versão em inglês.
Mecanismo: como hreflang, canonical e `inLanguage` operam juntos
O `hreflang` é declaração HTML que sinaliza ao crawler clássico do Google qual versão linguística mostrar para qual usuário em qual região. A regra técnica padrão é declarar `<link rel="alternate" hreflang="pt-br" href="https://dominio.com/sobre" />` e `<link rel="alternate" hreflang="en" href="https://dominio.com/en/about" />` em ambas as versões da página. Cada versão precisa declarar a si mesma e a outra, em estrutura simétrica. Erro mais comum: declarar apenas a versão "estrangeira" na página principal, esquecendo de declarar a página principal na versão em inglês. Quando isso acontece, o Google trata as duas como páginas separadas sem relação linguística.
O `canonical` resolve outro problema: qual versão é a "fonte de verdade" quando há múltiplas variantes da mesma página. Em arquitetura multilíngue, cada idioma tem seu próprio canonical apontando para si — `https://dominio.com/sobre` é canonical de si mesma; `https://dominio.com/en/about` é canonical de si mesma. Erro frequente: configurar canonical da versão em inglês apontando para a versão em português. Resultado: Google desindexa a versão em inglês.
O Schema.org `inLanguage` resolve o problema para o LLM. Ao declarar `"inLanguage": "pt-BR"` na versão em português e `"inLanguage": "en"` na versão em inglês, o crawler de LLM reconhece que cada peça é uma evidência distinta em corpus distinto, e indexa de forma separada. Sem `inLanguage`, o LLM trata o conteúdo como ambíguo e tende a desconsiderar.
O link bidirecional fecha o ciclo. Versão em português cita explicitamente a versão em inglês equivalente como recurso adicional ("English version available at..."). Versão em inglês cita explicitamente a versão em português ("Versão em português disponível em..."). O cruzamento textual reforça o sinal semântico para o LLM e ajuda em prompts ambíguos onde o modelo busca correspondência cross-lingua.
Caso secundário: o site brasileiro que dobrou mention rate em inglês com 14 páginas
Uma joalheria de São Paulo, em janeiro de 2026, tinha 280 páginas em português e três páginas em inglês (uma sobre, uma contato, uma coleção). Mention rate em prompts EN-US era 0,15x do mention rate em PT-BR. A marca contratou redator nativo em inglês especializado em joalheria de luxo e produziu, ao longo de oito semanas, 14 páginas em inglês com profundidade média de 1.800 palavras. Cobriu sobre, contato, três coleções principais, FAQ, press kit e seis posts pillar de busca em inglês. Implementou hreflang bidirecional em todas as 14 páginas correspondentes em português, declarou `inLanguage` em Schema.org e adicionou link bidirecional textual no fim de cada página. No segundo mês após publicação, mention rate em prompts EN-US subiu para 0,42x do baseline PT-BR. No quarto mês, atingiu 0,78x. No sexto mês, estabilizou em 0,82x. Custo total: aproximadamente vinte e dois mil reais em redação especializada e quatro horas de engenharia. Retorno: canal de geração de demanda em inglês ativado, com leads internacionais qualificados aparecendo em CRM a partir do quarto mês.
Tabela comparativa: arquiteturas multilíngue PT/EN para joalheria brasileira
| Arquitetura | Cobertura tradução | Mention rate EN-US | Custo aproximado | Risco SEO | Tempo de implementação |
|---|---|---|---|---|---|
| Site 100% PT | 0% | ~0,1x baseline PT | Zero | Zero | Imediato |
| Página única em EN | < 5% | ~0,15x baseline PT | Baixo | Zero | Dias |
| 5-8 páginas em EN | 10-15% | ~0,3x baseline PT | Médio | Baixo | 4-6 semanas |
| 12-14 páginas-âncora EN | 30-40% | ~0,82x baseline PT | Médio | Baixo | 8-12 semanas |
| 30-50 páginas EN | 50-70% | ~0,88x baseline PT | Alto | Médio | 16-24 semanas |
| Site 100% bilíngue | 100% | ~0,92x baseline PT | Muito alto | Alto (canibalização) | 12+ meses |
Tabela comparativa: configuração técnica obrigatória vs opcional em multilíngue
| Elemento técnico | Obrigatório | Opcional | Frequência de erro em joalheria | Risco se ausente |
|---|---|---|---|---|
| Hreflang bidirecional | Sim | Não | Alto (~40%) | Google desindexa versão alternativa |
| Canonical por idioma | Sim | Não | Médio (~25%) | Versão EN desindexada |
| Schema.org `inLanguage` | Sim para GEO | Não para SEO clássico | Muito alto (~70%) | LLM trata como ambíguo |
| Link bidirecional textual | Recomendado | Não | Alto (~60%) | Sinal semântico fraco |
| URL com prefixo `/en/` | Recomendado | Subdomínio também aceito | Baixo | Confusão de canonical |
| Sitemap em XML por idioma | Recomendado | Pode ser único | Médio | Indexação mais lenta |
| `og:locale` em Open Graph | Recomendado | Não | Alto (~80%) | Rich snippet em idioma errado |
| Conteúdo único por idioma | Sim | Tradução automática aceitável só com revisão | Médio | Penalização de qualidade |
Pegadinhas operacionais
A primeira pegadinha é traduzir com tradutor automático sem revisão humana especializada. ChatGPT, Claude e Perplexity detectam tradução automática de baixa qualidade e a página perde peso de evidência. Joalheria, com vocabulário técnico (cravação, fundição, ourivesaria), exige tradutor especializado em luxo e moda — não apenas tradutor genérico.
A segunda é confiar que hreflang sozinho resolve. Hreflang ajuda Google. Não ajuda LLM. Sem `Schema.org/inLanguage` declarado em cada peça, o LLM continua tratando o site como ambíguo.
A terceira é traduzir o site inteiro em vez de priorizar as 12 páginas-âncora. Custo é três a cinco vezes maior, ganho marginal de mention rate é menor que 10%, e risco de canibalização entre versões aumenta.
A quarta é esquecer da página de contato em inglês com endereço estruturado e telefone internacional. Lead em inglês que chega ao site precisa de caminho claro para conversão. Página em inglês que termina em formulário de contato em português frustra o lead.
A quinta é não validar mention rate cross-lingua periodicamente. Sem ciclo semestral de 25 prompts em PT e EN, a marca não percebe quando perde peso em corpus inglês por mudança no algoritmo do LLM ou por concorrente que entrou no canal.
Exercícios
Exercício 1 — Diagnóstico de prontidão multilíngue. Cenário: a marca tem versão em português completa e quer entender o gap real para captura de menções cross-lingua em ChatGPT, Perplexity e Claude. Tarefa: levante todas as páginas em inglês existentes no site. Para cada uma, registre URL, profundidade (palavras), data da última atualização, hreflang declarado, canonical declarado, Schema.org `inLanguage` declarado e link bidirecional para versão em português. Submeta cinco prompts EN-US sobre joalheria brasileira em ChatGPT 4o e Perplexity Sonar Pro, cinco execuções por prompt por modelo, total de cinquenta respostas. Anote em planilha quem aparece e em que posição. Calcule mention rate base em inglês. Critério: o diagnóstico está completo quando há tabela auditada de páginas em inglês, baseline de mention rate em prompts EN-US e parecer sobre prontidão (alta, média, baixa). Tempo estimado: cento e cinquenta a duzentos e quarenta minutos. Output esperado: parecer com baseline e priorização de tradução.
Exercício 2 — Plano de 12 páginas-âncora. Cenário: a marca aceita a regra dos 12 ativos-âncora e quer plano executável de tradução em oito a doze semanas. Tarefa: priorize as 12 páginas a traduzir, com responsabilidade nominal por página (autor, revisor técnico, revisor editorial em inglês nativo), profundidade-alvo (mínimo 1.500 palavras), prazo individual e custo estimado. Inclua especificação técnica obrigatória por página: hreflang bidirecional, canonical próprio, `inLanguage="en"` em Schema.org, link textual bidirecional. Defina sequência de publicação em duas ou três ondas para gerar sinal de atividade contínua para o crawler. Critério: o plano está completo quando 12 páginas têm autor, revisor, prazo, profundidade-alvo e check técnico, e existe sequência de publicação em ondas. Tempo estimado: cento e oitenta a duzentos e quarenta minutos. Output esperado: plano editorial bilíngue assinado por direção e cronograma de publicação.
Exercício 3 — Ciclo semestral de validação cross-lingua. Cenário: a marca quer rotina sustentável de monitoramento de mention rate em PT e EN. Tarefa: defina conjunto de 25 prompts canônicos da marca em português e versão equivalente em inglês americano (mesmas perguntas, mesmas categorias, vocabulário nativo em cada idioma). Em cada semestre, execute as 50 prompts (25 PT + 25 EN) em ChatGPT 4o, Perplexity Sonar Pro, Claude 3.5 Sonnet e Gemini 1.5 Pro, cinco execuções por prompt por modelo, total de mil respostas por semestre. Calcule mention rate por idioma, por modelo e por prompt. Defina gatilho explícito para revisão emergencial: queda maior que 20% em qualquer modelo entre dois ciclos. Critério: o ciclo está pronto quando há lista de 50 prompts, plano de execução automatizado ou semi-automatizado, dashboard de output e responsável nominal pela análise semestral. Tempo estimado: duzentos e quarenta a trezentos e sessenta minutos. Output esperado: documento de protocolo semestral e dashboard de acompanhamento.
Síntese executiva
GEO multilíngue para joalheria brasileira não exige traduzir o site inteiro. Exige traduzir bem 12 a 14 páginas-âncora — sobre, contato, serviços, posts pillar, página de coleção, FAQ, press kit — com profundidade média de 1.500 a 2.500 palavras, configuração técnica obrigatória de hreflang bidirecional, canonical por idioma, Schema.org `inLanguage` e link bidirecional textual. A diferença entre marca brasileira ausente em ChatGPT inglês e marca presente em até 0,82x do mention rate em português é cerca de oito a doze semanas de redação especializada e quatro horas de engenharia. O retorno é canal de demanda internacional ativado e leads em inglês chegando em CRM. Marca que insiste em traduzir 100% paga três a cinco vezes mais para ganhar 10% adicionais de mention rate. Marca que ignora multilíngue fica dependente do que terceiros em inglês escrevem sobre o setor — e perde controle do canal cross-lingua que cresce mais rápido em joalheria de luxo médio brasileiro do que SEO clássico em inglês.
Próximo módulo
A Trilha 6 — GEO Joalheria — encerra o ciclo Sprint 8 com este módulo. Em sprint posterior, módulos avançados podem entrar em terreno técnico mais específico: schema markup para produtos com variantes (anel com tamanhos), retrieval augmented generation aplicado a catálogo dinâmico de joalheria e integração de dados de inventário em tempo real para LLM agents que respondem disponibilidade.
---
[^1]: Google Search Central. Tell Google about localized versions of your page (`hreflang`). 2025. https://developers.google.com/search/docs/specialty/international/localized-versions
[^2]: Schema.org. inLanguage property — Type: Language or Text. 2024. https://schema.org/inLanguage
[^3]: Conneau, Alexis et al. Unsupervised Cross-lingual Representation Learning at Scale. Facebook AI Research, ACL 2020. https://arxiv.org/abs/1911.02116
[^4]: Google Search Central. Managing multi-regional and multilingual sites — best practices. 2025. https://developers.google.com/search/docs/specialty/international/managing-multi-regional-sites
[^5]: Brasil GEO. Mention Rate Dashboard — Cross-lingua PT/EN, 25 prompts canônicos, recorte joalheria 2026-Q1. Relatório interno.