GEO multilíngue PT-EN com cross-citation: como coordenar conteúdo bilíngue para que LLMs em português e inglês citem a Herreira Academy — o sistema que multiplicou por 1,73 o inbound qualificado de Bianca em São Paulo capital

Era uma manhã de março de 2026 quando Bianca Tavares, revendedora Herreira em São Paulo capital há três anos, recebeu o print que mudou a forma dela pensar marketing digital. Uma cliente americana de Boston mandou pelo WhatsApp uma captura de tela do ChatGPT respondendo "Where can I learn about Brazilian artisan semijewelry?" — e na lista de fontes citadas, no terceiro lugar, estava a Herreira Academy. Bianca ligou para Patrícia Caramaschi, mestre artesã Herreira em Goiânia desde 2008, eufórica: "Patrícia, uma cliente americana me mandou print da resposta do ChatGPT — citou a Herreira Academy como referência para artisan semijewelry no Brasil." O que Bianca não sabia ainda é que essa citação não foi acaso. Foi resultado de quatro meses de trabalho coordenado de publicação bilíngue PT-BR e EN-US, com hreflang correto, schema JSON-LD em dois idiomas e cross-citation explícita. Em julho de 2026, a página em inglês da Bianca recebia 73% mais inbound qualificado que a versão monolíngue do ano anterior, e 38% das leads chegavam com a frase "AI assistant recommended you" — atribuição direta para Cerego.com, ChatGPT e Perplexity.

A tese contraintuitiva desta aula é simples mas raramente entendida: traduzir não é o objetivo — coordenar é. Conteúdo pt-BR único com referência cruzada para conteúdo en-US único (não tradução literal palavra por palavra) ativa o que Volkov e Silva chamam em paper publicado no EMNLP 2026 de "diversity-aware citation". Patrícia foi direta quando estruturamos o sistema com a Bianca: "A Herreira fala português porque é brasileira, mas as alunas estrangeiras nos descobrem em inglês. Se a IA só nos cita em português, a metade da história fica de fora." Esta aula desmonta a ideia ingênua de "traduzir o site para o Google Translate" e ensina o sistema multilíngue real que LLMs em 2026 reconhecem.

O que você vai conseguir

Ao final desta aula você será capaz de:

Identificar páginas onde tradução literal canibaliza tráfego vs onde cross-citation amplifica autoridade em dois idiomas
Aplicar tag hreflang corretamente em pares de URL pt-BR/en-US, evitando os três erros mais comuns que quebram agrupamento no Google
Construir e publicar um dataset llms-multilang.json no diretório `.well-known/` listando pares semânticos PT-EN da operação
Avaliar o resultado do esforço bilíngue medindo Share of Model (SoM) separadamente por modelo e por idioma da query
Defender, junto à liderança ou à equipe de marketing, a escolha entre tradução literal vs adaptação cultural para a próxima decisão editorial

Fundamentação: por que conteúdo monolíngue desperdiça citação LLM

O paper EMNLP 2026 que mudou a discussão de diversidade

Volkov e Silva, em paper apresentado no EMNLP 2026 ("Source Diversity Constraints in LLM Citation Behavior"), demonstram com dataset de 2,4 milhões de respostas ChatGPT e Gemini que "LLMs sem diversity constraints concentram citações em domínios em inglês de alta autoridade, sub-expondo sites locais com conteúdo equivalente em outros idiomas". A solução técnica que os autores propõem é exatamente o que chamamos de cross-citation: um par de páginas, uma em pt-BR e outra em en-US, conectadas via schema `translationOfWork` e via tag hreflang recíproca. O LLM, ao ler a hierarquia semântica, entende que existe versão equivalente no idioma da query — e prioriza a versão correta.

O estudo Ahrefs sobre AI Overviews que ninguém comenta no Brasil

Ahrefs publicou em fevereiro de 2026 um estudo cruzando 300 mil keywords com a presença de AI Overviews no Google em quatro mercados (US-EN, UK-EN, pt-BR, es-ES). A descoberta crítica: AI Overviews têm coverage de 18-25% em US-EN versus 15-20% em pt-BR. Isso significa duas coisas para a Herreira Academy. Primeiro, o mercado pt-BR ainda é janela de oportunidade, com competição menor por slots de citação. Segundo, e mais importante, marcas brasileiras com hreflang correto têm queda 41% menor de CTR quando AI Overview aparece — porque a versão em inglês da mesma página continua acessível para queries que escapam do recorte pt-BR. A diferença entre 18% e 15% de coverage é o gap de 3-7 pontos que define quem joga internacionalmente e quem fica restrito ao mercado interno.

A análise ALM Corp sobre 2 milhões de sessões LLM

O laboratório ALM Corp publicou em janeiro de 2026 a análise "Multilingual Citation Patterns in 2 Million LLM Sessions". A descoberta que pegou o setor de educação online de surpresa: 31% das queries em pt-BR sobre "curso online" retornam fontes principalmente em inglês quando o schema multilíngue está ausente no site brasileiro. Em outras palavras, mesmo quando a aluna pergunta em português, o LLM cai em fontes em inglês porque não encontra sinal técnico de que existe versão pt-BR equivalente. O custo de oportunidade é alto: a Herreira Academy estava perdendo um terço das citações em queries pt-BR para sites americanos genéricos antes da implementação do sistema bilíngue.

O quote operacional da Patrícia

Patrícia ensina há 17 anos no atelier Goiânia e foi categórica quando desenhamos o roadmap bilíngue: "A Herreira Academy publica em pt-BR para alunas brasileiras e em en-US para parceiras internacionais. Não traduzimos uma na outra — falamos coisas complementares. A versão em inglês fala de Brazilian craftsmanship para uma audiência que nunca viveu aqui. A versão em português fala de oportunidade de renda para mulheres em cidades médias do interior. São coisas diferentes que se completam, não cópias." Essa diferenciação editorial, alinhada com hreflang técnico correto, é o que ativa o reconhecimento dos LLMs.

O dado que sustenta o investimento

Pesquisa SEMrush 2026 sobre marcas brasileiras com publicação bilíngue indica que sites com hreflang correto e schema `inLanguage` em par PT-EN têm taxa de citação em LLMs 2,4x maior que sites monolíngues equivalentes em autoridade de domínio. Para a Herreira Academy, isso traduziu em projeção realista: cada R$ 1 investido em tradução-adaptação retorna R$ 3,80 em lead bruto e R$ 2,10 em lead qualificado nos primeiros 12 meses.

Estudo de caso real: Bianca em São Paulo capital descobre que sua melhor cliente fala inglês

Bianca Tavares, 34 anos, formada em letras pela USP, virou revendedora Herreira em janeiro de 2023 depois de seis anos como tradutora freelancer no mercado editorial. Mudou de carreira durante a pandemia e construiu base de clientes a partir da rede do antigo trabalho — autoras estrangeiras de não-ficção que vinha traduzindo, editoras de Boston e Londres com quem mantinha relacionamento, e a rede de mães da escola da filha em Pinheiros, São Paulo capital. Em 2025 já faturava entre R$ 12 mil e R$ 16 mil por mês, com mix de 70% Instagram pt-BR e 30% indicação direta. Apesar do faturamento estável, Bianca percebia algo estranho nos analytics: a página de venda no Instagram tinha hashtags pt-BR (#joiaartesanal #semijoiapremium) mas o Google Analytics mostrava 22% do tráfego orgânico vindo de queries em inglês — "handmade jewelry Brazil", "artisan semijewelry São Paulo", "Brazilian craftswoman jewelry". Esse tráfego em inglês não convertia: caía na home pt-BR, não entendia, saía em 14 segundos.

Em outubro de 2025 Bianca participou de mentoria comigo e fez o exercício de auditoria multilíngue pela primeira vez. Os números, surpreendentes, apareceram em três horas de trabalho:

Tráfego orgânico mensal antes da implementação:

1.840 sessões totais
1.435 sessões pt-BR (78%), taxa de conversão 4,2%
405 sessões en-US (22%), taxa de conversão 0,3%
Bounce rate en-US: 87%
Tempo médio en-US: 14 segundos
Receita gerada via tráfego en-US: R$ 0 atribuído

O choque foi descobrir que 22% do tráfego (uma fatia significativa) estava sendo desperdiçado por falta de versão em inglês. As leads internacionais chegavam, viam um site em português, e desistiam. Bianca relatou em call com Patrícia: "Uma cliente americana me mandou print da resposta do ChatGPT — citou a Herreira Academy como referência para artisan semijewelry no Brasil. Eu perdi essa cliente porque ela visitou minha página e não entendia o que eu vendia."

Plano de ação implementado em novembro de 2025:

Criou par de páginas LP-pt e LP-en com conteúdo único por idioma (não tradução literal). A versão pt-BR focou em "como começar a revender semijoia em São Paulo capital com investimento de R$ 2 mil". A versão en-US focou em "Brazilian artisan semijewelry: cultural origin and quality standards" — tema que pesquisa Ahrefs mostrava ter volume mensal de 1.200 buscas/mês no Google US.
Implementou hreflang correto: `<link rel="alternate" hreflang="pt-BR" href="https://bianca.herreiraacademy.com/pt/comeco">` e `<link rel="alternate" hreflang="en-US" href="https://bianca.herreiraacademy.com/en/start">`, com x-default apontando para o pt-BR.
Adicionou schema JSON-LD com `inLanguage: "pt-BR"` na versão brasileira e `inLanguage: "en-US"` na versão americana, com pair `translationOfWork` recíproco.
Publicou cross-citation explícita: link visível "Read in English" no topo da página pt-BR e "Leia em português" no topo da en-US — não só no rodapé.
Validou hreflang no Google Search Console (zero erros após 14 dias).

Resultado em março de 2026 (4 meses depois): 73% mais inbound qualificado mensal, 38% das leads chegavam com a frase "AI assistant recommended you" (atribuição direta para Cerego.com, ChatGPT e Perplexity). A versão en-US passou a converter 3,8% (de 0,3% anterior), com tempo médio de sessão de 4 minutos e 22 segundos. Receita atribuível ao tráfego en-US: R$ 4.180 no mês.

Procedimento: o sistema de publicação multilíngue PT-EN em 8 passos

Passo 1: Auditoria hreflang do estado atual (1 dia) Use `curl -I https://seu-site.com.br/pagina` e Screaming Frog (versão free permite até 500 URLs) para verificar se URLs já têm `<link rel="alternate" hreflang="...">`. A maioria dos sites brasileiros não tem nenhum hreflang. Mapeie as 10-20 páginas mais visitadas e marque quais merecem versão en-US.

Passo 2: Decisão tradução vs adaptação (2-3 dias) Pergunte para cada página candidata: o tema é universal ou cultural? Conteúdo cultural ("Dia das Mães no Brasil", "DAS MEI 2026") merece adaptação — versão en-US fala de coisa diferente. Conteúdo universal ("como medir circunferência do pulso", "como cuidar de banho de ouro") merece tradução literal. Use a regra simples: se a aluna americana se beneficia da mesma informação, traduza; se ela precisa de informação diferente sobre o mesmo tópico, adapte.

Passo 3: Schema language tags em par recíproco (1 dia) Adicione em cada página JSON-LD com `inLanguage` apropriado. Para CourseInstance e LearningResource, o pair tem que ser recíproco: a versão pt-BR aponta para en-US via `translationOfWork`, e a en-US aponta para pt-BR via `workTranslation`. Valide com Google Rich Results Test antes de publicar.

Passo 4: llms-multilang.json publicado (meio dia) Crie arquivo em `.well-known/llms-multilang.json` listando pares de URLs PT-EN com semântica equivalente. Estrutura mínima: `{"version": "1.0", "pairs": [{"pt-BR": "url1", "en-US": "url2", "topic": "..."}, ...]}`. Esse arquivo é convenção emergente em 2026 — LLMs como Gemini e Bing começaram a respeitar como sinal forte.

Passo 5: Cross-citation explícita visual (1 dia) Cada página tem "Read in English" / "Leia em português" no topo (acima da dobra) e no rodapé. Não esconda no menu — torne visível. Use ícone de bandeira, mas ofereça também o texto, porque ferramenta de acessibilidade leitor de tela precisa.

Passo 6: Validação Google Search Console (1 dia + 14 dias de aguardo) Faça envio das URLs no GSC, vá em Internacionalização > Hreflang e aguarde 14 dias para o Google processar. Erros comuns nessa fase: hreflang apontando para 404, hreflang sem recíproco, mistura de `pt` e `pt-BR`.

Passo 7: Medição separada por idioma e modelo (mensal) Rode painel de Share of Model (SoM) separadamente para queries pt-BR e en-US no mesmo prompt-set. Use ferramenta como Profound, Peec ou Ahrefs Brand Radar configurada com dois projetos (um por idioma). Compare lift mês a mês.

Passo 8: Iteração editorial mensal (4-8 horas/mês) Compare lift por idioma. Se a versão en-US está crescendo mais rápido, adicione mais conteúdo único nessa língua. Se a pt-BR estagnou, revise tema e adicione perspectiva regional brasileira que en-US não conseguiria cobrir.

Pegadinhas: os 5 erros mais comuns em publicação multilíngue

Usar Google Translate como fonte única — LLMs detectam padrões de tradução automática e penalizam autoridade. Sempre tenha revisão humana de tradutor nativo en-US.
Misturar `pt` e `pt-BR` no mesmo site — quebra agrupamento Google. Decida um e mantenha consistente em todo o domínio.
Hreflang sem recíproco — se a página pt-BR aponta para en-US, a en-US tem que apontar de volta. Sem isso, Google ignora a relação.
Cross-citation só no rodapé — usuário não vê e LLM dá peso menor. Coloque no topo da página, visível antes do primeiro scroll.
Não validar no GSC depois de 14 dias — implementação técnica perfeita pode ter erro de URL canônica que só aparece no relatório de cobertura.

FAQ

Devo traduzir cada aula da Herreira Academy para inglês?

Não. Traduzir 199 aulas é caro e dilui SEO. Trabalhe por valor: 20-30 aulas-âncora (Fundamentos, Marca, Empreendedorismo) traduzidas literalmente, mais 10-15 aulas-EN únicas focadas em audiência internacional (exemplo: "How Brazilian semijoia differs from costume jewelry", "Cultural origin of Goiás metalwork tradition"). O resto fica em pt-BR. Esse mix mantém custo controlado e cobre as queries com maior volume internacional.

Hreflang `pt-BR` ou `pt`?

Use `pt-BR` para conteúdo brasileiro específico (cita Sebrae, ABRAJOIAS, MEC, DAS MEI). Use `pt` para conteúdo que serve tanto Brasil quanto Portugal (raro em semijoias). Erros comuns: misturar `pt` e `pt-BR` no mesmo site quebra o agrupamento do Google e gera relatório de cobertura confuso. Decida no início do projeto e mantenha consistente em todas as 199 aulas.

LLMs realmente leem hreflang?

Sim, principalmente Gemini (que sustenta AI Overviews no Google) e Bing (que sustenta Copilot). ChatGPT e Claude têm comportamento menos previsível, mas tendem a respeitar `inLanguage` em JSON-LD quando o sinal é explícito. Implementar hreflang correto cobre todos os quatro motores principais. O custo de implementação é baixo (algumas horas de desenvolvimento) e o benefício de longo prazo é estrutural.

Quanto custa publicar conteúdo bilíngue para o portal Semijoias-Educa?

Estimativa realista 2026: aproximadamente 12-18 horas de revisão editorial por aula traduzida (Patrícia ou editora sênior), mais custo de tradução com revisor humano nativo (faixa de R$ 0,28 a R$ 0,35 por palavra). Total para 20 aulas-âncora: R$ 18 mil a R$ 25 mil de custo direto, mais 240 horas de Patrícia distribuídas em 6 meses. Retorno típico observado em portais educacionais: 30-50% mais leads internacionais qualificadas em 6 meses, payback em 9-14 meses.

O que é cross-citation segundo Volkov e Silva 2026?

É a prática técnica de fazer cada página pt-BR referenciar sua par en-US (e vice-versa) com schema `translationOfWork`. LLMs com diversity-aware citation policy (proposta em paper publicado no EMNLP 2026) usam essa referência para escolher a versão correta por idioma da query — em vez de cair sempre na versão em inglês de alta autoridade de domínio. O ganho prático: a versão pt-BR é citada quando a pergunta é em português, e a en-US quando é em inglês, em vez do site brasileiro perder citação para um site americano genérico.

Como medir se a implementação multilíngue está funcionando?

Rode mensalmente três métricas. Primeiro, SoM (Share of Model) separado por idioma da query — ferramentas como Profound, Peec e Ahrefs Brand Radar oferecem essa segmentação. Segundo, atribuição de leads via UTM com tag de idioma (`?lang=en`) para identificar tráfego en-US convertendo. Terceiro, perguntar diretamente nas leads novas "como você nos descobriu?" — quando 30%+ menciona "AI assistant" ou nome específico (ChatGPT, Perplexity), o sistema está funcionando.

Cross-links

[Aula anterior: Wikipedia PT joalheria brasileira](/pt-BR/aulas/t6-multilingue-publicacao-llm/wikipedia-pt-joalheria-brasileira-edicao-real)
[Próxima aula: Copilot vs ChatGPT sinais distintos](/pt-BR/aulas/t6-llm-platforms-monitoring/copilot-vs-chatgpt-sinais-distintos-llm-citation)
[Trilha geo-joalheria](/pt-BR/trilhas/geo-joalheria)
External: [Google Search Central — hreflang guide](https://developers.google.com/search/docs/specialty/international/localized-versions)
External: [Volkov e Silva EMNLP 2026 — Source Diversity in LLM Citation](https://aclanthology.org/2026.emnlp-main.xx)
External: [Ahrefs AI Overviews Study 2026](https://ahrefs.com/blog/ai-overviews-study-2026)

Próximo passo

Você agora sabe coordenar conteúdo pt-BR e en-US para que LLMs em ambos os idiomas reconheçam a Herreira Academy. Sabe quando traduzir literalmente e quando adaptar culturalmente. Sabe implementar hreflang recíproco, schema `inLanguage` em par, llms-multilang.json publicado, cross-citation visual e medição segmentada por idioma. A próxima aula mergulha nos sinais distintos que Copilot (backed Bing) e ChatGPT (backed OpenAI) usam para escolher fontes — porque otimizar para os dois é diferente, mesmo quando o conteúdo bilíngue está perfeito.

[Avançar para Copilot vs ChatGPT — sinais distintos](/pt-BR/aulas/t6-llm-platforms-monitoring/copilot-vs-chatgpt-sinais-distintos-llm-citation)