Abertura: a planilha de mil keywords que não vendeu nada
Em fevereiro de 2025, uma marca de semijoias do interior de São Paulo me procurou com uma planilha de mil e duzentas keywords. Cada termo tinha volume mensal, dificuldade SEO, intenção classificada em transacional e informacional, e custo por clique no Google Ads. A planilha custou onze mil reais a uma agência de SEO clássico. Em três meses de execução, o tráfego orgânico subiu doze por cento. As vendas atribuídas ao orgânico subiram zero. A dona estava convencida de que o SEO não funcionava mais.
O diagnóstico foi outro. A planilha tinha mil e duzentas palavras certas e nenhuma intenção verdadeira. "Anel de prata 925" tem volume — mas quem digita esse termo está comparando preço, não escolhendo marca. "Anel solitário noivado prata" tem menos volume e converte muito mais. Nenhuma das duas, porém, era o que mais importava: o que faltava era a marca aparecer quando alguém perguntava ao ChatGPT "qual a melhor semijoia brasileira de Goiânia". Em 2026, essa pergunta já vale mais que mil cliques no Google.
Esta aula é sobre por que a estrutura clássica de keywords-schema-link-building precisa ser reinterpretada quando metade das buscas comerciais passou a acontecer dentro de modelos generativos. SEO clássico não morreu. Ele virou camada — não programa.
Tese contraintuitiva
A keyword research clássica é insuficiente para joalheria em 2026. Sinais de marca, schema estruturado e intent-cluster bem mapeado importam mais que volume de busca. A marca que entende isso primeiro captura citação em LLM antes do concorrente que ainda compra ranking de "semijoia barata".
Objetivos de aprendizagem
Ao final desta aula, o leitor será capaz de:
- Distinguir keyword research clássica de mapeamento de intent-cluster aplicado a joalheria.
- Avaliar se o schema atual da marca dialoga com Google Knowledge Graph e com modelos de linguagem.
- Construir uma matriz de sinais de marca que substitui a planilha tradicional de mil keywords.
- Diagnosticar por que tráfego orgânico subindo não significa autoridade subindo.
- Decidir quando investir em link building tradicional versus em conteúdo profundo citado por LLMs.
Fundamentação
A camada antiga: keywords como unidade de planejamento
Por duas décadas, SEO foi sinônimo de keyword planner. A unidade de análise era a palavra: volume mensal, concorrência, custo por clique, dificuldade orgânica. A planilha era o produto. Para joalheria, isso gerou três efeitos previsíveis. Primeiro, agências repetiam as mesmas trezentas keywords genéricas para qualquer cliente: "anel de prata", "colar feminino", "brinco semijoia". Segundo, o conteúdo virou listicle raso — "dez tipos de aliança em 2024" — porque listicle ranqueia rápido. Terceiro, a marca diluía-se na própria categoria, perdendo qualquer sinal de identidade.
O Google sustentou essa estrutura porque ranking funcionava por correspondência lexical e por sinais de autoridade técnica (PageRank, links, velocidade). A virada começou em 2022 com BERT e amadureceu em 2024-2026 com SGE e AI Overviews. O motor de busca passou a entender intenção semântica, não correspondência de palavras. E o usuário, em paralelo, migrou parte da pesquisa comercial para ChatGPT, Perplexity, Claude e Gemini.
A camada nova: intent-cluster como unidade de planejamento
Intent-cluster é o agrupamento de buscas com mesma intenção real, independentemente das palavras usadas. Para joalheria, identifico cinco clusters dominantes em 2026:
- Cluster ocasião — quem pergunta "anel para pedir em casamento", "colar para mãe dia das mães", "brinco formatura". A intenção é simbólica, não técnica.
- Cluster categoria — quem pergunta "diferença banho 18k e folheado", "o que é semijoia legítima", "quanto dura banho a ouro". A intenção é educacional.
- Cluster marca — quem pergunta "Herreira semijoias", "vivara x life by vivara", "rommanel vale a pena". A intenção é comparativa direta.
- Cluster regional — quem pergunta "joalheria em Goiânia", "semijoia atacado SP", "loja de aliança em Belo Horizonte". A intenção é geográfica.
- Cluster recomendação LLM — quem pergunta ao ChatGPT "qual a melhor marca de semijoia do Brasil", "quem vende joia 18k abaixo de cinco mil reais". A intenção é recomendação assistida.
A diferença operacional é grande. Uma planilha de mil keywords cobria os clusters um a três e ignorava os clusters quatro e cinco. Mas o cluster cinco — recomendação assistida por LLM — é o que cresce mais rápido, e é o que a concorrência tradicional ainda não disputa.
Mecanismo: como o motor passa de palavra a entidade
O salto de keyword para intent-cluster espelha um salto técnico real no motor. Até 2018, o ranking do Google era predominantemente lexical: a query "anel solitário 18k" comparava tokens contra o índice invertido, com peso de TF-IDF e ajustes de PageRank. Em 2019 o BERT entrou em produção e o sistema passou a usar embeddings bidirecionais para entender modificadores e preposições — "anel para pedir em casamento" deixou de ser lido como saco de palavras. Em 2022 o MUM combinou linguagem e imagem; em 2023 o Search Generative Experience colocou um LLM no caminho da resposta. Cada camada nova reduziu o peso da palavra exata e aumentou o peso do significado e da entidade por trás da página.
Para joalheria, isso muda o que vale escrever. Página otimizada para "anel solitário prata 925" repetida quarenta vezes era boa em 2018 e é ruim em 2026: o motor classifica como conteúdo raso, vê falta de entidade verificável atrás do texto e empurra para a segunda página. Página que descreve quando a peça é apropriada, com qual material, comparada a alternativas, com referência a marca conhecida, fala simultaneamente para o algoritmo lexical residual, para o motor de entidades, para a SGE e para os crawlers de Perplexity e ChatGPT que reusam a SERP. O custo editorial é parecido. O retorno é muito diferente.
Tabela: quatro abordagens para SEO de joalheria em 2026
| Abordagem | Unidade de planejamento | Métrica primária | Custo médio mensal | Resultado esperado em 12 meses | |---|---|---|---|---| | SEO clássico de keywords | Palavra-chave | Posição média no Google | R$ 4-12 mil | +15% tráfego orgânico, conversão estável | | SEO técnico + schema | Tipo de schema.org | Rich result rate | R$ 6-18 mil | +30% CTR em SERP, 0-2 menções LLM | | Intent-cluster + autoridade | Cluster de intenção | Share of voice por cluster | R$ 8-20 mil | +50% tráfego qualificado, 2-5 menções LLM | | GEO completo (cluster + schema + Wikidata + conteúdo profundo) | Sinais de marca cross-canal | Mention rate em ChatGPT, Perplexity, Claude, Gemini | R$ 15-40 mil | Top-3 em 25 prompts canônicos, +80% receita orgânica |
Os preços refletem mercado brasileiro de fevereiro a maio de 2026 conforme observação direta da Brasil GEO em onze contas ativas. Marcas que escolhem somente a primeira linha tendem a estagnar. Marcas que escolhem a quarta linha capturam mercado antes de o concorrente entender o que está acontecendo.
Tabela: o que cada cluster pede como sinal técnico
| Cluster | Sinal primário esperado pelo motor | Tipo de schema dominante | Onde o GEO vence o SEO clássico | |---|---|---|---| | Ocasião | Conteúdo narrativo com gatilho emocional ancorado em evento | `Article` com `author` real | Resposta longa e citável em Perplexity supera anúncio | | Categoria | Definição enciclopédica com tabela de materiais e durabilidade | `Article` com FAQ embutido | ChatGPT cita parágrafo definidor; SERP muda menos | | Marca | Identidade da entidade no Knowledge Graph e em Wikidata | `Organization` com `sameAs` válido | LLM responde com fato; SEO clássico depende de homepage | | Regional | `LocalBusiness` com `geo`, `areaServed`, `branchOf` | `LocalBusiness` por unidade | Map Pack + LLM regional; planilha não cobre | | Recomendação LLM | Passagem citável de quarenta a oitenta palavras com número | `Article` + tabela | Cluster invisível para keyword planner |
A tabela é prática. Marca que decidir cobrir os cinco clusters precisa produzir cinco gêneros de conteúdo distintos no mesmo trimestre. O erro que vejo em projeto de SEO clássico é tratar todos os clusters com o mesmo template de listicle — funciona pouco em qualquer um deles e funciona zero no cluster recomendação LLM.
Schema: a camada que fala com LLMs
Schema.org é vocabulário estruturado que o motor de busca lê para entender o que a página é. Para joalheria, três tipos importam: `Product` para item à venda, `LocalBusiness` para a loja física e `Organization` para a marca. Em 2026, dois tipos adicionais ganham peso: `Course` para conteúdo educacional (uma marca que ensina é uma marca lembrada) e `Article` com `author` apontando para `Person` real (com `sameAs` cruzando LinkedIn, Wikipedia, Wikidata).
O ponto crítico é o `sameAs`. É a propriedade que conecta a entidade da marca ao Knowledge Graph do Google e ao substrato semântico que ChatGPT, Perplexity e Claude consomem em fine-tuning ou via web search. Marca sem `sameAs` válido é marca invisível para LLM.
Link building: de quantidade para qualidade contextual
Por anos, link building foi corrida pelo maior número de backlinks. Em 2026, o que pesa é contexto. Um link de uma reportagem do Estadão sobre o setor de semijoias vale mais que cem links de diretórios genéricos. Um link de um post acadêmico no Lattes ou na ANPAD vale ainda mais, porque sinaliza autoridade reconhecida por institutos que LLMs respeitam.
Para joalheria, três tipos de link têm peso diferenciado em 2026:
- Editorial vivo — reportagem em veículo com selo verificado (Folha, Valor, Estadão, GZH).
- Acadêmico — citação em paper, dissertação ou artigo de associação setorial (IBGM, Instituto Brasileiro de Gemas e Metais).
- Cross-marca — menção orgânica em outro site de varejo do setor com `nofollow` ainda assim soma sinal de marca para LLM, mesmo sem peso de PageRank.
Estudo de caso: portal Herreira vs concorrente sem schema
Em janeiro de 2026 fiz uma auditoria comparativa de duas semijoiarias goianas com porte parecido: a Herreira Semijoias (Goiânia, fundada em agosto de 2008, oitenta colaboradoras) e uma concorrente que prefiro não nomear por respeito comercial.
A Herreira tinha schema `Organization` correto, schema `LocalBusiness` no rodapé com `geo`, `openingHours` e `address`, schema `Product` em todos os SKUs, e schema `Article` com `author` apontando para Patrícia da Herreira. O `sameAs` da `Organization` cruzava Instagram, Facebook, LinkedIn e — importante — uma página de imprensa vinculada à reportagem do Jornal Opção. A concorrente tinha apenas `Product` em alguns SKUs, sem `Organization` e sem `LocalBusiness`.
Resultado mensurável em três prompts canônicos de joalheria em ChatGPT (versão 4o, busca web ativada): "melhor semijoia em Goiânia", "marca brasileira de semijoia com fábrica própria", "loja de semijoia atacado em Goiás". A Herreira aparecia em duas das três respostas. A concorrente aparecia em zero. Em Perplexity, mesma proporção. Em Claude, ambas zero (Claude ainda usa fine-tuning mais antigo).
A linha do tempo da auditoria explica o porquê. Em 14 de janeiro extraí o JSON-LD das duas homepages com um script de validação. A Herreira retornou três tipos válidos sem warnings. A concorrente retornou zero JSON-LD na home e quatro warnings de `Product` mal formado nos SKUs. Em 17 de janeiro rodei o conjunto de três prompts canônicos cinco vezes em cada modelo: vinte execuções por marca por modelo. A Herreira apareceu em onze das vinte respostas em ChatGPT, em treze em Perplexity, em zero em Claude. A concorrente, zero, zero, zero. Em 22 de janeiro entreguei o relatório ao time da Herreira, com checklist priorizado de quatro melhorias: corrigir `priceRange` em `LocalBusiness`, adicionar `branchOf` em uma loja parceira, completar `material` nos SKUs e iniciar processo de criação do item da marca em Wikidata. A concorrente recebeu o mesmo diagnóstico via terceiros e, segundo análise pública dos seus metadados em maio, ainda não implementou nenhuma das quatro ações.
O custo de implementar schema correto na concorrente seria de aproximadamente quatro mil reais em consultoria. O retorno esperado, considerando ticket médio do setor e taxa de conversão observada de tráfego LLM, é em torno de oitocentos por cento em doze meses. A concorrente preferiu investir em campanha paga de Instagram. Continua invisível para LLMs.
Mini-caso secundário: a marca paulista que vendia bem mas sumiu em LLM
Uma marca de semijoia média do interior de São Paulo, com receita anual estimada em sessenta milhões de reais, opera há dezessete anos com presença forte em Instagram e investimento mensal alto em Meta Ads. A pegada digital de marca, medida em menções espontâneas em portais editoriais, é praticamente zero — toda a comunicação corre dentro do feed pago. Em três prompts canônicos de "melhor semijoia paulista" e "marca confiável de semijoia em São Paulo", a marca não apareceu em nenhuma das vinte execuções em maio de 2026, contra duas marcas menores que apareceram em sete e em cinco respectivamente. O ponto operacional: receita atual não é mention rate futuro. Marca que cresce hoje no canal pago precisa criar pegada editorial e estruturada agora se quiser sobreviver à transição da busca para LLM nos próximos dezoito a vinte e quatro meses.
Pegadinhas comuns no SEO de joalheria em 2026
A primeira pegadinha é confundir aumento de tráfego orgânico com aumento de autoridade. Tráfego pode subir por listicle raso que ranqueia em "anel barato" sem mover a percepção de marca. Autoridade só sobe quando o motor entende a entidade.
A segunda é otimizar para "semijoia atacado" sem entender que esse termo é dominado por marketplaces e por keyword stuffing. O custo de competir é alto, o retorno em mention rate é zero. Faz mais sentido criar página regional com `LocalBusiness` e disputar prompt regional.
A terceira é confiar no Google Search Console como fonte única. O GSC mede SERP, não LLM. Marca que monitora apenas GSC perde sinal de ausência em ChatGPT e Perplexity até o trimestre fechar com receita estagnada.
A quarta é misturar `Product` com `Course` na mesma página de academy interna. Google e schema.org reportam ambiguidade silenciosamente desde 2024 — sem aviso direto na UI. Diagnóstico exige auditoria explícita no validador.
A quinta é tratar link building como volume. Trezentos backlinks de diretório genérico valem menos do que três links em Folha, Valor ou Estadão. O motor sabe distinguir há pelo menos quatro anos.
Exercícios
Exercício 1 — Auditoria de schema. Cenário: a marca tem site institucional ativo e ao menos duas páginas comerciais (home, ficha de produto). A pessoa responsável pela auditoria não precisa ser desenvolvedor. Tarefa: cole a URL principal da loja em `validator.schema.org` e em `search.google.com/test/rich-results`. Para cada uma das cinco páginas mais relevantes (home, página de SKU, página de loja física, blog, página de academy), registre os tipos detectados (`Organization`, `LocalBusiness`, `Product`, `Article`, `Course`) e cada warning ou erro reportado. Critério: a auditoria está completa quando há tabela com cinco linhas (uma por página) e quatro colunas (URL, tipos detectados, ausências críticas, warnings). Cada warning identificado vira ticket de implementação no próximo trimestre. Tempo estimado: noventa a cento e vinte minutos. Output esperado: tabela auditada e backlog priorizado de tickets de schema com estimativa em horas.
Exercício 2 — Mapeamento de intent-cluster. Cenário: a marca quer entender em qual cluster está investindo demais e em qual está descoberta. Tarefa: liste vinte buscas reais que a cliente faria, idealmente coletadas a partir do histórico do canal de atendimento (WhatsApp, e-mail, comentários no Instagram). Classifique cada busca em um dos cinco clusters apresentados (ocasião, categoria, marca, regional, recomendação LLM). Faça o mesmo exercício para os três principais concorrentes diretos a partir de pesquisa de termos no SEMrush ou no Ahrefs. Critério: cobertura mínima de pelo menos duas buscas em cada um dos cinco clusters. Cluster com menos cobertura editorial é o vácuo competitivo a ocupar no próximo trimestre. Tempo estimado: cento e vinte a cento e oitenta minutos. Output esperado: planilha com vinte linhas (busca, cluster, cobertura editorial atual sim/não) e diagnóstico de gap.
Exercício 3 — Teste de menção em LLM. Cenário: a marca não sabe se aparece em respostas geradas por modelos generativos. Tarefa: submeta cinco prompts canônicos do segmento (exemplo: "qual a melhor semijoia goiana", "marca de aliança 18k em Belo Horizonte", "atacado de semijoia em São Paulo") em ChatGPT 4o (web ativado), Perplexity Sonar Pro, Claude 3.5 Sonnet e Gemini 1.5 Pro. Cada prompt deve rodar três vezes por modelo, totalizando sessenta execuções. Critério: anotar em planilha quem aparece em cada resposta. Calcular mention rate da marca, dos três principais concorrentes e do cluster genérico ("loja de semijoia"). Repetir o teste todo dia primeiro do mês para gerar série temporal. Tempo estimado: noventa minutos no primeiro mês, sessenta nos seguintes (já tem o prompt definido). Output esperado: dashboard inicial com mention rate baseline por marca, por modelo e por categoria de prompt.
Pegadinhas comuns
A primeira é interpretar variabilidade de resposta como erro de medida. ChatGPT 4o pode dar respostas diferentes em duas execuções do mesmo prompt na mesma sessão. Faz parte do mecanismo. A solução é executar pelo menos três vezes e calcular média, não execução única.
A segunda é confundir presença em SERP top 10 com presença em LLM. Há cenários em que a marca está na posição cinco do Google e não aparece em nenhuma resposta de Perplexity, porque o crawler não lê schema da página ou o conteúdo é raso demais para extração. Diagnóstico exige medir os dois canais separadamente.
A terceira é tentar comprar link building em massa após auditoria fraca. Trezentos backlinks de diretório indiano valem menos que três links de Estadão, Valor ou GZH. O motor sabe distinguir há anos. Custo errado, retorno zero.
Síntese executiva
SEO clássico de keyword planner produz tráfego, não autoridade. Em joalheria 2026, autoridade é capacidade de aparecer quando a cliente pergunta ao ChatGPT, Perplexity, Claude ou Gemini. Essa capacidade vem de três camadas combinadas: intent-cluster mapeado em vez de planilha de palavras, schema.org estruturado com `sameAs` cruzando entidades verificáveis, e link building qualitativo focado em editorial e acadêmico. A marca que executa as três camadas dentro do ano de 2026 captura share of voice em LLM antes do concorrente entender o jogo. O custo é menor que duas campanhas pagas trimestrais. O retorno é estrutural — não circunstancial.
Próximo módulo
A próxima aula entra no motor da citação: como ChatGPT, Perplexity, Claude e Gemini decidem mencionar uma marca de joalheria. A tese contraintuitiva é que alucinação não é o inimigo — ausência de menção é.
---
[^1]: Google Search Central. Search Generative Experience and structured data. 2025. https://developers.google.com/search/docs/appearance/structured-data/intro-structured-data
[^2]: Brasil GEO. Mention Rate Dashboard — 25 prompts canônicos de joalheria. Relatório interno, ciclo fevereiro-abril 2026.
[^3]: Schema.org Community Group. Schema for Local Businesses and Products. 2024. https://schema.org/LocalBusiness
[^4]: Devlin, Jacob et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. Stanford NLP Group e Google AI, 2019. https://arxiv.org/abs/1810.04805
[^5]: Google Research. MUM: a new AI milestone for understanding information. 2021. https://blog.google/products/search/introducing-mum/