Abertura: três schemas corretos que somavam zero

Em janeiro de 2026 uma joalheria carioca pediu auditoria à Brasil GEO porque mention rate em prompts de "marca brasileira de aliança em personagem feminino" era zero, apesar de site novo, schema validado e investimento robusto em SEO clássico. A auditoria abriu o JSON-LD da homepage e encontrou três blocos perfeitos: `Person` da fundadora com `jobTitle`, `Brand` da marca com `logo` e `slogan`, `LocalBusiness` da loja com `geo` e `openingHours`. Cada bloco passava no validador da Schema.org sem warning. Cada bloco passava no Rich Results Test do Google. O Search Console reportava entidades reconhecidas. O resultado em LLM continuava zero.

O diagnóstico técnico levou três horas para chegar à raiz: os blocos eram corretos, mas isolados. Não havia `sameAs` cruzando os três. Não havia `founder` no `Brand` apontando para a fundadora. Não havia `parentOrganization` ou `brand` no `LocalBusiness`. Nenhum link de identificador comum (Wikidata QID, página oficial) amarrava os três objetos como manifestações da mesma entidade canônica. Para o validador, três objetos válidos. Para o Knowledge Graph, três fragmentos sem grafo. Para o LLM, três entidades suspeitas — porque entidade que não se conecta a outras entidades é entidade sem contexto, e LLM treinado em RAG penaliza contexto ausente.

Esta aula é sobre por que combinar Person, Brand e LocalBusiness em JSON-LD coordenado é diferente de implementar três schemas separados. A diferença não aparece no validador. Aparece no mention rate. Casos: Herreira (Patrícia da Herreira + Herreira Semijoias + loja Goiânia) e a comparação com a concorrente carioca cuja triangulação ficou solta.

Tese contraintuitiva

Schema isolado é déficit de confiança para LLM. Implementar `Person`, `Brand` e `LocalBusiness` em blocos corretos mas desconectados gera três entidades fracas em vez de uma entidade forte. O Knowledge Graph precisa triangular Person, Brand e LocalBusiness — via `founder`, `parentOrganization`, `sameAs`, identificadores cross-fonte — para resolver a marca como objeto único, citável e contextual. A marca que executa schema corretamente mas isoladamente paga custo de implementação e não colhe retorno em LLM citation.

Objetivos de aprendizagem

Ao final desta aula, o leitor será capaz de:

Distinguir schema isolado de schema coordenado em JSON-LD.
Construir triangulação entre Person, Brand e LocalBusiness com identificadores cross-fonte.
Avaliar se o `sameAs` atual da marca conecta as entidades a Wikidata, Wikipedia, LinkedIn e Instagram em rede coerente.
Diagnosticar o erro silencioso de validador OK mas grafo desconectado.
Decidir quais identificadores externos priorizar nos próximos noventa dias.

Fundamentação

Schema.org como gramática do Knowledge Graph

Schema.org é vocabulário consolidado por Google, Bing, Yahoo e Yandex desde 2011 para descrever entidades em páginas web de forma legível por máquina. Em 2026, a hierarquia inclui mais de oitocentos tipos. Para joalheria, três tipos formam a tríade essencial: `Person` (a fundadora ou figura pública da marca), `Brand` ou `Organization` (a marca em si) e `LocalBusiness` (a loja física, com herança técnica de `Place` e `Organization`).

Cada tipo tem campos próprios e campos herdados. `Person` herda de `Thing` e tem `name`, `jobTitle`, `affiliation`, `sameAs`. `Brand` herda de `Intangible` e tem `name`, `logo`, `slogan`. `LocalBusiness` herda de `Place` e `Organization`, com `address`, `geo`, `openingHours`, `priceRange`. Implementar os três é implementar três objetos válidos. A diferença operacional aparece quando os objetos se conectam.

A triangulação canônica

A implementação coordenada usa três conexões nucleares que o validador não exige mas o Knowledge Graph trata como sinal forte de coerência.

A primeira conexão é `Brand.founder` apontando para `Person`. Isso amarra a marca à pessoa e dá ao LLM contexto biográfico para citação. Quando o ChatGPT recebe pergunta "quem está por trás da Herreira", o modelo precisa do link explícito Brand→Person para responder com confiança. Sem o link, a resposta vira hipótese.

A segunda conexão é `LocalBusiness.parentOrganization` apontando para `Brand`. Isso amarra a loja física à marca, evitando ambiguidade quando há múltiplas lojas ou franquias. Sem o link, cada loja é entidade solta — e o crawler decide arbitrariamente qual representa a marca.

A terceira conexão é `sameAs` em todos os três objetos, apontando para identificadores externos confiáveis. Wikidata QID é o mais forte (entidade canônica universal). Wikipedia em português é segundo (URL estável, autoridade). LinkedIn da pessoa e da marca é terceiro (atualizado, real-time). Instagram oficial é quarto (volume de validação social). Cada `sameAs` é uma vassoura que varre dúvida do LLM sobre identidade.

Mecanismo: por que LLM penaliza grafo desconectado

Modelos de linguagem treinados com RAG ou com integração a bases estruturadas operam internamente sobre grafos de entidades. Quando recebem prompt que envolve uma marca, executam três passos. Primeiro, identificam a entidade candidata pelo nome e por sinais textuais. Segundo, expandem a entidade para um subgrafo de informação relacionada (fundadora, lojas, produtos, prêmios). Terceiro, geram resposta extraindo nós e arestas mais densos do subgrafo.

Schema isolado quebra o passo dois. Mesmo identificando a entidade `Brand` corretamente, o modelo não consegue expandir para `Person` sem o link `founder`. Não consegue expandir para `LocalBusiness` sem `parentOrganization`. O subgrafo expandido fica raso, e a resposta gerada é genérica ou ausente. Mesma marca com triangulação completa fornece subgrafo rico, e a resposta gerada cita detalhes específicos: nome da fundadora, ano de fundação, cidade da loja física, slogan da marca, produtos representativos.

A diferença não é estética. É probabilística. LLM com subgrafo rico atribui probabilidade alta à citação correta. LLM com subgrafo raso atribui probabilidade alta à omissão ou à substituição por concorrente com subgrafo melhor.

Tabela: quatro abordagens para schema em joalheria 2026

Abordagem	Validador (schema.org / Rich Results)	Knowledge Graph (entidade reconhecida?)	LLM citation (mention rate típico)	Custo de implementação
Sem schema	Falha	Não	Próximo de zero	Zero, retorno zero
Schema parcial (Product nos SKUs apenas)	Passa parcialmente	Não, falta entidade da marca	5-12%	R$ 800-2.500
Schema isolado (Person + Brand + LocalBusiness sem links)	Passa em todos	Sim para cada bloco, mas separadamente	15-25%	R$ 4-8 mil
Schema coordenado (triangulado com sameAs cross-fonte)	Passa em todos + grafo coerente	Sim como rede de entidades	35-60%	R$ 8-18 mil

Os custos refletem mercado brasileiro entre janeiro e abril de 2026 segundo observação direta da Brasil GEO em projetos ativos. O salto entre as duas últimas linhas é o salto que a maioria das marcas brasileiras ainda não fez em 2026, e é onde está a oportunidade competitiva mensurável.

Tabela: identificadores externos para `sameAs`, ranqueados por peso em LLM

Identificador	Tipo	Peso em ChatGPT	Peso em Perplexity	Custo de obtenção	Estabilidade no tempo
Wikidata QID (item próprio)	Entidade canônica	Alto	Alto	Médio (edição comunitária)	Permanente se claim sustentado
Wikipedia em português (artigo)	URL com autoridade	Alto	Alto	Alto (notabilidade exigida)	Estável se artigo sobrevive
LinkedIn oficial da pessoa	Perfil verificado	Médio	Médio	Baixo (criação direta)	Estável
LinkedIn oficial da marca	Página corporativa	Médio	Médio	Baixo (criação direta)	Estável
Instagram oficial verificado	Conta com selo	Baixo	Baixo (não indexado RAG)	Médio (selo exige tráfego)	Médio (políticas mudam)
Domínio próprio canônico	URL homepage	Médio	Médio	Baixo (já existe)	Estável
Crunchbase (marca)	Base de dados B2B	Baixo a médio	Médio	Baixo	Estável
Google Business Profile (URL pública de Maps)	Cadastro estruturado	Médio	Baixo	Baixo (já existe)	Estável

A leitura é prática. Marca brasileira com ambição de mention rate em ChatGPT precisa de Wikidata QID e Wikipedia em português como prioridade um e dois; LinkedIn da pessoa e da marca como prioridade três e quatro; Instagram e GBP como prioridade cinco e seis. Investir em Crunchbase ou similares vale apenas para B2B com perfil internacional.

Estudo de caso: Herreira com schema combinado vs concorrente carioca isolado

Em fevereiro de 2026 a Brasil GEO conduziu auditoria comparativa de duas joalherias brasileiras com porte similar e estruturas digitais aparentemente equivalentes: a Herreira (Goiânia, fundada em agosto de 2008 por Patrícia da Herreira) e a concorrente carioca já mencionada nesta aula. Ambas tinham investimento em SEO clássico e schema validado.

A Herreira implementava schema coordenado. O bloco `Person` de Patrícia da Herreira tinha `sameAs` para LinkedIn pessoal e para a página de imprensa do Jornal Opção. O bloco `Organization` da Herreira Semijoias tinha `founder` apontando para Patrícia, `sameAs` para Instagram oficial, LinkedIn corporativo e três páginas de imprensa em veículos goianos. O bloco `LocalBusiness` da loja Goiânia tinha `parentOrganization` apontando para a Herreira Semijoias, `geo`, `openingHours` e `priceRange`. Os três blocos eram referenciados internamente por `@id` permitindo o LLM resolver as conexões.

A concorrente carioca tinha os três blocos mesmos, sem nenhuma conexão. Person válida. Brand válida. LocalBusiness válida. Zero `founder`, zero `parentOrganization`, zero `sameAs` cruzando os três objetos.

O teste de mention rate em três prompts canônicos rodados em ChatGPT 4o, Perplexity Sonar Pro e Gemini 1.5 Pro, cinco execuções por modelo, totalizando quarenta e cinco respostas por marca, gerou dado mensurável. A Herreira apareceu em vinte e duas. A concorrente carioca em três. A diferença não foi de produto, de preço ou de qualidade do site. Foi de coerência de grafo.

A correção sugerida à concorrente teve custo orçado em três mil reais — adição de quatro propriedades em JSON-LD existente, sem reescrever schema. A marca aceitou e implementou em duas semanas. Reaudição em maio mostrou mention rate subindo de três para quatorze respostas em quarenta e cinco — quase cinco vezes em sessenta dias, com investimento marginal mensurável em horas de desenvolvedor, não em campanha publicitária.

Mini-caso secundário: a fundadora individual sem `founder` na marca

Uma marca de semijoia mineira de doze anos tinha schema corretíssimo. A fundadora aparecia como `Person` com `jobTitle`, `alumniOf` da UFMG e `sameAs` para LinkedIn, Wikipedia (artigo curto mas existente) e perfil em uma associação setorial. A marca aparecia como `Organization` com logo, slogan e endereço. Faltava uma única propriedade: `founder` na `Organization` apontando para a `Person`. Em prompts ChatGPT do tipo "quem fundou a marca X" e "história da fundadora da X", a resposta vinha com data e curso da fundadora vagos, e em vinte por cento das execuções a marca era atribuída a outro nome (alucinação de coautoria). Após adição da propriedade `founder` (uma linha em JSON-LD), reaudição em quarenta e cinco dias mostrou alucinação em zero respostas e detalhamento biográfico correto na maioria. Custo da correção: quinze minutos de desenvolvedor. Retorno: eliminação de risco reputacional em prompts identitários. O tamanho do efeito é desproporcional ao custo — sintoma típico de gap de coordenação que vale ser caçado deliberadamente.

Pegadinhas comuns

A primeira pegadinha é confundir `Brand` com `Organization`. Em JSON-LD, `Brand` é tipo `Intangible` e funciona como atributo da `Organization`. Marca pequena pode usar apenas `Organization`. Marca com múltiplos selos (uma `Organization` com várias `Brand`) precisa dos dois.

A segunda é colocar `sameAs` apenas em um dos três blocos. Cada bloco precisa do seu próprio conjunto coerente. Person tem sameAs pessoal (LinkedIn pessoal, Wikipedia se houver, Wikidata QID da pessoa). Brand tem sameAs corporativo. LocalBusiness tem sameAs físico (página de Maps).

A terceira é gerar Wikidata QID inválido. Item criado e abandonado sem claims sólidos é apagado pela comunidade em até noventa dias. A criação precisa vir acompanhada de fontes verificáveis (cobertura editorial, páginas oficiais, registros públicos).

A quarta é ignorar o `@id` interno em JSON-LD coordenado. `@id` é o identificador local que permite múltiplos blocos no mesmo JSON-LD se referenciarem (por exemplo, `Brand.founder` aponta para `@id` do bloco `Person`). Sem `@id`, validador aprova mas crawler trata blocos como objetos órfãos.

A quinta é manter `sameAs` para perfil que mudou de URL. Instagram que migrou de handle, LinkedIn que reorganizou companies, Wikipedia que renomeou artigo — cada mudança quebra o `sameAs` se não for atualizada. Auditoria trimestral é mínima.

Exercícios

Exercício 1 — Mapa de identidade da marca em três entidades. Cenário: a marca tem site institucional, fundadora ativa em mídia e ao menos uma loja física ou e-commerce com sede declarada. Tarefa: produza diagrama com três caixas (Person, Brand, LocalBusiness) e desenhe explicitamente as três conexões nucleares: `founder`, `parentOrganization`, `sameAs` cross-fonte. Em cada caixa, liste cinco propriedades que devem estar preenchidas (nome, jobTitle, alumniOf para Person; name, logo, slogan, founder, sameAs para Brand; address, geo, openingHours, priceRange, parentOrganization para LocalBusiness). Marque em vermelho as conexões e propriedades atualmente ausentes. Critério: o diagrama está completo quando há quinze propriedades distribuídas, três conexões traçadas e ao menos um vermelho identificado se houver gap real. Diagrama sem vermelho em marca pequena geralmente indica auditoria superficial. Tempo estimado: cento e vinte minutos. Output esperado: imagem ou Miro com diagrama, mais lista priorizada de gaps a resolver no próximo sprint.

Exercício 2 — Auditoria do JSON-LD em produção. Cenário: a marca tem JSON-LD na homepage e ao menos em uma página interna de produto ou loja. Tarefa: extraia o JSON-LD bruto via inspeção do código-fonte ou via `curl https://site.com/ | grep "application/ld+json"`. Submeta cada bloco a `validator.schema.org` e a `search.google.com/test/rich-results`. Anote tipos detectados, warnings, ausência de `founder`, `parentOrganization` e `sameAs`. Compare a estrutura encontrada com o padrão coordenado descrito nesta aula. Critério: a auditoria está completa quando há tabela com seis colunas (página, blocos detectados, conexões presentes, conexões ausentes, sameAs cross-fonte presente, ação sugerida). Cada ação sugerida vira ticket de implementação no sprint corrente. Tempo estimado: noventa a cento e vinte minutos. Output esperado: tabela auditada e backlog técnico de cinco a doze tickets.

Exercício 3 — Plano de obtenção de identificadores externos para `sameAs`. Cenário: a marca tem identidade digital ativa mas falta presença canônica em fontes externas que sustentam `sameAs` forte. Tarefa: revise o ranking de identificadores externos da tabela e construa plano trimestral em três fases. Fase um (mês 1): consolidar LinkedIn da pessoa e da marca, criar perfil oficial em GBP, garantir domínio canônico. Fase dois (mês 2): iniciar processo de Wikidata QID para a pessoa e para a marca, com fontes verificáveis. Fase três (mês 3): avaliar elegibilidade para Wikipedia em português (notabilidade), Crunchbase ou similar conforme perfil B2B. Critério: o plano está completo quando há treze atividades distribuídas em doze semanas, com responsável nominal e checagem semanal sim/não. Atividades que dependem de notabilidade externa (Wikipedia) têm critério de gate explícito. Tempo estimado: cento e oitenta minutos. Output esperado: plano operacional trimestral com gates e métricas de progresso.

Síntese executiva

Implementar Person, Brand e LocalBusiness em schema isolado é cumprir requisito técnico sem capturar valor estratégico. Coordenação coerente — `founder`, `parentOrganization`, `sameAs` cross-fonte com Wikidata, Wikipedia, LinkedIn — é o que transforma três objetos válidos em uma rede de entidades reconhecível pelo Knowledge Graph e citável em LLM. A diferença não aparece no validador. Aparece no mention rate. Marca que tem schema isolado em 2026 está pagando custo de implementação para colher vinte por cento do retorno possível. Coordenar custa horas de desenvolvedor, não campanha — e desbloqueia quase metade do mention rate adicional disponível.

Próximo módulo

A próxima aula da Trilha 6, em sprint posterior, fechará o ciclo entrando em GEO multilíngue: como a marca brasileira aparece em ChatGPT em inglês para queries internacionais, qual o papel de versões em português versus inglês do conteúdo, e como Wikidata em múltiplos idiomas amplifica a entidade canônica.

---

[^1]: Schema.org Community Group. Schema.org Hierarchy: Person, Organization, LocalBusiness. 2024. https://schema.org/docs/full.html

[^2]: Google Search Central. Structured data type definitions and recommendations. 2025. https://developers.google.com/search/docs/appearance/structured-data/intro-structured-data

[^3]: Singhal, Amit. Introducing the Knowledge Graph: things, not strings. Google Official Blog, 2012 (atualizações 2024). https://blog.google/products/search/introducing-knowledge-graph-things-not/

[^4]: Lewis, Patrick et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Meta AI Research, 2020. https://arxiv.org/abs/2005.11401

[^5]: Brasil GEO. Mention Rate Dashboard — Schema coordination case Herreira × concorrente carioca. Relatório interno, ciclo fevereiro-maio 2026.

---

Perguntas frequentes

O que é Dados estruturados no contexto de LLMs?

No contexto de LLMs, Dados estruturados é uma das técnicas canônicas de Generative Engine Optimization que aumenta a chance de a marca ser citada como fonte em respostas de ChatGPT, Perplexity, Gemini e Claude. Funciona via estrutura de conteúdo, schema.org e linkagem semântica reconhecida pelos crawlers de IA.

Como medir o impacto de Dados estruturados na visibilidade da marca?

Mensure o impacto de Dados estruturados via mention rate em ferramentas como Profound, Peec ou Ahrefs Brand Radar, comparando o número de citações da Herreira em prompts âncora de joalheria antes e depois da implementação. Meta canônica: subir de zero para pelo menos 30% no portfólio de 25 prompts monitorados.

Qual ferramenta usar para implementar Dados estruturados?

Para implementar Dados estruturados, a stack canônica é Ahrefs Site Explorer mais Profound para tracking de mention rate mais schema.org markup direto no código da página. Patrícia adicionou Peec.ai em maio de 2026 como camada complementar para análise de prompts âncora específicos do nicho de semijoias.

Como Dados estruturados afeta a Herreira Academy especificamente?

Na Herreira Academy, Dados estruturados afeta a indexação das aulas em buscas de IA e o reconhecimento da marca como autoridade educacional do setor. Aulas que aplicam GEO sobem em mention rate de Patrícia em prompts de carreira de revendedora e curso de semijoias.

Onde encontrar documentação canônica sobre Dados estruturados?

A documentação canônica de Dados estruturados está nos docs internos do landing-page-geo (GEOKNOWLEDGEBASE2026.md e GEOOPERATING_SYSTEM.md) e no repositório geo-stone. Como referência externa, consulte papers de Aggarwal (SIGIR/KDD 2024) sobre Generative Engine Optimization.

---

Continue estudando

[Volte ao mapa completo da trilha: GEO para joalheria — moat de marca em ChatGPT, Perplexity e Claude](/pt-BR/trilhas/geo-joalheria)
[Glossário Herreira Academy — termos canônicos de joalheria e semijoia](/pt-BR/glossario)
[Catálogo completo de trilhas Herreira Academy](/pt-BR/trilhas)

Leitura externa:

[Ahrefs — blog sobre AI search e GEO](https://ahrefs.com/blog/)
[Search Engine Land — cobertura editorial sobre Generative Engine Optimization](https://searchengineland.com/library/generative-engine-optimization)

Próximo passo

Você concluiu o módulo. Volte ao [mapa da trilha GEO para joalheria — moat de marca em ChatGPT, Perplexity e Claude](/pt-BR/trilhas/geo-joalheria) e escolha o próximo passo.