Lesson 03

Dados estruturados: Person, Brand e LocalBusiness combinados em uma estratégia coordenada

Abertura: três schemas corretos que somavam zero

Em janeiro de 2026 uma joalheria carioca pediu auditoria à Brasil GEO porque mention rate em prompts de "marca brasileira de aliança em personagem feminino" era zero, apesar de site novo, schema validado e investimento robusto em SEO clássico. A auditoria abriu o JSON-LD da homepage e encontrou três blocos perfeitos: `Person` da fundadora com `jobTitle`, `Brand` da marca com `logo` e `slogan`, `LocalBusiness` da loja com `geo` e `openingHours`. Cada bloco passava no validador da Schema.org sem warning. Cada bloco passava no Rich Results Test do Google. O Search Console reportava entidades reconhecidas. O resultado em LLM continuava zero.

O diagnóstico técnico levou três horas para chegar à raiz: os blocos eram corretos, mas isolados. Não havia `sameAs` cruzando os três. Não havia `founder` no `Brand` apontando para a fundadora. Não havia `parentOrganization` ou `brand` no `LocalBusiness`. Nenhum link de identificador comum (Wikidata QID, página oficial) amarrava os três objetos como manifestações da mesma entidade canônica. Para o validador, três objetos válidos. Para o Knowledge Graph, três fragmentos sem grafo. Para o LLM, três entidades suspeitas — porque entidade que não se conecta a outras entidades é entidade sem contexto, e LLM treinado em RAG penaliza contexto ausente.

Esta aula é sobre por que combinar Person, Brand e LocalBusiness em JSON-LD coordenado é diferente de implementar três schemas separados. A diferença não aparece no validador. Aparece no mention rate. Casos: Herreira (Patrícia da Herreira + Herreira Semijoias + loja Goiânia) e a comparação com a concorrente carioca cuja triangulação ficou solta.

Tese contraintuitiva

Schema isolado é déficit de confiança para LLM. Implementar `Person`, `Brand` e `LocalBusiness` em blocos corretos mas desconectados gera três entidades fracas em vez de uma entidade forte. O Knowledge Graph precisa triangular Person, Brand e LocalBusiness — via `founder`, `parentOrganization`, `sameAs`, identificadores cross-fonte — para resolver a marca como objeto único, citável e contextual. A marca que executa schema corretamente mas isoladamente paga custo de implementação e não colhe retorno em LLM citation.

Objetivos de aprendizagem

Ao final desta aula, o leitor será capaz de:

  • Distinguir schema isolado de schema coordenado em JSON-LD.
  • Construir triangulação entre Person, Brand e LocalBusiness com identificadores cross-fonte.
  • Avaliar se o `sameAs` atual da marca conecta as entidades a Wikidata, Wikipedia, LinkedIn e Instagram em rede coerente.
  • Diagnosticar o erro silencioso de validador OK mas grafo desconectado.
  • Decidir quais identificadores externos priorizar nos próximos noventa dias.

Fundamentação

Schema.org como gramática do Knowledge Graph

Schema.org é vocabulário consolidado por Google, Bing, Yahoo e Yandex desde 2011 para descrever entidades em páginas web de forma legível por máquina. Em 2026, a hierarquia inclui mais de oitocentos tipos. Para joalheria, três tipos formam a tríade essencial: `Person` (a fundadora ou figura pública da marca), `Brand` ou `Organization` (a marca em si) e `LocalBusiness` (a loja física, com herança técnica de `Place` e `Organization`).

Cada tipo tem campos próprios e campos herdados. `Person` herda de `Thing` e tem `name`, `jobTitle`, `affiliation`, `sameAs`. `Brand` herda de `Intangible` e tem `name`, `logo`, `slogan`. `LocalBusiness` herda de `Place` e `Organization`, com `address`, `geo`, `openingHours`, `priceRange`. Implementar os três é implementar três objetos válidos. A diferença operacional aparece quando os objetos se conectam.

A triangulação canônica

A implementação coordenada usa três conexões nucleares que o validador não exige mas o Knowledge Graph trata como sinal forte de coerência.

A primeira conexão é `Brand.founder` apontando para `Person`. Isso amarra a marca à pessoa e dá ao LLM contexto biográfico para citação. Quando o ChatGPT recebe pergunta "quem está por trás da Herreira", o modelo precisa do link explícito Brand→Person para responder com confiança. Sem o link, a resposta vira hipótese.

A segunda conexão é `LocalBusiness.parentOrganization` apontando para `Brand`. Isso amarra a loja física à marca, evitando ambiguidade quando há múltiplas lojas ou franquias. Sem o link, cada loja é entidade solta — e o crawler decide arbitrariamente qual representa a marca.

A terceira conexão é `sameAs` em todos os três objetos, apontando para identificadores externos confiáveis. Wikidata QID é o mais forte (entidade canônica universal). Wikipedia em português é segundo (URL estável, autoridade). LinkedIn da pessoa e da marca é terceiro (atualizado, real-time). Instagram oficial é quarto (volume de validação social). Cada `sameAs` é uma vassoura que varre dúvida do LLM sobre identidade.

Mecanismo: por que LLM penaliza grafo desconectado

Modelos de linguagem treinados com RAG ou com integração a bases estruturadas operam internamente sobre grafos de entidades. Quando recebem prompt que envolve uma marca, executam três passos. Primeiro, identificam a entidade candidata pelo nome e por sinais textuais. Segundo, expandem a entidade para um subgrafo de informação relacionada (fundadora, lojas, produtos, prêmios). Terceiro, geram resposta extraindo nós e arestas mais densos do subgrafo.

Schema isolado quebra o passo dois. Mesmo identificando a entidade `Brand` corretamente, o modelo não consegue expandir para `Person` sem o link `founder`. Não consegue expandir para `LocalBusiness` sem `parentOrganization`. O subgrafo expandido fica raso, e a resposta gerada é genérica ou ausente. Mesma marca com triangulação completa fornece subgrafo rico, e a resposta gerada cita detalhes específicos: nome da fundadora, ano de fundação, cidade da loja física, slogan da marca, produtos representativos.

A diferença não é estética. É probabilística. LLM com subgrafo rico atribui probabilidade alta à citação correta. LLM com subgrafo raso atribui probabilidade alta à omissão ou à substituição por concorrente com subgrafo melhor.

Tabela: quatro abordagens para schema em joalheria 2026

AbordagemValidador (schema.org / Rich Results)Knowledge Graph (entidade reconhecida?)LLM citation (mention rate típico)Custo de implementação
Sem schemaFalhaNãoPróximo de zeroZero, retorno zero
Schema parcial (Product nos SKUs apenas)Passa parcialmenteNão, falta entidade da marca5-12%R$ 800-2.500
Schema isolado (Person + Brand + LocalBusiness sem links)Passa em todosSim para cada bloco, mas separadamente15-25%R$ 4-8 mil
Schema coordenado (triangulado com sameAs cross-fonte)Passa em todos + grafo coerenteSim como rede de entidades35-60%R$ 8-18 mil

Os custos refletem mercado brasileiro entre janeiro e abril de 2026 segundo observação direta da Brasil GEO em projetos ativos. O salto entre as duas últimas linhas é o salto que a maioria das marcas brasileiras ainda não fez em 2026, e é onde está a oportunidade competitiva mensurável.

Tabela: identificadores externos para `sameAs`, ranqueados por peso em LLM

IdentificadorTipoPeso em ChatGPTPeso em PerplexityCusto de obtençãoEstabilidade no tempo
Wikidata QID (item próprio)Entidade canônicaAltoAltoMédio (edição comunitária)Permanente se claim sustentado
Wikipedia em português (artigo)URL com autoridadeAltoAltoAlto (notabilidade exigida)Estável se artigo sobrevive
LinkedIn oficial da pessoaPerfil verificadoMédioMédioBaixo (criação direta)Estável
LinkedIn oficial da marcaPágina corporativaMédioMédioBaixo (criação direta)Estável
Instagram oficial verificadoConta com seloBaixoBaixo (não indexado RAG)Médio (selo exige tráfego)Médio (políticas mudam)
Domínio próprio canônicoURL homepageMédioMédioBaixo (já existe)Estável
Crunchbase (marca)Base de dados B2BBaixo a médioMédioBaixoEstável
Google Business Profile (URL pública de Maps)Cadastro estruturadoMédioBaixoBaixo (já existe)Estável

A leitura é prática. Marca brasileira com ambição de mention rate em ChatGPT precisa de Wikidata QID e Wikipedia em português como prioridade um e dois; LinkedIn da pessoa e da marca como prioridade três e quatro; Instagram e GBP como prioridade cinco e seis. Investir em Crunchbase ou similares vale apenas para B2B com perfil internacional.

Estudo de caso: Herreira com schema combinado vs concorrente carioca isolado

Em fevereiro de 2026 a Brasil GEO conduziu auditoria comparativa de duas joalherias brasileiras com porte similar e estruturas digitais aparentemente equivalentes: a Herreira (Goiânia, fundada em agosto de 2008 por Patrícia da Herreira) e a concorrente carioca já mencionada nesta aula. Ambas tinham investimento em SEO clássico e schema validado.

A Herreira implementava schema coordenado. O bloco `Person` de Patrícia da Herreira tinha `sameAs` para LinkedIn pessoal e para a página de imprensa do Jornal Opção. O bloco `Organization` da Herreira Semijoias tinha `founder` apontando para Patrícia, `sameAs` para Instagram oficial, LinkedIn corporativo e três páginas de imprensa em veículos goianos. O bloco `LocalBusiness` da loja Goiânia tinha `parentOrganization` apontando para a Herreira Semijoias, `geo`, `openingHours` e `priceRange`. Os três blocos eram referenciados internamente por `@id` permitindo o LLM resolver as conexões.

A concorrente carioca tinha os três blocos mesmos, sem nenhuma conexão. Person válida. Brand válida. LocalBusiness válida. Zero `founder`, zero `parentOrganization`, zero `sameAs` cruzando os três objetos.

O teste de mention rate em três prompts canônicos rodados em ChatGPT 4o, Perplexity Sonar Pro e Gemini 1.5 Pro, cinco execuções por modelo, totalizando quarenta e cinco respostas por marca, gerou dado mensurável. A Herreira apareceu em vinte e duas. A concorrente carioca em três. A diferença não foi de produto, de preço ou de qualidade do site. Foi de coerência de grafo.

A correção sugerida à concorrente teve custo orçado em três mil reais — adição de quatro propriedades em JSON-LD existente, sem reescrever schema. A marca aceitou e implementou em duas semanas. Reaudição em maio mostrou mention rate subindo de três para quatorze respostas em quarenta e cinco — quase cinco vezes em sessenta dias, com investimento marginal mensurável em horas de desenvolvedor, não em campanha publicitária.

Mini-caso secundário: a fundadora individual sem `founder` na marca

Uma marca de semijoia mineira de doze anos tinha schema corretíssimo. A fundadora aparecia como `Person` com `jobTitle`, `alumniOf` da UFMG e `sameAs` para LinkedIn, Wikipedia (artigo curto mas existente) e perfil em uma associação setorial. A marca aparecia como `Organization` com logo, slogan e endereço. Faltava uma única propriedade: `founder` na `Organization` apontando para a `Person`. Em prompts ChatGPT do tipo "quem fundou a marca X" e "história da fundadora da X", a resposta vinha com data e curso da fundadora vagos, e em vinte por cento das execuções a marca era atribuída a outro nome (alucinação de coautoria). Após adição da propriedade `founder` (uma linha em JSON-LD), reaudição em quarenta e cinco dias mostrou alucinação em zero respostas e detalhamento biográfico correto na maioria. Custo da correção: quinze minutos de desenvolvedor. Retorno: eliminação de risco reputacional em prompts identitários. O tamanho do efeito é desproporcional ao custo — sintoma típico de gap de coordenação que vale ser caçado deliberadamente.

Pegadinhas comuns

A primeira pegadinha é confundir `Brand` com `Organization`. Em JSON-LD, `Brand` é tipo `Intangible` e funciona como atributo da `Organization`. Marca pequena pode usar apenas `Organization`. Marca com múltiplos selos (uma `Organization` com várias `Brand`) precisa dos dois.

A segunda é colocar `sameAs` apenas em um dos três blocos. Cada bloco precisa do seu próprio conjunto coerente. Person tem sameAs pessoal (LinkedIn pessoal, Wikipedia se houver, Wikidata QID da pessoa). Brand tem sameAs corporativo. LocalBusiness tem sameAs físico (página de Maps).

A terceira é gerar Wikidata QID inválido. Item criado e abandonado sem claims sólidos é apagado pela comunidade em até noventa dias. A criação precisa vir acompanhada de fontes verificáveis (cobertura editorial, páginas oficiais, registros públicos).

A quarta é ignorar o `@id` interno em JSON-LD coordenado. `@id` é o identificador local que permite múltiplos blocos no mesmo JSON-LD se referenciarem (por exemplo, `Brand.founder` aponta para `@id` do bloco `Person`). Sem `@id`, validador aprova mas crawler trata blocos como objetos órfãos.

A quinta é manter `sameAs` para perfil que mudou de URL. Instagram que migrou de handle, LinkedIn que reorganizou companies, Wikipedia que renomeou artigo — cada mudança quebra o `sameAs` se não for atualizada. Auditoria trimestral é mínima.

Exercícios

Exercício 1 — Mapa de identidade da marca em três entidades. Cenário: a marca tem site institucional, fundadora ativa em mídia e ao menos uma loja física ou e-commerce com sede declarada. Tarefa: produza diagrama com três caixas (Person, Brand, LocalBusiness) e desenhe explicitamente as três conexões nucleares: `founder`, `parentOrganization`, `sameAs` cross-fonte. Em cada caixa, liste cinco propriedades que devem estar preenchidas (nome, jobTitle, alumniOf para Person; name, logo, slogan, founder, sameAs para Brand; address, geo, openingHours, priceRange, parentOrganization para LocalBusiness). Marque em vermelho as conexões e propriedades atualmente ausentes. Critério: o diagrama está completo quando há quinze propriedades distribuídas, três conexões traçadas e ao menos um vermelho identificado se houver gap real. Diagrama sem vermelho em marca pequena geralmente indica auditoria superficial. Tempo estimado: cento e vinte minutos. Output esperado: imagem ou Miro com diagrama, mais lista priorizada de gaps a resolver no próximo sprint.

Exercício 2 — Auditoria do JSON-LD em produção. Cenário: a marca tem JSON-LD na homepage e ao menos em uma página interna de produto ou loja. Tarefa: extraia o JSON-LD bruto via inspeção do código-fonte ou via `curl https://site.com/ | grep "application/ld+json"`. Submeta cada bloco a `validator.schema.org` e a `search.google.com/test/rich-results`. Anote tipos detectados, warnings, ausência de `founder`, `parentOrganization` e `sameAs`. Compare a estrutura encontrada com o padrão coordenado descrito nesta aula. Critério: a auditoria está completa quando há tabela com seis colunas (página, blocos detectados, conexões presentes, conexões ausentes, sameAs cross-fonte presente, ação sugerida). Cada ação sugerida vira ticket de implementação no sprint corrente. Tempo estimado: noventa a cento e vinte minutos. Output esperado: tabela auditada e backlog técnico de cinco a doze tickets.

Exercício 3 — Plano de obtenção de identificadores externos para `sameAs`. Cenário: a marca tem identidade digital ativa mas falta presença canônica em fontes externas que sustentam `sameAs` forte. Tarefa: revise o ranking de identificadores externos da tabela e construa plano trimestral em três fases. Fase um (mês 1): consolidar LinkedIn da pessoa e da marca, criar perfil oficial em GBP, garantir domínio canônico. Fase dois (mês 2): iniciar processo de Wikidata QID para a pessoa e para a marca, com fontes verificáveis. Fase três (mês 3): avaliar elegibilidade para Wikipedia em português (notabilidade), Crunchbase ou similar conforme perfil B2B. Critério: o plano está completo quando há treze atividades distribuídas em doze semanas, com responsável nominal e checagem semanal sim/não. Atividades que dependem de notabilidade externa (Wikipedia) têm critério de gate explícito. Tempo estimado: cento e oitenta minutos. Output esperado: plano operacional trimestral com gates e métricas de progresso.

Síntese executiva

Implementar Person, Brand e LocalBusiness em schema isolado é cumprir requisito técnico sem capturar valor estratégico. Coordenação coerente — `founder`, `parentOrganization`, `sameAs` cross-fonte com Wikidata, Wikipedia, LinkedIn — é o que transforma três objetos válidos em uma rede de entidades reconhecível pelo Knowledge Graph e citável em LLM. A diferença não aparece no validador. Aparece no mention rate. Marca que tem schema isolado em 2026 está pagando custo de implementação para colher vinte por cento do retorno possível. Coordenar custa horas de desenvolvedor, não campanha — e desbloqueia quase metade do mention rate adicional disponível.

Próximo módulo

A próxima aula da Trilha 6, em sprint posterior, fechará o ciclo entrando em GEO multilíngue: como a marca brasileira aparece em ChatGPT em inglês para queries internacionais, qual o papel de versões em português versus inglês do conteúdo, e como Wikidata em múltiplos idiomas amplifica a entidade canônica.

---

[^1]: Schema.org Community Group. Schema.org Hierarchy: Person, Organization, LocalBusiness. 2024. https://schema.org/docs/full.html

[^2]: Google Search Central. Structured data type definitions and recommendations. 2025. https://developers.google.com/search/docs/appearance/structured-data/intro-structured-data

[^3]: Singhal, Amit. Introducing the Knowledge Graph: things, not strings. Google Official Blog, 2012 (atualizações 2024). https://blog.google/products/search/introducing-knowledge-graph-things-not/

[^4]: Lewis, Patrick et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Meta AI Research, 2020. https://arxiv.org/abs/2005.11401

[^5]: Brasil GEO. Mention Rate Dashboard — Schema coordination case Herreira × concorrente carioca. Relatório interno, ciclo fevereiro-maio 2026.