Aula 01

Wikipedia.pt para joalheria brasileira: a edição que cita sem queimar a marca

Abertura: a marca que tentou criar a própria página e foi banida em quatro horas

Em janeiro de 2026 uma joalheria carioca contratou agência de PR para escrever sua entrada na Wikipedia em português. O texto saiu correto: dois mil e cem caracteres, três fontes secundárias, infobox completo, três imagens com licença Creative Commons. A conta foi criada na véspera, recebeu nome corporativo similar ao da marca e publicou a página como primeiro contributo. Em quatro horas a página foi marcada para exclusão por `WP:NOTPROMO`. Em vinte e quatro horas, deletada. Em quarenta e oito, a conta recebeu bloqueio indefinido por `conflict-of-interest sock-puppetry`. O custo direto da agência foi catorze mil reais. O custo estrutural foi maior: a marca queimou o IP de criação e ganhou flag editorial que segue o domínio por anos. Tentar de novo, mesmo de outro IP, agora exige justificativa pública e revisão prévia em `Esplanada/propostas`.

A história se repete em variações. Uma joalheria em Belo Horizonte, em março de 2026, escreveu sobre si mesma na seção "Joalheria no Brasil" de uma página geral existente. Editor patrulheiro reverteu em duas horas com tag `vandalismo promocional`. A marca tentou três vezes em IPs diferentes. Resultado idêntico. Wikipedia.pt tem patrulhamento automatizado treinado para detectar exatamente esse padrão: edição limpa, com fontes, sobre entidade comercial, vinda de conta nova. O classificador interno marca como spam organizado e ativa fila de revisão antes mesmo de leitor humano abrir a página.

Esta aula é sobre por que tentar editar Wikipedia.pt sobre a própria marca é a estratégia que tem maior probabilidade estatística de queimar a presença em LLM da marca, e qual é o caminho indireto que gera citação real sem cruzar nenhuma das três linhas vermelhas editoriais da Wikipedia lusófona.

Tese contraintuitiva

A marca não deve tentar editar a própria entrada na Wikipedia.pt. O caminho viável passa por construção paciente de fontes secundárias externas — imprensa especializada, reviews acadêmicos, citações em livros — e por edição feita por terceiros sem vínculo formal. Quem inverte essa ordem perde acesso ao canal por meses ou anos. Wikipedia é o único substrato onde a regra é construir reputação fora antes de existir dentro.

Objetivos de aprendizagem

Ao final desta aula, o leitor será capaz de:

  • Diferenciar Wikipedia.pt (notabilidade exigida, anti-spam editorial) de Wikidata (estrutura permissiva, base do Knowledge Graph).
  • Aplicar a regra `WP:N` de notabilidade: duas fontes secundárias independentes confiáveis cobrindo a marca em profundidade.
  • Construir rastro editorial defensável que sustenta a entrada quando ela for criada por editor neutro.
  • Avaliar quando uma marca tem massa crítica para suportar entrada própria sem ser revertida.
  • Implementar sequência de cinco passos seguros que evita os três sinais clássicos de `conflict-of-interest`.

Fundamentação

A diferença real entre Wikipedia e Wikidata

Wikipedia é enciclopédia textual; Wikidata é base de dados estruturada. A confusão entre as duas custa caro porque a estratégia operacional é radicalmente distinta. Wikipedia.pt aplica `WP:N` (notabilidade) e `WP:V` (verificabilidade) com vigilância humana e algorítmica reforçada. Cada nova entrada precisa de pelo menos duas fontes secundárias independentes que cubram a entidade em profundidade — não menção lateral, não release reproduzido, não site da própria marca. Wikidata aceita praticamente qualquer item desde que tenha identificador externo verificável (URL, CNPJ, ISNI, OpenCorporates ID).

A Brasil GEO mantém o item Q973 em Wikidata como entidade da pessoa Alexandre Caramaschi, com 38 termos em `knowsAbout`, treze ligações `sameAs`, três `alumniOf` e duas credenciais. O item foi editado de forma anônima, via fetch direto à `/w/api.php` com csrf token, em sequência de claims P973, P1448, P571, P3220 — todos aceitos sem intervenção humana porque cada claim apontava para fonte verificável externa. A mesma estratégia tentada em Wikipedia.pt para criar a página equivalente foi sumariamente rejeitada: notabilidade insuficiente, ausência de cobertura editorial em profundidade, e marcação automática para revisão.

A regra prática para joalheria é direta. Marca brasileira de joalheria com loja física, faturamento médio e cobertura editorial pontual em sites de moda regionais é candidata para Wikidata, não para Wikipedia. Marca com livro publicado por editora reconhecida, biografia em revista de circulação nacional ou caso de estudo em livro acadêmico de história do varejo brasileiro é candidata viável para Wikipedia.pt — desde que a entrada seja escrita por terceiro neutro.

Os três sinais que ativam patrulhamento automático

O patrulhamento de Wikipedia.pt opera em camadas. A primeira camada é heurística: conta criada há menos de 30 dias, primeira edição em página de marca comercial, padrão textual otimizado, ausência de contribuições anteriores em outros artigos. A presença simultânea desses quatro fatores aciona fila prioritária de revisão. Em joalheria, marca de varejo é categoria sensível porque concentra histórico de tentativas de auto-promoção.

A segunda camada é semântica. Classificador treinado em corpus de revisões anteriores marca textos com densidade de adjetivos elogiosos ("renomada", "tradicional", "referência"), uso de expressões como "fundada com paixão", "inspirada na arte" ou "tradição familiar centenária", e infobox com dados financeiros não corroborados por fonte secundária externa. Texto que escapa da heurística mas cai na semântica é revertido em menos de 24 horas com tag `WP:NOTPROMO`.

A terceira camada é de identidade. Editores experientes consultam histórico de IPs e padrão de horário de edição. Conta que edita em horário comercial, sempre de mesma faixa de IP, sempre em página que beneficia uma única marca, é flagrada como `paid editing` ou `conflict-of-interest sock-puppetry`. Bloqueio resultante é indefinido e estende-se a todo IP corporativo associado.

Os cinco passos seguros para construir presença em Wikipedia.pt

O caminho indireto começa antes da entrada existir. Primeiro passo: a marca planta fontes secundárias ao longo de doze a vinte e quatro meses. Imprensa de moda regional, revistas de joalheria especializadas, podcasts de varejo brasileiro com transcrição publicada, reviews em blogs de notoriedade independente. Cada fonte deve cobrir a marca em profundidade, não em menção de uma linha. A meta operacional é seis a dez fontes secundárias verificáveis antes de pensar em entrada.

Segundo passo: a marca abre conta na Wikipedia.pt e contribui em outros artigos por pelo menos noventa dias antes de qualquer edição relacionada à própria marca. As contribuições devem ser temáticas (joalheria histórica, semijoia no Brasil, técnicas de cravação) e devem agregar valor enciclopédico verificável. Uma conta com 30+ edições em artigos não relacionados à própria marca passa a ter histórico defensável.

Terceiro passo: a entrada é proposta na `Esplanada/propostas` antes de ser criada. A proposta inclui rascunho em subpágina de usuário, lista de fontes, e justificativa explícita de notabilidade. Editor experiente do projeto Wikipedia comenta a proposta antes de a página ir ao espaço principal. Esse caminho é lento — duas a quatro semanas — mas reduz a chance de exclusão sumária para perto de zero.

Quarto passo: a edição é feita por terceiro sem vínculo formal com a marca. Pode ser jornalista que cobriu a marca, acadêmico que pesquisou o setor, editor voluntário que escolheu o tópico após ler as fontes secundárias acumuladas. A marca não paga nem orienta esse editor. A independência é editorialmente verificada e resgata a entrada de qualquer flag `paid editing`.

Quinto passo: a manutenção subsequente respeita as mesmas regras. A marca não corrige a própria entrada quando aparece imprecisão. Levanta o problema na página de discussão e espera que terceiro decida se procede. Tentar corrigir diretamente reabre a flag de conflito de interesse e pode levar a reversão completa para versão estável anterior.

Caso secundário: a marca que esperou três anos para ter entrada

Em 2023 uma joalheria histórica do Vale do Itajaí decidiu construir presença em Wikipedia.pt seguindo o caminho indireto. No primeiro ano, contratou jornalista freelance especializada em moda e patrocinou (sem direito de revisão editorial) reportagem em revista nacional de varejo. Pagou redator sênior para escrever capítulo em livro independente sobre joalheria brasileira. Em paralelo, criou perfil verificado em Wikidata via terceiro acadêmico. No segundo ano, financiou pesquisa universitária sobre técnicas locais de cravação que mencionou a marca como caso de estudo — pesquisa publicada em journal acadêmico com peer review. No terceiro ano, jornalista que cobriu a marca em 2023 propôs entrada na Wikipedia.pt como contribuição editorial pessoal. A entrada passou no primeiro patrulhamento, manteve-se estável dois anos, e em 2026 aparece em três dos quatro motores generativos quando o prompt é "joalherias históricas do sul do Brasil". Custo total da estratégia indireta: aproximadamente noventa mil reais distribuídos em três anos. Custo da estratégia direta tentada por concorrentes: zero financeiro, mas IP queimado e impossibilidade de tentar novamente nos próximos cinco anos.

Tabela comparativa: Wikipedia vs Wikidata vs Knowledge Graph vs LLM corpus

DimensãoWikipedia.ptWikidataKnowledge Graph GoogleLLM corpus (GPT-4, Claude)
Tipo de conteúdoTexto enciclopédico longoTriplas estruturadas RDFTriplas + texto resumidoTexto livre + embeddings
Notabilidade exigidaAlta (`WP:N`)Baixa (identificador externo)Médio (entity recognition)Variável
Edição por marca diretaProibida (COI)Aceita com cautelaIndireta via outros sinaisIndireta via fontes secundárias
Velocidade de propagação para LLMs30-90 dias7-30 dias14-45 diasPróximo treino (6-18 meses)
Fonte exigidaSecundária independenteIdentificador externoSchema + sinais cruzadosVolume + repetição cross-fonte
Risco de queimar marcaAltoBaixoBaixoBaixo
Custo de entrada bem feitaAlto (12-36 meses)Baixo (horas)MédioMédio-alto
PersistênciaAnos (se notável)DécadasDependente GooglePróximas gerações de modelos

Tabela comparativa: tipos de fontes que sustentam notabilidade Wikipedia.pt

Tipo de fontePeso editorialAceita para `WP:N`Tempo médio de aquisiçãoCusto indicativo
Site da própria marcaZeroNãoImediatoZero
Release reproduzidoQuase zeroNãoDiasZero a baixo
Reportagem editorial em veículo nacionalAltoSim3-12 mesesIndireto via PR
Capítulo em livro acadêmicoMuito altoSim12-24 mesesMédio
Artigo em journal peer reviewMuito altoSim18-36 mesesMédio-alto
Podcast com transcrição editorialMédioParcial2-6 mesesBaixo
Documentário com curadoriaAltoSim12-24 mesesAlto
Premiação setorial documentadaMédio-altoParcialVariávelMédio

Pegadinhas operacionais

A primeira pegadinha é a tentação de criar conta com nome próximo ao da marca. Conta `HerreiraSemijoias` ou `JoalheriaXBR` é flag instantânea de COI. Use nome pessoal real do editor terceiro, sem qualquer pista corporativa.

A segunda é citar o site da própria marca como fonte. `WP:V` exige fonte secundária; site próprio só serve para fato trivial e não conta para notabilidade. Quem usa site próprio como referência principal vê a entrada cair em revisão.

A terceira é traduzir entrada de Wikipedia em outro idioma como atalho. Wikipedia.pt aplica `WP:N` independentemente do que existe em outras versões linguísticas. Marca com entrada em inglês não é automaticamente notável em português. A entrada precisa sustentar-se sozinha em fontes lusófonas.

A quarta é tentar escrever no espaço de usuário e mover ao principal sem revisão. Editor patrulheiro detecta o movimento e reverte para subpágina de usuário ou marca para `WP:CSD/G11` — exclusão rápida por publicidade.

A quinta é responder em primeira pessoa em página de discussão. Quem escreve "nossa marca foi fundada em" perde imediatamente neutralidade editorial e reforça flag de COI. Use sempre terceira pessoa neutra mesmo em discussão.

Exercícios

Exercício 1 — Diagnóstico de notabilidade da marca. Cenário: a marca pondera se está pronta para uma entrada na Wikipedia.pt e precisa de leitura realista de massa crítica. Tarefa: liste todas as fontes secundárias publicadas sobre a marca nos últimos sessenta meses. Para cada fonte, registre veículo, autor, data, tipo (reportagem editorial, release reproduzido, capítulo de livro, paper acadêmico), profundidade (menção lateral, parágrafo, página completa) e independência editorial (jornalista próprio do veículo ou autoria do PR da marca). Aplique a régua `WP:N`: duas fontes secundárias independentes que cobrem a marca em profundidade. Critério: o diagnóstico está completo quando há tabela com mínimo de oito fontes, classificação rigorosa de cada uma e parecer fundamentado sobre prontidão para entrada (sim, não, ou em dois a três anos com plano específico). Tempo estimado: cento e vinte a cento e oitenta minutos. Output esperado: parecer de notabilidade assinado por responsável editorial, com decisão de avançar ou aguardar.

Exercício 2 — Edição neutra em Wikidata como degrau intermediário. Cenário: a marca não tem massa crítica para Wikipedia mas pode plantar item Wikidata sólido como base de Knowledge Graph. Tarefa: crie ou complete item Wikidata da marca usando edição anônima via API ou conta neutra. Adicione claims P31 (instância de joalheria), P571 (fundada em), P17 (Brasil), P159 (sede), P856 (site oficial) e até três `sameAs` cross-fonte. Documente cada claim com fonte verificável externa. Evite descrição em primeira pessoa e adjetivos elogiosos. Critério: o item Wikidata está pronto quando tem mínimo de oito claims, três `sameAs`, etiqueta multilíngue (pt e en) e descrição neutra de até 250 caracteres. Tempo estimado: noventa a cento e vinte minutos. Output esperado: item Wikidata público estável e sem reversão por trinta dias.

Exercício 3 — Plano editorial de fontes secundárias para 24 meses. Cenário: a marca aceita o caminho indireto e precisa cronograma realista para construir massa de notabilidade. Tarefa: desenhe plano de vinte e quatro meses dividido em quatro trimestres. Cada trimestre lista alvos de fonte secundária (mínimo de duas reportagens editoriais por trimestre, uma fonte acadêmica ou capítulo de livro por semestre, três participações em podcast com transcrição publicada por ano, candidatura a um prêmio setorial documentado por ano). Inclua orçamento estimado, responsável nominal, métrica de sucesso e gatilho para reavaliar plano se notabilidade não consolidar. Critério: o plano está completo quando cada trimestre tem alvos claros, orçamento total estimado, e regra explícita de pausa se massa crítica não chegar até o décimo oitavo mês. Tempo estimado: cento e oitenta a duzentos e quarenta minutos. Output esperado: plano editorial trimestral assinado pela direção da marca, com revisão semestral agendada.

Síntese executiva

Wikipedia.pt é o único canal de citação em LLM onde a edição direta pela marca tem retorno negativo esperado. Tentar criar entrada própria sem massa crítica de fontes secundárias queima o IP, o domínio e a equipe de PR. O caminho viável tem três anos de horizonte: plantar fontes secundárias verificáveis, abrir conta editorial neutra com histórico independente, propor entrada via `Esplanada` e aceitar que terceiro neutro escreva e mantenha o artigo. Quem aceita esse horizonte ganha presença que dura décadas em Wikipedia, alimenta Wikidata, abastece Knowledge Graph e propaga para toda nova geração de LLMs. Quem ignora paga catorze a oitenta mil reais para ser banido em quatro horas e fica fora do canal por anos. A diferença em mention rate entre marca presente em Wikipedia.pt e marca ausente, segundo o dashboard da Brasil GEO, é da ordem de 1,8x em prompts de joalheria histórica em ChatGPT 4o e 2,4x em Perplexity Sonar Pro.

Próximo módulo

A próxima aula entra em terreno técnico complementar: o arquivo `llms.txt` como controle granular do que LLM crawler ingere do site da marca. Diferente de `robots.txt`, o `llms.txt` permite distinguir GPTBot de ClaudeBot, autorizar Perplexity e bloquear scraping concorrencial, e proteger conteúdo pago sem prejudicar SEO clássico.

---

[^1]: Wikipedia. Wikipedia:Notabilidade (`WP:N`) — diretrizes de critérios de inclusão. 2025. https://pt.wikipedia.org/wiki/Wikipédia:Notabilidade

[^2]: Wikipedia. Wikipedia:Conflito de interesses (`WP:COI`) — diretriz editorial. 2025. https://pt.wikipedia.org/wiki/Wikipédia:Conflitodeinteresses

[^3]: Vrandečić, Denny e Krötzsch, Markus. Wikidata: A Free Collaborative Knowledgebase. Communications of the ACM, 2014. https://doi.org/10.1145/2629489

[^4]: Singhal, Amit. Introducing the Knowledge Graph: things, not strings. Google Official Blog, 2012 (atualizações 2024). https://blog.google/products/search/introducing-knowledge-graph-things-not/

[^5]: Brasil GEO. Mention Rate Dashboard — Wikipedia.pt como sinal de citação em ChatGPT e Perplexity, recorte joalheria 2026-Q1. Relatório interno.