O pesadelo do SEO: Quando o NoIndex não funciona

587
0
Share:
noindex

Colunista Eric Enge discute problemas comuns que surgem a partir de uma aplicação incorreta da tag noindex.

No tempo e no lugar certo, a tag noindex pode ser uma coisa maravilhosa. Infelizmente, há momentos em que ela pode causar problemas.

Ao longo dos últimos anos, tenho tido a oportunidade de trabalhar em uma série de sites com contagens de páginas que funcionam em centenas de milhões. As razões pelas quais as pessoas permitem que seus sites cresçam a tais tamanhos são muitas e variadas. Aqui estão algumas das razões mais comuns do porque isso acaba acontecendo:

1 – O editor está tentando maximizar a sua capacidade para classificar em long-tail terms.

2 – O editor acredita que oferecer um nível enorme de refinamentos é bom para a experiência do usuário.

3 – O site utiliza um sistema de marcação sem restrição, que permite que qualquer combinação de tags (mesmo combinações claramente ilógicas) para criar novas páginas únicas.

4 – A implementação do site possui erros que resultam na criação involuntária de páginas.

Quando os sites se tornam grandes dessa forma pode, muitas vezes, significar que várias das páginas têm um valor de desempenho muito baixo, ou que as diferenças entre grupos de páginas em uma determinada seção são quase triviais.

Considere, por exemplo, uma página sobre o “escova de limpeza de garrafas azuis para canhotos tamanho 10” e “escova de limpeza de garrafas verdes para canhotos tamanho 10”. Os usuários podem querer escolher sua cor, mas isso não deve realmente exigem a criação de uma nova página. Já vi situações em que a relação total de páginas para as páginas indiscutivelmente úteis é tão elevada como 10: 1!

O problema de ter páginas coma estas é que elas podem fazer com que seu site seja sinalizado pelo Google como site de conteúdo pobre. Isto poderia significar uma perda de visibilidade devido ao algoritmo Panda ou mesmo uma penalidade manual. Nenhuma delas é uma coisa boa!

Noindexing não é a resposta

Uma maneira de evitar ser penalizado é colocar a tag noindex nas páginas que você não deseja que sejam incluídas no índice do Google. Supondo que você consiga identificar todas as páginas que possam causar preocupação ao Google, isso iria eliminar o risco da pena manual ou de ser atingido pelo algoritmo Panda, mas isso não é suficiente. Vamos explorar as três razões principais:

  1. Diluição de PageRank Focus. Um cenário comum é que as páginas “ruins” estão ligadas a uma lista de produtos.

Quando isso for usado adequadamente, os links nessa lista estarão diretamente relacionados e serão altamente relevantes para a página, os links valerão a indexação, como mostrado aqui:

sedan-link

Agora, as chances são de que cada página do seu site tenha alguns links que apontam para a sua home page, a sua página “sobre nós”, a página “fale conosco”, a política de privacidade, e outras páginas menos focadas no tema como essas.

Não me interpretem mal, essas ligações são uma parte importante da estrutura do seu site, tê-los ali é uma coisa boa. No entanto, os links para essas páginas de produtos dentro de um caminho de navegação topicamente relevantes (“Links topicamente relevantes para Key Money Pages”) são verdadeiramente preciosos. Você não quer desperdiçá-los.

O problema começa quando alguns dos links na lista de produtos são páginas que não devem ser indexadas. Você pode resolver os problemas de penalidade com a tag noindex, mas você acaba perdendo um pouco desse PageRank. Aqui está uma página de exemplo para ilustrar o problema:

noindex-paginas

Na imagem de exemplo acima, 20% dos nossos links topicamente relevantes para Key Money Pages estão direcionados para uma página noindex. Este PageRank está, basicamente, completamente perdido. Por quê? Vamos dar uma olhada no que acontece nessa página noindex:

suv-noindex

Alguns dos PageRank são consumidos pela página noindex, e mesmo que a página noindex ainda possa passar o resto do PageRank à outras páginas através de links, a grande maioria desses links estão indo para outras páginas que não as suas key money pages, como eu mostrei no exemplo da imagem acima.

  1. PageRank enviou para a Terra do Nunca. Desperdiçar o PageRank das ligações topicamente relevantes para o Key Money Pages é ruim o suficiente, mas não é o único problema. Em sites muito grandes você pode ter uma situação onde o Google não rastreia todo o seu site, como mostrado aqui:

googlebot-crawls

Como mostrado nesta imagem, o Google atinge o ponto onde o rastreamento para. Ele simplesmente decidiu que há muitas páginas no site para que ele vá mais longe. No entanto, as páginas na parte inferior da árvore, onde o rastreamento para, ainda estão passando pelo PageRank e eles têm outras páginas que o Google não tem, e não vai, indexar. Esse PageRank efetivamente passou para terra do nunca, e é desperdiçado também.

  1. Consumo do Rastreamento da Largura de Banda. O Google ainda rastreia páginas com a tag noindex. Se você tem uma grande percentagem de páginas em seu site que não estão indexadas, o Google vai gastar tempo rastreando essas páginas ao invés de páginas que ele pode realmente classificar para você.

Isso pode te prejudicar quando você fizer grandes mudanças em seu site, que deseja que o Google veja e processe, ou quando você adicionar uma nova seção ao site. Para a maioria dos sites, o Google só rastreia uma pequena parte dele em um determinado dia, então se ele gastar o tempo em uma parte do seu “crawl budget” em páginas que não têm nenhum significado para eles, pode retardar muito o processo de descobrir as grandes novas mudanças que você fez.

Rel=Canonical também não é tão bom

Uma solução alternativa para a tag noindex é implementar a tag rel=canonical do Google para dizer a ele que uma determinada página deve ser considerada uma cópia ou um subconjunto de outra página. Em princípio, isso é ótimo, porque ele iria preservar todo o PageRank associado com a página e passá-lo de volta para a página vinculada na tag. Existem dois problemas com isso:

Rel=canonical é feito para ser usado apenas em casos em que a página com a tag sobre ele é uma cópia estrita ou subconjunto da página com o link da tag. Usá-lo em situações em que este não é o caso, não é aconselhável.

Mesmo se as páginas que você está tentando lidar são subconjuntos estritos de páginas que você deseja manter, o Google considera rel=canonical como uma sugestão, e pode optar por ignorar essa sugestão. Isso é, infelizmente, algo não tão incomum, e na minha experiência acontece muito com grandes websites.

Às vezes, você só tem que “ir pra cima”

Às vezes você apenas tem que assumir a tarefa de limpar a bagunça. Ele também pode pagar dividendos enormes, como mostra este gráfico de tráfego:

traffic-pop-after-page-cleanup

Nós reduzimos a contagem de páginas neste site em mais de 90%, a partir de centenas de milhões de páginas para dezenas de milhões. Parece que o Google gostou!

Um esforço de desenvolvimento significativo será necessário para endireitar este tipo de situação; no entanto, a minha experiência diz que as recompensas normalmente justificam o esforço.

Originalmente postado em http://searchengineland.com/noindex-gone-bad-215132

As opiniões e informação contidas neste post não necessariamente refletem a opinião do Search News Brasil, mas sim do autor convidado citado abaixo.

Eric Enge

Eric Enge

Atualmente CEO da Stone Temple Consulting uma agência de Search Marketing e Social Midia com mais de 60 funcionários situada em Massachusetts nos EUA. Eric é um dos autores do livro The Art of SEO. Articulista dos sites Search Engine Land e MOZ e palestrante dos maiores evento de Search Marketing do mundo. (Os textos aqui reproduzidos foram feitos com a autorização de Eric)

Mais artigos - Website

Share:

Leave a reply

Não vá embora sem curtir nossa fanpage!

Receba as notícias mais quentes do mercado de Search Marketing e Facebook Ads.