Não muito tempo atrás, eu e os meus colegas da Advanced Web Ranking veio com um HTML estudo baseado em cerca de 8 milhões de páginas de índice reunidos desde as vinte melhores resultados do Google para mais de 30 milhões de palavras-chave.
Nós escrevemos sobre a marcação de resultados e como os vinte melhores Google em páginas de resultados de implementá-las, então, foi ainda mais longe e obtido HTML de uso insights sobre eles.
O que isso tem a ver com SEO?
A forma como o HTML é escrito determina que os usuários vêem e como os motores de busca interpretar páginas web. Válido, bem formatado em HTML página também reduz os possíveis interpretações — estruturado de dados, metadados, de idioma, ou de codificação — pelos motores de pesquisa.
Este destina-se a ser uma técnica de SEO auditoria, algo que queria fazer desde o início: a desagregação de HTML, uso e como os resultados se relacionam com modernas técnicas de SEO e boas práticas.
Neste artigo, vamos abordar itens como meta tags que o Google entende, JSON-LD estruturado de dados, detecção de idioma, títulos de utilização, de relações sociais & meta de distribuição, AMPLIFICADOR e muito mais.
Meta tags que o Google entende
Ao falar sobre os principais motores de busca como fontes de tráfego, infelizmente, é apenas o Google e o resto, com o Duckduckgo ganhando força ultimamente e Bing quase inexistente.
Assim, nesta seção iremos focar a nossa atenção apenas sobre as meta tags que o Google listadas na Pesquisa Console Central de Ajuda.
Gráfico de pizza que mostra o total de números para as meta tags que o Google entende, descrito em detalhes nas seções abaixo.
A meta description é um ~150 caracteres do trecho que resume o conteúdo de uma página. Os motores de busca mostrar descrição meta nos resultados da pesquisa quando o pesquisado frase está contida na descrição.
SELETOR de
CONTAGEM
4,391,448
374,649
13,831
Nos extremos, encontramos 685,341 meta elementos com índice menor do que 30 caracteres e 1,293,842 elementos com o conteúdo de texto com mais de 160 caracteres.
O título é, tecnicamente, não é uma meta tag, mas ele é usado em conjunto com meta name=”descrição”.
Este é um dos dois mais importantes tags HTML quando se trata de SEO. É também uma obrigação de acordo com o W3C, ou seja, nenhuma página é válido com a falta de um tag de título.
A pesquisa sugere que, se você manter os seus títulos em um razoável de 60 caracteres, então você pode esperar de seus títulos para ser renderizado corretamente no SERPs. No passado, havia sinais de que resultados de pesquisa do Google comprimento do título foi prorrogado, mas não foi uma mudança permanente.
Considerando todo o exposto, a partir da plena 6,263,396 títulos encontramos, 1,846,642 tags de título parece ser muito longo (mais de 60 caracteres) e 1,985,020 títulos tinham comprimentos considerado muito curto (menos de 30 caracteres).
Gráfico de pizza mostra o título de marca de distribuição de comprimento, com uma duração de menos de 30 caracteres, sendo 31,7% e uma duração maior do que 60 caracteres, sendo cerca de 29,5%.
Um título a ser demasiado curto não deve ser um problema —afinal, é uma coisa subjetiva, dependendo do site de negócios. Seu significado pode ser expresso com palavras, mas é definitivamente um sinal de desperdício de otimização de oportunidade.
SELETOR de
CONTAGEM
6,263,396
falta tag
1,285,738
Outra coisa interessante é que, entre os sites de ranking na página 1-2 do Google, 351,516 (~5% do total de 7,5 M) estão usando o mesmo texto para o título e o h1 em suas páginas de índice.
Além disso, você sabia que com o HTML5, você só precisa especificar o tipo de documento HTML5 e um título, a fim de ter um perfeitamente válida página?
“Essas meta tags podem controlar o comportamento do motor de busca rastreamento e indexação. A meta tag robots aplica-se a todos os motores de busca, enquanto que o “googlebot” meta tag é específico para o Google”. – Meta tags que o Google entende
SELETOR de
CONTAGEM
1,577,202
139,458
Trecho de HTML para com uma meta de robôs e seus parâmetros de conteúdo.
Assim, a meta de robôs directivas fornecer instruções para os mecanismos de pesquisa sobre como rastrear e indexar o conteúdo de uma página. Deixando de lado o googlebot meta contar que é uma espécie de baixa, estávamos curiosos para ver mais frequentes robôs parâmetros, considerando que um grande equívoco é que você tem que adicionar uma meta tag robots no seu HTML cabeça. Aqui está o top 5:
SELETOR de
CONTAGEM
632,822
180,226
115,128
111,777
83,639
“Quando os usuários de pesquisa para seu site, os resultados de Pesquisa do Google, por vezes, apresentar uma caixa de pesquisa específicos para o seu site, juntamente com outros links diretos para seu site. Essa meta tag diz ao Google para não mostrar os sitelinks caixa de pesquisa.” – Meta tags que o Google entende
SELETOR de
CONTAGEM
1,263
Como seria de esperar, não muitos sites de escolher explicitamente dizer que o Google não para mostrar um sitelinks caixa de pesquisa quando seu site aparece nos resultados de busca.
“Essa meta tag informa ao Google que você não quer que a gente forneça uma tradução para esta página.” – Meta tags que o Google entende
Pode haver situações em que o fornecimento de seu conteúdo para um grupo muito maior de usuários não é desejado. Como diz o suporte do Google resposta acima, esta meta tag informa ao Google que você não quer que eles para fornecer uma tradução para esta página.
SELETOR de
CONTAGEM
7,569
“Você pode usar essa tag na página de nível superior do seu site para verificar a propriedade de Pesquisa Console.”- Meta tags que o Google entende
SELETOR de
CONTAGEM
1,327,616
Enquanto estamos no assunto, você sabia que se você é um proprietário verificado de uma propriedade do Google Analytics, o Google agora irá automaticamente verificar que mesmo site em Busca de Console?
“Isso define a página tipo de conteúdo e conjunto de caracteres.” – Meta tags que o Google entende
Basicamente, este é um dos bons meta tags. Ele define a página tipo de conteúdo e conjunto de caracteres. Considerando a tabela abaixo, nota-se que apenas cerca de metade das páginas de índice analisamos definir uma meta charset.
SELETOR de
CONTAGEM
3,909,788
“Essa meta tag envia o usuário para um novo URL após um determinado período de tempo e, às vezes, é usado como uma forma simples de redirecionamento.”- Meta tags que o Google entende
É preferível para redirecionar o seu site usando um redirecionamento 301 em vez de uma atualização de meta, especialmente quando assumimos que 30x redirecionamentos não perder PageRank e, o W3C recomenda que essa tag não ser usado. O Google não é um fã de ambos, recomendando que você use um do lado do servidor de redirecionamento 301 em vez disso.
SELETOR de
CONTAGEM
7,167
Do total de 7,5 M índice de páginas de nós analisado, encontramos 7,167 páginas que estão usando o acima de método de redirecionamento. Os autores não ter sempre o controle sobre server-side tecnologias e, aparentemente, eles usam essa técnica a fim de permitir redirecionamentos no lado do cliente.
Além disso, a utilização de Trabalhadores de uma ponta alternativa n, a fim de superar os problemas ao trabalhar com o legado de tecnologia pilhas e limitações de plataforma.
“Esta tag diz ao navegador como renderizar uma página em um dispositivo móvel. A presença dessa marca indica ao Google que a página é otimizado para celular.” – Meta tags que o Google entende
SELETOR de
CONTAGEM
4,992,791
Partir de 1o de julho, 2019, todos os sites começaram a ser indexados usando móvel do Google-o primeiro de indexação. Farol verifica se há uma meta name=”viewport” tag head do documento, assim que esta meta deve ser em cada página web, não importa o quadro ou CMS que você está usando.
Considerando o acima, teríamos de esperar mais sites do que o 4,992,791 de 7,5 milhões de páginas de índice analisados para usar um válido meta name=”viewport” em sua cabeça seções.
A concepção de sites fáceis de usar garante que as suas páginas executar bem em todos os dispositivos, por isso certifique-se de que a página web é compatível com dispositivos móveis aqui.
“Os rótulos de uma página como contendo conteúdo adulto, para sinal que pode ser filtrado por SafeSearch resultados.”- Meta tags que o Google entende
SELETOR de
CONTAGEM
133,387
Esta tag é usada para indicar o prazo de vencimento classificação de conteúdo. Ele não foi adicionado à meta tags que o Google entende lista até recentemente. Confira este artigo por Kate Morris sobre como tag de conteúdo adulto.
JSON-LD dados estruturados
Estruturado de dados está em um formato padronizado para fornecer informações sobre uma página e classificar o conteúdo da página. O formato de dados estruturado, pode ser Microdados, RDFa, e JSON-LD — tudo isso ajuda o Google a entender o conteúdo do seu site e gatilho especial resultado da busca de recursos para suas páginas.
Apesar de ter uma conversa com o incrível Dan Shure, ele veio com uma boa idéia de olhar para dados estruturados, tais como o logotipo da organização, nos resultados de pesquisa e no Gráfico de Conhecimento.
Nesta seção, vamos estar usando JSON-LD (JavaScript Object Notation de Dados Vinculados) apenas para coletar dados estruturados de informações.Isto é o que o Google recomenda que de qualquer maneira para fornecer pistas sobre o significado de uma página da web.
Alguns pedaços úteis sobre isso:
- No Google I/O de 2019, foi anunciado que a ferramenta de teste de dados estruturados serão substituídos pelos ricos resultados da ferramenta de teste.
- Agora o Googlebot índices páginas da web utilizando as mais recentes Cromo em vez do velho Chrome 42, o que significa que você pode atenuar o SEO problemas que você pode ter tido no passado, estruturadas de dados de suporte.
- Jason Barnard tinha uma interessante palestra no SMX Londres 2019 sobre como a Pesquisa do Google funciona a classificação e de acordo com sua teoria, existem sete fatores de ranking de nós pode contar; dados estruturados é definitivamente um deles.
- Builtvisible do guia de Microdados, JSON-LD, & Schema.org contém tudo que você precisa saber sobre o uso de dados estruturados no seu website.
- Aqui está um guia incrível para JSON-LD para iniciantes por Alexis Sanders.
- Por último, mas não menos importante, existem muitos artigos, apresentações, e lugares para mergulho no oficial do JSON para a Ligação de Dados do site.
Advanced Web Ranking HTML de estudo se baseia na análise do índice de páginas apenas. O que é interessante é que, embora não estabelecido nas orientações, o Google não parece se importar sobre dados estruturados em páginas de índice, como afirmou em um Estouro de Pilha resposta por Gary Illyes há vários anos. Ainda, no JSON-LD tipos de dados estruturados que o Google entende, nós achamos um total de 2,727,045 características:
Gráfico de pizza que mostra os tipos de dados estruturados que o Google entende, com Sitelinks searchbox sendo 49.7% — o valor mais alto.
DADOS ESTRUTURADOS RECURSOS
CONTAGEM
Artigo
35,961
Breadcrumb
30,306
Livro
143
Carrossel
13,884
Contatos empresariais
41,588
Curso
676
Crítica
2,740
Conjunto de dados
28
Empregador classificação agregada
7
Eventos
18,385
Fato de seleção
7
Página de perguntas frequentes
16
Como fazer
8
Anúncio de emprego
355
Livestream
232
Negócio Local
200,974
Logo
442,324
Media
1,274
Ocupação
0
Produto
16,090
P&r página
20
Receita
434
Reveja trecho
72,732
Sitelinks searchbox
1,354,754
Perfil Social
478,099
Software de aplicação
780
Enunciáveis
516
Assinatura e paywalled conteúdo
363
Vídeo
14,349
rel=canonical
O rel=canonical elemento, muitas vezes chamado de o “link canônico,” é um elemento HTML que ajuda a webmasters evitar problemas de conteúdo duplicado. Ele faz isso especificando a “URL canônica”, o “preferido”, versão de uma página da web.
SELETOR de
CONTAGEM
3,183,575
meta name=”keywords”
Não é novo que é obsoleto e o Google não usá-lo mais. Ele também aparece como se é um spam sinal para a maioria dos motores de busca.
“Enquanto os principais motores de busca não use palavras-chave meta para o ranking, eles são muito úteis para o onsite motores de busca como o Solr.” – JP Sherman sobre por que isso obsoleto meta ainda pode ser útil hoje em dia.
SELETOR de
CONTAGEM
2,577,850
256,220
14,127
Títulos
Dentro de 7,5 milhões de páginas, h1 (59.6%) e h2 (58.9%) estão entre os vinte e oito elementos utilizados na maioria das páginas. Ainda, após a recolha de todos os títulos, descobrimos que o h3 é o título com o maior número de aparições — 29,565,562 h3s de 70,428,376 total títulos encontrados.
Fatos aleatórios:
- H1–h6 elementos representam os seis níveis de cabeçalhos de seção. Aqui estão as estatísticas completas sobre títulos de utilização, mas encontramos 23,116 de h7s e 7,276 de h8s também. Isso é uma coisa engraçada, porque muitas pessoas não uso mesmo h6s muito frequentemente.
- Há 3,046,879 páginas com falta de h1 e no resto do 4,502,255 páginas, o h1 freqüência de uso é de 2,6, com um total de 11,675,565 elementos h1.
- Enquanto há 6,263,396 páginas com um título válido, como visto acima, apenas 4,502,255 estão usando um h1 dentro do corpo de seu conteúdo.
Falta alt tags
Este eterna SEO e acessibilidade problema ainda parece ser comum após a análise deste conjunto de dados. Do total de 669,591,743 imagens, quase 90% estão faltando o atributo alt ou usá-lo com um valor em branco.
).png” src=”//d2v4zi8pl64nxt.cloudfront.net/a-technical-seo-audit-of-8-million-pages/5d9ce8771b0f10.11799952.png” largura=”624″ height=”280″ dados de imagem=”d2s5m6p62ub2″ title=”gráfico (4).png”>gráfico de Pizza que mostra a tag img alt atributo de distribuição, com falta de alt sendo predominante — 81.7% de um total de cerca de 670 milhões de imagens encontramos.
SELETOR de
CONTAGEM
img
669,591,743
img alt=”*”
79,953,034
img alt=””
42,815,769
img w/ falta de alt
546,822,940
Detecção de idioma
De acordo com as especificações, as informações sobre o idioma especificado através do atributo lang pode ser usada por um agente de utilizador de controlo de renderização em uma variedade de maneiras.
A parte que nos interessa aqui é sobre “assistência motores de pesquisa.”
“O atributo lang HTML é usado para identificar o idioma do texto de conteúdo na web. Esta informação ajuda os motores de busca retorno idioma resultados específicos, e também é utilizado por leitores de tela, que alternar o idioma de perfis para fornecer o correto sotaque e pronúncia.” – Léonie Watson
Há um tempo atrás, John Mueller disse que o Google ignora o atributo lang HTML e recomendado o uso de link hreflang em vez disso. A Pesquisa do Google Console de documentação indica que o Google usa hreflang tags para corresponder ao idioma do usuário de preferência para a direita variação de suas páginas.
Gráfico de barras mostrando que 65% dos 7,5 milhões de páginas de índice utilize o atributo lang no elemento html, ao mesmo tempo, de 21,6% usam pelo menos um link hreflang.
Dos 7,5 milhões de páginas de índice que fomos capazes de olhar para dentro, 4,903,665 usar o atributo lang no elemento html. Cerca de 65%!
Quando ele vem para o atributo hreflang, sugerindo a existência de um website multilíngue, encontramos cerca de 1,631,602 páginas — o que significa em torno de 21,6% índice de páginas de usar pelo menos um link rel=”alternate” href=”*” hreflang=”*” elemento.
Gerenciador De Tags Do Google
Desde o início, o Google Analytics principal tarefa foi a de gerar relatórios e estatísticas sobre o seu site. Mas se você quiser agrupar determinadas páginas para ver como as pessoas estão a navegar através de funil, você precisa de uma única tag do Google Analytics. Este é o lugar onde as coisas ficam complicadas.
Gerenciador de tags do Google torna mais fácil:
- Gerenciar essa confusão de marcas permitindo que você defina regras personalizadas para quando e as ações do usuário que suas tags devem fogo
- Alterar suas tags, sempre que você quiser sem alterar o código fonte do seu site, que por vezes pode ser uma dor de cabeça devido à liberação lenta ciclos
- Utilizar outros analytics/ferramentas de marketing com GTM, novamente sem tocar no código-fonte do site
Procuramos *googletagmanager.com/gtm.js referências e vi que cerca de 345,979 páginas estão usando o Gerenciador de tags do Google.
rel=”nofollow”
“Nofollow” fornece uma maneira para os webmasters para informar os mecanismos de pesquisa “não siga links desta página” ou “não siga este link específico”.
A Google não siga estes links e também não transfere o patrimônio. Considerando isso, nós estávamos curiosos sobre rel=”nofollow” números. Nós achamos um total de 12,828,286 rel=”nofollow” links dentro de 7,5 milhões de páginas de índice, com uma média calculada de 1.69 rel=”nofollow” por página.
No mês passado, o Google anunciou dois novos atributos de link de valores que deve ser usado para marcar o nofollow propriedade de um link: rel=”patrocinados” e rel=”ugc”. Eu recomendo que você vá ler Ciro Shepard artigo sobre como o Google é nofollow, patrocinados & ugc links impacto SEO, saiba por que o Google mudou o nofollow, o ranking de impacto de nofollow links, e mais.
Uma tabela que mostra como o Google é nofollow, patrocinado, e UGC atributos de link de impacto de SEO, de Ciro de Shepard artigo.
Nós fomos um pouco mais longe e olhou para estes novos atributos de link de valores, encontrando 278 rel=”patrocinados” e 123 rel=”ugc”. Para ter certeza de que tinha os dados relevantes para essas consultas, atualizamos as páginas de índice do conjunto de dados, especificamente, duas semanas após o anúncio do Google sobre esse assunto. Em seguida, usando Moz autoridade de métricas, de resolvido o topo URLs descobrimos que usar pelo menos uma das rel=”patrocinadas” ou rel=”ugc” par:
- https://www.seroundtable.com/
- https://letsencrypt.org/
- https://www.newsbomb.gr/
- https://thehackernews.com/
- https://www.ccn.com/
- https://www.chip.pl/
- https://www.gamereactor.se/
- https://www.tribes.co.uk/
AMP
Acelerado Móvel Páginas (AMP), o Google iniciativa que visa acelerar a web móvel. Muitos editores estão fazendo o seu conteúdo disponível em paralelo para o AMP formato.
Para permitir que o Google e outras plataformas de saber sobre isso, você precisa link AMP e não-AMP páginas.
Dentro de milhões de páginas olhamos, encontramos apenas 24,807 não-AMPLIFICADOR de páginas fazendo referência a seu AMP versão usando rel=amphtml.
Social
Queria saber como compartilhável ou social de um site é hoje em dia, sabendo que Josh Buchea fez uma incrível lista com tudo que podia dar na cabeça da sua página web, nós extraímos o social seções de lá, e obteve os seguintes números:
Facebook Open Graph
Gráfico de barras mostrando o Facebook Open Graph meta tags de distribuição, descritos em detalhes na tabela abaixo.
SELETOR de
CONTAGEM
meta property=”fb:app_id” content=”*”
277,406
meta property=”og:url” content=”*”
2,909,878
meta property=”og:type” content=”*”
2,660,215
meta property=”og:title” content=”*”
3,050,462
meta property=”og:image” content=”*”
2,603,057
meta property=”og:image:alt” content=”*”
54,513
meta property=”og:description” content=”*”
1,384,658
meta property=”og:site_name” content=”*”
2,618,713
meta property=”og:localidade” content=”*”
1,384,658
meta property=”artigo:autor” content=”*”
14,289
Twitter cartão
Gráfico de barras mostrando o Twitter Cartão de meta tags de distribuição, descritos em detalhes na tabela abaixo.
SELETOR de
CONTAGEM
meta name=”twitter:cartão” content=”*”
1,535,733
meta name=”twitter:site” content=”*”
512,907
meta name=”twitter:author” content=”*”
283,533
meta name=”twitter:url” content=”*”
265,478
meta name=”twitter:title” content=”*”
716,577
meta name=”twitter:description” content=”*”
1,145,413
meta name=”twitter:imagem” content=”*”
716,577
meta name=”twitter:image:alt” content=”*”
30,339
E por falar em links, que pegou todos os que estavam apontando para as redes sociais mais populares.
Gráfico de pizza mostrando externa de relações sociais de distribuição, descritos em detalhes na tabela abaixo.
SELETOR de
CONTAGEM
6,180,313
5,214,768
1,148,828
1,019,970
Aparentemente existem muitos sites que ainda link para seus perfis do Google+, que é, provavelmente, um descuido, considerando o não-tão-recente Google+ desligamento.
rel=prev/next
De acordo com o Google, como usar rel=prev/next não é um programa de indexação de sinal de mais, como anunciado no início do ano:
“Como nós avaliamos a nossa indexação de sinais, que decidiu se aposentar rel=prev/next. Estudos mostram que os usuários de amor a uma única página de conteúdo, objetivo para que, quando possível, mas multi-parte também é bom para a Pesquisa do Google.”- Twitter pelo Google Webmasters
No entanto, no caso de que ele é importante para você, Bing, diz ele usa-las como pistas para a descoberta de página e a estrutura do site compreensão.
“Nós estamos usando estas (como a maioria de marcação) como sugestões para a página de descoberta e compreensão da estrutura do site. Neste ponto, não estamos a mesclagem de páginas no índice com base nestes e nós não estamos usando prev/next no modelo de classificação.”- Frédéric Dubut do Bing
No entanto, aqui estão as estatísticas de uso encontramos olhando para milhões de páginas de índice:
SELETOR de
CONTAGEM
<link rel="prev" href="*"
20,160
<link rel="next" href="*"
242,387
Isso é muito bonito!
Sabendo como a média de página da web parece utilizando dados de cerca de 8 milhões de páginas de índice pode nos dar uma idéia mais clara das tendências e nos ajudar a visualizar o uso comum de HTML quando se trata de SEO moderno e técnicas emergentes. Mas isso pode ser um interminável saga — apesar de ter muitos números e estatísticas para explorar, ainda há muitas perguntas que precisam de resposta:
- Nós sabemos como é estruturado de dados é usado na natureza agora. Como vai evoluir e como muito estruturado de dados será considerado suficiente?
- Devemos esperar que a AMP aumentar o uso de em algum lugar no futuro?
- Como vai rel=”patrocinados” e rel=”ugc” mudar a nossa maneira de escrever HTML em uma base diária? Quando a codificação de links externos, além de target=”_blank” rel=”noopener de combinação”, agora temos a considerar a rel=”patrocinados” e rel=”ugc” combinações bem.
- Nós nunca vai aprender a adicionar atributos alt valores para imagens que tenham uma finalidade além da decoração?
- Quantas meta tags ou atributos teremos que adicionar a uma página da web para agradar os motores de busca? Nós realmente necessário o recém-anunciado de dados-nosnippet atributo HTML? O que está próximo, dados allowsnippet?
Há outras coisas que gostaria de ter terminado bem o endereço, como “tempo-para-primeiro-byte” (TTFB) valores, o que está correlacionado com o ranking; eu recomendo HTTP Arquivo para isso. Eles periodicamente rastreamento dos principais sites na web e registro de informações detalhadas sobre quase tudo. De acordo com as últimas informações, eles já analisados 4,565,694 websites exclusivos, com completa Farol pontuações e ter armazenado em particular tecnologias como jQuery ou extensão para todo o conjunto de dados. Enorme adereços para Rick Viscomi, que faz um trabalho incrível como o seu “mordomo”, como ele gosta de chamar a si mesmo.
Realizar este estudo em grande escala, foi um passeio divertido. Aprendemos muito e esperamos que você encontrou acima números interessantes, como o fizemos. Se existe uma tag ou atributo em especial que você gostaria de ver os números, por favor, deixe-me saber nos comentários abaixo.
Mais uma vez, confira o código HTML completo os resultados do estudo e deixe-me saber o que você pensa!