De Web Standards a Inteligência Artificial e o que SEO tem a ver com isso

14 Mar

Há muito tempo se fala de padrões web, web 2.0, algoritmos de busca e a famosa web semântica, que traz a promessa de organizar toda a web e incorporar significado às informações. A partir destes, surge um novo tema de pesquisas, a Web Intelligence, que busca trazer o “conhecimento” à web. Por isso, hoje eu trago esse post um tanto quanto “científico” para tentar analisar no que já evoluímos hoje em relação à web e seus padrões e o que falta para chegarmos à um nível onde toda a informação é agrupada de forma organizada e de fácil entendimento para todos, sejam seres humanos ou robôs, e como isso facilitará nossas vidas e, principalmente, a experiência do usuário.

Web Standards

Padrões Web, também conhecido como “Tableless” (apesar de não gostar muito do termo!), são um conjunto de diretrizes do W3C que orientam os desenvolvedores na criação de uma web acessível a todos, independentemente dos dispositivos usados ou de suas necessidades especiais. Quando separamos o conteúdo da apresentação, ou seja, HTML, CSS e JScript, obtemos páginas com código mais limpo, leve, de fácil manutenção e mais semântico.

Web standards

Relação com SEO: desenvolver um site acessível o torna mais compreensível não só para deficientes visuais, mas também para os mecanismos de busca. Páginas semânticas, onde um título será mostrado com <h1>, por exemplo, ao invés de <p><strong>Título</p></strong>, tem mais significado e agrega mais valor ao seu conteúdo (que é muito mais que rei em tempos de Panda!), além de diminuir o tempo de carregamento, que é um dos fatores de rankeamento do Google.

HTML 5

Vem com novos elementos que ajudarão mais ainda na estruturação da página, tanto para nós desenvolvedores como para os buscadores. Alguns desses novos elementos: <header>, <article>, <section>, <nav>, <details>, etc.

Relação com SEO: ainda não é algo relevante para os algoritmos de busca, mas com certeza é bom já estarmos de olho para o futuro, pois com a segmentação conseguiremos organizar mais ainda nosso conteúdo. Com as páginas se tornando compatíveis ao HTML5, as search engines começarão a dar mais atenção à ele. Segundo JohnMu, do Google, quando os desenvolvedores começarem a o utilizar corretamente, e então eles perceberem que a linguagem traz informação adicional, aí sim o algoritmo pode ser modificado. Além disso, existe ainda a necessidade dos browsers se adaptarem totalmente ao novo padrão.

Estrutura do HTML5

(Fonte: Smashing Magazine)

Web Semântica

A ideia surgiu em 2001, quando Tim Berners-Lee, James Hendler e Ora Lassila publicaram um artigo na revista Scientific American intitulado: “Web Semântica: um novo formato de conteúdo para a Web que tem significado para computadores vai iniciar uma revolução de novas possibilidades.”
Antes de mais nada, é muito importante saber diferenciar o conceito de semântica web – que é justamente a utilização dos padrões citados acima – do de Web Semântica, que é o formato proposto por Sir Berners-Lee!

A idéia, na prática, era retornar uma resposta completa e convincente à perguntas do tipo: “Preciso de uma saia, que custe no máximo R$20,00 e que não seja muito curta, para usar num casamento”. Com o que temos hoje, pode ser até encontrada uma resposta para tal pesquisa, porém levaria hoooooooras de pesquisa até um resultado desejado.
Para chegarmos a esse tão alcançado ambiente, especialistas citam 2 possibilidades: desenvolvimento de ferramentas para extrair significado da web atual e criação de uma nova estrutura, substituindo o que temos hoje (o que, na minha opinião, é altamente inviável!).

Um exemplo interessante é o Swoogle, um mecanismo de indexação e busca de documentos de Web Semântica, desenvolvido pela Universidade de Maryland. O Swoogle indexa documentos RDF e OWL, ao invés de HTML puro, extrai metadados e computa relações entre eles.

Swoogle

Relação com SEO: as buscas no Google, por exemplo, seriam muito mais organizadas, os nichos de trabalho muito melhor definidos, e os resultados para os usuários melhor personalizados e com mais sentido. Temos também aí a aplicação dos Microformats, que já são muito utilizados atualmente e que possuem o objetivo de agregar semântica a documentos XML e (X)HTML, explicando de forma extremamente básica. Se quiser mais informações, consulte esse ótimo Guia de SEO para Microformats.
Além disso, um caso interessante é do Best Buy através da integração da sintaxe RDFa aos blogs oficiais que representam cada uma de suas lojas, com o objetivo de tornar seus produtos e serviços (como preços, hora de funcionamento, etc) mais visíveis e, desta forma, permitindo as search engines melhor exibi-los. Leia mais sobre o case do Best Buy (pdf em inglês).

Google PageRank

IMHO, o melhor caminho para alcançar algo próximo à teoria da Web Semântica seria a utilização de mineração de dados, como nos algoritmos do Page Rank (aliás, você sabia que o processo do PageRank pertence à Universidade de Stanford e não ao Google?! Somente o nome PageRank pertence a eles!), que explora as decisões humanas sobre o que é relevante para ordenar os resultados de busca.

Web Intelligence

E, finalmente, quando juntamos os pontos de semântica, personalização e compreensão/previsão de comportamento do usuário, encontramos um novo campo, ainda muito pouco explorado: a Web Intelligence.

A Web Intelligence pode ser entendida como uma direção para pesquisa científica e desenvolvimento que explora os fundamentos e aplicações práticas de inteligência artificial e tecnologia da informação na próxima geração de produtos, serviços, sistemas e as diversas atividades baseadas na Web. Basicamente, WI poderia ser resumida como:

  • Combinação de Inteligência Artificial com Tecnologia da Informação
  • Aplicações de Inteligência Artificial na Web
  • Sistemas de informação inteligentes na Web

O grande objetivo da Web Intelligence é poder identificar e segmentar usuários de forma única. Seria a base da personalização. Nesse cenário, perguntas básicas mas ainda sem respostas convincentes, poderiam ser respondidas, como por exemplo: “Quais páginas seu cliente visitou e qual a associação semântica entre elas? Porque ele tomou esse caminho? Quais suas preferências a partir disso?”

A personalização torna-se, então, um fator principal para:

  • fazer uma recomendação dinâmica a um usuário baseado em seu perfil e comportamento;
  • modificação automática do conteúdo de um website e sua organização;
  • combinação de dados da Web com dados de marketing para fornecer informações sobre como os visitantes utilizam o website e montar estratégias a partir disso.

É importante ressaltar que funcionalidades desse tipo já existem sim na web, mas os dados ainda apresentam deficiências e muitas vezes não condizem com o real, por isso é inserida a participação da Inteligência Artificial para estudo do comportamento do usuário.

Mais informações sobre Web Intelligence:

Conclusão

Começando com os códigos semânticos presentes nos padrões web, conteúdos de qualidade, a personalização da Web Semântica, a mineração de dados como a presente nos algoritmos do PageRank e a ajuda da Inteligência Artificial, poderemos alcançar a chamada World Wisdom Wide Web, possibilitando aos usuários a melhora da encontrabilidade de suas buscas, melhorando assim a experiência do usuário.

Web Intelligence
(Fonte: http://wi.dii.uchile.cl)

Enfim, quis sair um pouco do básico e dos checklists e trazer um pouco mais de informação teórica, pois, na minha opinião, não adianta você vender algo sem ter conhecimento de causa, não é? E estudar sempre é um bom passo para isso!

E vocês, o que acham dessa “viagem”? Deixem seus comentários, opiniões, críticas e afins!



14 Comentários to “De Web Standards a Inteligência Artificial e o que SEO tem a ver com isso”

  1. Luan Muniz March 14, 2011 at 1:16 pm #

    Eu sou desenvolvedor front-end então gostei muito deste post, comentarios que me abriram um pouco a mente pra algumas coisas 😛
    Parabens, ótimo post!

    Eu sinceramente estou ficando maravilhado com o blog.
    Só artigo de extrema qualidade!
    Só alto nível!
    Parabens a todas as meninas!!

    Gostei

    • Renata Tibiriçá March 14, 2011 at 1:35 pm #

      Oi Luan! Que bom que te ajudou a entender mais as coisas! O objetivo era exatamente esse!

      Obrigada e volte sempre! =D

  2. MarianaRodrigues March 14, 2011 at 1:22 pm #

    Parabéns Renata pelo post!
    Estou aprendendo muito com vocês por aqui.

    Sucesso sempre para o Seo de Saia =)

  3. leandro almeida March 14, 2011 at 1:32 pm #

    Muito bacana o blog, venho acompanhando desde o inicio e realmente o time das meninas ta forte! Parabéns!!

  4. Leo March 14, 2011 at 1:32 pm #

    Eu gostei deste post.
    O problema é que ainda não sabemos nem fazer o feijão com arroz.
    Na questão semântica e usabilidade 99% dos front-ends brasileiros são fracos. Padrões Fracos e Css deploráveis. Sean um amigo front end que trabalha na Austrália disse o seguinte:
    Quando verificamos portfólios para contratar alguém examinamos o CSS e verificamos a unidade usada para o tamanho de fontes. Se o designer
    usa pixels já está descartardo do processo seletivo.
    Pergunte para 10 desenvolvedores brasileiros o que significa “ems”.
    Não conhecem e não sabem porque devem que usar fontes em “ems”.
    Grids responsivos nunca vi aqui.

    • Renata Tibiriçá March 14, 2011 at 1:47 pm #

      Oi Leo!

      Que bom que gostou!
      Bom, eu discordo em partes da sua opinião, pois acho que no Brasil já crescemos MUITO sim em relação à padrões web e afins. Lógico que ainda há muito para crescermos e aprendermos, mas isso acontece em qualquer lugar. Com certeza muitos sites na Australia tb não tem noção do que são padrões web ou usabilidade!
      Achei tb a opinião desse front-end australiano um tanto quanto “xiita”. Medir a qualidade de um trabalho de um profissional front-end apenas por ele usar ‘px’ ou ’em’ não diz nada sobre quem ele é ou pode fazer. Temos que olhar para o todo em um trabalho!
      Se alguém não sabe o que é “em” ou grid, é apenas uma questão de estudo! E estamos aqui para isso: sempre crescer aprendendo, afinal ninguém nunca nasceu sabendo, não é mesmo?! =)

      Obrigada pela visita e volte sempre! =D

  5. Paulo Rodrigues March 14, 2011 at 2:03 pm #

    Oi Renata,

    Quero te desejar parabéns pelo artigo, achei muito bem explicado, tirou até muitas dúvidas minha em relação a WI.

    Sou também Dev.Front-End e acompanhei uma parte daqueles desenvolvimentos em tabelas, pesados e sem semântica. A web hoje evoluiu pra caramba, espero ansiosamente que o HTML5 seja desenvolvido pela maioria e que as novas TAGS de marcação as quais você citou, vire um grande paramêtro de indexação para o Google.

    Obs: Passei um olho na sua monografia e também gostei, parabéns. Muito bacana você falar hoje sobre os padrões web.

    • Renata Tibiriçá March 14, 2011 at 2:14 pm #

      Obrigada, Paulo! Que bom que te ajudou! Quero mesmo colaborar e ajudar sempre! =)

  6. Thiago Dini March 14, 2011 at 3:17 pm #

    Muito bom! Vale ressaltar também que o os desenvolvedores acabam deixando de lado a semântica para ‘apelar’ no SEO, colocando conteúdo não relativo e em locais que não deveria estar, para promover seus sites em buscas orgânicas. A semântica é algo complexo, e precisa que todos trabalhem da mesma forma. Os padrões estão ai, e muitos ainda surgirão. Cabe a todos respeitar e ajudar para que isso facilite cada vez mais a vida de todos.

  7. Weslley Marques March 15, 2011 at 12:39 am #

    Olá Renata,

    parabéns pelo blog e post, me refrescou muito a memória, as vezes acabamos se preocupando de mais com layout e esquece da importância do código.

    Estou trabalhando em um projeto interessante de Inteligência Artificial, vale a pena conferir. – http://www.ledface.com

    • Renata Tibiriçá March 15, 2011 at 2:51 pm #

      Muito legal o projeto, Weslley! Gostei! Parabéns e obrigada por compartilhar! =)

  8. Anna Raquel Serra March 18, 2011 at 8:43 pm #

    Sou fã da Web Semântica!
    Acho legal esse tipo de informação ser disseminada entre quem faz SEO, já que as ferramentas de busca acabam contribuindo bastante para a popularização de microformatos e informação estruturada: elas implementam, o pessoal passa a usar pra rankear e acaba virando padrão do mercado… Ótimo!

    Bom saber que o blog está com uma proposta fora da caixa! Quero mais posts “científicos” :)

    • Renata Tibiriçá March 21, 2011 at 2:05 am #

      Oi Anna!
      Que bom que gostou! É um assunto bem complexo, mas é sempre bom olhar fora da caixa mesmo, como vc disse, e ver que tem muito mais além do SEO nosso de cada dia! rs

      Volte sempre! =)

  9. aquino May 10, 2012 at 11:33 pm #

    Parabéns pelo post!

Deixe um comentário