Tecnologia

Web Semântica – explorando novas possibilidades

Web Semântica1 é a evolução da web que conhecemos atualmente, com toda sua informação organizada que busca viabilizar pesquisas como em um banco de dados de forma que humanos e máquinas possam compreendê-la.

Imagine que você precise fazer uma viagem de última hora, tendo que se ausentar por alguns dias. É possível que você necessite encontrar um hotel para se hospedar e, como não conhece muito bem a cidade, nada melhor do que pesquisar na internet. Porém, você tem alguns critérios: precisa ser um hotel que forneça café da manhã e almoço, tenha estacionamento com manobrista, internet, telefone, etc. Após uma rápida pesquisa fornecendo estes dados, o computador poderá trazer resultados específicos com os hotéis que se encaixem exatamente nos requisitos desejados. É esta a ideia principal da Web Semântica.

Surgiu em 2011 através do Tim Berners-Lee2 – físico britânico, cientista da computação e professor. Criador do World Wide Web (WWW) –, James Hendler3 e Ora Lassila4 (autores do artigo publicado na revista Scientific American com o título: “Web Semântica: um novo formato de conteúdo para a Web que tem significado para computadores vai iniciar uma revolução nas novas possibilidades”5). Podemos dizer também que esta é a Web de Dados Linkados, que possibilita a criação de repositórios de dados na web, construção de vocabulários e regras para ‘conversar’ com esses dados. E os sites atuais podem aderir a esta evolução, através dos Microformats, incluindo-os na estrutura do seu site.

DADOS LINKADOS

A linkagem de dados é possível através das tecnologias como: RDF, SPARQL, OWL, etc. Um ambiente onde a aplicação pode consultar os dados, tirar conclusões usando vocabulários, entre outras funções. Porém, para que isso se torne realidade, é necessário ter uma enorme quantidade de dados disponíveis na Web Semântica e as relações entre eles devem ser disponibilizadas para a criação da web de dados. Com a tecnologia RDF é possível alcançar e criar o link entre os dados, permitindo à conversão e o acesso à base de dados existentes (relacional, XML, HTML, etc.).

VOCABULÁRIOS E ONTOLOGIAS

Os Vocabulários definem os conceitos e relações utilizados para descrever e representar uma área de preocupação. Eles são utilizados para classificar os termos que podem definir uma aplicação particular, caracterizar as relações possíveis e definir possíveis constrangimentos sobre o uso de tais termos. Podem ser muito complexos, definindo milhares de termos; ou muito simples, descrevendo apenas um/dois conceitos. Sua função é interagir com os dados, podendo ampliar a base de conhecimentos.

Ontologias são utilizadas para vocabulários mais complexos, e possivelmente coleção muito formal dos termos. Enquanto o vocabulário é utilizado quando é dispensado o formalismo, usando apenas um sentido solto. Em casos mais complexos a aplicação poderá precisar de uma ontologia mais detalhada, complementando as informações extras, que inclui a descrição formal de como autores devem ser identificados de forma exclusiva, por exemplo.

CONSULTAS

No contexto da Web Semântica, Consulta significa tecnologias e protocolos que podem programaticamente recuperar informações da Web de dados. Assim como os bancos de dados relacionais precisam de linguagens de consulta específica, a rede de dados (geralmente representada usando a tecnologia RDF como formato de dados) precisa de sua própria linguagem de consulta. Este é o papel do SPARQLquery e os protocolos de acompanhamento. SPARQL torna possível o envio e recebimento de resultados, por exemplo, através de HTTP ou SOAP.

INFERÊNCIAS

Podem ser caracterizadas por descobrir novos relacionamentos, e significa que os procedimentos automáticos podem gerar novas relações com base nos dados e em alguma informação adicional sob a forma de um vocabulário. A fonte de informação adicional pode ser definida através dos vocabulários ou conjuntos de regras, ambas as abordagens recorrem a técnicas de representação do conhecimento.

A Inferência é uma das ferramentas de escolha para melhorar a qualidade da integração de dados na web, através da descoberta de novas relações, analisando automaticamente o conteúdo dos dados, ou gestão do conhecimento na web em geral.

APLICAÇÕES VERTICAIS

É o termo utilizado para designar áreas de aplicação genéricas, comunidades específicas, entre outras, que podem ajudar as suas operações, melhorar a sua eficiência, fornecer uma melhor experiência ao usuário, etc. Estas aplicações podem apresentar casos específicos, por vezes casos de uso não muito comuns, requisitos em termos de expressividade do vocabulário ou consulta de linguagens, as considerações de eficiência para inferências, etc.

MICROFORMATS

Os Microformatos6 são conjuntos de formatos abertos, desenvolvidos para acionar a semântica em qualquer documento XML, HTML e XHTML, usando atributos específicos como: class, rel, ver. Os buscadores podem extrair informações específicas de páginas que usam microformatos. Algumas especificações são:

  • hCard – para informações de contatos;
  • hCalender – para eventos;
  • hReview – para revisões;
  • XFN – para relações sociais;
  • Rel-license – para licenças.

Como podemos notar, é a web passando por mais uma evolução, modificando nossos padrões de pesquisas, trazendo grandes melhorias. E claro, mecanismos de busca como o Google, já estão acompanhando esta evolução, basta agora às organizações e usuários que possuem sites pessoais se atentarem a estas mudanças e prepara-los para a Web 3.0, explorando o máximo possível destas novas possibilidades.

Renato Cunha

Comentários

Deixe uma resposta