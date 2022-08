Entornointeligente.com /

Apesar de ser um dos segredos mais bem guardados do mundo, o código base do motor de busca do Google não é a única razão para o êxito deste serviço.

Ainda que ninguém na concorrência, até hoje, tenha conseguido um sistema tão eficiente a «minar» as páginas da internet e os seus conteúdos, e depois a estratificá-los de modo a responder de forma verdadeiramente útil a cada pesquisa, este processo está permanentemente em afinação.

Na semana passada, no seu blogue oficial , a Google anunciou a introdução de alterações na forma como as páginas da web passariam a ser classificadas (o ranking interno utilizado pelo sistema de pesquisa), de maneira a «desclassificar conteúdo que pareça ter sido sobretudo criado para ficar bem colocado nos motores de busca em vez de para ajudar ou informar as pessoas».

Subscrever Isto porque, ainda que, tal como referido, o código base (a «alma», por assim dizer) do Google seja segredo, há vários mecanismos que são bem conhecidos, por quem cria conteúdo para a Net , o que lhes permite tentar «manipular» o motor de busca, de modo a obter melhor classificação da sua página – colocando-a, assim, acima das outras num resultado de pesquisa.

Os técnicos da Google estão constantemente a retocar os algoritmos de pesquisa, que hoje em dia contam com software de inteligência artificial.

A escolha de certas palavras-chave, de palavras de ação, a repetição das mesmas de tempos a tempos, a utilização de legendas nas imagens, hyperlinks para páginas de grande tráfego, são apenas alguns exemplos de técnicas de SEO ( Search Engine Optimization – otimização para motor de busca) que os criadores de conteúdo utilizam.

Também bem conhecidas por quem navega na internet são as técnicas de clickbait – títulos e/ou fotos muito apelativos, que muitas vezes ligam para páginas que são pouco mais do que fotogalerias gigantes, cada uma necessitando apenas de um clique (ou um arrastar do dedo, nos ecrãs táteis) – que na realidade apenas tentam promover artificialmente «tráfego» ( i.e. , um utilizador contar como muitos) e, como tal, fazer aumentar o ranking no motor de busca.

A Google justifica as mexidas no seu programa como forma de fazer baixar a classificação deste tipo de websites, para assim melhorar a experiência dos utilizadores: «Este novo update garantirá que conteúdo não-original, de baixa qualidade, não aparecerá de forma destacada na pesquisa», lê-se no texto oficial da empresa. «Os nossos testes concluíram que isto vai permitir melhores resultados relativamente à educação online , bem como a artes e entretenimento, compras e conteúdos tecnológicos.»

Inteligência artificial aplicada

Esta é apenas a mais recente de uma série de modificações que a Google tem feito ao seu motor de busca. E não se fica por aqui. «No ano passado, iniciámos uma série de atualizações para destacar resultados mais úteis baseados na experiência em primeira mão. Continuaremos a refinar estes sistemas nas próximas semanas e iremos lançar uma nova atualização para tornar mais fácil encontrar resultados originais e de alta qualidade», lê-se ainda no blogue oficial.

Uma das formas que a Google utiliza para concretizar os resultados da pesquisa é a Inteligência Artificial. O primeiro sistema deste género foi revelado em 2015.

Denominado RankBrain, é um software que «lê» os termos pesquisados e ajuda a enquadrá-los, contextualmente, nas páginas da internet. Além disso, colabora na atribuição de ranking das páginas, como o próprio nome indica.

Um exemplo: é o sistema de IA que distingue, na pesquisa «Qual é o animal no topo da cadeia alimentar?» que não se procura especificamente por animais em concreto, mas sim por um conceito da biologia (este exemplo surge originariamente num texto do jornal Times of India ).

Outro módulo chama-se MUM ( Multitask Unified Model ) , que está «treinado» em pelo menos 75 línguas diferentes e é responsável por preencher as caixas de texto de perguntas/resposta que surgem no topo da página de resultados. É capaz de «ler» vários tipos de conteúdos, desde texto simples a imagens, e acaba por ser o responsável pela maioria das respostas que atualmente recebe quando faz a (cada vez menos apócrifa) ação de «perguntar ao Google».

Segundo a própria empresa, este sistema de IA é mil vezes mais rápido do que o sistema anterior, lançado em open source (código aberto à comunidade), em 2019, denominado Bidirectional Encoder Representations from Transformers , ou simplesmente BERT . Este módulo foi inicialmente aplicado ao sistema de pesquisa do Google e foi o responsável pelos primeiros » snippets » (respostas curtas) no Google.

Todos estes módulos utilizam modelos de processamento de linguagem natural o que, só por si, significa um avanço tecnológico significativo. Ao contrário do que acontecia há poucos anos, o Google não responde hoje a palavras-chave ou a termos inscritos em campos específicos. Estes sistemas literalmente leem todo o conteúdo das páginas indexadas pelos bots que «minam» a Net – e contextualizam esses dados.

O sistema não é perfeito. E provavelmente nunca o será. Mas a própria Google o afirma: está sempre a ser atualizado. Por isso, nunca estranhe se, de um dia para o outro, notar subtis diferenças nos seus resultados da pesquisa.

Existem fórmulas standard para melhorar as pesquisas no motor de busca.

Dicas para otimizar a sua pesquisa A Google afirma que tem dados que demonstram que 58% dos utilizadores portugueses não utilizam todos os «truques» possíveis para otimizar as suas pesquisas, pelo que, esta semana (a mesma em que a Google fez o upgrade do seu sistema de busca.

Por isso, divulgou em comunicado dez dicas para o utilizador otimizar a sua busca:

1. Pesquise por X ou Y: isto originará resultados relacionados com X, Y ou ambos. Em vez da palavra » or» também pode usar o sinal de pontuação «|».

2. Para encontrar uma correspondência exata no Google, coloque a frase de pesquisa entre aspas.

3. Utilize o menos para excluir palavras da pesquisa.

4. Procure por páginas que tenham no título a palavra pesquisada.

5. Coloque «..» entre dois números para pesquisar por um intervalo de preços específico.

6. Restrinja a sua pesquisa a uma página web específica colocando o operador » site: » seguido do domínio onde pretende procurar a informação.

7. Pesquise dentro dos links por uma palavra ou palavras específicas. Os resultados vão trazer apenas os links que contêm a palavra pesquisada. Se adicionar um site na pesquisa, pode refinar ainda mais os resultados.

8. Utilize o operador «define:» antes de uma palavra para encontrar a definição desse termo. Trata-se de um dicionário integrado ao Google.

9. O operador de pesquisa » filetype:» limita os resultados de pesquisa a arquivos de um formato específico, por exemplo, pdf, docx, txt, ppt, etc.

10. Combine os diferentes operadores de pesquisa para ter mais precisão nos resultados.

