Moteur de recherche
Sommaire
- 1- Objectifs
- 2- Définitions
- 3- Quelques fonctions des moteurs de recherche ?
- 3.1- Le Crawling
- 3.2- L'Indexation
- 3.3- Le Stockage
- 4- Les réseaux sociaux et les moteurs de recherche
- 4.1- Twitter lance son propre moteur de recherche
- 4.2- Facebook : expérimentation de son moteur de recherche
- 5- Index et indexation
- 5.1.1- Sommaire du cours Internet
Moteur de recherche
-
Objectifs
- Connaitre les différents moteur de recherche
-
Définitions
- Un moteur de recherche est une application web permettant de trouver des ressources à partir d’une requête sous forme de mots. Les ressources peuvent être des pages web, des articles de forums Usenet, des images, des vidéos, des fichiers, etc.
- C’un outil qui permet de rechercher sur le Web (mais aussi sur un ordinateur personnel) des ressources, des contenus, des documents etc., à partir de mots clés. Il suffit de renseigner les expressions qui forment la requête et le moteur de recherche déniche automatiquement les ressources correspondant à la recherche. Les résultats apparaissent organisés selon une logique propre à chaque moteur.
- Les moteurs de recherche sont des programmes informatiques qui peuvent être utilisés pour parcourir des documents ou des bases de données.
-
Quelques fonctions des moteurs de recherche ?
-
Le Crawling
- Les termes de crawler, robot de crawl ou spider, désignent dans le monde de l’informatique un robot d’indexation. Concrètement, il s’agit d’un logiciel qui a pour principale mission d’explorer le Web afin d’analyser le contenu des documents visités et les stocker de manière organisée dans un index.
- Le crawler, ou araignée web, est un composant logiciel vital du moteur de recherche. Il trie essentiellement à travers l’Internet pour trouver les adresses de sites Web et le contenu d’un site Web pour le stockage dans la base de données des moteurs de recherche. Crawling peut scanner de toutes nouvelles informations sur Internet ou localiser des données plus anciennes.
- Les robots de recherche ont la capacité de faire des recherches sur un large éventail de sites Web en même temps et de recueillir de grandes quantités d’information simultanément. Ceci permet au moteur de recherche de trouver le contenu actuel sur une base horaire.
- L’araignée web rampe jusqu’à ce qu’elle ne puisse plus trouver d’informations dans un site, comme par exemple d’autres hyperliens vers des pages internes ou externes.
-
L’Indexation
- Une fois que le moteur de recherche a parcouru le contenu d’Internet, il indexe ce contenu en fonction de la présence de phrases de mots clés dans chaque site Web individuel. Cela permet de trouver facilement une requête de recherche particulière et un sujet.
- Les expressions de mots-clés sont le groupe particulier de mots utilisés par une personne pour effectuer une recherche sur un sujet particulier.
- La fonction d’indexation d’un moteur de recherche exclut d’abord tous les articles communs et inutiles tels que « le », « a » et « an ». Après avoir éliminé le texte commun, il stocke le contenu d’une manière organisée pour un accès rapide et facile.
- Les concepteurs de moteurs de recherche développent des algorithmes de recherche sur le Web en fonction de mots-clés et d’expressions de mots-clés spécifiques.
- Ces algorithmes associent des mots-clés et des expressions de mots-clés générés par l’utilisateur au contenu d’un site Web particulier, en utilisant l’index.
-
Le Stockage
- Le stockage du contenu Web dans la base de données du moteur de recherche est essentiel pour une recherche rapide et facile. La quantité de contenu disponible pour l’utilisateur dépend de l’espace de stockage disponible.
- Les grands moteurs de recherche comme Google et Yahoo sont capables de stocker des quantités de données se situant dans les téraoctets, offrant une plus grande source d’information disponible pour l’utilisateur.
-
Les réseaux sociaux et les moteurs de recherche
- Les réseaux sociaux veulent toujours plus de place sur le web! Ainsi certains géants n’hésitent pas à se positionner sur le créneau du moteur de recherche. Découvrons donc ce que propose Twitter et Facebook dans ce domaine.
-
Twitter lance son propre moteur de recherche
- Le 3 février 2015, lors d’une conférence à Londres, Twitter dévoile son propre moteur de recherche Curator! Il s’agit d’un moteur de recherche dédié aux professionnels : journalistes web, les rédacteurs, diffuseurs d’émission en direct. En bref, toutes les personnes qui doivent effectuer une veille très ciblée de l’information.
- Curator est donc un agrégateur de contenus qui combine les vidéos, les tweets et les vines issus de l’application de streaming Périscope. Le moteur de recherche épingle les sujets qui sont susceptibles d’intéresser le professionnel de l’information. Il aura alors un aperçu en temps réel des sujets de discussion qui sont en cours sur Twitter.
-
Facebook : expérimentation de son moteur de recherche
- Facebook expérimente depuis peu son propre moteur de recherche. Ce nouveau moteur de recherche permettrait de partager des articles avec son réseau Facebook directement sur son statut, sans avoir à sortir du réseau social. Le moteur de recherche Facebook donnerait accès à une boîte de dialogue dans laquelle l’internaute tape sa requête. Il obtiendrait alors la liste des articles appropriés et ceux déjà postés par ses amis sur le même sujet.
-
Index et indexation
- Un moteur de recherche enregistre une grande partie des sites présents sur le web grâce à un programme appelé robot.
- L’ensemble des sites web enregistrés par un moteur de recherche s’appelle l’index et l’action d’enregistrer ces sites s’appelle l’indexation.
- Quand vous faites une requête, le moteur de recherche vous présente les sites de l’index qu’il pense répondre le mieux à votre besoin d’information.
- Pour cela, le moteur doit classer les sites de l’index, en notant chaque page avec un score de pertinence. La façon de classer les sites est un secret très important pour les moteurs de recherche.
- On sait que google utilise, entre autre, le nombre de fois et l’endroit où le mot clé apparaît dans la page, le nombre de liens qui pointent vers le site… Le système de classement de google s’appelle le Pagerank
- http://www.salonsdunet.com/les-moteurs-de-recherche/fonctions.html
.
———-
Bibliographie