La passion de Paul pour la technologie et les médias numériques remonte à plus de 30 ans. Né au Royaume-Uni, il vit maintenant aux États-Unis.
Image du domaine public de Pixabay
Qu’est-ce qu’un moteur de recherche ?
Également connu sous le nom de moteur de recherche Web et de moteur de recherche Internet, un moteur de recherche est un programme informatique (généralement basé sur le Web) qui collecte et organise le contenu de partout sur Internet.
L’utilisateur saisit une requête composée de mots clés ou d’expressions, et le moteur de recherche répond en fournissant une liste de résultats qui correspondent le mieux à la requête de l’utilisateur. Les résultats peuvent prendre la forme de liens vers des sites Web, des images, des vidéos ou d’autres données en ligne.
Comment fonctionnent les moteurs de recherche ?
Le travail d’un moteur de recherche peut être décomposé en trois étapes. Premièrement, il y a le processus de découverte de l’information. Deuxièmement, il y a l’organisation des informations afin qu’elles puissent être consultées et présentées efficacement lorsque les utilisateurs recherchent quelque chose. Troisièmement, les informations doivent être évaluées pour présenter aux utilisateurs des moteurs de recherche des réponses pertinentes à leurs requêtes.
Ces trois étapes sont généralement appelées exploration, indexation et classement.
Rampant
Les moteurs de recherche utilisent des logiciels appelés robots d’exploration Web pour localiser les informations accessibles au public sur Internet, c’est pourquoi ce processus est connu sous le nom d’exploration. Les robots d’exploration Web peuvent aussi parfois être appelés robots d’indexation des moteurs de recherche. Le processus est compliqué, mais essentiellement les crawlers/spiders trouvent les serveurs Web (également connus sous le nom de serveurs en abrégé) qui hébergent les sites Web, puis procèdent à leur enquête.
Une liste de tous les serveurs est créée et il est établi combien de sites Web sont hébergés sur chaque serveur. Le nombre de pages de chaque site Web, ainsi que la nature du contenu, par exemple, du texte, des images, de l’audio, de la vidéo, sont également vérifiés. Les robots d’exploration suivent également tous les liens du site Web, qu’ils soient internes qui pointent vers des pages du site ou externes qui pointent vers d’autres sites Web et les utilisent pour découvrir plus de pages.
Indexage
Les informations trouvées par les robots d’indexation sont organisées, triées et stockées afin qu’elles puissent ensuite être traitées par les algorithmes pour être présentées à l’utilisateur du moteur de recherche. C’est ce qu’on appelle l’indexation. Toutes les informations de la page ne sont pas stockées par le moteur de recherche, mais uniquement les informations essentielles dont les algorithmes ont besoin pour évaluer la pertinence de la page à des fins de classement.
Classement
Lorsqu’une requête est saisie dans un moteur de recherche, l’index est parcouru à la recherche d’informations pertinentes, puis trié dans un ordre hiérarchique par un algorithme. Cet ordre des pages de résultats des moteurs de recherche (SERPS) est appelé classement.
Différents moteurs de recherche utilisent différents algorithmes et donnent donc des résultats différents. Au fil des ans, les algorithmes sont devenus de plus en plus complexes car ils tentent de présenter des réponses plus pertinentes et précises en réponse aux requêtes des utilisateurs des moteurs de recherche.
Faites défiler pour continuer
10 exemples de moteurs de recherche
1.Google
Google est de loin le plus grand moteur de recherche au monde. Il gère plus de 5 milliards de recherches chaque jour et détient une part de marché de plus de 90 % au moment de la rédaction (août 2019). Développé à l’origine par Larry Page et Sergey Brin en 1997, Google a connu un tel succès qu’il est devenu synonyme de services de moteurs de recherche, entrant même dans le dictionnaire sous forme de verbe, les gens utilisant des expressions telles que : « je l’ai googlé » lorsqu’ils ont cherché quelque chose en ligne.
2. Bing
Les origines de Bing de Microsoft peuvent être trouvées dans les moteurs de recherche antérieurs de la société technologique, MSN Search, Windows Live Search et Live Search. Bing a été lancé en 2009 avec de grands espoirs qu’il pourrait usurper son rival Google, mais malgré le fait d’attirer de nombreux fans, les choses n’ont pas tout à fait fonctionné de cette façon. Malgré tout, Bing est le troisième plus grand moteur de recherche au monde après Google et Baidu. Il est disponible en 40 langues différentes.
3. Yahoo!
Yahoo! La recherche est un autre acteur important dans le monde des moteurs de recherche. Cependant, pendant une grande partie de son histoire, il a fourni l’interface utilisateur, mais s’est appuyé sur d’autres pour alimenter l’index de recherche et l’exploration du Web. De 2001 à 2004, il était propulsé par Inktomi puis Google. Depuis 2004, Yahoo! La recherche était indépendante jusqu’à ce qu’un accord soit conclu avec Microsoft en 2009, selon lequel Bing alimenterait l’index et l’exploration.
4. Ask.com
Initialement connu sous le nom de Ask Jeeves, Ask.com est un peu différent de Google et Bing, car il utilise un format de questions et réponses. Pendant un certain nombre d’années, Ask.com s’est efforcé de devenir un rival direct des grands moteurs de recherche, mais de nos jours, les réponses sont fournies à partir de ses vastes archives et des contributions des utilisateurs, ainsi qu’avec l’aide d’un fournisseur de recherche tiers anonyme et externalisé. .
5. Baidu
Fondé en 2000 par Robin Li et Eric Xu, Baidu est le moteur de recherche le plus populaire en Chine et le quatrième site Web le plus visité au monde, selon le classement Alexa. Baidu trouve ses origines dans RankDex, un moteur de recherche précédemment développé par Robin Li en 1996. Outre son moteur de recherche chinois, Baidu propose également un service de cartographie appelé Baidu Maps et plus de 55 autres services liés à Internet.
6. AOL.com
AOL, maintenant appelé Aol. et connu à l’origine sous le nom d’America Online, était un acteur important au début de la révolution Internet, fournissant un service d’accès à distance à des millions d’Américains à la fin des années 1990. Malgré le déclin d’AOL alors que le haut débit a progressivement remplacé l’accès commuté, le moteur de recherche AOL est toujours utilisé par une minorité significative de chercheurs. Le 23 juin 2015, AOL a été racheté par Verizon Communications.
7. DuckDuckGo
DuckDuckGo (DDG) possède un certain nombre de caractéristiques qui le distinguent de ses principaux concurrents. Il met fortement l’accent sur la protection de la vie privée des chercheurs, donc plutôt que de profiler les utilisateurs et de leur présenter des résultats personnalisés, il fournit les mêmes résultats de recherche pour n’importe quel terme de recherche donné. L’accent est également mis sur la qualité plutôt que sur la quantité en ce qui concerne les résultats de recherche. L’interface de DDG est très propre et non surchargée de publicités.
8. WolframAlpha
WolframAlpha se présente comme un moteur de connaissances informatiques. Au lieu de répondre aux requêtes des chercheurs avec une liste de liens, il répond avec des réponses mathématiques et scientifiques à leurs questions, en utilisant des « données organisées » de source externe. WolframAlpha a été lancé en 2009 et est devenu un outil précieux pour les universitaires et les chercheurs.
9. Yandex
Lancé en 1997, Yandex est le plus grand moteur de recherche de Russie et le quatrième site Web le plus populaire du pays. En dehors de la Russie, le moteur de recherche est également très présent en Ukraine, en Biélorussie, au Kazakhstan et dans d’autres pays de la Communauté des États indépendants. En plus de la recherche, Yandex propose de nombreux autres produits et services liés à Internet, notamment des cartes et de la navigation, de la musique, du commerce électronique, des applications mobiles et de la publicité en ligne.
10. Archives Internet
Internet Archive offre un accès public gratuit à un large éventail de documents numériques. Une bibliothèque numérique à but non lucratif basée à San Francisco, c’est un excellent outil pour retracer les domaines de l’histoire et voir comment ils ont évolué au fil des ans. Outre les sites Web, vous pouvez également trouver des applications logicielles et des jeux, des films/vidéos, de la musique, des images animées et une vaste collection de livres du domaine public. Internet Archive milite également pour un Internet libre et ouvert.
Ce contenu est exact et fidèle au meilleur de la connaissance de l’auteur et ne vise pas à remplacer les conseils formels et individualisés d’un professionnel qualifié.
© 2019 Paul Goodman