Internet

Qu’est-ce que le Web Invisible et comment l’utiliser ?

M / s. Carroll est une chercheuse passionnée et une rédactrice indépendante qui écrit sur une myriade de sujets avec lesquels elle a de l’expérience et des connaissances.

Testez vos connaissances sur Internet

qu'est-ce-que-le-web-invisible

Le Web invisible, également appelé Web caché ou Web profond, est cette partie d’Internet qui est généralement inaccessible aux moteurs de recherche conventionnels comme Google ou Bing. Cela signifie qu’en tant qu’utilisateur final, vous ne verrez généralement pas son contenu ou ne saurez même pas qu’il est là. Lorsque vous recevez des « hits » à partir d’un terme ou d’une expression de recherche, vous ne voyez qu’une fraction de ce qui se trouve sur le Web, car les moteurs de recherche ne récupèrent que les pages Web. Ils manquent de matériel alors que les répertoires thématiques ne le peuvent pas. Un bon exemple est celui des journaux qui publient en ligne, mais les moteurs de recherche ne peuvent pas franchir la barrière de l’enregistrement et, par conséquent, le contenu n’apparaît pas lorsque vous naviguez. Le matériel de la base de données est un autre exemple. La plupart des moteurs de recherche limitent le nombre de pages qu’ils recherchent, abandonnant les plus anciennes et en ajoutant de nouvelles par préférence (placement payant et inclusion payante).

Il existe également de nombreux sites Web privés et propriétaires qui ne sont tout simplement pas recherchés lors de la recherche habituelle de l’utilisateur final. Cela ne signifie pas que vous devez désactiver l’utilisation des moteurs de recherche, cela signifie simplement que vous devez apprendre à utiliser d’AUTRES outils qui effectueront des recherches sur le Web caché. En fait, la plus grande partie des données récupérables sur Internet est cachée et on estime que le Web caché est au moins 50 fois plus grand que le Web exploré. Considérant qu’environ 900 milliards de pages d’informations sont stockées sur le Web invisible, et que seulement 25 % d’entre elles ont été indexées, il y a beaucoup plus qu’il n’y paraît.

Façons de rechercher sur le Web invisible ou profond

qu'est-ce-que-le-web-invisible

Il existe plusieurs tactiques que vous pouvez utiliser pour trouver du matériel Web invisible. Cependant, aucun d’entre eux n’est infaillible et tous peuvent devoir être utilisés dans le cadre d’un seul effort de recherche. Malgré l’ambiguïté d’Internet, voici un bon point de départ :

Recherches préventives

Une recherche préventive signifie essentiellement élaborer une stratégie avant même de commencer. Les avocats obtiennent fréquemment des grèves préventives contre les jurés – pourquoi ? stratégie. De même, vous avez besoin d’une stratégie pour éliminer le contenu indésirable. Lorsque vous naviguez sur le World Wide Web, pensez d’abord à ce que vous essayez d’accomplir. Par exemple, si vous recherchez du matériel de base de données, utilisez des phrases booléennes qui incorporent des mots-clés tels que base de données, référentiel et/ou archive. Considérez cet exemple : entrez « trains + base de données ». Entrez ensuite « trains + archive ». Vous obtenez deux résultats totalement différents de matériel introuvable sur Internet au quotidien. Avec la première recherche, vous obtiendrez la base de données des stations Amtrak. Avec la deuxième recherche, vous obtiendrez un historique d’Amtrak. Si vous deviez saisir simplement « trains », vous obtiendrez la page d’accueil d’Amtrak et l’horaire actuel.

A lire aussi :  50+ jolis emojis à essayer : la liste ultime

De plus, vous pouvez restreindre votre champ d’application en limitant les recherches à certains paramètres régionaux à l’aide d’extensions de pays. Une liste de ceux-ci peut être trouvée en ligne en recherchant sur Google « codes de pays pour Internet ». Par exemple, pour savoir ce que le Royaume-Uni a à dire sur la guerre nucléaire, saisissez « guerre nucléaire +.uk ». De même, vous pouvez trouver ce que la Chine a à dire en saisissant « guerre nucléaire +.cn », mais gardez à l’esprit que vous pouvez également apprendre ce que « CNN » a à dire à ce sujet.

De toute évidence, si vous ne connaissez pas ces méthodes de porte dérobée pour déverrouiller les données cachées, vous ne les verrez jamais sur la liste de votre navigateur. Pour plus de conseils, lisez plus loin.

qu'est-ce-que-le-web-invisible

Utilisez les extensions de fichier pour réduire votre portée

Si vous utilisez n’importe quel type de logiciel de bureau, vous connaissez diverses extensions de fichiers comme Microsoft Word -.doc ; Obtenez parfait – .wpd; Excel – .xls, etc. Celles-ci sont importantes car vous pouvez isoler le matériel par extension de fichier sur le Web en faisant précéder votre recherche de type de fichier : par exemple, en prenant l’exemple des trains un peu plus loin, entrez « filetype:mdb trains » et vous obtiendrez peut-être des informations de base de données assez propriétaires dans la plupart des cas. chaque langue.

Tout comme vous avez utilisé le suffixe .mdb pour rechercher des fichiers dbase, vous pouvez utiliser d’autres extensions de fichier pour obtenir des résultats de recherche plus stricts. Tapez « filetype:ppt » sans espace et votre terme de recherche, et vous n’obtiendrez que des fichiers Power Point. Tapez « filetype:.pdf » et votre terme de recherche et vous n’obtiendrez que des fichiers Adobe Acrobat. Les extensions de type de fichier les plus courantes sont .doc (Word), .ppt (Power Point), .pdf (Adobe), .xls (Excel) et .jpg (Jpeg) ou .tif (TIF) pour les images, mais tout suffixe légitime peut être utilisé. Essayez celui-ci : « filetype:ppt rainbows et vous verrez une présentation assez sophistiquée sur la physique derrière un arc-en-ciel.

qu'est-ce-que-le-web-invisible

Faites défiler pour continuer

qu'est-ce-que-le-web-invisible

Utiliser la recherche inversée

La recherche inversée signifie utiliser la logique inverse. Parfois, tout ce que vous avez, ce sont des fragments d’informations. Ces informations peuvent vous mener à l’information que vous recherchez vraiment. Par exemple, saisissez un numéro de téléphone et vous trouverez peut-être plusieurs pistes à qui appartient ce numéro de téléphone. Le même principe fonctionne pour les adresses physiques et les adresses e-mail. J’ai même utilisé Google Earth pour déterminer quel type de véhicule quelqu’un conduisait. Cela ne fonctionne pas toujours, mais c’est un bon point de départ lorsque vous n’avez aucune idée. Il existe une myriade de liens et de programmes disponibles pour vous aider à rechercher en arrière, qu’il s’agisse de numéros de téléphone, d’adresses, de noms ou d’images.

A lire aussi :  Pourquoi devriez-vous obtenir une évaluation de nom de domaine

Exploration de données

Malheureusement pour certains, et plus heureux pour d’autres comme les sociétés de marketing, le Web a fait un excellent travail en collectant des informations provenant de diverses sources et en les rendant accessibles au public. Lorsque vous pouvez extraire et intégrer ces données à partir de pages Web, vous faites de l’exploration de données. L’exploration de données devient de plus en plus sophistiquée et de nombreux outils ont été développés permettant aux organisations de collecter des habitudes ou des préférences d’acheteurs, des données démographiques, des statistiques, etc.

L’exploration de données se fait via différents types de logiciels d’exploration de données ou de moteurs de recherche. Ask.com (anciennement Teoma) a un mineur de données intégré, il est donc sage de l’utiliser lorsque le matériel invisible devient important. Par exemple, si vous recherchez « mots croisés » sur Google, vous obtiendrez des mots croisés en ligne gratuits, les puzzles les plus populaires tels que USA Today et LA Times, mais si vous recherchez « mots croisés » sur Ask.com, vous verrez une barre latérale (pour votre droite) ou des articles récents ou pertinents sur les mots croisés.

Un autre bon moteur de recherche est WebCrawler. Recherchez « grenouilles qui mordent » dans votre navigateur Google, puis essayez-le depuis WebCrawler. Vous verrez que la différence est assez conséquente. WebCrawler ramassera plusieurs articles de bonne qualité alors que Google ne le fera pas à moins que vous n’ajoutiez le terme article dans votre recherche. Les étudiants doivent utiliser l’exploration de données lorsqu’ils recherchent du contenu de recherche.

Utiliser un Web Pathfinder invisible

L’intention d’un Pathfinder est de présenter une variété de ressources sur un sujet particulier. Il opère en dehors du domaine du placement et de l’inclusion payants, de sorte que les publicités et la popularité ne contrôlent pas nécessairement le contenu. Les Pathfinders sont également populaires parmi les étudiants qui s’appuient souvent sur des recherches de sujets qui donnent les mêmes résultats dans tous les navigateurs.

Il existe de nombreux éclaireurs Web invisibles. répertoires. les moteurs de recherche et les passerelles telles que Around the Web in 80 Days, A9, The Invisible Web Directory et Pinakes sont également de bons points de départ. Gary Price et Chris Sherman ont écrit un excellent livre intitulé « The Invisible Web: Uncovering Information Sources Search Engines Can’t See » si vous voulez en savoir plus.

A lire aussi :  Comment créer une page Wikipedia qui sera approuvée à 100%

Autres conseils utiles

Il existe de nombreux autres conseils pour effectuer des recherches sur le Web profond. Lorsque vous recevez des messages « Page introuvable » pour des sites invisibles, supprimez toutes les données après le point d’interrogation et relancez la recherche. Cela peut vous conduire à la page d’accueil où vous pouvez ensuite rechercher à nouveau du contenu. Ceci est important car les pages Web sont constamment mises à jour et modifiées et les liens ou les URL deviennent invalides au cours du processus, mais le contenu peut toujours être là.

Considérez également que la plupart des moteurs de recherche sont conçus pour rechercher du texte, de sorte que les images et les graphiques peuvent être négligés. Si vous recherchez spécifiquement des images ou des vidéos, utilisez une fonction de moteur de recherche qui les cible.

Lorsque vous effectuez une recherche sur le Web « profond », gardez à l’esprit qu’une partie est « sombre ». Il a été surnommé le Dark Web parce qu’il contient de la pornographie, du contenu de sites de rencontres, des opportunités de marché noir, etc. Le Dark Web est devenu si vaste qu’il fait l’objet d’un autre article, mais la route de la soie très médiatisée n’en est qu’un bon exemple.

Profitez de la recherche avec vos nouvelles techniques, mais soyez prudent. Sans un bon pare-feu pour vous protéger, vous vous exposez aux virus, au piratage et à d’autres choses sombres qui se cachent sur le Web.

Pour plus d’informations sur la recherche sur le Web invisible, lisez ces deux liens :

http://www.guardian.co.uk/technology/2001/sep/06/internetnews.onlinesupplement ;

http://conferences.alia.org.au/online2003/papers/sherman.ppt ;

Sources : Schlein, Alan M. Trouvez-le en ligne : le guide complet de la recherche en ligne. Troisième édition. 2003, Facts on Demand Press, Tempe Arizona. Http://www.noodletools.com Maîtrise de l’information : stratégies de recherche et maîtrise de l’information : profondeur de la recherche. http://www.ericdigests.org Découvrir le Web caché, parties I et II.

Geek le 04 septembre 2017 :

Je lirais le Guide de l’auto-stoppeur sur le Web profond par geeqguide.com Scary Jaw drop. Outil utile pour aller sur DN.

Vicki Carroll (auteur) de la région du Grand Birmingham le 17 janvier 2011 :

Génial, Onix1. Merci d’avoir partagé.

Onix1 le 16 janvier 2011 :

Merci pour cela!

j’ai trouvé un moteur de recherche google deep/invisible web

http://ultraskulls.co.cc

kowalite de Partout le 27 mars 2010 :

C’est une information incroyable, Alahiker. Des trucs dont je n’avais absolument aucune idée. Je vais certainement ajouter cette page à mes favoris. Merci pour ce hub.

Bouton retour en haut de la page