Connaissez-vous le fonctionnement d’un moteur de recherche ?

3.7/5

Internet est un univers en pleine expansion. Et contrairement à la bibliothèque de Babel, on n’y trouve pas “tout”, mais “de tout”. Parcourant des galaxies entières d’informations, les moteurs de recherches ont été conçus pour dompter l’immensité de ce monde numérique.

 

En effet, le terme “moteur de recherche” désigne un outil capable de référencer automatiquement les contenus présents sur le web (pages, textes, images, vidéos). De cette manière, ils optimisent considérablement les chances de combler les lacunes de nos connaissances personnelles.

 

Mais des questions subsistent : que nous coûte une telle prouesse technique ? Nous guide-t-elle toujours sur des voies éclairées ? Naviguer ne comporte-t-il pas des écueils ? Google est à ce jour l’outil le plus puissant du marché, et le plus utilisé par les internautes. Pourtant, ce géant ne peut (encore?) à lui seul résoudre ces énigmes.

 

Voici donc un tour d’horizon sur les meilleures alternatives servant à interroger internet, et ce qu’elles peuvent vous offrir.

Fonctionnement d’un moteur de recherche web

Les moteurs de recherche utilisent de nombreux programmes, lesquels s’aventurent dans une jungle de données en tout genre.

 

Ils accèdent aux contenus via les URLs des sites qui les diffusent, les examinent, les classent et puis les stockent. Ils les restituent ensuite à travers des pages de résultats (Search Engine Result Page ou SERP dans le jargon), lesquelles répondent à la requête d’un internaute.

 

 

Celle-ci est exprimée au moyen d’une saisie de mots-clés. Ainsi, le moteur de recherche n’attend pas qu’on lui soumette une requête pour fouiller le contenu du grand fatras du web.

En effet, il dispose de sa propre bibliothèque, déjà bien organisée afin d’offrir rapidement les meilleures pages en termes de pertinence. Ce sont des algorithmes qui assurent les étapes d’un tel processus :

Différents types d’algorithmes d’un moteur de recherche web

  • les Crawlers sont des robots chargés de l’exploration : ils nagent à toute vitesse et minent dans le web pour collecter des liens URL, « matière première » de la recherche internet ;

 

  • les Scrappers analysent le contenu des pages, afin d’effectuer un premier tri sur la pertinence ;

 

  • les Indexeurs font office de bibliothécaires du web, qui classent les pages par milliers (Google utilise Caffeine pour proposer le meilleur contenu récent) ;

 

  • les filtres de recherche (notamment Panda, Pingouin et Colibri pour Google) hiérarchisent les réponses en sanctionnant le manque de pertinence des contenus. Ils s’intéressent, entre autres, aux mots utilisés, à la structure, la longueur, l’accessibilité, la popularité ou encore l’autorité d’une page web. Puis ils affichent en premier les meilleurs résultats susceptibles de convenir au besoin de l’utilisateur. Pour cela, ils analysent le contexte d’utilisation (les mots-clés, les clics, les rebonds et reformulations, etc..)

 

Ainsi, les résultats dits “naturels” (dont ne font pas partie les publicités, lesquelles achètent leur visibilité) sont positionnés verticalement dans le SERP, par ordre de pertinence.

Qu’est-ce qu’un métamoteur (ou méta-moteur) ?

Au premier abord, les métamoteurs sont difficiles à distinguer des moteurs de recherche normaux. En effet, ils sont tout aussi faciles à utiliser, car les résultats affichés en SERP se ressemblent, et pour cause !

 

Les métamoteurs compilent les informations qu’ils puisent dans les moteurs de recherche généralistes. En résumé, utiliser un métamoteur revient à soumettre une requête à plusieurs outils de recherche à la fois.

 

Bien évidemment, les résultats similaires ne s’affichent pas deux fois. Sur certains métamoteurs, l’utilisateur peut connaître d’où provient chaque résultat (avec des infobulles, logos ou étoiles). D’autres proposent un mode annuaire, classant par thèmes les pages proposées.

Google : l’écrasant numéro 1 du marché mondial des moteurs de recherche web

moteurs de recherche

De nos jours, lorsqu’on effectue une recherche sur un sujet, on parle de le “googler” ou de le “googliser”. L’entreprise est en passe de devenir l’antonomase de la recherche internet. Même la phrase “Google est ton ami” est une manière sarcastique de signaler à quelqu’un son inculture.

 

Malgré sa totale intégration au monde du XXIe siècle, avec plus de quatre-vingt-dix pourcents des parts de marché dans plusieurs parties du monde, le boss des moteurs de recherche dissimule dans son ombre des dizaines d’alternatives concurrentes. Nous allons voir avec quels arguments ces dernières entendent rivaliser avec un tel Googliath. 

 

Google, histoire d’une entreprise au sommet du marché du web

Tout commence avec Larry Page (22 ans) et Sergey Brin (21 ans), étudiants à l’Université de Standford. Ces deux informaticiens en herbe se lancent dans le projet de concevoir un moteur de recherche.

 

En 1997, ce qui deviendra Google (en référence au nombre Gogol, un “1” suivi d’une centaine de zéros) est d’abord baptisé BlackRub. En 1998, les deux partenaires créent la société Google inc.

 

Peu de temps après, Susan Wojcicki (devenue depuis l’actuelle CEO de YouTube), loue son garage à la petite équipe, à quelques encablures de la Silicon Valley.

 

18 ans d’ascension fulgurante dans le monde des internautes

 

Après que nous avons tous survécu au bug imaginaire de l’an 2000, les jeunes entreprises Yahoo! et Google sont devenues partenaires. Leur index avait alors franchi le milliard d’URLs répertoriés. Et ce n’était qu’un début : 

 

  • 2001 : on passe à 3 milliards de liens. Il est temps d’affiner les performances du moteur de recherche en y intégrant diverses fonctionnalités ;

 

  • 2002 : Google Actualités et Froogle (ancêtre de Google Shopping) voient le jour ;

 

  • 2004 : l’index pèse 6 milliards d’URLs. Avec plus de huit-cents employés, Google arrive alors sur la scène de Wall Street ;

 

  • 2005 : dans la foulée, la firme lance le très célèbre Google Maps, suivi de Google Analytics quelques mois plus tard ;

 

  • 2006 : Google Trends voit le jour en 2006. C’est là que la firme rachète un autre mastodonte : YouTube. Entre-temps, l’index web se gonfle pour atteindre les mille milliards d’URLs ;

 

  • 2009 : Google Traduction est désormais en mesure d’offrir ses services en 50 langues ;

 

  • 2017 : Google investit 3 milliards de dollars pour demeurer le moteur de recherche par défaut des systèmes IOS. 

 

  • 2018 : Google fête sa majorité universelle et propose aux internautes en possession d’un Android la fonctionnalité Google Pay.

 

Un règne régulièrement contesté par les utilisateurs et les autres acteurs du marché

De nos jours, et de plus en plus, le rejeton de la Mountain View a ses détracteurs. En effet, sa recherche du meilleur en matière de puissance et d’efficacité se heurte à des questions qui, de près ou de loin, relèvent de l’éthique : violation de droits d’auteurs, non-protection de la vie privée, évasion fiscale en Europe, pratique de la censure en Chine, etc.

 

La neutralité du net a ainsi été mise à mal à quelques reprises.

 

Il y a encore très peu, le licenciement aux circonstances douteuses de Timnit Gebru a fait beaucoup de bruit. Cette employée s’occupait justement de concilier les IA aux problèmes d’éthique.

 

À ce jour, des milliers de lettres de soutien provenant de collaborateurs et d’universitaires somment l’entreprise de fournir clairement les motifs d’une telle décision. Dans cette perspective, mieux vaut maîtriser quelques alternatives, possibles leviers de contre-pouvoir.

Liste non exhaustive des moteurs de recherche Web alternatifs et concurrents de Google

Si cette liste a vocation à vous donner un panorama représentatif en la matière, elle oublie très certainement des outsiders parfaitement valables.

 

Notre objectif était davantage de les classer par catégorie, afin que vous disposiez de divers outils de recherche adaptés à différents usages. 

Les concurrents directs de Google dans le monde du web

Nous avons placé dans cette catégorie des moteurs de recherche alternatifs dont la ressemblance à Google se joue sur l’interface, la popularité et le poids commercial (voire politique et national).

 

Débutons donc par les grands ersatz de Google : 

Bing : un moteur de recherche alternatif dans la même lignée que Google

On aurait pu s’attendre à un choc des titans entre Microsoft Bing et Google, compte tenu de la puissance de la société de Bill Gates. Ce sera peut-être un jour le cas, puisque ce moteur de recherche n’a été rendu public qu’au milieu de l’année 2009, laissant quelques coudées d’avance au leader du marché.

 

Ainsi, il n’est pas dit que dans dix ou vingt ans, les choses ne s’équilibrent pas.

Ce qui expliquerait la lutte acharnée de Google dans cette course de fond pour la performance. Cela étant, Bing peine encore un peu partout à dépasser les 2 pourcents de parts de marché.

 

En conséquence, pour exister, l’outil de recherche de Microsoft doit encore utiliser des chemins de traverse, en passant par les produits Microsoft tels qu’Office, Skype, la Xbox ou même Alexa. Vous avez donc pu être utilisateur de Bing sans le savoir ! Quoi qu’il en soit, avec Microsoft Bing, les internautes peuvent, entre autres, rechercher sur le web : 

 

  • Images, vidéos et actualités ;

 

  • Des voyages ou une localisation quelconque avec Bing Maps ;

 

  • Une traduction, avec Microsoft Traduction ;

 

  • Un comparatif de prix à travers Ciao ;

 

  • La lecture du Flux RSS sur chaque page de résultats.

 

Yahoo : ancien partenaire de Google, actuel collaborateur de Bing

Yahoo a débuté dans les années 90 en tant qu’annuaire web. À l’image de Google, ce sont deux universitaires, David Filo et Jerry Yang qui sont à l’origine d’un des sites les plus visités du web à l’aube du XXIe siècle.

 

Dans les années 2000, Yahoo faisait même figure de leader sur le marché des moteurs de recherche.

 

Néanmoins, malgré le rachat de deux autres outils de recherche (Alta Vista et AllTheWeb) en 2003, le site ne décolle pas aussi bien que son partenaire d’alors : Google Search. En 2009, Yahoo pactise alors avec Microsoft autour du lancement de Bing.

 

Le moteur de recherche de Yahoo reste malgré tout actif, proposant à ce jour des actualités et de l’hébergement web. Il donne également accès à des portails spécialisés, dans le sport ou dans la finance, par exemple.

Yandex : une solution alternative russe

Depuis 1997, Yandex N.V. se place comme le grand concurrent russe de Google. Son nom est d’ailleurs tiré d’une formulation dont les mots suggèrent l’alternative : “Yet Another iNDEXer”.

 

Au pays des tsars, Yandex a déjà été positionné en tête, avec 50 pourcents des parts du marché (Google est repassé devant, en août 2019).

 

Le bas de son interface semble déjà revendiquer les territoires de son empire. En outre, l’affichage des principales fonctionnalités est aussi clair qu’intuitif. En voici une liste tronquée : 

  • Un navigateur web connu sous le nom de Yandex Browser

 

  • Yandex Mail

 

  • Les services de Yandex Taxi (qui collabore avec Uber pour le covoiturage, le VTC, etc.)

 

  • Yandex Maps

 

 

 

  • Yandex Market, une e-boutique aux airs d’Amazon

 

À l’image de son homologue américain, lequel joue encore à armes égales au sein de la Mère Patrie, Yandex participe à ce jour au développement d’autres technologies de pointe, telles que la domotique, l’assistance vocale ou les voitures autonomes. Une Guerre Froide numérique ?

 

Baidu : un moteur de recherche alternatif devenu leader en Chine

« Baidu » se traduit en français par « des centaines de fois ». C’est une référence à la recherche poétique et acharnée de l’idéal. De nos jours, cet outil de recherche domine chez les internautes chinois, avec plus de 60 pourcents des parts de marché.

 

Probablement en raison de la démographie chinoise, il a été classé 3e site internet le plus consulté en 2019. Pourtant, le moteur de recherche en mandarin ne répertorie même pas un milliard d’URLs (seulement 740M de pages web).

 

À l’instar de Google et de Yandex, la firme étend ses activités dans l’avancée technologique. Elle est notamment très concernée par le logiciel libre et plus particulièrement l’intelligence artificielle.

 

Depuis 2007, Baidu a élargi ses parts de marché en région japonaise. Toutefois, la progression de son territoire pourrait se heurter à sa pratique très fréquente de la censure.

 

Même son encyclopédie collaborative Baidu Baike craint en permanence d’offenser le gouvernement chinois. 

Ask : une entreprise à la mauvaise réputation

Malgré une idée initiale visionnaire, Ask est devenu le vilain petit canard des moteurs de recherche web.

À ses débuts, l’objectif était d’offrir aux internautes la possibilité de formuler leurs demandes en langage naturel.

 

Plus besoin de ne renseigner que les meilleurs mots pour obtenir une réponse pertinente ! Cela ressemble fort aux compétences actuelles du Hummingbird de Google, qui date de 2012.

 

Ainsi, Ask peut répondre à des questions posées en anglais, français, espagnol, allemand, italien et néerlandais. Cependant, les pratiques agressives de cet outil de recherche pour s’immiscer sur les ordinateurs en ont agacé plus d’un !

 

On a ainsi vu plusieurs fois s’installer sa barre de recherche sans que l’on comprenne pourquoi.

 

Mais il y a pire : en plus de se propager à la manière d’un virus informatique, c’est un véritable parcours du combattant pour s’en débarrasser.

 

Manifestement un bon exemple de ce qu’il ne faut pas faire… que les internautes toutefois en mémoire !

Moteurs de recherche alternatifs axés sur la confidentialité

C’est bel et bien le respect de la vie privée qui semble motiver le plus souvent les utilisateurs d’outils de recherche alternatifs.

En effet, c’est l’un des premiers reproches adressés à Google : collecter un maximum de données personnelles afin de s’en resservir (pour les publicités par exemple).

 

Le fait qu’il les partage même avec des tiers a tendance à inquiéter les utilisateurs, voire les agacer. Ainsi, de plus en plus de gens se tournent vers des solutions annexes, lesquelles foisonnent sur la toile.

 

Parmi ceux que nous n’avons arbitrairement pas présentés dans notre liste, il convient de citer SearX, Gigablast, disconnect Search, Search Encrypt, Gibiru ou encore Peekier…

DuckDuckGO : meilleur moteur de recherche web respectant votre vie privée

Nous commençons très logiquement par le populaire DuckDuckGo, qui date de 2008. Il s’est rapidement fait connaître comme « le moteur de recherche qui ne vous piste pas“. Aussi n’utilise-t-il de cookie qu’en cas de nécessité absolue, et ne collecte aucune donnée personnelle, adresse IP, etc.

 

Il analyse seulement les mots-clés utilisés. Ainsi, contrairement à Google, il n’adapte pas ses SERP au profil d’utilisateur, ce qui en fait un moteur un peu moins pertinent. Sa force de recherche se base sur les principes du métamoteur, capable d’utiliser Bing, Yahoo! et plus de 400 autres moteurs de recherches.

 

Son propre web crawler est désigné sous le nom de DuckDuckBot. Enfin, à la manière de Google, DuckDuckGo accorde la priorité aux sites HTTPS.

 

DuckDuckGo est déjà une référence de moteur de recherche respectant la vie privée : les internautes peuvent l’ajouter en extension au navigateur Chrome.

Qwant : un outil de recherche alternatif très populaire pour protéger vos données personnelles

Plus récent, car mis à disposition des internautes en 2013, le Français Qwant s’est également fait connaître pour ne pas tracer ses utilisateurs.

 

Dans cette perspective, il garantit leur vie privée en ne vendant pas de données personnelles, notamment pour les publicités.

 

Quant à l’affichage des résultats, il est conçu pour respecter au mieux le principe de neutralité sur internet. Contrairement à DuckDuckGo, Qwant indexe toutes ses pages web, ce qui le rend indépendant de Bing, sur lequel il comptait, avant 2016, pour afficher des résultats pertinents.

 

À ce propos, les SERP de Qwant se décomposent en divers types de résultats, comprenant les sites standards, l’e-commerce, l’éducation, les réseaux sociaux et plus généralement l’actualité.

 

Quoi qu’il en soit, il semblerait que Qwant gagne progressivement en popularité, à en juger par le nombre de requêtes le concernant sur… Google !

Swisscows : l’alternative suisse pour un contenu soft

Swisscows cherche à concurrencer Google en faisant jouer la carte de la vie privée, de l’éthique, mais également celle de l’innovation. En effet, il s’est développé en tant que moteur sémantique, à savoir qu’il est censé comprendre les requêtes en intégrant le contexte dans lequel les mots-clés sont employés.

Cela permet d’offrir des résultats plus pertinents à partir de questions formulées dans un langage plus naturel. En outre, Swisscows entend protéger vos données personnelles, puisqu’il ne conserve pas les adresses IP et fonctionne sans cookie.

 

D’autre part, l’outil de recherche a pris le parti de ne donner aucun résultat donnant accès à de la pornographie ou à des vidéos violentes. Avec l’ensemble de ses serveurs localisés en Suisse, le site avait dû répondre à 120 millions de requêtes rien que pour l’année 2016.

Startpage : pour des résultats Google sans livrer vos données personnelles 

Les serveurs de Startpage se situent aux États-Unis et aux Pays-Bas. Ce métamoteur n’est qu’une semi-alternative à Google, dans la mesure où il calque ses réponses sur celles de Google Search. Cela étant, les résultats qu’il affiche sont filtrés à travers un proxy gratuit, afin que votre adresse IP reste dissimulée.

 

Pour cela, il suffit d’utiliser le mode “Anonymous View” qui lance Ixquick-proxy dès que vous cliquez dessus. À l’instar des outils de recherche cités précédemment, il n’utilise pas non plus de cookie. En d’autres mots, c’est un moyen d’utiliser Google sans laisser vos données personnelles circuler sur le web.

 

Enfin, ce métamoteur spécialisé dans la protection de la vie privée fonctionne avec tous les navigateurs.

Moteurs de recherche alternatifs écologiques et solidaires

Bien qu’ils émergent à peine, il en existe déjà plein (.blue, Discodium, Ecolee, Ekoru, OceanHero) ! L’idée paraît simple, mais assez brillante : faire en sorte qu’un geste quotidien ait un impact humanitaire et/ou environnemental positif.

 

En puisant dans leur chiffre d’affaires, ces entreprises parviennent à planter des arbres, protéger des océans, ou encore aider la recherche contre les maladies graves. Seul bémol : l’efficacité n’est pas toujours au niveau du tentaculaire Google.

 

Malgré ce retard technique, la plupart de ces outils de recherches respectent le plus possible la vie privée des utilisateurs, à l’instar de Qwant ou de DuckDuckDo.

Lilo : une goutte d’eau humanitaire pour chaque requête

Commençons avec un moteur de recherche français connu sous le nom de Lilo. Le groupe se présente comme un moyen de financer des actions de solidarité sans que vous dépensiez un euro.

 

Il peut s’agir de sauver des forêts, de protéger des animaux, de lutter contre des maladies, de défendre des zones défavorisées de la population humaine mondiale, etc. Chaque requête vous rapporte une “goutte” que vous attribuez au projet qui vous intéresse.

 

À l’heure actuelle, 3 millions d’euros auraient déjà été distribués à des associations. Autre avantage : vos données personnelles ne sont pas enregistrées par l’outil de recherche.

 

L’inconvénient, c’est que vous aurez encore régulièrement envie de switcher sur Google afin d’avoir une plus grande finesse/rapidité dans les résultats offerts.

Ecosia : des millions d’arbres déjà plantés par ses utilisateurs

Contrairement à Lilo, qui se veut généraliste sur les actions solidaires, Ecosia, actif depuis 2009, se concentre sur la plantation d’arbres. S’émanciper de Google reviendrait alors à lutter contre la déforestation avec ce moteur de recherche allemand.

L’idée, qui vient de Christian Kroll, est d’utiliser les bénéfices des publicités hébergées par l’outil de recherche pour financer cette interminable quête.

 

En revanche, il s’agit d’un métamoteur, lequel dépend totalement de Microsoft Bing. Cela étant, la firme assure supprimer les données personnelles des utilisateurs au bout d’une semaine, sans les avoir vendues ou communiquées. En outre, elle anonymise les adresses IP, pour un relatif respect de la confidentialité de votre vie privée.

Ecogine : pour lutter contre l’empreinte carbone de la recherche web

Et voici un autre moteur de recherche français, né en 2008, à l’école d’ingénieurs Polytech Nantes : Ecogine ! Là où Ecosia ne prend qu’une partie de ses bénéfices pour planter des arbres, Ecogine pousse le bouchon plus loin.

 

Ne fonctionnant qu’avec des bénévoles, cette alternative aux gros moteurs de recherche soutient des associations avec la totalité des bénéfices provenant de la publicité. Autre particularité : un compteur vous informe de la quantité de CO2 émis à chaque requête.

 

Cela permet la prise de conscience en temps réel de notre impact environnemental. Ce compteur sert en quelque sorte de quota : on compense la pollution d’internet en finançant des projets écologiques internationaux (avec Pur Projet, par exemple).

 

Le calcul de l’empreinte carbone tient compte des infrastructures, des centres de données et des appareils mis en jeu pour effectuer une recherche. En moyenne, une requête équivaudrait au rejet de 10 g de CO2

.

OceanHero : les internautes au secours du monde océanique

Les océans font partie des grandes préoccupations écologiques, avec l’apparition inquiétante de continents plastiques. En conséquence, OceanHero se concentre sur la partie bleue de notre planète.

 

À l’instar de Lilo et d’autres outils de recherches comme Qwant, elle peut être ajoutée en extension de Chrome. Pour la suite, le principe est à peu près le même que les moteurs de recherche présentés plus haut. Pour vous faire un ordre d’idée, OceanHero assure que cinq requêtes valent une bouteille de plastique retirée des paysages marins.

 

D’autre part, votre vie privée est protégée, car vos recherches ne sont pas suivies ; elles sont même cryptées en SSL. Quant à vos données personnelles, elles ne sont jamais exploitées par des tiers.

Moteurs de recherches scientifiques

Creusons plus avant dans le potentiel énorme des moteurs de recherches ! Ceux qui vont suivre sont spécialisés dans un domaine en particulier. C’est une excellente manière de trouver des innovations en matière de pertinence et d’affichage de contenu.

 

De quoi s’émanciper un peu plus des grands leaders du marché en devenant encore plus exigeants sur la qualité des informations que l’on nous délivre !

 

Ici encore, la liste ne saurait être exhaustive. On citera néanmoins Boardreader, spécialiste des forums, Eidtis, consacré à l’édition, MyScienceWork ou encore FreefullPDF, pour des contenus plus ou moins académiques.

Isidore : pour du contenu pertinent en sciences humaines et sociales

Isidore se présente comme une plateforme de recherche permettant d’accéder à des contenus en sciences humaines et sociales sous forme de données numériques.

 

Ce service moissonne donc des quantités de notices, de corpus, de publications, de métadonnées, etc. issus de l’actualité scientifique. En revanche, Isidore ne collecte que des pages en français, anglais ou espagnol.

 

Une fois ces données moissonnées, elles sont enrichies à travers des croisements avec des référentiels métier ou produit, mais aussi par l’intervention de la communauté universitaire et scientifique.

 

Ces enrichissements de l’information ont pour objectif d’établir un lien significatif entre les données disponibles. De quoi approfondir certains débats en répondant à des questions factuelles, ou vous offrir les vérifications nécessaires à la publication d’un bon article !

CiteSeerx : un accès privilégié au monde académique de la science

Cite Seer X ressemble un peu à Isidore dans la mesure où il est dédié à l’information à portée scientifique.

 

Ce moteur de recherche sert donc également de librairie numérique (notamment grâce au logiciel libre SeerSuite), pour un contenu sous forme d’articles académiques.

Précisons que le domaine de recherche le plus sérieusement suivi demeure l’informatique.

 

Sans surprise, un tel outil de recherche a été élaboré par des chercheurs du Penn State College of Information Sciences and Technology. Ainsi, Isaac Concill et Lee Giles ont créé CiteSeer X afin de réunir des informations précises et rigoureuses, faisant autorité dans le monde scientifique.

 

On y accède notamment par le biais d’un index de citation. Cela permet de retrouver des articles entiers à partir d’une formule ou d’une phrase glanée dans un cours ou dans un livre !

WolframAlpha : répond à vos questions et satisfait votre curiosité

WoframAlpha tire son nom de Stephen Wolfram, un physicien responsable de la création de Mathematica, logiciel de calcul.  WolframAlpha est un exemple très abouti d’intelligence artificielle, puisqu’il est capable de rassembler, de croiser et d’exposer des informations en les synthétisant.

 

Les internautes obtiennent ainsi des « fiches pratiques » sur des contenus issus du monde scientifique. Cela peut concerner les mathématiques, la physique-chimie, la biologie ou encore la géopolitique. Du tableau périodique des éléments aux chromosomes humains, en passant par la démographie de telle population en telle année, les internautes y puisent autant d’informations fondamentales que d’anecdotes intrigantes !

 

À essayer dès qu’une question vous taraude…

Moteurs de recherches à l’adresse des professionnels en entreprise

Avec ce type de contenu, on arrive de plus en plus à un public de niche…

 

Mais il n’est jamais trop tôt pour se familiariser avec les outils conçus pour les collaborateurs d’entreprises !

 

Notamment pour ceux qui ont l’habitude de manipuler de la data, il semble indispensable d’en connaître au moins un ! Outre les trois que nous présentons ci-dessous, citons Oracle et Varonis comme des références à garder sous le coude.

Basedig : une mine d’informations pour les entreprises

Le rôle que s’assigne Basedig est de recueillir de l’Open Data (données publiques) sous tous les formats possibles. Cela peut s’appliquer, entre autres, à la maintenance prédictive et l’analyse des performances commerciales des entreprises.

 

Indexées puis stockées sur la plateforme de recherche, les données et métadonnées sont délivrées sous un format unique. Le mode recherche est classique : des requêtes sous forme de mots-clés. Puis, lorsque vous trouvez une réponse pertinente, vous pouvez la télécharger en Excel, CVS ou encore JSON.

 

Question technologie, les librairies de Basedig exploitent une intelligence artificielle performante en apprentissage et en prise de décision.

Datafari : autre spécialiste de l’information data

À l’adresse des entreprises, Datafari propose les mêmes services que son homologue évoqué un peu plus haut. Moteur de recherche multisource et multiformat, il assure également un haut niveau de sécurité des données.

 

C’est un outil qu’il faut prendre en main petit à petit, qui permet, entre autres de :

  • effectuer une recherche simple ou avancée ;

 

  • filtrer les résultats ;

 

  • faire une liste de favoris ;

 

  • configurer des notifications par mail à la modification de documents correspondant à une requête antérieure ;

 

  • gérer le classement et l’affichage des fichiers ;

 

  • créer des utilisateurs afin de leur attribuer une tâche ;

 

  • accéder aux statistiques d’utilisation de l’outil de recherche ;

 

  • générer des promoliens (à l’instar de Google AdWords).

 

 Exalead : répond aux questions des entreprises

L’on doit la création d’Exalead aux responsables du développement d’AltaVista. Un moteur de recherche d’entreprise pour le moins performant puisqu’il dépassait largement les 15 milliards de pages indexées en 2010.

 

Son utilisation se destine à des applications métiers répondant à des problèmes correspondant à la réalité du terrain. Ainsi, contrairement à Datafari et Basedig, il ne se présente pas comme un généraliste de la data. Sa technologie est entièrement tournée vers l’utilisation métier.

 

Au même titre qu’Isidore ou WolframAlpha, il enrichit le contenu qu’il indexe dans sa base de données. Les fichiers de même catégorie sont donc liés entre eux, afin que l’information soit facile à dégager des documents proposés en réponse.

Outils de recherche d’images

L’on est régulièrement en recherche d’images lorsqu’on rédige des articles, ou qu’on tient simplement un site internet.

Parfois, le problème de droits d’auteur se pose avec les contenus de Google, de Bing ou de Yahoo !

 

Nous avons donc trouvé trois moteurs de recherche spécialistes des images dont les fonctionnalités pourraient vous être utiles.

Pisearch : des millions d’illustrations à filtrer facilement

Picsearch est un classique, un moteur de recherche répertoriant plus de 3 milliards d’images.

Sa recherche avancée permet de filtrer les photos et autres illustrations par couleur, par taille, par orientation, etc.

 

Toutefois, vous ne tomberez pas automatiquement sur des images libres de droits. En outre, les mots-clés de longue traîne peuvent encore lui poser quelques problèmes…

TinEye : le moteur de recherche inversé

Ce qui est intéressant avec Tineye, c’est sa technique d’identification d’image. On le considère comme un moteur de recherche inversé, puisqu’au lieu de vous proposer des illustrations en réponse à votre requête, c’est vous qui fournissez l’image en question.

 

S’il la reconnaît parmi les plus de 2 milliards déjà indexées, il sera en mesure de vous fournir les URLs qui l’utilisent. Parfait pour vérifier certaines sources ou pour simplement obtenir la même image en meilleure qualité !

CCsearch : offre aux internautes des images libres de droitst

Ce moteur-ci vous sera d’une grande aide si vous manquez d’illustrations libres de droits.

 

Qu’il s’agisse d’œuvres peintes ou numériques, de dessins ou de photos, vous n’aurez pas nécessairement besoin d’autorisation pour les modifier, les distribuer ou les afficher. L’interface de cet outil de recherche est on ne peut plus classique.

 

En option, vous aurez accès à des filtres pour n’obtenir que des illustrations sans contraintes de droits d’auteur. Enfin, en vous faisant un compte, vous aurez la possibilité de dresser des listes d’images, à taguer ou à désigner comme favoris.

Bonus : Aleph, un moteur de recherche Deep et Dark Web

Pour finir sur une note plus pimentée, il nous paraissait intéressant de parler d’Aleph Search Dark. Ce moteur de recherche a pour vocation d’aider à mieux connaître la partie immergée de l’iceberg web.

 

Aussi indexe-t-il des pages dédiées aux trafics d’armes, de drogue, etc.

 

Aleph indexerait presque la totalité du dark web en 70 langues, ce qui semble pour le moins faramineux. En principe, les utilisateurs utilisent The Onion Router ou I2P, mais il faut une URL exacte.

 

Aleph est donc un outil dangereux, mais ses créateurs refusent plus d’un tiers des demandes de leur logiciel.

 

En effet, la question éthique est plus que jamais brûlante avec un tel instrument de recherche.

 

Toutefois, Aleph peut s’avérer très utile pour les institutions chargées de la défense nationale. À ce propos, et pour l’anecdote, cette sulfureuse création est d’origine française !

Les moteurs de recherche : un choix peu anodin ?

À travers cet article, vous aurez pu entrapercevoir les hauts moyens technologiques mis en œuvre pour que vous puissiez trouver la boulangerie la plus proche d’un Airbnb préalablement réservé sur le web.

 

Vous aurez également une idée plus concrète des influences géopolitiques que peuvent avoir les grands détenteurs de l’information instantanée, mais également leur impact environnemental. Quant à la pertinence des résultats pour satisfaire votre curiosité, nous avons pu constater qu’elle pouvait dépendre du support choisi.

 

En effet, ouvrir son ordinateur ne doit-il pas vous laisser le choix de trouver autant ce qui vous plaît que ce que vous avez besoin de savoir ?

Et de le faire en mesurant et en contrôlant mieux les avantages, mais aussi les coûts (sur l’environnement ou sur votre vie privée) d’un si vaste savoir encyclopédique littéralement à portée de main ?

FAQ 

Quelle est la différence entre un moteur de recherche et un navigateur web ?

Les navigateurs sont des logiciels vous permettant de vous rendre sur internet. Ils se composent généralement d’une interface constituée d’une zone d’affichage, d’un menu, une barre d’adresse et une barre de favoris.

 

Quant aux moteurs de recherche, leur rôle est de plonger dans un océan de contenus, accessibles via des URLs. Ensuite, ils font remonter à la surface ce qu’ils ont trouvé de mieux. Les résultats sont alors triés et alignés verticalement.

 

En résumé, les moteurs de recherche sont aux navigateurs web ce que les filets de pêche sont aux bateaux (en bien plus intelligents quand même!.)

Comment modifier son moteur de recherche par défaut sur un navigateur web ?

C’est quelque chose que l’on peut faire avec Chrome, Firefox, Safari, etc. De façon générale, les étapes se ressemblent : il vous faut ouvrir le menu de votre navigateur, puis aller dans les paramètres (ou options).

 

Ensuite, il vous suffit de trouver la section “moteur de recherche” (ou “Search Engine”) afin d’y choisir ce que vous préférez entre Duckduckgo, Qwant ou encore Ecosia, etc. Le procédé est à peu près le même sur smartphone.

Quel est le meilleur moteur de recherche alternatif à Google ?

Si votre idée est de boycotter Google pour une raison ou pour une autre, la réponse est pour le moins radicale : tous les autres moteurs seront adéquats ! Nous vous conseillons néanmoins d’en utiliser plusieurs, en fonction de vos besoins immédiats.

 

Pour des réponses pointues, tentez CiteSeer X ou les autres moteurs de recherche scientifiques que nous avons listés dans notre article. Pour protéger votre vie privée, essayez plutôt DuckDuckGo ou Qwant.

 

Il en existe pléthores d’autres, dont nous citons une partie dans notre classement.

Enfin, concernant les petites recherches du quotidien, pourquoi ne pas opter pour un outil de recherche solidaire, comme Lilo ou Ecosia ?

Quid des moteurs de recherche pour enfants ?

Il n’est guère rassurant d’imaginer son enfant tomber sur des résultats scabreux, voire dangereux pour lui. En effet, les mots-clés les plus anodins peuvent comporter des ambiguïtés.

 

D’ordinaire, on active le contrôle parental, mais d’autres options existent. À ce titre, les moteurs de recherche pour enfants reposent sur l’élaboration manuelle de listes blanches.

 

À l’inverse des listes noires, elles sélectionnent uniquement les contenus adaptés aux mineurs. C’est un moyen bien meilleur moyen que d’établir une liste noire à jamais incomplète. Ce sont des employés humains qui effectuent des ajouts et des vérifications régulières.

 

L’on tiendra ainsi compte non seulement du type de contenu, mais également des offres commerciales et de la protection des données, afin de préserver les internautes mineurs des premiers dangers du monde du web.