Auteur : Jean-René Gonthier

Banques de données et moyen de recherche sur le Net

 

De la BD à l’«engin de recherche»

 

En guise de préambule, signalons d’emblée que nous ne pourrons faire le tour de toutes les banques de données actives sur Internet, ce serait trop conséquent. Aussi, nous limiterons-nous à quelques aspects de celles-ci et des moyens de recherche de l’information sur le Net.
Et pour évoquer la grande diversité des banques de données disponibles. citons en quelques-unes :


Juris Serveur
: Un site français qui rassemble les conventions collectives et les dispositions statuaires relatives à la fonction publique.
http://www.conventionscollectives.com

Texmondo : Banque de données sur les textiles
http://www.texmondo.com

Strategis : Base de données recensant tous les brevets canadiens
http://strategis.ic.gc.ca

Newspaper : L’idéal pour un fournisseur d’information tel qu’un quotidien ou un magazine est de stocker ses données dans un serveur afin de pouvoir en tout temps accéder de façon intelligente à l’information. Sur ce site se trouvent stockés près de 100’000 articles de presse accessibles par mots clés ainsi qu’un total de 130 magazines.
http://www.newspaper.com

BABEL : Un glossaire de termes, acronymes et abréviations couramment utilisés en informatique. Ce recueil est réactualisé trois fois par an.
http://www.access.digex.net/~ikind/babel.html

Alice : La base de données européenne Alice (Adult Learning Information Center Europe) est basée en Finlande (http://www.vsy.fi/alice) et possède aussi un site en Suisse. Il s’agit d’une banque de données au service du secteur de l’éducation non formelle des adultes.
http://www.alice.ch
 
Mieux-Etre international : Cette banque de données est fort utile aux professionnels de la santé, de la psychologie et de l'environnement car elle leur permet de se présenter ainsi que leurs activités.
http://www.parcours.com/

BADAC : Cette banque de données sur les structures des administrations cantonales a élu domicile plus près de chez nous. C’est un service proposé sur le Web par l’Idheap.
http://idheap-badac.unil.ch

Swiss Firmindex : Comme son nom l’indique, c’est un répertoire regroupant toutes les entreprises suisses présentes sur le Net. Ce site quadrilingue possède une classification très fine assurant une recherche des plus pointues.
http://www.firmnet.com

Encyclopédie technique : La recherche dans ce glossaire anglais de termes techniques permet de faciliter la compréhension du jargon électronique et informatique.
http://www.techweb.com/encyclopedia/

Swiss-ModelRepository : En chimie ou en biologie le recensement des molécules et des protéines permet aussi de partager intelligemment les recherches afin de faire avancer la science. Ce site recense en l’occurrence des modèles de protéines.
http://www.expasy.ch

Recherche avancées - projets européens
Avant de passer aux méthodes de recherche pure signalons encore que le KBF, (Office de coordination des participants suisses aux projets de recherches internationaux) met à disposition son serveur pour proposer des thèmes de recherche dans le domaine des techniques de l’information mais aussi pour trouver des partenaires.
Quelques thèmes parmi la trentaine de projets en consultation : le tourisme interactif, les procédés de votation en ligne, réseau global de communication pour PME…
Proposer des idées de recherche :
http://www.idealist.net/psISTdoc/psform.html
Trouver des partenaires : http://www.idealist.net/psIST.html

Source du document


La recherche sur Internet


C’est une évidence : sur Internet on trouve de tout et pour tous les goûts. Mais quand il s’agit de fouiller ce vaste espace, plus d’un surfeur se trouve bien embarrassé. Il n’existe aucun remède miracle, cela se saurait!

Pourtant, pour mener à bien une recherche, disons qu’il faut tout d’abord avoir une idée bien précise du but exact de celle-ci afin de cerner le mot clé le plus pointu. Si ce terme n’est pas répertorié, il faudra alors élargir la quête par le choix d’un mot plus large de sens ou par l’adjonction de plusieurs termes. On optera alors pour une recherche évoluée faisant appel à des opérateurs booléens.

Selon une récente étude menée par l’annuaire allemand «Allesklar» (http://www.allesklar.de), les dix mots de recherche les plus utilisés représentent déjà 15% de toutes les entrées et les 60 plus fréquents un bon quart. La moitié de toutes les requêtes est effectuée avec un vocabulaire de seulement 700 termes. Le résultat le plus fréquemment constaté est frustrant car ce sont généralement des milliers de correspondances plus ou moins vagues avec le domaine recherché qui sont trouvées.

Et pourtant, quelques connaissances de base et un minimum de bon sens suffisent dans de nombreux cas pour obtenir des résultats de recherche utilisables.


 

 


Objectif
premier : ordonner le Net

 
Internet est tellement vaste que de nombreuses organisations ont pris le taureau par les cornes et ont tenté d’y mettre un peu d’ordre. L’objectif, dans la plupart des cas, est purement commercial. C’est par exemple le placement d’une bannière publicitaire si possible en accord plus parfait avec le domaine interrogé.
Deux moyens de recherche totalement différents se côtoient : d’une part les annuaires et d’autre part les moteurs de recherche.
 


Qu’est-ce qu’un annuaire?


Il s’agit d’un outil de recherche qui recense des sites web par des fiches descriptives. Chaque site est référencé par son titre et son URL ainsi qu’un bref commentaire. Dans certains cas, la dernière date de modification du site est aussi incluse. Ce travail de fourmi est essentiellement humain et ne peut guère s’automatiser.
Dans cette catégorie, qui s’apparente à des «pages jaunes du Web», on trouve des sites comme Yahoo qui est l’un des plus connus (http://www.yahoo.com). Si une requête posée sur Yahoo n’aboutit à aucun résultat, le quémandeur se verra dirigé automatiquement vers Inktomi.com, qui, lui, est un moteur de recherche.
Voici encore d’autres annuaires:
Web.de (http://www.web.de),
Allesklar (http://www.allesklar.de),
Dmoz (le petit dernier de Netscape) aussi dénommé «Open Directory Project» (http://www.dmoz.org).

Pourquoi choisir un moteur de recherche?

 
Le concept du moteur de recherche est foncièrement différent de l’annuaire. Il est basé sur l’utilisation d’«espions» ou de robots logiciels (appelés crawlers ou spiders). Ceux-ci examinent le Web à intervalles réguliers et dressent des index.
Dans les moteurs de recherche citons l’incontournable et très performant Altavista de Compaq/Digital (http://www.altavista.com ou http://www.av.com). Ce moteur fait appel au robot logiciel «scooter» pour remettre à jour, toutes les six semaines, son index qui totalise 150 millions de pages. Selon Abondance.com, cet incontournable Altavista sort vainqueur d’un test portant sur les huit principaux moteurs de recherche mondiaux.

Voici donc ce classement général :
Altavista (13,3/20);
Northern Light (13,02/20);
Excite (10,42/20);
HotBot (9,53/20);
Lycos (9,28/20);
WebCrawler (9,15/20);
Voila (8,82/20)
et enfin Infoseek en huitième position avec 8,46 sur 20 points
Voici encore d’autres moteurs de recherche non moins intéressants tels que :
Opentext
(http://indexopentext.com)
et Google, l’un des derniers-nés (http://www.google.com).
Swiss Search (http://www.search.ch),
SwissGuide (http://www.swissguide.ch).
Cette liste, qui n’est évidemment pas exhaustive, est sujette à des évolutions.
 

 

Qui remporte la palme?


Selon une autre source PC Data, pour ne pas la nommer, (http://www.atpcdata.com), une étude semblable a été réalisée au mois de juillet 1999. Et là c’est Yahoo! qui sort vainqueur, suivi par MSN en deuxième position, Lycos en septième et Excite douzième.
Signalons encore que suivant la requête, il est préférable de faire appel à des sites spécialisés. Ainsi si l’on recherche une adresse e-mail aux Etats-Unis, il est préférable de dénicher tout d’abord un annuaire de pages jaunes en entrant les mots-clés «Yellow + Page», puis parfaire la recherche. Si l’on est purement francophone ou que l’on désire connaître une information axée sur la France, la Belgique ou le Québec, il faut alors avoir recours aux moteurs francophones suivants :

Francité (http://francite.com),

Eureka (http://www.eureka-fr.com) ou encore

Lokace (http://www.lokace.iplus.fr), un moteur de recherche qui s’est fait racheter par le groupe Infosources (Infonie).

Il y a encore :
«C’est trouvé» (http://www.ctrouve.com),

Nomade (http://www.nomade.fr)

et enfin Voilà (http://www.voila.fr).


Même des questions
pointues trouvent des réponses


Et si l’on désire poser une question bien spécifique, pourquoi ne pas faire un tour du côté de http://www.cybertrouvetout.com ou tout un chacun peut questionner l’espace cybernétique et espérer, comme dans les «usenet», qu’une bonne âme viendra répondre à la question.

Compuserve, un réseau propriétaire


Ce fournisseur d’accès désormais allié à AOL, et donc à Netscape, conserve en son sein un réseau privé comportant nombre de forums et de banques de données. Mis à part cet antre privatif, Compuserve a aussi un pied sur Internet et là, pour accéder aux innombrables richesses du Net, il exploite les ressources des moteurs de recherche et annuaires suivants:

http://www.swissguide.ch

http://www.search.ch

http://www.altavista.com

http://www.dinoonline.ch

http://www.web.de

http://www.northernlight.com

http://www.yahoo.com

http://www.hotbot

et http://www.lycos.com
(Source : JR Gonthier Edition IB 9/99 avec les données glanées sur le web: