logo-cnrs.jpg
mininist.gif
test_titre.gifContact benchmarking

La fiche descriptive de KeyWatch

IdentitéGénéralitésFonctionnalitésCommentaire du testeur

Identité

KeyWatch est un logiciel de type intégré.
Il s'agit d'un logiciel commercialisé.
DescriptionKeyWatch permet de :
- gérer et collecter tous types de sources ;
- détecter les modifications et les nouveautés apparues sur les sources (production d'un comparatif entre l'information à T, T+1, T+n) ;
- interroger et mettre en évidence les termes recherchés ;
- produire des alertes et alimenter des portails en temps réel ;
- accéder de manière permanente aux documents originaux.
- créer et gérer des profils personnalisés correspondant à des requêtes précises sur une ou plusieurs bases ;
- mettre en évidence, à l’aide d’un traitement statistique et de cartographie, les relations existant entre différents champs de données structurées (forums, brevets, notices bibliographiques).
- créer des rapports de veille de manière automatisée ou semi-automatisée
Nom de la société éditriceiScope
Contact19-21, rue Valette
75005 Paris
France
Tel : 01 45 84 29 24
Mail : info@iScope.fr
Thierry.Regnier@iscope.fr
Url : www.iScope.fr
Type de testLogiciel testé par le service Veille le 01-02-2006 sur un logiciel acheté
Version d'essaiLa version concernée est le(la) 2.5.
Comparatifs des versionsPas d'information

Généralités

PrixPlus de 10000 euros pour du multiposte
Informations supplémentaires sur le(s) tarif(s)

Le prix exact est de 15000 €.
- logiciel avec / sans le module statistique : il n'y a aujourd'hui qu'un tarif global pour la plate-forme.

- "simple" service ASP : environ 1.000 euros/mois selon les prestations associées.

- formation : 760 euros par jour

- "service après vente" : les développements spécifiques, aménagements, identification et paramétrages de sources sont facturés 760 euros homme/jour

- les prestations de conseil, audit ... sont facturés 1000 euros/mois

Aide en ligneManuel d'utilisation
Support techniquePrésent
Prérequis techniquesous Unix : Linux (Fedora, Redhat, Debian, SlackWare …), SunOS, HP-UX, BSDOS, IRIX, AIX, FreeBSD, OpensBSD, OSF1).
Linux RedHat Enterprise ou Fedora sont fortement conseillés.
Sous Windows NT 4.0 server SP5 ou SP6a,
Windows 2000/2003/Me/XP en version serveur ou station (Windows XP ou 2003 sont recommandés)

- Disque dur de 70 à 160 Go (SCSI 10.000 à 15.000 rpm recommandé)

- 1 à 2 Go de mémoire vive (512 Mo minimum)

- Carte réseau Ethernet et TCP/IP comme protocole de communication
Logiciels

- Un serveur web : apache recommandé, ou serveur web de Microsoft IIS version 4.0 minimum
OpenSSL recommandé ou Microsoft Certificate Server (pour clés SSL
Internet Explorer version 4.0 minimum, Netscape 4.5 minimum, Mozilla 1.5 mimimum
- L'interface graphique utilise Macromedia Flash 5 à 7.
Installation -

Autre information : Installation assistée sous Windows

AdministrationDifficile

Autre information : Difficulté à prendre en main et à comprendre les modalités de fonctionnement du crawler. Les parties consacrées à la constitution des profils, aux statistiques sont plus facilement appréhendables.

Qualité de l'interface Homme/MachineTrès intuitive
UtilisationFacile
MultilinguismeLangues :
  • Français
  • Anglais
  • Allemand
  • Espagnol
  • Italien
Autres langues danois, finnois, néerlandais, norvégien , portugais, suédois
Pas de cross-language

Reconnaissance automatique des langues effective

Replier

Fonctionnalités

Documents Requête Collecte Analyse Diffusion
Documents
Type de documents
  • Structuré
  • Non structuré
Autre information :
Le module statistique ne traite que des documents structurés au format ASCII
Formats des documents traités
  • TXT
  • HTM
  • PDF
  • Microsoft Office
Informations supplémentairesRSS ...
Formats d'export
  • XML
Informations supplémentairesIl n'y a pas de format propriétaire
Requête 
Taille de requête
  • Requête illimitée
Taille en nombre de caractèrespas d'information sur la taille en nombre de caractères
Requête
  • Opérateur AND
  • Opérateur OR
  • Opérateur SAUF
  • Troncature à droite
  • Parenthèses
  • Expression exacte
Informations supplémentairesUne seule ou plusieurs banques de sources peuvent être interrogées. La taille du paragraphe environnant le mot-clé en surbrilance est paramétrable ainsi que le nombre maximum de documents résultats (par défaut, 5000). Il est également possible de gérer "des dictionnaires" de synonymes (dictionnaire général/dictionnaires par bases).
Collecte 
Type de collecte
  • Moteur
  • Surveillance d'une page
  • Détection d'une nouvelle page
  • Détection d'une page supprimée
  • Crawl du site
  • Crawl d'une partie d'un site
  • Crawl à partir d'une Url
  • Crawl d'une liste d'Urls
  • Crawl d'Urls extérieures au site initial
  • Possibilité de paramétrer la profondeur du crawl
  • Possibilité de paramétrer le sens du crawl
Informations supplémentairesUne banque de sources peut contenir jusqu'à 50000 urls.
L'arborescence des pages rapatriées est visualisée.
Les éléments nouveaux, supprimés, modifiés d’une url sont mis en évidence.
KeyWatch gère les formulaires, les pages dynamiques, les authentifications.
Les crawls peuvent être limités à certains types de documents.
Il est possible d’effectuer des crawls à partir d’une requête qui concernera une base de données, un forum identifiés.
Les données locales peuvent également être surveillées.
La mise à jour du lancement du crawl est soit : horaire, quotidienne, hebdomadaire, bi-hebdomadaire, mensuelle.
Si les possibilités du crawler semblent considérables, sa prise en main est loin d’être évidente.
Analyse 
Analyse statistique
  • Comptage d'occurrence en intrachamp (référence bibliographique)
  • Comptage de cooccurrence en intrachamp (référence bibliographique)
  • Comptage d'occurrence en interchamps (référence bibliographique)
Informations supplémentairesPour obtenir les calculs d’occurrences intra champ et les calculs de cooccurrences, il faut créer des modèles en fonction des champs sur lesquels on veut travailler. Même si cet aspect peut paraître dans un premier temps laborieux, il permet une grande souplesse d’utilisation : tous les champs sont traitables sans développement informatique conséquent.
Les calculs interchamps concernent surtout le traitement auteurs-affiliations ; brevets-pays ; email-organisation
Par ailleurs, il faut que le lien entre les champs soient explicités car l'outil établit le lien entre la première occurrence du premier champ et la première occurrence du 2ème champ, la nième occurrence du premier champ avec la nième occurrence du deuxième champ.
Analyse linguistique
  • Analyse lexicale
  • Gestion de dictionnaires
Informations supplémentairesLe moteur gère le stemming. Il est possible de gérer un dictionnaire de synonymes.
CatégorisationPas de catégorisation
ClassificationPas de classification
Diffusion 
Diffusion
  • Par envoi de résultats
  • Par mail
Informations supplémentairesPossibilité soit d'adresser un mél avec lien renvoyant vers la plate-forme soit d’envoyer les documents correspondants
La V2.5 propose un portail personnalisable en fonction de groupe d'utilisateurs
Représentation graphique
  • Tableaux
  • Cartographie
Informations supplémentairesLes représentations graphiques sont claires et les réseaux apparaissent de manière évidente.
Accès aux documentsOui
Replier

Commentaire du testeur

CommentaireIl faut noter que la logique de l’outil est de collecter des pages web à partir d’urls et non à partir d’une requête. Une fois, les pages aspirées on pourra faire les recherches thématiques.

Les moins
Complexité de la prise en main du principal crawler

Les plus
Puissance de l’outil
Interface sobre, intuitive
Les représentations graphiques sont claires et les réseaux apparaissent de manière évidente.
Possibilité d’être couplé à des modules linguistiques comme LexiQuest Mine de SPSS ou Insight Discoverer de Temis.
La réactivité de la société quand on a un problème à résoudre.
Replier