logo-cnrs.jpg
mininist.gif
test_titre.gifContact benchmarking

La fiche descriptive de LexiQuest Mine

IdentitéGénéralitésFonctionnalitésCommentaire du testeur

Identité

LexiQuest Mine est un logiciel de type analyse.
Il s'agit d'un logiciel commercialisé.
DescriptionOutil de fouille de texte s'appuyant sur des techniques linguistiques et statistiques, il identifie des concepts, leurs relations, leur évolution de manière graphique (mise en évidence de réseau d'auteurs, d'organismes, de pays, de relations thématiques)
Nom de la société éditriceSPSS
ContactLa Défense 4, 20 av André Prothin Tour Europlaza
5 ème étage
92927 Paris-La-Défense Cedex
France
Tel : 00.33.1.41.97.36.00
Mail : contactsfr@spss.com
Url : http://www.spss.com/fr/produits_solutions/Data_Text_Mining/Lexiquest_Mine.htm
Type de testLogiciel testé par le service Veille le 12-10-2005 sur un logiciel acheté
Version d'essaiLa version concernée est le(la) 2.2.
Comparatifs des versionsPas d'information

Généralités

Prix -
Aide en ligneManuel d'utilisation
Support techniquePrésent
Prérequis techniqueWindows NT Server 4.0 (Service Pack 6 or later) + Index Server
Windows 2000 Server SP2
Winsows XP Pro
Solaris 2.6 (or later)
Linux Red Hat 6.x
Internet Information Server 3, 4, 5
Apache 1. 3. x
Netscape Enterprise Server 3, iPlanet Web Server
Microsoft Internet Explorer 4.0 (or later) with the Java Virtual Machine (not included anymore in IE6)
Netscape Navigator 4.0 (or later)
Mode client/serveur
InstallationInstallation assistée sur monoposte
AdministrationModérée

Autre information : Mise en place des Trends (évolution des termes) et des agents (possibilité d’enregistrer des requêtes pour les relancer lors d’une mise à jour du corpus) loin d’être évidente.

Qualité de l'interface Homme/MachineL’interface est relativement intuitive au niveau de l’utilisation finale sauf peut-être pour les Trends.
UtilisationFacile
MultilinguismeLangues :
  • Français
  • Anglais
  • Allemand
  • Espagnol
  • Italien
Autres languesPas d'autres langues
Pas de cross-language

Reconnaissance automatique des langues effective

Informations supplémentairesDans la version 3.1 un couplage avec la version 3.0 de la technologie SMTS de Language Weaver permet de traiter et de restituer en anglais des documents source en arabe, chinois, néerlandais, français, allemand, italien, japonais et espagnol.
Replier

Fonctionnalités

Documents Requête Collecte Analyse Diffusion
Documents
Type de documents
  • Structuré
  • Non structuré
Formats des documents traités
  • TXT
  • HTM
  • XML
  • PDF
  • Microsoft Office
Formats d'export
  • HTM
Informations supplémentairesSont déchargeables en format html :
1.les listes de concepts extraits suite au traitement ;
2.la liste des concepts associés à un concept sélectionné (avec indication de leur nature et de leur poids).
Requête 
Taille de requêtePas d'information
Taille en nombre de caractèrespas d'information sur la taille en nombre de caractères
Requête
  • Opérateur(s) de proximité
  • Opérateur SAUF
  • Expression exacte
Informations supplémentairesLe moteur de recherche propre à l'outil, Mine Search, ne propose que les opérateurs NOT et NEAR. Avec sa logique d’aide à la formulation de requête, on ne peut rédiger directement sa requête pour effectuer une recherche sur le corpus traité : on est obligé de sélectionner des concepts. La recherche sur un chiffre ne fonctionne pas.
Remarque pour les documents structurés : si, par exemple, vous sélectionnez le concept pays d’affiliation France, la recherche sera par la suite effectuée sur toute la notice et non pas seulement sur le champ du pays d’affiliation. Dans le résultat de la requête, vous retrouverez ainsi des documents avec le concept France dans la zone affiliation et/ou dans toute autre zone.
Il faut souligner la possibilité de lancer des recherches sur différents moteurs et bases de données AltaVista, Google, Yahoo, Agris, PubMed … La rédaction de la requête est alors liée à la logique du moteur sélectionné.
Collecte 
Type de collectePas d'information sur la collecte
Informations supplémentairesPas d'information supplémentaire concernant la collecte
Analyse 
Analyse statistique
  • Comptage d'occurrence en intrachamp (référence bibliographique)
  • Comptage de cooccurrence en intrachamp (référence bibliographique)
  • Comptage d'occurrence en interchamps (référence bibliographique)
  • Comptage d'occurrence (texte integral)
  • Comptage de cooccurrence (texte integral)
Informations supplémentaires3 algorithmes sont proposés : organize (calcul d'occurrence), discover (Cij²/Ci*Cj où i et j sont 2 termes ; la représentation graphique met en évidence les relations exclusives entre 2 termes), track (Cij²/Ci*Cj ; la représentation graphique met en évidence des relations rares).
Analyse linguistique
  • Analyse lexicale
  • Analyse syntaxique
  • Extraction terminologique
  • Gestion de dictionnaires
  • Recherche entités nommées
Informations supplémentairesPrésence du Mesh comme ressource terminologique. Possibilité d’en intégrer d’autres.
8 structurations possibles de l'information : termes, personnes, organismes, produit, localisation, non linguistiques comme les numéros de téléphone, concepts personnels, inconnus.
CatégorisationPas de catégorisation
ClassificationIl s'agit d'une classification hiérarchique
Diffusion 
DiffusionPas d'information sur la diffusion
Informations supplémentairesPas d'information complémentaire sur la diffusion
Représentation graphique
  • Cartographie
  • Courbes de tendances
Informations supplémentairesLes relations entre chaque type de concepts sont visualisables (association entre un auteur/organisme/pays et des thématiques, coopération scientifique au niveau des auteurs/organismes/pays ...).
Les réseaux entre concepts ne se présentent pas automatiquement à l'écran : il faut sélectionner un concept et afficher son réseau.
Dans un premier temps, s’affichent :
les concepts des documents les plus récents (en fonction de la date système) lié au concept sélectionné. Un curseur (storyboard) permet d’augmenter le nombre de documents traités.
les 9 concepts les plus fortement associés au concept sélectionné. Un curseur (signal) permet de réduire ou d’augmenter le coefficient d’association.
Accès aux documentsOui
Replier

Commentaire du testeur

CommentaireLes moins
Certaines lignes de commandes encore nécessaires sous Unix (éclatement d’un corpus de notices en notices, création des agents …) : l’intégration dans une interface plus ergonomique serait la bienvenue !
Quelques soucis avec les traits-d’union : les concepts ne sont pas toujours extraits même dans des documents structurés où l’on précise que la zone auteur correspond à des concepts Personne, que la zone pays d’affiliation correspond à une Localisation.
Encore des soucis avec la taille « forcée » d’un concept, notamment pour les noms des organismes dans une zone prédéfinie d’un document structuré (le concept est scindé).
Les réseaux entre concepts ne se présentent pas automatiquement à l'écran : il faut sélectionner un concept et afficher son réseau.
Les plus
Les 8 propositions de structuration de l’information.
Les combinaisons et relations immédiates entre ces 8 natures de concept.
Possibilité d’intégrer ses propres règles d’extraction d’entités nommées.
Replier