logo-cnrs.jpg
mininist.gif
test_titre.gifContact benchmarking

Fiche de test de LexiquestMine

LexiquestMine
2.2
5000 références bibliographiques
11-01-2006

Questions générales concernant le thème OGM

Nombre de 'Oui' = 5
Nombre de 'Oui difficilement' = 0
Nombre de 'Non' = 0
Nombre de 'Sans objet' = 5
Nombre total de questions = 10

Questions générales concernant le thème OGM

Oui
Oui
Sans objet
Oui
Oui
Évolution et nouveautés

Sans objet
Oui
Sans objet
Sans objet
Sans objet

1. Auteurs
Des extractions de termes pas toujours compréhensibles notamment dans le cas de notices bibliographiques. Ex. Présence de « Lee » dans la liste, alors qu’il est toujours suivi d’un prénom ou d’initiales. Serait-ce dû à une lemmatisation systématique ?
Certains noms avec traits d’union ne sont pas extraits ex. LEE (Virginia M.-Y.) LEE (J.-M.)

2. Réseaux d'auteurs
La visualisation des réseaux s’effectuant à partir de la sélection d’un auteur, on ne peut répondre à cette question de manière directe et rapide

3. Réseaux d'auteurs les plus productifs
On sélectionne le ou les auteurs les plus productifs pour voir leurs réseaux mais ce ne sera pas forcément les réseaux les plus productifs.
A partir de l’écran affichant les coauteurs, on fait apparaître les liens entre les auteurs mais en sélectionnant coauteur par coauteur.

4. Organismes
Plusieurs affiliations sont tronquées (ex. "University of Tokyo" pour Department of Physiological Chemistry and Metabolism, Graduate School of Medicine, The University of Tokyo, ou pour Department of Neuropathology and Neuroscience, Graduate School of Pharmaceutical Sciences, University of Tokyo, 7-3-1 Hongo.

La suppression de toute ponctuation dans les champs permet d’avoir une seule entrée pour plusieurs noms d’organismes commençant de manière identique (ex. « institute of genetics and developmental biology chinese academy of sciences a une seule entrée pour « Institute of Genetics and Developmental Biology, Chinese Academy of Sciences » et « Institute of Genetics and Developmental Biology, Chinese Academy of Sciences, Datun Road, Building 917 »). Par contre, d’autres entrées existent pour « National Key Laboratory of Plant Genomics, Institute of Genetics and Developmental Biology, The Chinese Academy of Sciences », « National Key Laboratory of Plant Genomics, Institute of Genetics and Developmental Biology, Chinese Academy of Sciences », « Plant Biotechnology Laboratory, Institute of Genetics and Developmental Biology, Chinese Academy of Sciences », « Institute of Genetics and Developmental Biology, CAS ».

"Pathology" apparaît dans la liste des organismes : Il semblerait qu’à partir du moment où un terme est extrait, son marquage sera lié à la fréquence d’apparition du terme dans le champ retrouvé.

5. Pays
Etats-Unis, Royaume-Uni, Pays-Bas n'apparaissent pas : serait-ce lié au trait d'union ?
New York et Europe présents en tant que "location" alors qu’ils ne sont pas dans le champ consacré.

6. Nombre de publications par année
La fonctionnalité liée aux « trends » montre l’évolution cumulative et non la production année par année.

7. Nouveaux concepts
Lors du traitement du corpus avec de nouvelles données ou lors de l’utilisation de la fonctionnalité des tendances, les 500 nouveaux concepts sont listés avec leur fréquence mais sans marquage (auteurs, organismes, pays, termes).
Les 500 concepts présents lors du premier traitement du corpus et lors de la mise à jour sont également listés.


Questions relatives à un thème plus précis

Nombre de 'Oui' = 5
Nombre de 'Oui difficilement' = 0
Nombre de 'Non' = 0
Nombre de 'Sans objet' = 5
Nombre total de questions = 10

Questions relatives à un thème plus précis

Oui
Oui
Oui
Oui
Oui
Oui
Évolution et nouveautés

Sans objet
Sans objet
Sans objet
Sans objet
Sans objet

1. Nombre d'articles
Distinguer la fréquence d'occurrence apparaissant entre parenthèse du nombre d'articles répondant à la requête.

2. Organismes
Plusieurs organismes n’apparaissent pas à l’écran alors qu’ils sont effectivement associés au terme « Sécurité alimentaire » dans la notice (ex. Monsanto agriculture France S.A.S, Europarc du chene, 1, rue Pierre-Monod ; University of Nebraska, Lincoln, 143, Food Industry Complex ; Zealand Institute of Gene Ecology, University of Canterbury ; Norwegian Institute of Gene Ecology)
Monsanto co. apparaît à l’écran alors que dans la notice on a Monsanto agriculture France S.A.S, Europarc du chene, 1, rue Pierre-Monod

3. Auteurs
Plusieurs auteurs n’apparaissent pas à l’écran alors qu’ils sont effectivement associés au terme « Sécurité alimentaire » dans la notice et quand on recherche ces auteurs le concept « Sécurité alimentaire » apparaît bien à l’écran (ex. JAFFE (Gregory) ; BANNON (G.) ; HOWLETT (J.) ; PEIJNENBURG (A.) ; DE LATTRE-GASQUET (Marie) )

4. Réseaux d'auteurs
On est obligé de mettre en évidence tous les liens entre chacun des auteurs et d’analyser le nombre d’articles coécrits.

5. Pays
France Allemagne et Italie n’apparaissent pas alors qu’ils sont dans la liste des pays les plus fréquents du corpus.
Etats-Unis, Royaume-Uni et Pays-Bas n’apparaissent pas non plus (problème du trait d’union ?)

6. Nombre de publications par année
La fonctionnalité liée aux « trends » montre l’évolution cumulative et non la production année par année.
Complexité pour mettre les années effectives à la place de la date du traitement des données

7. Nouveaux concepts
On ne peut répondre directement à cette question à moins de voir l’évolution de chacun des concepts-auteurs-organismes et pays associés à « sécurité alimentaire ».
Pour connaître le nombre de documents associé à un terme, il faut effectuer la recherche. Mais cette dernière s’effectue sur toute la notice (ex. pour le pays Egypte, 13 notices sont retrouvées mais 11 sont effectivement écrites par un auteur égyptien, les 2 autres ont Egypte dans la zone des mots-clés.

Questions relatives à un auteur

Nombre de 'Oui' = 5
Nombre de 'Oui difficilement' = 0
Nombre de 'Non' = 0
Nombre de 'Sans objet' = 7
Nombre total de questions = 12

Questions relatives à un auteur

Oui
Oui
Oui
Sans objet
Oui
Oui
Sans objet
Évolution et nouveautés

Sans objet
Sans objet
Sans objet
Sans objet
Sans objet

1. Thématiques
Plusieurs concepts n’apparaissent pas à l’écran alors qu’ils sont effectivement associés, dans la notice, à l’auteur « Strazielle C » et quand on recherche ces concepts, l’auteur « Strazielle C » apparaît bien à l’écran (ex. Animal transgenique, Souris).
Par contre d’autres concepts associés dans la notice à l’auteur « Strazielle C » ne semblent pas avoir été extraits (ex. Etude comparative, Etude experimentale, Perception espace, Orientation spatiale, Angoisse anxiete, Cytochrome, Activite enzymatique, Activite motrice spontanee, Locomotion)

2. Pour quel organisme travaille-t-elle ?
On ne peut réponde directement à cette question à moins qu’au sein de la notice le lien entre l’auteur et l’affiliation soit mentionné

3. Organismes avec lesquels elle travaille
Plusieurs organismes n’apparaissent pas à l’écran alors qu’ils sont effectivement associés, dans la notice, à l’auteur « Strazielle C » (ex. Universite de Rouen, Faculte de Medecine et de Pharmacie, 22 bld Gambetta, INSERM EMI 9906. IFRMP 23, Batiment de Recherche, Salle ID18 ; Department of Genetics, University of Alabama at Birmingham, School of Medicine and Dentistry)

Plusieurs affiliations sont tronquées (ex. universite henri poincare nancy i laboratoire de pathologie moleculaire et pour Universite Henri Poincare, Nancy I, Laboratoire de Pathologie Moleculaire et Cellulaire des Nutriments (EMI-INSERM 0014) and Service de Microscopie Electronique, Faculte de Medecine)

4. Nationalités des organismes
Seule la Suisse apparaît
Plusieurs pays n’apparaissent pas à l’écran alors qu’ils sont effectivement associés, dans la notice, à l’auteur « Strazielle C » et quand on recherche ces pays, l’auteur « Strazielle C » apparaît bien à l’écran (France, Canada,
A l’écran, Etats-Unis n’apparaît pas comme étant associé à Strazielle C. alors qu’il est associé dans des notices

4. Pays pour lequel elle travaille
On ne peut réponde directement à cette question à moins qu’au sein de la notice le lien entre l’auteur et l’affiliation soit mentionné

Questions relatives à un organisme

Nombre de 'Oui' = 1
Nombre de 'Oui difficilement' = 0
Nombre de 'Non' = 3
Nombre de 'Sans objet' = 5
Nombre total de questions = 9

Questions relatives à un organisme

Oui
Non
Non
Non
Évolution et nouveautés

Sans objet
Sans objet
Sans objet
Sans objet
Sans objet

1. Laboratoires CNRS
Certains organismes ne sont pas extraits (ex. Laboratoire d'Immunologie, CNRS UMR 6101, Faculte de Medecine, Universite de Limoges, 2 rue du Dr Marcland).
Des noms d'organismes sont tronqués (ex. "genethon/centre national de la recherche scientifique cnrs unite mixte de " pour genethon/centre national de la recherche scientifique cnrs unite mixte de la recherche scientifique (umr) 8115)
2. UMR 5004
Les croisements entre un organisme et des termes, pays sont possibles mais la recherche sur une chaîne de chiffres ne semblent pas fonctionnée.

Questions relatives à un pays

Nombre de 'Oui' = 5
Nombre de 'Oui difficilement' = 0
Nombre de 'Non' = 0
Nombre de 'Sans objet' = 6
Nombre total de questions = 11

Questions relatives à un pays

Oui
Oui
Sans objet
Oui
Sans objet
Oui
Oui
Évolution et nouveautés

Sans objet
Sans objet
Sans objet
Sans objet

1. Thématiques
Plusieurs termes n’apparaissent pas à l’écran alors qu’ils sont effectivement associés, dans la notice, au pays « France » mais quand on recherche ces concepts, le pays « France » n'apparaît pas à l’écran (ex. Laine ; Production animale ; Qualite production ; Gene majeur ; Locus quantitatif).
Par contre d’autres termes associés dans la notice au pays « France » ne semblent pas avoir été extraits (ex. Gitelman syndrome)

2. Auteurs français
On ne peut réponde directement à cette question à moins qu’au sein de la notice le lien entre l’auteur et l’affiliation soit mentionné.

3. Auteurs français et étrangers
Plusieurs auteurs n’apparaissent pas à l’écran alors qu’ils sont effectivement associés, dans la notice, au pays « France » mais quand on recherche ces auteurs, le pays « France » n'apparaît pas à l’écran (ex. BLANCHARD ; ROUX ; PIETRI ...).
Par contre d’autres auteurs associés dans la notice au pays « France » ne semblent pas avoir été extraits (ex. NICOLET-BAROUSSE ; BLOCH-FAURE : serait-ce lié au trait-d'union)

4.Organismes français et étrangers
Certains organismes ne sont pas extraits (ex. Departement de Physiologie, Hopital Europeen George Pompidou, Institut National de la Sante et de la Recherche Medicale INSERM U.652, IFR 58, Universite Paris V).
Des noms d'organismes sont tronqués (ex. Universite Henri Poincare, Nancy 1, Laboratoire de Pathologie Moleculaire et Cellulaire en Nutrition (EMI-INSERM 0014) and Service de Microscopie Electronique, Faculte de Medecine)

5. Pays
Les Etats-Unis et l'Italie n'apparaissent pas alors qu'ils sont dans les notices associés à la France




Plusieurs fonctionnalités intéressantes notamment les croisements entre index facilement manipulables et l'évolution dans le temps d'un concept.
Pour ce dernier point, il faut cependant souligner qu’il ne s’agit pas de la visualisation de la progression annuelle d’un concept, mais de sa progression cumulative.
La principale gêne, notamment pour des données structurées comme les notices bibliographiques, est de ne pas retrouver les concepts extraits tels qu'ils apparaissent dans la notice (auteurs, organismes) et que le marquage des concepts ne respecte pas le champ d'où le concept a été extrait (ex. New-York est marqué comme "location" suivant les règles de Lexiquest Mine alors que nous souhaitons avoir dans les locations les termes extraits du champ bibliographique "pays" ; Pathology qui parce qu'il apparaît plus fréquemment dans la zone de l'organisme obtient ce marquage alors qu'il devrait être considéré comme un terme)

Quant à la lemmatisation, elle est parfois trop abrupte et l'on souhaiterait qu'elle ne fonctionne pas surtout sur des zones contrôlées.
De plus, les modalités de recherche ne sont pas évidentes : "secu" ne permet pas de lister les termes commençant par "secu" par contre sec5rive a permet de lister les termes commençant par securite a ; autre inconfort : le résultat de la recherche "lee y" affiche l'ensemble des concepts comportant lee par ordre alphabétique dont "lee y c" mais qui est loin derrière "chun geun lee" premier concept retrouvé.

Autres problèmes :
difficulté à extraire les concepts avec traits d'union.
tous les concepts ne sont pas associés à l'écran alors qu'ils le sont dans les notices