Politiques d'indexation et de gestion du vocabulaire

Ce document est réservé à l'usage du Service des bibliothèques de l'UQAM
et à sa consultation en ligne. Pour toute autre utilisation, veuillez d'abord obtenir l'autorisation.


GLOSSAIRE
Autopostage
Indexation complémentaire d'un document ou d'une question, qui consiste à attribuer automatiquement des descripteurs appartenant aux mêmes chaînes hiérarchiques que les descripteurs attribués directement par l'indexeur. Cette opération peut s'effectuer à l'entrée des documents dans la banque de données en remontant la chaîne hiérarchique, ou bien au moment de l'interrogation de la banque de données en descendant la chaîne hiérarchique (AFNOR 1987).

Bruit
Toute réponse non pertinente à une recherche documentaire (AFNOR 1987).
Le taux de bruit est le % exprimant le rapport entre le nombre de documents non pertinents extraits et le nombre total de documents extraits. Le bruit est l'inverse de la pertinence.

Candidat-descripteur
Mot ou groupe de mots proposé pour une insertion éventuelle dans un thésaurus (AFNOR 1987).

Cohérence
Dans le cas idéal, pour un système donné et dans un environnement donné, l'indexation d'un même document par plusieurs indexeurs devrait être identique, l'indexation de plusieurs documents sur un même sujet devrait être identique, et l'indexation d'un document par un même indexeur à des moments différents devrait être identique. La cohérence est soit conceptuelle (dans l'analyse de contenu, l'identification et la sélection des sujets à indexer) soit terminologique (dans la décomposition des sujets en concepts et dans la traduction en langage documentaire).

Concept
Élément de la pensée, représentation mentale d'êtres ou de choses, de qualités, d'actions, de localisations, de situations, de rapports, etc. le plus souvent exprimés par un terme. (HUDON 1994).
Voir aussi Terme.

Descripteur
Mot ou expression exprimant un concept, figurant dans un thésaurus et utilisé pour représenter le contenu d'un document lors de l'indexation. Est parfois appelé abusivement mot-clé (Chaumier 1988).
Mot ou groupe de mots retenu dans un thésaurus et choisi parmi un ensemble de termes équivalents pour représenter sans ambiguité une notion apparaissant dans un document ou dans une demande de recherche documentaire (AFNOR 1987).

Exhaustivité de l'indexation
Indexation de tous les sujets identifiés dans un document à indexer. L'exhaustivité est l'absence de silence et est fonction du taux de couverture et du taux de rappel du système documentaire (Chaumier 1988).
Qualité de l'indexation dépendant du rapport quantitatif entre les informations effectivement exprimées par tous les éléments d'indexation et celles contenues dans le document (AFNOR 1987).

Facette
Catégorie de notions de même nature ou exprimées d'un même point de vue, telle que phénomène, processus, propriété, outil, permettant un regroupement de notions indépendamment des disciplines traitées (AFNOR 1987).

Indexation
Description du contenu d'un document à l'aide d'un langage documentaire pour faciliter la mémorisation de l'information dans un fichier en vue d'une recherche ultérieure (Chaumier 1988).
Processus destiné à représenter par les éléments d'un langage documentaire ou naturel des données résultant de l'analyse du contenu d'un document ou d'une question. On désigne également ainsi le résultat de cette opération (AFNOR 1987).

Indexation basée sur la requête
Le document est indexé non seulement en fonction de l'environnement d'utilisation mais aussi en tenant compte de certaines requêtes spécifiques qui correspondent à des utilisations spécifiques du document.

Indexation basée sur l'objet
Indexation du document faite en fonction de l'environnement d'utilisation et des besoins de l'ensemble des usagers. Ce type d'indexation favorise une plus grande objectivité et une meilleure cohérence entre indexeurs.

Indexation générique
Le document est indexé d'une façon plus générale que le sujet précis dont il traite (par exemple la classe, la thématique, etc. à laquelle appartient le sujet). Ce type d'indexation favorise le rappel au repérage et une meilleure cohérence entre indexeurs. L'indexation de type générique fait appel à des descripteurs moins spécifiques que les concepts du document à indexer plutôt que d'introduire de nouveaux termes dans la banque. Le niveau de spécificité reste quand même relativement élevé.

Indexation spécifique
Indexation du sujet de la façon la plus précise possible.

Langage documentaire
Ensemble organisé de termes normalisés utilisé pour représenter le contenu des documents à des fins de mémorisation pour une recherche ultérieure. On distingue essentiellement dans les langages documentaire, les classifications et les thésaurus (Chaumier 1988).
Langage artificiel constitué de représentations de notions et de relations entre ces notions et destiné, dans un système documentaire, à formaliser les données contenues dans les documents et dans les demandes des utilisateurs (AFNOR 1987).

Langage naturel
Langage qui évolue et dont les règles résultent de l'usage sans être nécessairement prescrites d'une manière formelle (AFNOR 1987).

Macrothésaurus
Thésaurus couvrant un très large domaine de la connaissance et qui peut servir de point de départ à des thésaurus plus spécialisés (AFNOR 1987).

Méthode analytique
Collecte de termes significatifs du langage naturel dans un domaine déterminé, obtenu par l'analyse de contenu de documents (AFNOR 1987).

Méthode synthétique
(Méthode a priori). Collecte de termes significatifs du langage naturel dans un domaine déterminé, à partir de sources lexicales préétablies (AFNOR 1987).

Mot-clé
Mot ou groupe de mots choisi soit dans le titre ou le texte d'un document, soit dans une demande de recherche documentaire, pour en caractériser le contenu (AFNOR 1987).

Mot-outil
Descripteur qui ne peut décrire une information à lui seul; a pour fonction de préciser un descripteur et doit obligatoirement être combiné avec d'autres descripteurs (AFNOR 1987).

Non-descripteur
Mot ou groupe de mots figurant dans un thésaurus avec interdiction d'emploi et renvoi à un ou plusieurs descripteurs à utiliser (AFNOR 1987).

Note d'application
Brève explication précisant les modalités d'emploi d'un descripteur (AFNOR 1987).

Pertinence
Ce sont les bonnes réponses obtenues par une requête. Le taux de pertinence est le % exprimant le rapport entre le nombre de documents pertinents extraits et le nombre total de documents extraits. La pertinence est l'inverse du bruit.
Voir aussi Précision.

Polysémie
Caractère d'un terme possédant plusieurs sens totalement ou partiellement distincts (AFNOR).

Pondération
Attribution d'un poids ou valeur à un descripteur en fonction de son importance dans le texte indexé (Chaumier 1988b).
Procédé permettant d'attribuer des valeurs relatives aux descripteurs dans l'indexation d'un document ou d'une question (AFNOR 1987).

Postcoordination
Principe suivant lequel les combinaisons entre les descripteurs s'effectuent au cours de la recherche documentaire (AFNOR 1987).

Précision
La précision est une mesure de la capacité du système à retrouver uniquement les documents pertinents.
Voir aussi Pertinence.

Précoordination
Principe suivant lequel les combinaisons entre les termes d'un langage documentaire s'effectuent au cours de son élaboration, par exemple la création des termes composés dans un thésaurus (AFNOR 1987).

Profondeur d'indexation
Qualité conférée à l'indexation, dépendant de la spécificité des éléments retenus pour celle-ci (AFNOR).
C'est le nombre moyen de descripteurs utilisés pour indexer la documentation.

Rappel
C'est le nombre de documents pertinents retrouvés par rapport au nombre total de documents pertinents contenus dans le système.
Pourcentage exprimant le rapport entre le nombre de données pertinentes fournies par un système documentaire en réponse à une question et le nombre de données pertinentes existant dans ce système documentaire (AFNOR 1987).
Il mesure la capacité du système à retrouver tous les documents pertinents. Le rappel est l'inverse du silence

Relation sémantique
Relation unissant les termes entre eux à l'intérieur d'un thésaurus. On distingue en général les relations d'équivalence, de hiérarchie et d'association (Chaumier 1988).

Sélectivité
Indexation de certains sujets identifiés dans un document à indexer: le sujet principal seulement pourrait être indexé.

Silence
Ensemble des documents pertinents qui ne sont pas repérés lors d'une recherche documentaire (Hudon 1994).
Ensemble des références pertinentes qui répondant à une question et existant dans le fichier n'ont pas été extraites lors de l'interrogation (Chaumier 1988).
Dans une recherche documentaire, il y a silence lorsque des documents pertinents répondant à une question et existant dans la mémoire ne sont pas sélectionnés à la suite de l'interrogation (AFNOR 1987).
Il mesure la difficulté du système à retrouver tous les documents pertinents. Le silence est l'inverse du rappel

Spécificité
Voir Indexation spécifique

Terme
Mot ou groupe de mots employé pour représenter une notion (AFNOR 1987).
Mot ou groupe de mots représentant un concept (Hudon 1994).

Terme générique
Descripteur désignant une notion englobant d'autres notions plus fines représentées par des termes spécifiques (AFNOR 1987).

Terme spécifique
Descripteur désignant une notion incluse dans une notion plus large représentée par un terme générique (AFNOR 1987).

Thésaurus
Dictionnaire de termes normalisés, organisés de manière conceptuelle, et reliés entre eux par des relations sémantiques (Chaumier 1988).
Langage documentaire fondé sur une structuration hiérarchisée d'un ou plusieurs domaines de la connaissance et dans lequel les notions sont représentées par des termes d'une ou plusieurs langues naturelles et les relations entre notions par des signes conventionnels (AFNOR 1987).

Thésaurus à termes préférentiels
Thésaurus dans lequel un seul des termes équivalents représentant une notion est utilisé pour l'indexation et la recherche documentaire (AFNOR 1987).

Uniterme
Terme formé d'un seul mot employé pour représenter un concept ou une partie seulement de l'expression d'un concept.
 

© ANALYSE DOCUMENTAIRE  --  Questions et commentaires
(8 février 2006)