Estructura:


La estructura de un tesauro se basa en los siguientes elementos:
  • Unidades léxicas: Que pueden conformar las siguientes categorías: grupos de descriptores que agrupan los términos bien por campos (temas), o por clases de términos (facetas).
    • Descriptores: Son aquellos términos permitidos. Un descriptor es la palabra o conjunto de palabras del lenguaje corriente que corresponde a un único concepto. Dicho término será utilizado para el análisis y recuperación del documento. Podemos encontrar descriptores construidos por uno o más términos.
      • Términos simples o unitérminos: empleados cuando el concepto es claro en si mismo, sin necesidad de añadir ninguna otra palabra, o cuando se usa como genérico de términos más concretos o específicos. Por ejemplo: Documentos

      • Términos compuestos: La mayoría de los términos de un tesauro adquieren su verdadero sentido cuando se convierten en términos compuestos, ya que así se alcanza una mayor especificidad. Regularmente la estructura sintáctica de los términos compuestos suele ser la siguiente:
        • sustantivo + adjetivo: Documentos Digitales
        • sustantivo + sintagma preposicional: Documentos de archivos
        • sustantivo + sintagma aposicional: Documentos RDF/XML
    • No descriptores: Son aquellos términos que son descartados como descriptores una vez elegido el término que elimine la sinonimia del lengauje natural.
  • Relaciones semánticas: Son aquellas relaciones que se establecen entre los términos de un tesauro. Podemos distinguir las siguientes:
    • Relaciones de equivalencia: derivadas de la gran proximidad fonética o sémica entre los descriptores y no descriptores (sinónimos, cuasi-sinónimos, etc). Este tipo de relaciones se suelen representar mediante el término USE (relación entre el término no preferente y el término preferente, o término a usar más aceptado) y las siglas UP (Usado por), que en inglés son USE y UF. Ejemplo: Dictablanda GOBIERNO BERENGUER. USE GOBIERNO BERENGUER U.P (Usado por) Dictablanda.

    • Relaciones jerárquicas: Son relaciones asimétricas, establecidas entre los descriptores, en las que un término es superior o genérico de otro. Esta estructura clasificatoria distingue al tesauro de las listas alfabéticas de materias o palabras clave, así como de diccionarios y léxicos. De esta forma se crean campos conceptuales que clasifican los términos y los agrupan en un campo delimitado de significados o facetas que se van agrupando en disciplinas y sub-disciplinas. Para la presentación de las relaciones jerárquicas se suelen utilizar determinadas siglas como T.G. (Término Genérico) y T.E. (Término Específico). Si un descriptor tiene un solo descriptor por encima de él es monojerárquico, si tiene dos o más es polijerárquico. las relaciones jerárquicas pueden ser de dos tipos:
      • Relaciones género-especie: se aplica a acciones, propiedades y agentes. (T.G. Armas/T.E. Armas blancas)
      • Relaciones parte-todo: el nombre de una parte implica y evoca la del todo poseedor. Se aplica a objetos, lugares, disciplinas y sus partes de estudio, estructuras sociales, etc. (T.G. Guerra/T.E. Guerra de Irak)
    • Relaciones asociativas: Son relaciones asimétricas establecidas entre descriptores de distintas familias, distintas a las jerárquicas o de equivalencia, y que designan conceptos capaces de evocar mutuamente, por asociación de ideas, relaciones entre ellos. Este tipo de relación se suele representar mediante las siglas T.R. (Término Relacionado) o en inglés RT (Related Term). La mayoráa de las relaciones asociativas se establecen entre términos que comparten un lexema común (por ejemplo, POLÍTICA. T.R. POLÍTICOS) o que mantienen unas relaciones de hiperonimia o hiponimia (CARGOS MUNICIPALES. T.R. ADMINISTRACIÓN LOCAL). También podemos añadir Notas de Alcance (N.A.) con el fin de ofrecer una explicación o descripción del significado del término.