domingo, 28 de agosto de 2016


GENERALIDADES Y CONCEPTOS SOBRE LOS TESAUROS.

¿Que es un tesauro?
La respuesta mas completa y breve es que un tesauro es un lenguaje documental, artificial y especializado, ya que se suele articular en torno a un tema, área concreta del conocimiento o bien se realizan para servir al desarrollo temático o profesiona de una institución determinada.

¿Cómo funcionan?
A grandes rasgos funciona como otros lenguajes documentales tales como los encabezamientos de materia, es decir, la herramienta o lenguaje documental, (Tesauro en este caso), que está compuesto por unos términos que se usarán para asignarlos a los documentos en función del contenido de estos. Esto permitirá recuperar la tipología de información recogida en estos documentos utilizando esos mismos términos asignados con anterioridad en el momento del almacenamiento.

Los términos del tesauro.
Los tesauros tienen dos tipos de términos:
  1. Descriptores. Son los términos que sí se utilizan en el tesauro para representar el contenido del documento, son términos temáticos, geográficos, cronológicos y onomásticos.
  2. No descriptores. Estos términos no se utilizan para indizar el contenido de los documentos, pero sirven para guiarse y ver cuales si se utilizan; suelen ser sinónimos o cuasisinónimos (a veces términos equivalentes o aparentemente sinónimos significan distintas cosas en lenguaje común).
Los términos necesarios para la elaboración de un tesauro se pueden recoger de las siguientes fuentes:
  • Listas de términos. (Otros tesauros, índices, diccionarios, glosarios,...).
  • Textos de los que extraer términos (Títulos, extractos o textos completos de ítems indizados, preguntas de los usuarios,...).
  • Gente (fundamentalmente especialistas en la materia en la que queremos profundizar para realizar el tesauro).
Los térmnos deben ser en lo posible sustantivos y sintagmas nominales, un término debe ser lo bastante general para ser utilizado en un índice remitiendo a un cierto número de términos mas específicos. Pero un término no debe ser tan general como para que remita a demasiados ítems. Por ejemplo "Noticias", no sería útil en un tesauro para la indizaciòn de noticias. Algunos de estos términos terminarán siendo descriptores y otros pueden no ser utilizados en el tesauro en su forma original, pero pueden sugerir unos conceptos que necesitan de alguna manera ser cubiertos.

Algunas pautas para la normalización formal de los términos seleccionados:
  • Los términos deben ser sustantivos o sintagmas nominales.
  • Utilizar la forma plural para las cosas que pueden ser contadas. (Balas).
  • Utilizar el singular para los sustantivos no contables. (Metal).
  • Utilizar el singular para procesos, características y condiciónes. (Maldad).
  • No invertir términos. (Zapatillas deportivas y no Deportivas, Zapatillas).
  • Evitar usar demasiadas preposiciones. (Programas infantiles y no programas para niños).
  • Excluir signos de puntuación, signos diacríticos, carácteres especiales y abreviaturas.
  • En las palabras polisémicas (mas de un significado), se puede eliminar esta añadiendo un calificador al término (Resistencia (electricidad)), o bien haciendo transformación sintagmática (Resistencia eléctrica).
La estructura del tesauro.
Los tesauros tienen habitualmente una estructura dividia en tres partes:
  1. Un apartado jerárquico donde se representan lso descriptores en el contexto de su campo semántico.
  2. Una parte alfabética que facilita la entrada al tesauro por la primera palabra con significado entre los descriptores y no descriptores. Expresa las relaciones del vocabulario.
  3. Un índice que permite el acceso por el resto de términos significativos.
Las relaciones usadas en los tesauros.
Normalmente en los tesauros se suelen dar tres tipos de relaciones:
  1. Relaciones semánticas que se forman entre los descriptores y los no descriptores. Los térmnos no preferentes remiten al descriptor y éste hace constar sus sinónimos no útiles para indizar ni recuperar información. Los operadores mas habituales para representar esto son los siguientes: UP (Úsase Por), USE, UF, USE (en inglés). O bien los signos = o una flecha.
  2. Relaciones jerárquicas que se establecen entre descriptores e indican la posición del descriptor dentro del esquema sistemático del tesauro. Los operadores mas habituales para representar esto son los siguientes: TG (Término Genérico) y TE (Término Específico). BT y NT respectivamente en inglés. O bien los signos <, >.
  3. Relaciones asociativas. Se establecen también entre descriptores y permiten relacionar descriptores de distintos campos semánticos pero que suelen aparecer juntos en la documentación. Sirve para que el indizador o usuario utilice términos en los que quizá no había pensado. El operador que lo representa es TR (Términos Relacionado ) o RT en inglés. También se utilizan las rayas ....

 Recuperado desde:
http://lenguajesdocumentalesugr.blogspot.com/2011/06/generalidades-y-conceptos-sobre-los.html


No hay comentarios:

Publicar un comentario