Lenguaje Documental

Lenguaje documental
Información sobre la plantilla
Concepto:Son lenguajes convencionales que usamos para describir el contenido de los documentos, su fin: el almacenamiento y la recuperación de la información.

Lenguaje Documental. Todo sistema artificial de signos normalizados que facilitan la representación formalizada del contenido de los documentos para permitir la recuperación manual o automática de la información solicitada por los usuarios.

Recorrido histórico

Con las primeras bibliotecas, apenas existía una vaga ordenación por materias: filosofía, historia, etc.; porque hasta el siglo XVIII las bibliotecas se empleaban exclusivamente para guardar libros.

Las primeras manifestaciones de clasificaciones bibliográficas aparecen en la segunda mitad del siglo XIX, estas clasificaciones están inspiradas en la lógica y en los sistemas filosóficos, y surgen fundamentalmente con el objetivo de ordenar las colecciones de las grandes bibliotecas, pues cada vez es mayor la demanda de libros y el número de estos en las colecciones.

Estas clasificaciones del siglo XIX están fundadas en el Principio de Precoordinación y son de carácter enciclopédico. Intentan recopilar de manera sistemática el contenido de que tratan los libros y así van creando una clasificación del saber humano.

Precoordinación significa que se establece un sistema previo de todas las relaciones de las materias posibles. El concepto moderno de clasificación lo introdujo Cutter en el siglo XX. Cutter introdujo el lenguaje de encabezamientos de materia.

A lo largo del siglo XX, también comenzaron a surgir los lenguajes especializados que aparecieron como respuesta a la dispersión y extensión del conocimiento. La primera clasificación bibliográfica importante fue la de Brunet en 1804, que estableció cinco clases: teología, jurisprudencia, historia, filosofía y literatura. Esta clasificación se utilizó para la redacción de catálogos bibliográficos y para la relación de fondos de bibliotecas públicas y privadas. Era una clasificación poco evolutiva y quedó insuficiente frente a los nuevos campos de interés.

Cutter a principios del siglo XX creó una clasificación con siete clases principales y posteriormente desarrolló individualmente cada una de las clases. Creó distintos esquemas, más simples o más complejos, para cada una de las clases.

A mitad del Siglo XX se produce una explosión documental y de desarrollo tecnológico, y como consecuencia de esto, las anteriores clasificaciones se quedan cortas y es ahora cuando aparecen los lenguajes documentales de indización, especializados en cada campo del saber y que ofrecen más flexibilidad y simpleza para analizar el contenido del documento.

La indización supone representar, con términos de un vocabulario previamente estructurado, la materia del documento. Estos lenguajes surgen por los avances en la automatización de las unidades de información. En la actualidad existen varios lenguajes que se emplean conjunta o paralelamente.

Objetivos

El objetivo fundamental del lenguaje documental es facilitar la recuperación de la información y de los documentos, reduciendo el esfuerzo y el tiempo del usuario en la búsqueda.

Se mantiene que el lenguaje documental tiene capacidad para representar los mensajes contenidos en los documentos, lo que le permite cumplir dos objetivos específicos:

  • Normalización. Se refiere a la unificación de terminología.
  • Inducción. Se refiere a la indicación a los usuarios de todas las posibles alternativas para recuperar la información.

El lenguaje documental interviene en dos fases del proceso documental, primero en la descripción y después en la recuperación de la información.

Funciones

  • Describir el contenido de los documentos. Después de la lectura e identificación de los conceptos contenidos en los documentos, éstos se representan mediante un lenguaje documental que proporciona un vocabulario unívoco que permite traducir los conceptos en términos normalizados.
  • Recuperación de la información. El lenguaje documental suministra el vocabulario de los conceptos de la demanda, es decir proporciona instrumentos para efectuar búsqueda es a niveles distintos de generalidad especificidad. En este sentido que se trata de un lenguaje intermediario entre las informaciones contenidas en los documentos y las informaciones solicitadas por el usuario.
  • Ordenación y archivo de documentos. Sobre todo son útiles porque permiten resolver problemas de multilingüismo.

Relación entre lenguaje natural y lenguaje documental

El lenguaje natural es utilizado para la comunicación inmediata y el lenguaje documental se utiliza para conseguir una comunicación que es un medio, un código unívoco y estereotipado, controlado y no libre, normalizado y no arbitrario. El lenguaje documental ejerce un control léxico e impide la utilización de distintos significantes libres para un mismo significado, con objetos de sobrevivir dentro de un código normalizado.

Los lenguajes documentales difieren del lenguaje natural en el aspecto de que poseen una forma más elaborada intelectualmente y nada arbitraria en comparación de las lenguas naturales, aunque su capacidad expresiva sea más limitada. El lenguaje documental es un lenguaje no natural aunque pueda utilizar signos de este. Esos signos adquieren valor semántica o por medio de su normalización, de las reglas morfosintácticas que lo articulan.

Características

  • Entropía. Es la mayor cantidad de información aportada por un solo signo o mensaje. La entropía es lo contrario de la redundancia. El lenguaje documental ha de ser unívoco, no puede permitirse la ambigüedad del lenguaje natural.

Ruido documental: son las respuestas no pertinentes que se obtienen en una búsqueda documental. La pertenencia es el porcentaje de documentos encontrados que responden a la demanda.

Silencio documental: son los documentos pertinentes que responden a una demanda de usuario y que no son obtenidos en una búsqueda aunque se encuentren en el sistema.

  • Ausencia de sinonimia, homonimia y polisemia.

Sinonimia es la coincidencia en el significado de dos o más vocablos. También es la coincidencia o cercanías de los significados de palabras de distinto sonido.

Homonimia es la igualdad entre los significantes de dos o más palabras que poseen distintos significados. También se puede definir como la coincidencia externa en el sonido de dos o más palabras de distintos significado. Por ejemplo: vello − bello, vino (sustantivo)− vino (verbo).

Polisemia es la reunión de varios significados en un mismo significante. También es la propiedad de una palabra detener dos o más significados distintos. Por ejemplo: hoja (papel, árbol), tejidos (textil, biología).

Un lenguaje documental no puede tener coincidencia entre dos o más signos, no puede tener un significante con varios significados ni varios significantes con un significado.

  • Son lenguajes simétricos y uniformes, lo que le resta la ambigüedad típica de los lenguajes naturales.
  • Son lenguajes gráficos y no orales.
  • No expresan nunca deseos, emociones ni las opiniones personales de quienes que los ejecutan.
  • Hacen uso de sustantivos y adjetivos. Rara vez aparece un verbo u otras categorías gramaticales.
  • Dejan expresadas de forma evidente las relaciones lexicosemánticas y sintácticas.

Componentes

Los lenguajes documentales que están compuestos de tres aspectos:

  • Vocabulario o léxico: es el conjunto de términos que se utiliza para expresar el contenido informativo (semántico) de un documento o de una solicitud de información. Este vocabulario puede estar constituido por diferentes tipos de términos de acuerdo con las necesidades que hayan determinado su aceptación.

Este conjunto es indispensable para poder hablar de lenguaje documental. Pueden incluir palabras aisladas o conjuntos de palabras que suelen coincidir con el lenguaje natural.

Otros tipos de lenguajes que aparecen son los códigos alfabéticos, numéricos o alfanuméricos. Los alfabéticos coinciden con las palabras y los numéricos y alfanuméricos utilizan números, los últimos combinados con palabras o letras.

De acuerdo al tipo de lenguaje al que pertenezca ese vocabulario y los términos pueden expresar:

1ro una clase (es decir el conjunto finito o infinito tomado de un todo de objetos que se distinguen por un determinado rasgo).

2do un epígrafe (es decir la palabra, combinación de palabras o frase del lenguaje natural, que se utiliza para designar la materia de todo un documento, de parte del documento o de la demanda de información).

3ro una palabra clave (conjunto de palabras significativas extraídas del documento a partir del título, del resumen o del texto completo y que aluden a su contenido sin expresar ninguna relación entre ellas).

4to un descriptor (es un término que se ha escogido a partir de un conjunto de sinónimos y de términos relacionados, para representar de manera unívoca la materia de que trata un documento; también es la palabra o grupo de palabras incluidas en un tesauro, escogidas de entre un conjunto de términos equivalentes para representar sin ambigüedad la materia de un documento).

  • Sintaxis: son las relaciones que se establecen entre los términos para construir cadenas, frases u oraciones. Hay tres tipos de relaciones que se pueden dar entre el vocabulario de un lenguaje documental:

Relaciones de coordinación: aquellas que relacionan dos términos al mismo nivel. Puede haber de dos tipos:

  1. De adición: que permiten la ampliación del significado de cada concepto sumando ambos. Este tipo de relación se presenta sobre todo en lenguajes documentales expresados con códigos numéricos. Suelen ser relaciones reversibles porque el orden de los conceptos no modifica el significado de la expresión final.
  2. De extensión: cuando se amplía el significado de dos conceptos incluyendo los que se encuentran entre ambos

Relaciones de yuxtaposición: cuando se relacionan dos términos pero dejando exclusivamente lo que ambos tienen en común. Es un tipo de relación que utilizan los lenguajes documentales que usan como vocabulario los descriptores. Se utiliza sobre todo a la hora de recuperar la información.

Relaciones de subordinación: cuando se indica que un término está incluido dentro de otro, es decir cuando existe una relación jerárquica entre ellos. Es un tipo de relación que se utiliza sobre todo en los lenguajes documentales jerárquicos, es decir, los que estructuran por niveles de lo más general a lo más específico.

  • Morfología: es el conjunto de medios y procedimientos para transformar los términos o las palabras.

Tipología

Para un mejor estudio de los Lenguajes Documentales se hace necesario establecer una tipología par apoder distinguir las diferencias entre los mismos.

Esta Tipología se puede hacer atendiendo a diferentes criterios:

  • Criterio de control.

Atendiendo a él se pueden distinguir dos tipos de lenguajes documentales.

Lenguajes libres. Estos lenguajes serían aquellos que se componen de un vocabulario no predefinido, es decir que se va generando a medida que se realizan los procesos de indización. Solo pertenecerían a este tipo las listas de descriptores libres y las de palabras clave. Este tipo de lenguaje se caracteriza por una gran ambigüedad semántica (se da mucha polisemina y sinonimia). Serían los más parecidos al lenguaje natural.

En el caso de las listas de descriptores libres, ordenan alfabéticamente cada entrada sin hacer referencia a las demás, lo que dificulta la recuperación de los documentos. Sin embargo, los lenguajes libres presentan ventajas en el momento de la indización, ya que no es necesario realizar una traducción de los conceptos en los descriptores de un tesauro o en las materias de una lista.

Lenguajes controlados. Son aquellos que se componen de un vocabulario predefinido que establece unas relaciones entre los términos y que permite la neutralización de la polisemina y sinonimia, facilitando la recuperación de la información.

  • Criterio de coordinación de los términos.

Este criterio es una división en función del momento en que se coordinan los elementos que los componen.

Lenguajes precoordinados. Resultan cuando los términos se combinan en el momento de la descripción. O mejor dicho antes del momento de realizar la descripción del contenido semántico de la información procesada. En este caso los términos están unidos de acuerdo con unas reglas sintácticas establecidas por el propio lenguaje. La relación entre los términos es gramatical.

Este tipo de lenguajes contribuyen a conseguir precisión en la búsqueda, es decir tienen mayor capacidad para rechazar los documentos irrelevantes en el momento de la recuperación. Dentro de esta categoría estarían todas las clasificaciones jerárquicas (Dewey, CDU) y también algunas clasificaciones alfabéticas de materia (por ejemplo las listas de encabezamientos de materia).

Lenguajes postcoordinados. Cuando los términos que los integran se coordinan en el momento de la recuperación o búsqueda y a partir de las relaciones que sean necesarias establecer entre ellos de acuerdo con el contenido semántico de la solicitud de información.

Estos lenguajes carecen de sintaxis y, salvo excepciones, su vocabulario consiste en términos simples o unitérminos que se pueden conectar en el momento de la recuperación por medio de una sintaxis booleana. En estos lenguajes la relación entre sus términos es lógica. Los lenguajes postcoordinados son los lenguajes de tipo descriptor, por ejemplo las listas de palabras clave o los tesauros.

  • Criterio según la estructura lenguajes combinatorios.

La estructura determina el tipo de lenguaje documental de que se trate sobre la base de que a partir de ella se establecen la conexión y las relaciones que los términos que integran el sistema tienen entre sí.

Lenguajes jerárquicos o arborescentes. Son aquellos que organizan sistemáticamente el conocimiento. En ellos sus miembros se relacionan entre sí a partir de la subordinación. Son lenguajes que agrupan las materias en áreas categoriales. Todos los conceptos dependen de un superior de significado más genérico que a su vez se integra en otro superior y así sucesivamente.

Lenguajes de estructura sintáctica. Son aquellos que recurren a una sintaxis mediante la cual se pueden representar y relacionar los contenidos de los documentos. Constan de un conjunto de descriptores y de una gramática que excluye la ambigüedad al relacionar los conceptos. En estos lenguajes, un conjunto de descriptores forma una frase documental.

Definiciones de los lenguajes

Lenguajes de clasificación. Son lenguajes documentales fundados en la representación estructurada de una o varias áreas del conocimiento en clases en las que las nociones y sus relaciones son representadas por los índices de una notación. Presentan una distribución sistemática de conceptos en diversas categorías o clases de tal manera que cada materia tiene un lugar predefinido.

Las clases se pueden definir como un conjunto de objetos o asuntos que se distinguen por un determinado rango o que comparten una o más características identificadas normalmente por una notación específica. Se tratan de lenguajes codificados de forma numérica, alfabética o alfanumérica que pretenden ser la descripción sintética del contenido de los documentos. Suelen utilizarse en bibliotecas generales por su carácter enciclopédico.

Listas de encabezamiento de materia. Los encabezamientos de materia tratan de representar el tema o los temas de un documento utilizando una serie de términos expresados en el lenguaje natural y relacionados entre ellos. El encabezamiento procede de la precordinación de términos. Constituye un lenguaje documental cuyo vocabulario principal consta de un conjunto de palabras, combinaciones de palabras y frases de la lengua natural, dispuestas en orden alfabético y que designan las materias de alguna rama de la ciencia.

Tesauros. Son lenguajes postcoordinados de estructura combinatoria, constituidos por listas estructuradas de conceptos (descriptores) que posibilitan la descripción analítica del contenido de los documentos. Poseen un control terminológico muy alto. Pueden contener unitérminos y descriptores compuestos pues la univocidad de ciertos conceptos precisa que el sustantivo vaya acompañado por un adjetivo.

Listas de palabras clave. Son listas no estructuradas (excepto su ordenación alfabética) de conceptos seleccionados automáticamente que permiten describir el contenido de los documentos analizados.Los términos que se seleccionan en cada documento no permiten la descripción de otros materiales. Esto provoca que se den variaciones gramaticales de un mismo término y expresiones sinónimas de un mismo.

Fuentes