Post on 28-Jan-2016
Indización, Resumen y Catalogación Automática
Piedad Garrido PicazoFrancisco J. Martínez Domínguez
Alberto Segrera Torres
“Proceso que permite captar y representar el contenido de un documento.”
Identificación de los conceptos en lenguaje natural
Traslación de estos conceptos a su expresión por medio de un lenguaje controlado (normalizado)
Utiliza lenguajes de tipo documental, puesto que el lenguaje natural, presenta una eficacia muy limitada.
Si bien el lenguaje natural es simple y no requiere ningún esfuerzo de traducción, tiene un alto grado de ambigüedad que lo limita en un esfuerzo de sistematización de una determinada materia.
La indización automática, se limita a buscar los términos más representativos del documento y registrarlos.
Una máquina, en principio, es incapaz de realizar la labor de indizar, ya que no puede llegar a captar todos los matices conceptuales como puede hacerlo un indizador humano.
Sin embargo, es necesaria, pues la indización es el cuello de botella de la Catalogación.
Se emplean dos reglas en la indización automática: Los documentalistas deciden un conjunto de
identificadores; esta lista se compara en el ordenador con cada palabra del documento, si aparece algún identificador, se almacena como índice para ese documento.
Los documentalistas deciden un conjunto de palabras que NO deben ser seleccionadas como índice (antidiccionario); los sistemas automáticos cuentan el número de apariciones de las palabras no vacías y las más frecuentes serán elegidas como índices.
Durante el proceso de RESUMEN, el ordenador, crea una versión comprimida del texto original. Esta nueva versión deberá tener el mismo sentido que la anterior.
Es una tarea muy importante, pues las bibliotecas tienen que catalogar muchísimo material y si un ordenador puede realizar buenos resúmenes, se agiliza la catalogación.
CONCLUSIONES
Se están desarrollando continuamente proyectos para automatizar las tareas documentales.
El nivel encontrado hasta ahora, cuando el volumen de información es pequeño, es bastante aceptable.
Se necesitan máquinas muy potentes para obtener buenos resultados.
CONCLUSIONES
La aparición de la multimedia ha dificultado más todavía, la consolidación de estos sistemas.
Existe una escasa presencia de investigadores del área de Biblioteconomía y Documentación, en el estudio de automatización de las tareas documentales.
En España existe muy poca tradición de investigación en este campo.