12.2. Guía de búsqueda

Becky Bell

WALDO

Nicole C. Engard

Se han corregido errores de mecanografía, cambiado contenidos donde era necesario y se han añadido nuevos pantallazos. 

Octubre 2008

12.2.1. Descripción de la indexación y la búsqueda
12.2.2. Configuración de la indexación
12.2.3. Búsqueda básica
12.2.4. Búsqueda avanzada
12.2.5. Buscar con el Lenguaje Común de Comandos

Esta breve guía expone un esquema que muestra un ejemplo de cómo se puede configurar una base de datos MARC21, así como una breve guía introductoria sobre la búsqueda. Los campos de indexación que describe esta sección se refiere a los datos bibliográficos y no a la indexación de la base de datos de autoridades.

12.2.1. Descripción de la indexación y la búsqueda

Las bases de datos Koha se indexan con el software de código abierto Zebra. La documentación describe a Zebra como:

"...Zebra es un motor de indexación y recuperación de texto estructurado de propósito general y de alto rendimiento. Lee registros en una variedad de formatos de entrada (p. ej., correo electrónico, XML, MARC) y proporciona acceso a ellos a través de una poderosa combinación de expresiones de búsqueda booleanas y de consultas de texto libre con ordenación por relevancia.

Zebra soporta grandes bases de datos (decenas de millones de registros, decenas de gigabytes de datos). Permite actualizaciones incrementales de bases de datos en sistemas en uso de forma segura. Debido a que Zebra es compatible con el protocolo de recuperación de información Z39.50, puede buscar en bases de datos utilizando una enorme variedad de programas y toolkits, tanto comerciales como libres, que interactuan con este protocolo ..." Zebra - Guía del usuario y de referencia, p. 1, http://www.indexdata.dk/zebra/doc/zebra.pdf

Esta breve guía expone un esquema que muestra un ejemplo de cómo se puede configurar una base de datos MARC21, así como una breve guía introductoria sobre la búsqueda. Los campos de indexación que describe esta sección se refiere a los datos bibliográficos y no a la indexación de la base de datos de autoridades.

Nota

La configuración de indexación que se describe a continuación es la utilizada por Southeastern University. Su indexación local puede ser diferente.

12.2.2. Configuración de la indexación

La indexación de Koha utiliza tres archivos de configuración.

The first configuration file (etc/zebradb/biblios/etc/bib1.att) contains the Z39.50 bib-1 attribute list, plus the Koha local use attributes for Biblio Indexes, Items Index, and Fixed Fields and other special indexes. The Z39.50 Bib-1 profile is made up of several different types of attributes: Use, Relation, Position, Structure, Truncation, and Completeness. The bib-1 'Use' attribute is represented on the chart; the other attributes are used primarily when doing searches. While there are over 150+ use attributes that could be used to define your indexing set, it's unlikely that you will choose to use them all. The attributes you elect to use are those that become the indexing rules for your database. The other five attribute sets define the various ways that a search can be further defined, and will not specifically be addressed in this document. For a complete list of the standard Bib-1 attributes, go to http://www.loc.gov/z3950/agency/defns/bib1.html.

El segundo archivo (etc/zebradb/marc_defs/[marc21|unimarc]/biblios/record.abs) contiene la sintaxis abstracta que hacen corresponder las etiquetas MARC21 con el conjunto de atributos Use eligidos en el primer archivo. Las reglas establecidas en este archivo proporcionan reglas para autor, título, materia, palabra clave e identificadores estándar (LCCN, ISBN, ISSN, etc), entre otras cosas.

El tercer archivo (etc/zebradb/ccl.properties) es el de asignaciones de campo del Common Command Language (CCL). Este archivo combina el archivo de atributos bib-1 y agrega los clasificadores, que por lo general se conocen como nombres de índices. Los clasificadores, o índices, pueden ser: pn, cpn, cfn, ti, se, ut, nb, ns, sn, lcn, callnum, su, su-to, su-geo, su-ut, yr,pubdate, acqdate, ln, pl, ab, nt, rtype, mc-rtype, mus, au, su-na, kw, pb, ctype, y an.

El Diagrama de Indexación de Koha resume el contenido de estos tres en un formato más legible. Las dos primeras columnas identificadas como Atributo Z39.50 y Nombre Z39.50 coincide con el archivo de atributos Z39.50 bib-1. La tercera columna llamada Etiquetas MARC Indexadas es donde encontrará qué etiquetas MARC se mapean a un atributo. La cuarta columna llamada Cualificadores identifica las abreviaturas de búsqueda utilizadas en la consulta interna CCL. La siguiente descripción proporciona una definición para la palabra 'cualificadores'.

Los cualificadores se utilizan para dirigir la búsqueda a un determinado índice de búsqueda, como los índices de título (ti) y de autores (au). La norma CCL no especifica un conjunto particular de cualificadores pero sí sugiere notaciones para unos pocos. Usted puede personalizar el analizador sintáctico CCL para soportar un conjunto particular de cualificadores para reflejar el perfil del actual destino. Tradicionalmente, un cualificador se asignará a un atributo Use particular dentro del conjunto de atributos bib-1. También es posible establecer otros atributos, como atributos de estructura.

En la columna de etiquetas MARC indexadas, hay algunas convenciones utilizadas que tienen significados específicos. Éstas son:

  • Una etiqueta de tres dígitos (por ejemplo 100) significa que todos los subcampos en la etiqueta se puede utilizar en una consulta. Por lo tanto, si se introduce una búsqueda de 'Jackson' como autor, se recuperarán los registros en que Jackson podría ser el apellido o el nombre.

  • Una etiqueta de tres dígitos seguida por '$' y una letra (por ejemplo 600$a) significa que una consulta sólo buscará en el subcampo 'a'.

  • Una etiqueta de tres dígitos que es seguida por un ':' y una letra (240:w) significa que la consulta puede ser aún más cualificada. La letra que viene despues del ':' identifica la forma de realizar la búsqueda. Los valores más comunes que veremos son la 'w' (palabra), 'p' (frase), 's' (tipo), y 'n' (numérico).

Se indexan todos los contenidos de las etiquetas MARC, subcampos, y/o elementos de campo fijo que se enumeran en esta tabla. Usted verá que cada línea de atributo no se asigna a un cualificador específico (índice)-LC número de carnet, la línea 9 es un ejemplo. Sin embargo, cada palabra indexada (una cadena de caracteres precedida y seguida por un espacio) se puede buscar usando una palabra clave (kw) de búsqueda. Así, aunque un número específico de tarjeta de índice de LC no existe, usted todavía puede buscar por la etiqueta LCCN desde 010 se asigna al número de atributo LC-card. Para comprobar esto, escriba 72180055 en el cuadro de búsqueda persistente. Usted debe recuperar a Los propios dioses, de Isaac Asimov.

Ejemplos de elementos de campo fijo de indexación se pueden ver en la tabla entre Attribute 8822 y Attribute 8703. Estos atributos son los más comúnmente utilizados para limitar. Los atributos de campo fijo actualmente representan los códigos de BK. Los otros códigos de formato, si son necesarios, se podrían definir.

12.2.3. Búsqueda básica

La recuadro de búsqueda que el personal de la biblioteca y los usuarios verán más a menudo es el cuadro de búsqueda repetido en la parte superior de la página. Koha interpreta las búsquedas como búsquedas por palabras clave.

Para iniciar una búsqueda, escriba una palabra o varias palabras en el cuadro de búsqueda. Cuando se escribe una sola palabra se realiza una búsqueda por palabra clave. Usted puede comprobar esto tecleando una palabra en el formulario y tome nota de el número de resultados localizados. A continuación, repita la búsqueda con un cambio menor. Frente a la palabra de búsqueda, escriba 'kw =' seguido por el mismo término de búsqueda. Los resultados serán idénticos.

Cuando haya más de una palabra en el cuadro de búsqueda Koha también hará una búsqueda por palabras clave, pero un poco diferente. Cada palabra se buscará por su cuenta y después el conector Booleano 'and' limitará la búsqueda a los ítems con todas las palabras contenidas en los registros buscados.

Suponga que quiere encontrar material acerca de cómo las bibliotecas están usando los mashups. Usted seleccionará las palabras importantes y las introducirá en el cuadro de búsqueda.

La respuesta a esta búsqueda es:

El orden de las palabras no afecta los resultados recuperados, así que también podría entrar en la búsqueda de "mashups library". La respuesta a esta búsqueda son los resultados.

Demasiadas palabras en la caja de búsqueda daría como resultado pocos registros, como ilustra el siguiente ejemplo:

12.2.4. Búsqueda avanzada

Cuando usted no puede encontrar los materiales más adecuados con la búsqueda general, puede ir a la página de búsqueda avanzada haciendo clic en la opción de búsqueda en la barra de herramientas.

La página de búsqueda avanzada ofrece muchas maneras para limitar los resultados de su búsqueda. Usted puede buscar utilizando los operadores booleanos AND, OR y NOT, limitar por tipo de ítem; limitar por año e idioma; límitar por los subtipos audiencia, contenido, formato, o tipos de contenidos adicionales; por ubicación y disponibilidad.

La primera sección en la página de búsqueda avanzada ofrece una manera rápida y sencilla de utilizar los operadores booleanos en la búsqueda. Tenga en cuenta que esta pantalla depende de la configuración de las preferencias del sistema. Esta opción se puede encontrar en Administración > Preferencias del sistema > Buscar. La opción llamada expandedSearchOptionse debe establecer en 'mostrar' para ver la siguiente pantalla.

En esta sección puede elegir entre los muchos índices haciendo clic sobre la flecha en la primera casilla. El cuadro en blanco que sigue es donde se introduce su primer término o términos de búsqueda. En la segunda línea, puede elegir el operador booleano que desea utilizar en su búsqueda. Las opciones son 'y', 'o', y 'no'. A continuación, se puede elegir el índice de búsqueda, seguido por el segundo término o términos. Si tiene más términos que desea incluir en su búsqueda, puede hacer clic en el [+] para agregar otra línea en la búsqueda.

Un ejemplo de búsqueda se muestra a continuación, seguido de sus resultados:

Cuando utilice los operadores booleanos para ampliar o limitar una búsqueda, recuerde como actúa cada operador. El operador 'y' reduce los resultados que va a recuperar porque la búsqueda se efectuará en los registros que incluyen todos los términos de búsqueda. El operador 'o' amplía los resultados porque la buscará las apariciones de cada uno de los términos de búsqueda. El operador 'no' excluye los registros con el que sigue al operador.

Nota: si deja la preferencia expandedSearchOption en 'no mostrar', esta es la pantalla que se verá:

La página de búsqueda avanzada a continuación, muestra los múltiples tipos de límites que se pueden aplicar a los resultados de su búsqueda. Bien marcar una casilla o hacer una selección de un menú desplegable para restringir la búsqueda. Usted escriba el año, el año de rango o un 'mayor que (>)' o 'menor que (<)'.

Por último, puede elegir la forma de ordenar los resultados. Las opciones predefinidas de ordenamiento están en el área final de la pantalla de búsqueda avanzada.

The default sort is by relevance, although you can choose to sort by author, by title, by call number, by dates, or by popularity (which uses the information on total issues found in the items table). If you would prefer a different default sort, you can set defaultSortField to one of the other choices in Administration > System Preferences > Searching.

12.2.5. Buscar con el Lenguaje Común de Comandos

Koha utiliza el Common Command Language (CCL) (ISO 8777) como su protocolo de búsqueda interna. Las búsquedas iniciadas en la interfaz gráfica utilizan este protocolo, aunque la persona que busca no sabe qué índices, operadores y limitadores están disponibles y se utilizan para llevar a cabo la búsqueda. La persona que está buscando puede acceder a algunos de los índices utilizados en la búsqueda avanzada y así obtener un conjunto de resultados más precisos. Sin embargo, algunos usuarios comunes de la biblioteca y muchos del personal prefierne usar un lenguaje con comandos para la búsqueda. En esta parte del documento se presenta y explica el uso de los comandos de búsqueda de Koha. Los índices, operadores y limitadores utilizados son idénticos a los utilizados en la interfaz gráfica.

12.2.5.1. Índices

The CCL standard itself doesn't specify a particular set of qualifiers (indexes), but it does suggest a few short-hand notations such as 'ti', 'au', and 'su'. Koha has a default set of indexes; it's possible to customize that set by adding needed indexes based on local requirements. A qualifier (index) maps to a particular use-attribute within the Z39.50 BIB-1 attribute set. The complete Z39.50 Bib-1 Attribute can be viewed at http://www.loc.gov/z3950/agency/defns/bib1.html.

El conjunto estándar de índices de Koha es un ejemplo bastante común de reglas de indización MARC21. Los índices que se definen en Koha son índices habitualmente utilizados por otros sistemas integrados para bibliotecas. Los atributos Z39.50 Bib-1 se asignan de la siguiente forma a los índices:

Tabla 12.1. Atributos

Atributo bib-1Cualificador (índice)
Personal-namepn
Corporate-namecpn
Conference-namecfn
Títuloti
Title-seriesse
Title-uniformut
ISBNnb
ISSNns
Local numbersn
Local-classificationlcn and callnum
Subjectsu, su-to, su-geo, su-ut
Pubdateyr,pubdate
Date-of-Acquisitionacqdate
Languageln
Place-of-publicationpl
Abstractab
Notasnt
Record-typertype, mc-rtype, mus
Authorau, aut
Subject-person-namesu-na
Any (keyword)kw
Publisherpb
Content-typectype
Koha-Auth-Numberan
Author-personal-bibliographyaub
Author-in-orderauo

Refer to the Koha Indexing Chart for the MARC21 tags mapped to each Bib-1 Attribute and index combination.

12.2.5.1.1. Ejemplos de audiencia
  • aud:a Preescolar

  • aud:b Primaria

  • aud:c Pre-Adolescente

  • aud:d Adolescente

  • aud:e Adulto

  • aud:f Especializada

  • aud:g General

  • aud:j Juvenile

12.2.5.1.2. Ejemplos de contenido
  • fic:1 Ficción

  • fic:0 No ficción

  • bio:b Biografía

  • mus:j Grabación musical

  • mus:I Grabación no musical

12.2.5.2. Sintaxis de búsqueda

En el cuadro de búsqueda persistente (el que aparece en la parte superior de la mayoría de las pantallas) una única palabra generalmente recupera conjuntos de gran tamaño. Para limitar una búsqueda, puede utilizar varias palabras. Koha utiliza automáticamente el operador booleano 'y' para crear un conjunto de registros que coinciden con su entrada. Si desea restringir la búsqueda a un autor o un título o una materia o algún campo concreto, o si desea utilizar un operador booleano, no hay una forma obvia de lograr esa especificidad. El usuario de la biblioteca puede, por supuesto, ir a la página de búsqueda avanzada, sin embargo, si usted sabe como construir una búsqueda CCL, se puede lograr una mayor especificidad utilizando el cuadro de búsqueda persistente en cualquier página.

Hay un orden específico para la sintaxis de búsqueda CCL. Aunque puede ser utilizada para las búsquedas sencillas, es una manera especialmente eficaz para realizar búsquedas complejas, ya que ofrece un gran control sobre los resultados de su búsqueda. Para construir una búsqueda CCL, en primer lugar introduzca un código de índice deseado, a continuación, un signo igual, seguido de las palabras de su búsqueda. Los siguientes son ejemplos de búsquedas CCL simples.

  • ti=principios de contabilidad

  • au=escalante pedro

  • su=poesía

  • su-na=Shakespeare

  • kw=marlin

Usted puede refinar su búsqueda mediante la combinación de los términos de búsqueda con operadores booleanos 'and' 'or', o 'not'. Los siguientes son ejemplos de búsquedas con operadores booleanos.

  • ti=principios de contabilidad and au=escalante arce pedro

  • su=poesía not su-na=Shakespeare

  • kw=comunicación and su=debate

También puede optar por buscar cosas que comiencen con un carácter o conjunto de caracteres

  • ti,first-in-subfield=C (le mostrará todos los títulos que comienzan con la letra 'C')

Otras búsquedas de localización de cadenas se pueden realizar con las siguientes palabras clave:

  • rtrn : truncamiento a la derecha

  • ltrn : truncamiento izquierdo

  • lrtrn : truncamiento izquierdo y derecho

  • st-date : tipo fecha

  • st-numeric : tipo numérico (entero)

  • ext: búsqueda exacta sobre todo subcampo (no funciona con icu)

  • phr: búsqueda de expresión en cualquier lugar en el subcampo

  • startswithnt: subcampo comienza con

El uso de índices específicos y de operadores booleanos no es la única manera de refinar una búsqueda. También puede refinar su búsqueda como frase cuando busca por un título, autor o tema. La sintaxis de esta búsqueda es índex,phr=palabras de búsqueda.

Para ilustrar los resultados de diversos tipos de búsqueda, se realizaron búsquedas para los términos 'Tribunal Supremo'. Los resultados muestran que el índice de búsqueda y el orden de las palabras hacer una diferencia en los resultados de la búsqueda. En estos ejemplos sólo se muestra la cantidad de resultados devueltos y la búsqueda en sí misma. La búsqueda que se ha ejecutado está entre comillas simples.

También puede optar por utilizar limitadores en su consulta. Algunos limitadores comunes incluyen las fechas, los idiomas, los tipos de registros, y los tipos de ítems. En la búsqueda avanzada, puede bien hacer clic en una casilla o teclear datos para limitar la búsqueda. También puede aplicar los mismos límites con CCL usando la sintaxis de los siguientes ejemplos. En todos

Por fecha: su=Tribunal Supremo and yr,st-numeric=>2000

Cuando se límita por fecha, puede utilizar los símbolos: '>' (mayor que), '<' (menor que), '=' (igual), o 'AAAA-AAAA' (rango).

Por tipo de ítem: su=nursing and itype:BK

Cada biblioteca tendrá un conjunto diferente de tipos de ítems definidos en su configuración de circulación. Al configurar los tipos de ítems, se define un código y un nombre para cada uno. El nombre aparecerá en la página de búsqueda avanzada. El código que ha asignado se utiliza como un límite de búsqueda CCL, con el formato 'itype:x', donde 'x' es el código asignado. El conjunto inicial de tipos de ítems en Koha usualmente sera editado para reflejar las colecciones, así que los limitadores de tipo de ítems pueden ser diferentes que los iniciales. Los limitadores de tipos de ítems iniciales son:

  • itype:BKS libros, folletos, libros de ejercicios

  • itype:SR audiocasete, CDs

  • itype: IR Carpetas

  • itype:CF CD-ROMs, DVD-ROMs, Recursos generales en línea

  • itype:VR DVDs, VHS

  • itype:KT Kit

  • itype:AR Maquetas

  • itype:SER Publicaciones periódicas

Por formato: su=Tribunal Supremo not l-format:sr

Los limitadores de formato se derivan de una combinación de las posiciones 006 y 007 de la cabecera. Los formatos que se definen actualmente son los siguientes.

  • l-format:ta Material impreso común

  • l-format:tb Texto con letras grandes

  • l-format:fk Braille

  • l-format:sd CD audio

  • l-format:ss Grabación en casete

  • l-format:vf cinta VHS

  • l-format: DVD vídeo

  • l-format:co CD de software

  • l-format:cr Sitio Web

Por tipo de contenido: su=Tribunal Supremo not ctype:l

Los tipos de contenido se han tomado de la etiqueta 008 de MARC, posiciones 24-27.

Hay dos tipos de limitadores que no se describen en este documento. Ellos son: Audiencia y Contenido. La única diferencia en la sintaxis de la CCL es el limitador en sí. Se mencionan aquí en caso de que quiera utilizarlos.