13.2. Průvodce vyhledáváním

Becky Bell

WALDO

Sestavil

Nicole C. Engard

Opravené překlepy, úpravy obsahu podle potřeby a přidané nové snímnky. 

October 2008

13.2.1. Indexování a popis vyhledávání
13.2.2. Nastavení indexování
13.2.3. Základní vyhledávání
13.2.4. Pokročilé hledání:
13.2.5. Vyhledávání pomocí CCL (Common Command Language)

Tento stručný průvodce vám vysvětlí graf, který ukazuje vzorek, jak může být databáze MARC21 nakonfigurována, a stručný vyhledávací návod. Indexace polí popsané v tomto dokumentu se týkají bibliografických údajů a neřeší indexování databáze autorit.

13.2.1. Indexování a popis vyhledávání

Databáze Koha jsou indexovány v open-source software Zebra. Přehledně lze popsat Zebra jako:

"... Zebra je vysoce výkonný, univerzální indexátor strukturovaného textu a vyhledávací stroj. Čte záznamy v různých vstupních formátech (např. e-mail, XML, MARC) a poskytuje přístup k nim prostřednictvím výkonné kombinace boolovského vyhledání a ohodnoceného vyhledávání ve volných textech.

Zebra podporuje rozsáhlé databáze (desítky milionů záznamů, desítky gigabajtů dat). Umožňuje bezpečné, přírůstkové aktualizace databáze na živém systémy. Vzhledem k tomu, že Zebra podporuje vyhledávání informací pomocí protokolu Z39.50, můžete vyhledávat v databázích Zebra pomocí obrovského množství programů a nástrojů, a to jak komerčních tak free, které podporují tento protokol... "Zebra - Uživatelská příručka a reference, str. 1"http://www.indexdata.dk/zebra/doc/zebra.pdf

Tento stručný průvodce vám vysvětlí graf, který ukazuje vzorek, jak může být databáze MARC21 nakonfigurována, a stručný vyhledávací návod. Indexace polí popsané v tomto dokumentu se týkají bibliografických údajů a neřeší indexování databáze autorit.

Poznámka

Indexace popsaná v tomto dokumentu je soubor používaný v SouthEastern University. Vaše místní indexování se může lišit.

13.2.2. Nastavení indexování

Existují tři konfigurační soubory, které Koha používá při indexování.

První konfigurační soubor ( etc/zebradb/biblios/etc/bib1.att ) obsahuje Z39.50 bib- 1 seznam atributů , plus místní použití Koha atributů pro Biblio indexy, indexy jednotek a pevná pole a další speciální indexy . Bib-1 profil Z39.50 se skládá z několika různých typů atributů : užívání , vztah, pozice, struktura, rozšíření, a kompletnosti . Bib-1 "užití" je atribut reprezentovaný v tabulce , ostatní atributy jsou používány především při tomto hledání . I když existuje více než 150 atributů použití, které by mohly být použity k definování indexovací množiny, je nepravděpodobné, že si je všechny vyberete. Atributy, které se rozhodnete použít jsou ty, které se indexují pro databázi . Ostatních pět atributů definují různé způsoby vyhledávání, mohou být dále definovány, a zde nebudou konkrétně probírány. Pro úplný seznam standardních Bib-1 atributů , přejděte na http://www.loc.gov/z3950/agency/defns/bib1.html

Druhý soubor (etc/zebradb/marc_defs/[MARC21 | UNIMARC]/biblios/record.abs) obsahuje abstraktní syntaxi, která mapuje MARC21 tagy na sadu Atributu Užití, jak je chcete používat. Pravidla stanovená v tomto souboru obsahují profil Bath úrovně 0 a 1, které zahrnují autora, název, předmět, klíčové slovo a přesné vyhledání, jako jsou standardní identifikátory (LCCN, ISBN, ISSN, atd.)

Třetí obrázek (etc/zebradb/ccl.properties) je Common Command Language (CCL) mapování polí. Tento soubor kombinuje bib-1 nastavené atributy souboru a abstraktní soubor a přidá kvalifikátory, obvykle známé jako názvy indexů. Kvalifiátory, nebo indexy, pro tuto databázi: pn, cpn, cfn, ti, se, ut, nb, ns, sn, lcn, callnum, su, su-to, su-geo, su-ut, yr, pubdate , acqdate, ln, pl, ab, nt, rtype, mc-rtype, mus, au, su-na, kw, pb, ctype, a an.

Koha indexování Graf shrnuje obsah všech tří z těchto souborů ve více čitelném formátu. První dva sloupce označené atribut Z39.50 a název Z39.50 odpovídají Z39.50 bib-1 souboru atributů. Třetí sloupec s označením MARC tagy indexovány je místo, kde můžete zjistit, které MARC tagy jsou mapovány do atributu. Čtvrtý sloupec označen kvalifikátor uvádí zkratky používané v hledání vnitřního dotazu CCL. Následující popis uvádí definici pro slovo "kvalifikátory".

Kvalifikátor se používají pro přímé vyhledávání na určitou s možností vyhledávání indexem, jako je název (ti) a autor indexů (au). Samotná norma CCL nespecifikuje konkrétní sadu kvalifikátorů, ale navrhuje několik zkrácených zápisů. Můžete přizpůsobit CCL analyzátor pro podporu konkrétní sadu kvalifikátorů tak, aby odrážely aktuální cílový profil. Tradičně, kvalifikátor by měl mapovat na konkrétní atribut Užití v sadě atributů BIB-1. Je také možné nastavit další atributy, jako je například atribut struktury.

Ve sloupci indexované MARC tagy, jsou některé použité konvence, které mají specifické významy. Jedná se o:

  • Třičíslicový tag (100) znamená, že ve vyhledávacím dotazu, mohou být použity všechny podpole z pole (100) . Takže, pokud zadáte hledání "Jackson", jako autor, budete získávat záznamy, kde Jackson mohl být příjmení nebo jméno.

  • Třičíslicový tag, který má '$' následovaný písmenem (600$a) znamená, že vyhledávací dotaz bude hledat pouze v podpoli "a".

  • Tři číslicový tag, který je následován dvojtečkou ":" a písmenem (240: w) znamená, že vyhledávací dotaz může být dále kvalifikován. Písmeno následující za ":" určuje, jak provádět vyhledávání. Nejběžnější hodnoty, které uvidíte, jsou "w" (slovo), "p" (fráze), "s" (třídění), a "n" (číselné).

Obsah MARC polí, podpolí, a/nebo prvků pevných polí, které jsou uvedeny v této tabulce jsou indexovány. Uvidíte, že ne každá řádka atributů je mapována na konkrétní kvalifikaci (index)-LC číslo karty, řádek 9 je jeden příklad. Nicméně, každé indexované slovo (řetězec znaků předcházený a následovaný mezerou) lze vyhledávat pomocí klíčových slov (kw) hledání. Takže, i když specifický index čísla LC karty neexistuje, stále můžete vyhledávat podle LCCN od tagu 010 je přiřazen atribut LC-karty čísla. Chcete-li toto ověřit, zadejte 72180055 do pole persistentního vyhledávání. Měli byste získat Ani sami bohové od Isaac Asimova.

Příklady indexování prvků pevných polí lze vidět na grafu mezi atributů 8822 a atributů 8703. Tyto atributy se nejčastěji používají pro omezení. Atributy pevných polí představují v současné době BK kódy. Další kódy formátu, v případě potřeby, lze definovat.

13.2.3. Základní vyhledávání

Vyhledávací pole, které pracovníci knihovny a čtenáři uvidí nejčastěji je persistentní vyhledávací pole v horní části stránky. Koha interpretuje toto vyhledávání jako vyhledávání podle klíčového slova.

Chcete-li zahájit vyhledávání, můžete zadat slovo nebo více slov do vyhledávacího pole. Při zadání jednoho slova, se provádí vyhledávání klíčových slov. Můžete si to vyzkoušet a to zadáním jednoho slova do formuláře a poznamenejte si počet výsledků. Poté opakujte hledání s menší úpravou. Před hledané slovo napište "kw=" a následuje stejný hledaný výraz. Výsledky budou totožné.

Pokud máte více než jedno slovo do vyhledávacího pole, provede Koha také vyhledávání podle klíčových slov, ale trochu jinak. Každé slovo bude vyhledávat na jako vlastní, pak použije logickou spojku "AND" na zúžení vyhledávání na záznamy se všemi uvedenými slovy.

Předpokládejme, že chcete najít materiál o tom, jak knihovny používají mashup (=vyhledávání v různých typech zdrojů a sloučení výsledků). Vyberte hlavní slovo a zadejte je do hlavního vyhledávacího pole.

Odezva na toho hledání je:

Pořadí slov nemá vliv na načtené výsledky, takže můžete také zadat vyhledávání jako "mashup knihovna". Odpověď na toto vyhledávání je výsledek

Příliš mnoho slov ve vyhledávacím poli způsobí nalezení mála výsledků, jak ukazuje následující příklad:

13.2.4. Pokročilé hledání:

Pokud nemůžete najít nejvhodnější materiál v obecným hledání, můžete přejít na stránku Rozšířené vyhledávání kliknutím na na tento odkaz na hlavním panelu nástrojů.

Stránka Pokročilé hledání mnoho způsobů, jak omezit výsledky vyhledávání. Můžete vyhledávat pomocí booleovských operátorů AND, OR, a NOT; omezit podle typu jednotky, omezení podle roku a jazyka; omezení podle podtypu publika pro které je jednotka určena, podle obsahu, formátu, nebo další typy obsahu, podle umístění a dostupnosti.

První oblast omezení na stránce Pokročilé hledání umožňuje rychlý a jednoduchý způsob, jak používat logické operátory ve vyhledávání. Všimněte si, že toto zobrazení závisí na nastavení předvoleb systému. Tuto volbu lze nalézt na stránce Administrace> Systémová nastavení> Vyhledávání. Předvolba tzv. expandedSearchOption musí být nastaven na "Zobrazit", aby se zobrazil se následující obrazovce.

V této sekci si můžete vybrat z mnoha indexů kliknutím na šipku v prvním poli. Prázdné pole, které následuje, je místo, kde zadáte svůj první hledaný termín nebo termíny. Na druhém řádku, můžete zvolit logický operátor, který chcete použít při hledání. Možnosti jsou "a", "nebo" a "ne". Pak byste zase vybrali index pro vyhledávání, následovaný druhým termínem nebo termíny. Máte-li další aspekty, které chcete zahrnout do vyhledávání, můžete klepnout na [+] a přidat další řádek pro vyhledávání.

Dále je jednoduchý příklad hledání, následují jeho výsledky:

Pokud použijete boolovské logické operátory na rozšíření nebo zúžení vyhledávání, nezapomeňte na vliv každého operátora. Operátor "AND" zužuje výsledky které načtete, protože vyhledávač bude načítat pouze záznamy, které obsahují všechny hledané výrazy. Operátor "OR" rozšiřuje výsledky, protože vyhledávač přidává výsledky z jednotlivých hledání. Operátor "NOT" vylučuje výsledky s termínem, který následuje za operátorem "NOT".

Poznámka: Pokud necháte tuto předvolbu expandedSearchOption nastavenou na "Nezobrazovat", to je na displeji uvidíte:

Strana Pokročilé vyhledávání pak zobrazí více typů (filtrů) omezení, které mohou být použity na vaše výsledky vyhledávání. Buď zaškrtněte pole, nebo vyberte z rozbalovacího menu abyste zúžili vyhledávání. Budete zadejte rok, rozsah roků, nebo "větší než (>)" nebo "menší než (<)" rok.

Nakonec si můžete vybrat, jak budou výsledky řazeny. Předefinované možnosti řazení jsou na konci obrazovky Pokročilého hledání.

The default sort is by relevance, although you can choose to sort by author, by title, by call number, by dates, or by popularity (which uses the information on total issues found in the items table). If you would prefer a different default sort, you can set defaultSortField to one of the other choices in Administration > System Preferences > Searching.

13.2.5. Vyhledávání pomocí CCL (Common Command Language)

Koha používá Common Command Language (ISO 8777) jako vnitřní hledací protokol. Vyhledávání zahájené v grafickém rozhraní, použije také tento protokol, i když čtenář neví, které indexy, operátory a argumenty jsou k dispozici a jsou používány k provádění hledání. Hledající můžete využít Pokročilé hledání, pokud je žádáno přesnější vyhledávání výsledků a kde argumenty k vyhledání jsou známé. Nicméně, někteří uživatelé knihovny a mnoho zaměstnanců knihoven dávají přednost použití struktury dotazu na základě příkazů. Tato část dokumentu bude prezentovat a vysvětlí použití příkazového hledání na základě struktury Koha. Indexy, operátory a filtry zde používané jsou totožné s těmi, které se používají v grafickém rozhraní.

13.2.5.1. Indexy

Samotná norma CCL nespecifikuje konkrétní sadu kvalifikací (indexy), ale navrhuje několik zkratek, jako jsou "ti", "au" a "su". Koha má výchozí sadu indexů; tuto sadu je možné přizpůsobit přidáním potřebných indexů založených na místních požadavcích. Kvalifikátor (index) mapuje na konkrétní atribut "Užiti" v Z39.50 BIB-1 množině atributů. Kompletní Z39.50 Bib-1 atributy můžete vidět na http://www.loc.gov/z3950/agency/defns/bib1.html

Standardní soubor indexů (argumentů) Koha je docela obyčejný příklad pravidel MARC21 indexování. Indexy, které jsou definovány v Koha jsou indexy, které se obvykle používají v jiných integrovaných knihovních systémech. Definovaná množina atributů Z39.50 Bib-1 mapových na na indexy (atributy) Koha zahrnuje:

Tabulka 13.1. Atributy

Bib-1 AttributKvalifikátor (index)
Jméno osobypn
Corporate-namecpn
Jméno konferencecfn
Názevti
Název periodikase
Uniformní názevut
ISBNnb
ISSNns
Místní číslosn
Místní klasifikacelcn and callnum
Předmět (téma)su, su-to, su-geo, su-ut
Datum vydáníyr,pubdate
Datum přírůstku (získání do fondu)acqdate
Jazykln
Místo vydánípl
Abstrakt (výtažek)ab
Poznámkynt
Typ záznamurtype, mc-rtype, mus
Autorau, aut
Předmět je jméno osobysu-na
Cokoliv (Klíčové slovo)kw
Vydavatelpb
Typ obsahuctype
Koha číslo autoraan
Autorova osobní bibilografieaub
Autor v pořadí (vedlejší autor)auo

Refer to the Koha Indexing Chart for the MARC21 tags mapped to each Bib-1 Attribute and index combination.

13.2.5.1.1. Příklady publika (pro které je jednotka určena)
  • aud:a Předškolní

  • aud:b Základní

  • aud:c Mládež

  • aud:d Dospívající mládež

  • aud:e Dospělí

  • aud:f Specializovaní

  • aud:g Obecný čtenář

  • aud:j Mladiství

13.2.5.1.2. Příklady obsahu
  • fic:1 Fiction

  • fic:0 Non Fiction

  • bio:b Životopisy

  • mus:j Hudební nahrávky

  • mus:I Nehudební nahrávky

13.2.5.2. Syntaxe hledání

V hlavním vyhledávacím poli, jednotlivá slova obecně vyhledají mnoho výsledků. Chcete-li zúžit vyhledávání, můžete použít více slov. Koha automaticky používá "AND" boolovského operátoru, aby vytvořila sadu záznamů odpovídajících zadání. Pokud chcete zúžit vyhledávání podle autora nebo názvu nebo předmětu, nebo nějaké jiné konkrétní oblasti nebo použít logický operátor, není zcela zřejmé, jak toho dosáhnout v konkrétním případě. Uživatel knihovny může přejít na stránku Pokročilé vyhledávání, ale pokud víte, jak se používat CCL, můžete dosáhnout větší přesností, než při použití hlavního vyhledávacího pole.

Existuje specifická syntaxe hledání pomocí CCL. I když se to může použit pro jednoduché vyhledávání, je to obzvláště účinný způsob, jak provádět složité vyhledávání, protože vám poskytuje velkou kontrolu nad výsledky vyhledávání. Chcete-li vytvořit CCL hledání, zadejte nejprve požadovaný kód indexu (argumentu), pak rovnítko následované hledaným slovem(y). Níže jsou uvedeny příklady jednoduchého vyhledávání CCL.

  • ti=základy účetnictví

  • au=brown joseph

  • su=poezie

  • su-na=Shakespeare

  • kw=marlin

Můžete upřesnit své hledání tím, že kombinuje vyhledávací termíny s booleovskými operátory "AND", "OR", nebo "NOT". Níže jsou uvedeny příklady vyhledávání pomocí booleovských operátorů.

  • ti=principy účtenictví AND au=brown joseph

  • su=poezie NOT su-na=Shakespeare

  • kw=komunikace AND su=debata

Můžete také hledat věci, které začínají znakem nebo sérií znaků

  • ti,first-in-subfield=C (ukáže všechny tituly, které začínají písmenem"C")

Jiné umístění umístění vyhledávaného řetězce může být provedeno s následujícími klíčovými slovy:

  • rtrn : right truncation

  • ltrn : levostranné zaokrouhlení (left truncation)

  • lrtrn : levostranné a pravostranné zaokrouhlení (left and right truncation)

  • st-date : typ datumu

  • st-numeric : typ number (integer)

  • ext : vyhledání na přesnou shodu v celém podpoli (nepracuje s icu)

  • phr : vyhledání na frázi kdekoliv v podpoli (fráze = text několika slov)

  • startswithnt : podpole začíná na

Použití specifických indexů a boolovské operátory nejsou jediný způsob modifikace vyhledávání. Můžete také upřesnit hledání jako fráze při hledání názvu, autora nebo tématu. Syntaxe pro toto hledání je index, phr = hledaná slova .

Pro ilustraci výsledků různých typů vyhledávání, hledání bylo provedeno na slova "Nejvyšší soud". Výsledky ukazují, že hledání na slova a pořadí slov, dělají rozdíl ve výsledcích vyhledávání. Pouze počet výsledků a hledání sama o sobě je uvedeno v těchto příkladech. Hledání je vždy uvedeno v jednoduchých apostrofech.

Můžete také zvolit použití omezovačů ve svém vyhledávacím dotazu. Běžné omezovače jsou datumy, jazyky, typy záznamů a typy jednotek. V pokročilém vyhledávání, můžete buď zatrhnout políčko nebo zadat údaje pro omezení vyhledávání. Můžete také použít stejné omezení s CCL pomocí syntaxe uvedené následujících příkladech. Ve všech

Datum: su=Nejvyšší soud AND yr,st-numeric=>2000

Když chcete omezit podle datumů, můžete použít symboly ">" (větší než), "<" (menší než), "=" (rovná se), nebo "yyyy-yyyy" (rozsah).

Typ jednotky: su=ošetřovatelství AND itype:BK

Každá knihovna bude mít jinou sadu typů jednotek definovaných v jejich konfiguraci výpůjček. Při nastavování typů jednotek, můžete definovat kód a název pro každý z nich. Název se zobrazí na stránce Pokročilé vyhledávání. Kód takto přiřazený slouží jako omezení pro CCL vyhledávání, formátované jako "iType: x", kde "x" je přidělený kód. Počáteční sada typů jednotek je ve Koha obvykle upravena tak, aby odrážela vlastní sbírky, takže vaše omezení na typ jednotky se může lišit. Počáteční omezovače typu jednotky následují.

  • itype:BKS Knihy, Brožury, Učebnice

  • itype:SR Audiokazety, CD

  • itype:IR Binders

  • itype:CF CD-ROMs, DVD-ROMs, Obecné Online zdroje

  • itype:VR DVDs, VHS

  • itype:KT Kit

  • itype:AR Models

  • itype:SER Serials

Podle formátu: su=Nejvyšší soud NOT l-format:sr

Omezovače formátu jsou odvozeny z kombinace polí LDR, 006 a 007. Formáty, které jsou v současné době definovány, jsou následující.

  • l-format:ta Běžný tisk

  • l-format:tb Velký tisk

  • l-format:fk Braillovo písmo

  • l-format:sd CD audio

  • l-format:ss Kazetová nahrávka

  • l-format:vf VHS páska

  • l-format:vd DVD video

  • l-format:co CD software

  • l-format:cr Website

Předmět: su=Nejvyší soud NOT ctype:l

Typy obsahu jsou převzaty z MARC21 tag 008, pozice 24-27.

Existují ještě ​​další dva typy omezovačů, které nejsou popsány v tomto dokumentu. Jsou to: audience (cílová skupina) a obsah. Jediný rozdíl v syntaxi CCL je aktuální omezovač. Zde jsou reprodukovány jen v případě, že jste chtěli použít tyto omezovače.