20 let normativne kontrole v sistemu COBISS

Letos mineva 20 let od uvedbe normativne kontrole v sistemu COBISS. okrasna slikaNajprej je bila uvedena normativna kontrola avtorjev v Sloveniji, priprave na uvedbo pa so trajale več let. Sistem COBISS.SI so knjižnice uporabljale že več kot deset let in bibliografske baze podatkov so vsebovale veliko zapisov, zato je bilo treba precej časa posvetiti tudi analizi obstoječih podatkov. V tem času je stekla tudi prenova programske opreme, ki je takrat še vedno delovala na platformi VMS, kar je uvajanje normativne kontrole zaradi pomanjkanja resursov dodatno upočasnilo. Po večletnih pripravah smo decembra 2001 kreirali inicialno bazo CONOR.SI z nekaj manj kot 25.000 programsko kreiranih zapisov za osebna imena raziskovalcev in avtorjev iz zapisov za slovensko nacionalno bibliografijo. Za vse knjižnice v sistemu COBISS.SI je bila vzpostavljena ena normativna baza CONOR.SI, ki je bila na istem strežniku kot vzajemna baza COBIB.SI.
Po dobrem letu dni, ko so katalogizatorji redigirali zapise v bazi CONOR.SI, v IZUM-u pa smo prilagodili programsko opremo za delo z normativno kontrolo, smo na velikonočne praznike aprila 2003 (18.–21. 4.) končno inicialno povezali avtorje v bibliografskih zapisih z normativnimi zapisi iz baze CONOR.SI in omogočili vnos avtorjev prek normativne baze. Programska oprema COBISS2 je v tistem času v COBISS.SI tekla na več kot 50 strežnikih VMS, na katerih so bile bibliografske baze podatkov, zato je pri prehodu sodelovalo večje število sodelavcev, ki so zaganjali konverzijo, indeksirali baze in testirali uspešnost postopka. K sreči je prehod uspel že v prvem poskusu.

V nadaljnjih letih je veliko sodelavcev IZUM-a sodelovalo pri razvoju novih funkcionalnosti v vseh segmentih in prehod na novo generacijo programske opreme COBISS3, zato sta nadaljnji razvoj in uvajanje normativne kontrole potekala zelo počasi. V naslednjem koraku smo pripravili normativno kontrolo korporacij, ki pa se je leta 2007 ustavila v postopku testiranja in smo jo uvedli šele leta 2018. Hkrati smo se ukvarjali tudi z normativno kontrolo za cirilična okolja in okolja, ki enakovredno uporabljajo latinico in cirilico (t. i. sinhrona digrafija). Normativno kontrolo za cirilično okolje smo uvedli najprej v COBISS.BG v Narodni in univerzitetni knjižnici Kiril in Metod, ki se je v COBISS vključila leta 2010 in je takoj začela uporabljati COBISS3/Katalogizacijo, normativna baza pa je prenesena s konverzijo iz prejšnjega sistema. Obvezen vnos osebnih imen iz normativne baze je bil vklopljen leta 2016. V sistemu COBISS.BG smo dobili tudi prvo normativno bazo predmetnih oznak, ki je bila prav tako s konverzijo prenesena iz prejšnjega sistema, vendar tam še vedno nimajo vključenega vnosa predmetnih oznak prek normativne baze. V Sloveniji je vzporedno tekla tudi gradnja Splošnega geslovnika COBISS (SGC), ki je bil vključen v COBISS.SI šele leta 2018, čeprav je bil dostopen v COBISS/OPAC oz. kasneje COBISS+ od leta 2006. Normativno kontrolo predmetnih oznak s Splošnim geslovnikom COBISS pa smo v sistemu COBISS.SI vzpostavili leta 2021. Normativna baza za dela po modelu IFLA LRM je trenutno še v fazi analize. Tabela 1 prikazuje časovni potek uvajanja normativne kontrole različnih entitet v sistemu COBISS.net od leta 2003 do 2022.

Tabela 1: Časovni potek uvajanja posameznih vrst normativne kontrole v sistemu COBISS.net
Tabela 1: Časovni potek uvajanja posameznih vrst normativne kontrole v sistemu COBISS.net

Danes se normativna kontrola osebnih imen uporablja ali pa je vsaj v pripravi v vseh sistemih COBISS (tabela 2). Normativno kontrolo korporacij in predmetnih oznak uporabljamo samo v sistemu COBISS.SI, vnos prek normativne baze pa zaenkrat še ni obvezen.

Tabela 2: Stanje v sistemu COBISS.Net na dan 1. 4. 2023
Tabela 2: Stanje v sistemu COBISS.Net na dan 1. 4. 2023

Ob uvedbi normativne kontrole avtorjev v sistemu COBISS.SI je bilo v bazi CONOR.SI slabih 25.000 zapisov, z začetnim povezovanjem pa so bili povezani samo avtorji iz zapisov za slovensko nacionalno bibliografijo in raziskovalci, pri katerih pa smo že prej za identifikacijo uporabljali šifro raziskovalca. V vzajemni bazi COBIB.SI je bila povezana približno tretjina bibliografskih zapisov. Pri tako majhni normativni bazi prednosti normativne kontrole niso bile vidne na prvi pogled. Ker pa je bilo pri kreiranju bibliografskih zapisov povezovanje avtorjev z normativno kontrolo obvezno, so katalogizatorji pridno polnili bazo CONOR.SI in število povezanih avtorjev je dovolj hitro naraščalo. Za povezovanje obstoječih bibliografskih zapisov so si lahko pomagali z orodjem za paketno povezovanje normativnih in bibliografskih zapisov, za usklajenost avtorjev v bibliografskih zapisih s podatki v bazi CONOR.SI pa smo poskrbeli za sinhronizacijo (programsko usklajevanje) podatkov, ki poteka vsako noč.

Vendar čeprav v COBISS.SI že 20 let uporabljamo vnos osebnih imen prek normativne baze, je še vedno precej bibliografskih zapisov, ki nimajo povezanih vseh avtorjev, tako v vzajemni kot v lokalnih bibliografskih bazah. Povezovanje avtorjev pri ažuriranju obstoječih bibliografskih zapisov ni obvezno, sinhronizacija je obvezna samo v vzajemni bazi, sistematično povezovanje avtorjev pa je ročno delo, ki zahteva čas. Večina zapisov, ki nimajo povezanih vseh avtorjev, so stari zapisi. Npr. od četrtine zapisov, ki nimajo povezanih vseh avtorjev, jih je bilo več kot 70 % kreiranih pred letom 2000. Del takih zapisov pa je bil kreiranih s konverzijami.

Pri zapisih, ki imajo avtorje povezane, pa se odpira še eno vprašanje: trenutna arhitektura sistema z eno vzajemno in več lokalnimi bibliografskimi bazami še vedno dopušča razlike v zapisih, zato se lahko avtorji po bazah razlikujejo, čeprav so povezani z normativnimi zapisi. Teoretično imamo lahko toliko različnih verzij enega bibliografskega zapisa, kot je lokalnih baz v sistemu. Takšna arhitektura izhaja iz časov, ko je bil sistem COBISS zastavljen in je bila komunikacijska infrastruktura še premalo zmogljiva. Zato so imele pri ažuriranju zapisov prednost lokalne baze podatkov. Pri prehodu na COBISS3/Katalogizacijo smo ažuriranje zapisov spremenili tako, da ima prednost vzajemna baza. Ker pa so isti podatki še vedno shranjeni v več bazah, je nekonsistentnost še vedno možna tudi pri novih zapisih. Za odpravo teh razlik bi morali spremeniti arhitekturo vzajemne katalogizacije.

Uvedba normativne kontrole in enoličnega identifikatorja CONOR.ID nam je omogočila sodelovanje v mednarodnih projektih in olajšala delo v aplikacijah, ki zahtevajo enolično identifikacijo avtorjev. CONOR.ID najdemo tudi na Wikipediji in tudi avtorji so se že navadili sklicevati nanj. Medtem ko smo za identifikacijo raziskovalcev še pred uvedbo normativne kontrole uporabljali šifro raziskovalca, je normativna kontrola precej poenostavila uvedbo knjižničnega nadomestila, pri katerem poleg točnih podatkov o izposojah potrebujemo tudi točne podatke o avtorjih. Hkrati takšne aplikacije pripomorejo k urejanju podatkov, saj imajo sami avtorji interes za to, da so podatki točni. Slika 1 prikazuje padec deleža naslovov z nepovezanimi avtorji izvirnih monografskih publikacij za knjižnično nadomestilo v sistemu COBISS.SI z 21,4 % (ali 11.969 naslovov) leta 2003 na samo 1,0 % (ali 866 naslovov) leta 2022. Od leta 2018 izvažamo podatke za osebna imena in korporacije iz baze CONOR.SI tudi v VIAF (Virtual International Authority File). Izmenjava normativnih zapisov med posameznimi sistemi v COBISS.net še ni omogočena.

Slika 1: Upadanje deleža naslovov z nepovezanimi avtorji izvirnih monografskih publikacij v knjižničnem nadomestilu
Slika 1: Upadanje deleža naslovov z nepovezanimi avtorji izvirnih monografskih publikacij v knjižničnem nadomestilu

20 let je precej dolga doba in medtem ko korak po korak vpeljujemo normativno kontrolo v vsakem sistemu posebej, se je porodilo več novih modelov organizacije bibliografskih podatkov, od katerih je najnovejši IFLA LRM (Library Reference Model), nobeden od teh pa še ni zaživel v polni meri. Vzporedno se spreminja tudi arhitektura sistema. Danes podatki niso več shranjeni na kopici VMS strežnikov ampak v eni sami bazi, kar olajša dostop do podatkov, programska oprema COBISS3 pa se počasi umika novi generaciji COBISS4.

Pripravila Andreja Tominac

Viri: