CHUÊÍN NGHIÏÅP VUÅ CÊÌN AÁP DUÅNG TRONG XÛÃ LYÁ VAÂ BIÏN MUÅC TAÂI LIÏÅU ÀIÏÅN TÛÃ ThS. Vuä Dûúng Thuyá Ngaâ Àaåi hoåc Vùn hoaá Haâ Nöåi Giúái thiïåu möåt söë chuêín nghiïåp vuå cêìn aáp duång trong xûã lyá vaâ biïn muåc taâi liïåu àiïån tûã: chuêín mö taã vaâ truy cêåp taâi nguyïn, chuêín aáp duång phûúng diïån kïët húåp thuêåt ngûä chuã àïì, chuêín siïu dûä liïåu Dublin Core, chuêín tûâ vûång mö taã loaåi taâi liïåu, chuêín ISO mö taã yïëu töë ngaây thaáng vaâ chuêín ISO maä ngön ngûä. Cuâng vúái viïåc ûáng duång cöng nghïå thöng tin ngaây möåt sêu röång trong thûåc tïë, caác taâi liïåu àiïån tûã ngaây caâng trúã nïn phöí biïën trïn thïë giúái vaâ úã Viïåt Nam. Thûåc tïë àoá àaä laâm caác chuêín biïn muåc, ngoaâi möåt söë quen thuöåc daânh cho caác taâi liïåu truyïìn thöëng, thïm àa daång vúái sûå xuêët hiïån caác chuêín cho biïn muåc taâi liïåu àiïån tûã. Àïí hûúáng túái sûå chuêín hoaá trong xûã lyá taâi liïåu àiïån tûã, möåt söë quy tùæc mö taã, caác baãng tra cûáu chuã àïì, chuêín biïn muåc múái àaä àûúåc caác thû viïån úã nhiïìu nûúác trïn thïë giúái quan têm aáp duång. Baâi viïët naây seä àïì cêåp túái möåt söë chuêín duâng trong biïn muåc, xûã lyá taâi liïåu vaâ möåt söë quy àõnh cêìn tuên thuã khi aáp duång chuáng. 1. Biïn muåc mö taã: Chuêín mö taã vaâ truy cêåp taâi nguyïn (Resource Description Access- RDA) àaä àûúåc soaån thaão. Chuêín RDA do Uyã ban Húåp taác Phaát triïín RDA (Joint Steering Committee for Development of RDA- JSC) xêy dûång tûâ nùm 2005 vaâ dûå kiïën ban haânh thaáng 11 nùm 2009. Muåc tiïu cuãa RDA laâ thay thïë AACR2 àïí trúã thaânh möåt böå chuêín hoaân chónh hûúáng dêîn mö taã vaâ kiïím soaát àiïím truy cêåp cho têët caã caác daång taâi liïåu, höî trúå hiïåu quaã cho quaá trònh tòm kiïëm taâi liïåu, àùåc biïåt laâ trong möi trûúâng àiïån tûã, núi àoâi hoãi àöå tûúng thñch cao vúái cöng nghïå web vaâ cú súã dûä liïåu. RDA àûúåc xêy dûång dûåa trïn mö hònh cuãa 4 chuêín: chuêín Yïu cêìu chûác nùng àöëi vúái biïíu ghi thû muåc FRBR (Functional Requirements for Bibliographic Records); chuêín Yïu cêìu chûác nùng àöëi vúái dûä liïåu kiïím soaát FRAD (Functional Requirements for Authority Data) do Hiïåp höåi Thû viïån Quöëc tïë IFLA ban haânh; chuêín Mö hònh töíng quaát chuêín siïu dûä liïåu Dublin Core (Dublin Core Metadata Initiatives Abstract Model) vaâ chuêín Tûúng thñch (Tûúng taác) dûä liïåu trong hïå thöëng thûúng maåi àiïån tûã (interoperability of data in e-commerce systems) do Cöång àöìng chêu Êu (European Community Infor) ban haânh. Vïì nöåi dung, RDA àaä phaãn aánh àûúåc möåt söë àùåc thuâ cuãa taâi THÖNG TIN vaâ TÛ LIÏÅU - 2/2010 5
liïåu àiïån tûã maâ AACR2 chûa thïí hiïån àûúåc. 2. Cöng cuå àõnh chuã àïì taâi liïåu: bïn caånh baãng Tiïu àïì chuã àïì cuãa Thû viïån Quöëc höåi Hoa Kyâ, Chuêín aáp duång phûúng diïån kïët húåp thuêåt ngûä chuã àïì FAST (Faceted Application of Subject Terminology) - hay coân goåi laâ Baãng thuêåt ngûä chuã àïì theo lônh vûåc (theo caách dõch cuãa Thaái Thõ Thanh Thuyã) àaä àûúåc biïn soaån vaâ triïín khai aáp duång. Chuêín FAST do Trung têm Thû viïån Maáy tñnh trûåc tuyïën OCLC (Online Computer Library Center) xêy dûång tûâ nùm 1998. Nhúâ phaát triïín trïn cú súã böå àïì muåc chuã àïì LCSH cuãa Thû viïån Quöëc höåi Hoa Kyâ, FAST thûâa hûúãng nhûäng thïë maånh àùåc biïåt cuãa möåt böå chuã àïì nöíi tiïëng nhêët thïë giúái àöìng thúâi àaáp ûáng caác yïu cêìu chuyïn nghiïåp cuãa möåt böå àïì muåc chuã àïí trong thúâi àaåi thû viïån àiïån tûã. FAST àûúåc thiïët kïë theo hûúáng giaãm thiïíu viïåc xêy dûång caác chuöîi àïì muåc phûác taåp nhûng vêîn duy trò sûå phong phuá vïì tûâ vûång cuãa LCSH. Khaác vúái LCSH caác chuã àïì cuãa FAST àûúåc xêy dûång chuã yïëu theo phûúng phaáp hêåu kïët húåp (LCSH thiïn vïì phûúng phaáp tiïìn kïët húåp). Sûå àúån giaãn hoaá trong viïåc kïët húåp chuã àïì cuãa FAST giuáp viïåc àõnh chuã àïì trúã nïn dïî daâng hún vaâ ngûúâi àõnh chuã àïì khöng nhêët thiïët phaãi laâ caán böå biïn muåc. FAST àaåt àûúåc àöå tûúng thñch cao vúái hïå thöëng tòm kiïëm nïn rêët thuêån lúåi cho viïåc tòm kiïëm tñch húåp caác taâi liïåu thuöåc nhiïìu ngaânh vaâ nùçm úã nhiïìu CSDL khaác nhau. Möåt thuêån lúåi rêët lúán àöëi vúái caác thû viïån àang sûã duång LCSH khi chuyïín sang sûã duång FAST laâ hai böå chuêín chuã àïì naây coá thïí duâng song song vúái nhau. Nghiïn cûáu gêìn àêy trïn möåt hïå thöëng aáp duång caã hai chuêín naây cho thêëy sûå khaác biïåt rêët nhoã vïì kïët quaã tòm kiïëm taâi liïåu tûâ hïå thöëng tñch húåp hai chuêín naây. Trong viïåc phaát triïín FAST, muåc tiïu chñnh laâ taåo ra sûå tûúng thñch vúái siïu dûä liïåu hiïån coá, dïî daâng chuyïín àöíi, hiïåu quaã, chi phñ baão trò thêëp vaâ coá khaã nùng tûúng taác ngûä nghôa. Vöën tûâ vûång FAST àûúåc chia thaânh taám loaåi hoùåc caác khña caånh riïng biïåt: tïn caá nhên, tïn cú quan töí chûác, tïn àõa lyá, sûå kiïån, nhan àïì, thúâi gian, chuã àïì vaâ hònh thûác/thïí loaåi. Vïì cêëu truác, FAST bao göìm 4 Hïå àïì muåc (facets): Hïå àïì muåc chñnh (Topical facet), Hïå àïì muåc àõa lyá (Geographic facet), Hïå àïì muåc thïí loaåi (Forms facet) vaâ Hïå àïì muåc thúâi kyâ (Periods facet). Hïå àïì muåc chñnh bao göìm caác àïì muåc lúán vaâ caác tiïíu muåc chung tûúng ûáng. Caác àïì muåc cuãa FAST rêët giöëng caác àïì muåc cuãa LCSH, ngoaåi trûâ laâ caác àïì muåc LCSH thûúâng bao göìm têët caã caác tiïíu muåc chñnh vaâ caác tiïíu muåc chñnh naây seä àûúåc taåo lêåp riïng. Möåt àiïím khaác nûäa laâ têët caã caác chuöîi àïì muåc chñnh cuãa FAST àïìu nùçm trong danh saách kiïím soaát (authority file). Caác àïì muåc cuãa FAST àûúåc lêåp theo quy tùæc thûá bêåc cuãa LCSH nhûng chó coá caác tiïíu muåc chñnh múái àûúåc gheáp vúái 6 THÖNG TIN vaâ TÛ LIÏÅU - 2/2010
caác àïì muåc lúán. VD: Quaãn lyá dûå aán cöng nghiïåp Xûã lyá dûä liïåu; Àûúâng öëng gas tûå nhiïn Àùåc àiïím kinh tïë. Hïå àïì muåc àõa lyá bao göìm têët caã caác tïn àõa danh vaâ àûúåc thiïët lêåp theo trêåt tûå giaán tiïëp. VD: Ohio Columbus thay vò Columbus (Ohio) nhû trong LCSH. Viïåc sûã duång quy tùæc giaán tiïëp àaä giaãm thiïíu sûå phûác taåp cuãa quy tùæc kïët húåp caã trûåc tiïëp vaâ giaán tiïëp cuãa LCSH, àöìng thúâi caãi thiïån giao diïån vaâ quy tùæc tòm kiïëm cho ngûúâi duâng. Tïn àõa danh cêëp 1 cuãa FAST àûúåc giúái haån hún nhiïìu so vúái LCSH do sûã duång baãng Maä Àõa danh. VD: Maryland-Quêån Worcester [n-us.md]. Têët caã caác àïì muåc àõa lyá cuãa FAST àïìu nùçm trong danh saách kiïím soaát. Hïå àïì muåc thïí loaåi bao göìm têët caã caác daång tiïíu muåc. Àïì muåc thïí loaåi FAST àûúåc thiïët lêåp bùçng phûúng phaáp taách têët caã caác àïì muåc thïí loaåi tûâ caác àïì muåc chñnh vaâ àïì muåc àõa lyá cuãa LCSH. Têët caã caác àïì muåc thïí loaåi cuãa FAST àïìu nùçm trong danh saách kiïím soaát. Hïå àïì muåc thúâi kyâ bao göìm têët caã caác àïì muåc thúâi kyâ cêëu truác theo daång ngaây hoùåc giai àoaån. Caác àïì muåc theo niïn àaåi seä àûúåc phaãn aãnh bùçng thúâi kyâ thûåc bao quaát thúâi gian àïì cêåp trong nöåi dung taâi liïåu. VD: Triïìu àaåi Töëng, 960-1279 seä àûúåc thay búãi 960-1279. Tuy nhiïn, cêëu truác ngaây theo phûúng thûác naây cuãa FAST seä laâm mêët thöng tin böí ñch, nhû úã vñ duå naây laâ mêët thöng tin: Triïìu àaåi Töëng (möåt triïìu àaåi lõch sûã nöíi tiïëng cuãa Trung Quöëc). Do thiïët lêåp àïì muåc thúâi kyâ chó coá möåt haån chïë khi mö taã laâ ngaây cuöëi phaãi lúán hún ngaây àêìu theo thûá tûå thúâi gian nïn àïì muåc thúâi kyâ khöng nùçm trong danh muåc kiïím soaát nhû ba hïå àïì muåc trûúác àoá. 3. Khöí mêîu biïn muåc: Chuêín siïu dûä liïåu Dublin Core (Dublin Core Metadata Framework) àaä nöíi lïn nhû möåt chuêín biïn muåc caác taâi liïåu vaâ nguöìn tin àiïån tûã àûúåc caác thû viïån úã nhiïìu nûúác, trong àoá coá Viïåt Nam, quan têm aáp duång. Chuêín siïu dûä liïåu Dublin Core (DC) do Trung têm Thû viïån Maáy tñnh trûåc tuyïën OCLC vaâ Trung têm quöëc gia caác Chûúng trònh siïu maáy tñnh NCSA (National Centre for Super Computing Applications) xêy dûång thaáng 3 nùm 1995. Chuêín Dublin Core hiïån taåi coá hai cêëp àöå mö taã: àún giaãn (simple) vaâ chi tiïët (qualified). ÚÃ cêëp àöå àún giaãn, DC bao göìm 15 yïëu töë cú baãn: Nhan àïì, Taác giaã, Chuã àïì, Mö taã, Nhaâ xuêët baãn, Àöìng taác giaã, Ngaây, Loaåi taâi liïåu, Àõnh daång, Nhêån daång (Àõnh danh), Nguöìn, Ngön ngûä, Quan hïå, Phaåm vi vaâ Baãn quyïìn (Right). ÚÃ cêëp àöå chi tiïët, DC böí sung caác phuå töë vaâ caác quy tùæc (Qualifiers) chuêín hoáa nöåi dung mö taã nhùçm nêng cao chêët lûúång mö taã vaâ tòm kiïëm taâi liïåu. Caác yïëu töë böí sung chó nhùçm laâm roä yïëu töë mö taã hún laâ múã röång hay thay àöíi nöåi dung yïëu töë. Vúái nhûäng àiïím maånh naây, DC nhanh choáng àûúåc chêëp nhêån vaâ trúã thaânh möåt THÖNG TIN vaâ TÛ LIÏÅU - 2/2010 7
trong nhûäng chuêín àûúåc aáp duång rêët phöí biïën hiïån nay trong thû viïån àiïån tûã. Àïí thûåc hiïån viïåc biïn muåc theo DC àûúåc thöëng nhêët vaâ àaãm baão chuêín hoaá, möåt söë tiïu chuêín àaä àûúåc aáp duång: Chuêín tûâ vûång mö taã loaåi taâi liïåu, Chuêín quöëc tïë mö taã yïëu töë ngaây thaáng (ISO 8601-2004), Chuêín maä ngön ngûä (ISO 639-2). Chuêín tûâ vûång mö taã loaåi taâi liïåu Dublin Core (DCMI Type Vocabulary): do töí chûác Dublin Core (DCMI) biïn soaån nùm 2008 nhùçm cung cêëp möåt danh saách tûâ chuêín thöëng nhêët vïì loaåi taâi liïåu, höî trúå viïåc chuêín hoaá cöng taác mö taã, nhêån daång vaâ trao àöíi dûä liïåu giûäa caác hïå thöëng vaâ cú quan thû viïån - thöng tin. Chuêín naây bao göìm 12 nhoám tûâ chñnh: (i) Böå sûu têåp Collection; (ii) Têåp húåp dûä liïåu Dataset; (iii) Sûå kiïån Event; (iv) Hònh aãnh Image; (v) Taâi liïåu tûúng taác InteractiveResource; (vi) Hònh aãnh àöång MovingImage; (vii) Vêåt thïí - PhysicalObject; (viii) Service Dõch vuå; (ix) Phêìn mïìm Software; (x) Êm thanh Sound; (xi) Hònh aãnh tônh StillImage; (xii) Vùn baãn Text. Möîi nhoám tûâ chñnh bao göìm àõnh nghôa vaâ têåp húåp tûâ vûång mö taã chi tiïët caác loaåi taâi liïåu thuöåc nhoám àoá. Vñ duå: nhoám tûâ Vùn baãn bao göìm taâi liïåu daång tûâ àïí àoåc nhû saách, baáo, thú, luêån vùn, thû tûâ,. Töí chûác DCMI khuyïën nghõ caác àún võ thaânh viïn aáp duång chuêín DCMI Type Vocabulary àïí mö taã yïëu töë Loaåi taâi liïåu (Type) trong chuêín siïu dûä Dublin Core. Chuêín ISO mö taã yïëu töë ngaây thaáng (ISO 8601-2004, Data elements and interchange formats Information interchange Representation of dates and times): ISO 8601-2004 do Uyã ban Kyä thuêåt ISO/TC 154 ban haânh nùm 2004 vaâ thay thïë toaân böå caác chuêín ISO 8601 trúã vïì trûúác. Muåc tiïu cuãa ISO 8601-2004 laâ thöëng nhêët àõnh daång dûä liïåu vïì ngaây, thaáng vaâ thúâi kyâ. ÛÁng duång cuãa ISO 8601-2004 trong trao àöíi thöng tin, àùåc biïåt laâ giûäa caác hïå thöëng xûã lyá dûä liïåu vaâ caác thiïët bõ tûúng ûáng, àaä haån chïë töëi àa viïåc mö taã khaác nhau trêåt tûå ngaây thaáng nùm, hay giúâ phuát giêy nhùçm loaåi boã nhêìm lêîn trong nhêån daång söë vaâ giaãm thiïíu chi phñ phaát sinh. Hïå thöëng àõnh daång cuãa ISO 8601-2004 rêët linh hoaåt cho pheáp ngûúâi duâng coá thïí mö taã àêìy àuã thöng tin vïì thúâi gian hoùåc chó mö taã ngùæn goån thöng tin cêìn thiïët theo nhu cêìu. ISO 8601-2004 quy àõnh caách mö taã ngaây, thúâi gian trong ngaây, giúâ quöëc tïë, giúâ àõa phûúng + chïnh giúâ, ngaây vaâ giúâ, thúâi kyâ vaâ caác thúâi kyâ coá tñnh liïn tuåc. Viïåc mö taã yïëu töë thúâi gian aáp duång chuêín ISO 8601-2004 höî trúå quaá trònh nhêån daång trong caác hïå thöëng, taåo khaã nùng so saánh, sùæp xïëp vaâ àöåc lêåp vúái ngön ngûä. Chuêín ISO 8601-2004 hiïån àang àûúåc sûã duång röång raäi trïn rêët nhiïìu hïå thöëng nhû chûúng trònh maáy tñnh, taâi liïåu hoåc thuêåt, taâi liïåu daång Web, thûúng maåi àiïån tûã cuãa caác cú quan, töí chûác trïn toaân cêìu. Töí chûác Dublin Core àaä khuyïën nghõ aáp duång chuêín ISO 8601-2004 cho yïëu töë mö taã ngaây (date) trong chuêín siïu dûä liïåu Dublin Core. 8 THÖNG TIN vaâ TÛ LIÏÅU - 2/2010
Chuêín maä ngön ngûä ISO 639-2 (Codes for the representation of names of languages): do caác uyã ban Kyä thuêåt ISO TC37, TC46, SC2 vaâ SC4 thuöåc Töí chûác Tiïu chuêín Quöëc tïë àöìng soaån thaão vaâ ban haânh nùm 1998 àïí chuêín hoáa viïåc mö taã ngön ngûä aáp duång trong lônh vûåc thuêåt ngûä, tûâ vûång, thöng tin tû liïåu (thû viïån, dõch vuå thöng tin, xuêët baãn). Böå chuêín ISO 639 bao göìm hai phêìn: 639-1: Alpha-2 code (maä hai kyá tûå) vaâ 639-2: Alpha-3 code (maä ba kyá tûå). Chuêín ISO 639-2 ra àúâi àïí haån chïë nhûäng khoá khùn phaát sinh tûâ viïåc duâng maä ngön ngûä 2 kyá tûå chûä caái cuãa chuêín ISO 639-1. Chuêín ISO 639-2 àûúåc xêy dûång dûåa trïn danh saách Maä nûúác cuãa chuêín MARC nhùçm dung hoaâ sûå khaác biïåt giûäa ngûúâi chuyïn duâng thû muåc vaâ ngûúâi duâng quan têm àïën caác ûáng duång thuêåt ngûä. ISO 639-2 hiïån àaä cêåp nhêåt toaân böå maä ngön ngûä thuöåc böå 639-1, do àoá têët caã caác maä ngön ngûä hai kyá tûå àaä coá thïm phêìn maä ba kyá tûå tûúng ûáng. Caã hai böå chuêín naây àïìu àûúåc xêy dûång úã daång múã àïí cöång àöìng sûã duång coá thïí cêåp nhêåt thïm. Do Töí chûác ISO àaä trao quyïìn kiïím soaát àùng kyá cho Thû viïån Quöëc Höåi Hoa Kyâ nïn chuêín naây seä àûúåc Thû viïån Quöëc höåi Hoa Kyâ tiïëp tuåc phaát triïín. Chuêín ISO 639-2 àûúåc töí chûác Dublin Core khuyïën nghõ aáp duång àïí mö taã yïëu töë ngön ngûä (language) trong chuêín Dublin Core. Caác thû viïån vaâ cú quan thöng tin úã Viïåt Nam àang àêíy nhanh tiïën trònh hiïån àaåi hoaá vaâ giaânh nhiïìu sûå quan têm cho viïåc xêy dûång vaâ phaát triïín caác thû viïån àiïån tûã. Àïí xêy dûång vaâ quaãn trõ caác thû viïån àiïån tûã khöng thïí boã qua cöng taác biïn muåc. Chuá yá aáp duång caác chuêín nghiïåp vuå ngay tûâ àêìu seä laâ möåt trong nhûäng yïëu töë vaâ àiïìu kiïån tiïn quyïët giuáp cho caác thû viïån hoaåt àöång hiïåu quaã, àaãm baão chêët lûúång, taåo àiïìu kiïån cho viïåc chia seã thöng tin vaâ phuåc vuå ngûúâi duâng tin möåt caách töët nhêët. Àiïìu àoá phêìn naâo seä goáp phêìn ruát ngùæn dêìn khoaãng caách giûäa caác thû viïån Viïåt Nam vúái caác thû viïån tiïn tiïën trïn thïë giúái. Taâi liïåu tham khaão 1. Alan Danskin. RDA Scope and Structure, 1July 2009. http://www.rda-jsc.org/docs/5rda-scoperev4.pdf 2. Dublin Core Metadata Initiatives, 2009. http://www.dublincore.org 3. El-Sherbini, M. & Klim, G. Metadata and cataloging practices. The Electronic Library, 2004, 22(3): 238-248. 4. Gorman, M. RDA: imminent debacle: The editor of AACR2 takes issue with cataloguing s new direction.(cataloguing)(resource Description and Access, revision of the Anglo-American Cataloguing Rules). American Libraries 2007, 38(11): 64(2). 5. International Standard Organization: ISO 8601-2004, Data elements and interchange formats Information interchange Representation of dates and times, ISO TC 154. http://www.iso.org/iso/catalogue_detail?csnumber=40874 6. Internet Assigned Numbers Authority. MIME Media Types. OCLC. FAST Faceted Application of Subject Terminology, 2009. http://www.oclc.org/research/projects/fast 7. Taylor, A. G. Comparison of keyword searching using FAST vs. Using LCSH, 2006, ALA Annual Conference. New Orleans, Louisiana (USA) OCLC. 8. http://fast.oclc.org THÖNG TIN vaâ TÛ LIÏÅU - 2/2010 9