Pärast Dot-Pomm: saada teabeotsing parem seekord

link: http://www.hastingsresearch.com/net/08-net-information-retrieval.shtml

Esimene laine dot-com revolutsioon ebaõnnestus mitmel põhjusel. Ahnus, upsakus ja teadmatus hulgas olid inimeste puudusi. Dot-comid ei suutnud võrdselt tehniline teostus, ja võib-olla suurim tehniline vastasel oli kehv informatsiooni ülekanne: inimesed lihtsalt ei suutnud leida seda, mida nad tahtsid. Selles raamatus Marcia J. Bates, UCLA on infoteaduse osakond piiritleb mõned need vead. – Nicholas Carroll

Marcia J. Bates, UCLA Department of Information Studies
Kuupäev: August 5, 2002

Sissejuhatus

Kõrgusel 1990 infotehnoloogia mull, teabe vahendaja, uurides küsimus kliendile, kutsus mind ja selgitas, et tema klient oli võttes vaidlus teise dot-com firma üle, mis firma oli esimene leiutada idee “push” tehnoloogiat, st, automaatselt teabe saatmist, et inimeste huvi valdkondades nad olid määratud ette. Eesmärk päring oli teha kindlaks, et ükski kolmas isik oli mõte varem.

Ma selgitasin, et maakler, et idee “push” tehnoloogiat, mis oli esimene nn “selektiivne teabe levitamine,” või SDI, ja minu teada oli esimene välja pakutud 1961 – jah, 1961 – artikkel ajakirjas Ameerika Dokumentatsiooni poolt IBM-i arvuti teadlane nimega H. P. Luhn (1961). Ta töötas välja idee küllaltki põhjalikult; ainus oluline erinevus oli see, et vana suurarvutite oleks sülitada välja informatiivne postkaardid tuleb saata klientidele asemel, et saata teavet, online – kuna puudus “online”, et kasutada neid päevi.

Mul on olnud mitmeid kogemusi, nagu see üks, kuna Internet plahvatuse lavale 1990. Ma vaatasin nagu sadu miljoneid dollareid on investeeritud uuesti ratast leiutada – on sageli halvasti. Igaüks mõistab ja võtab enesestmõistetavaks, et seal on teadmisi vaja taotlemise ja kasutamise tehnoloogia. Kahjuks on paljud Web ettevõtjad ei suuda mõista, et paralleelselt on teadmisi vaja kohta teabe kogumine, korraldamine, kinnistades seda edukalt in information systems, esitades seda arukalt sätestatud liideste ja annab otsida võimalusi, et tõhusalt ära kasutada statistilisi omadusi, informatsiooni ja inimeste info, kes otsivad käitumist.

“Sisu” on koheldud nagu mingi supp, et “sisu pakkujad” kühvel välja potid ja tee hulgimüük arvesse infosüsteemid. Kuid see ei tööta nii. Hea teabeotsing disain nõuab lihtsalt nii palju kogemusi teabe ja süsteemide teavet organisatsiooni, kui see ei kohta tehnilise süsteemi aspekte.

See on ka see, et palju, mida üks loomulikult eeldab selle kohta, kuidas peavad inimesed, otsige, ja hankida teavet, on vale – tõde on counter-intuitiivne. Kuidas inimesed toime ei tea, üritades välja selgitada, kuidas nad kasutavad informatsiooni, ressursse, on keeruline ja peen äri (Bates, 1998). Samuti hea infosüsteem lahendusi, mis võimaldavad inimestel otsida ja hankida teavet tõhusalt on ka counter-intuitiivne. Hea süsteemid ei tööta nii, nagu võiks eeldada. Oli dot-com ettevõtted, kellega konsulteeriti uurimistööd infoteaduse kohta SDI, nad on õppinud, et SDI oli suuresti ebaõnnestunud, välja arvatud teatud olukordades (Pakendaja ja Soergel, 1979). See ei ole üllatav, siis, et “push” tehnoloogiat, mis on suurel määral ka õnnestunud.

Internet gold rush, Web ettevõtjad ja riskikapitalistid, kes rahastatud need kõik olid sama tavalised – ja-eksi – ideid, kuidas informatsiooni ülekanne toimib. Nii nad tegi imelise mängu. Ettevõtte asutajad ja nende rahalised toetajad jagatud visioon oma Interneti-ettevõtted, mis oli vale otsaga ja ebaproduktiivne mitmel viisil, kuid kõige olulisem, oli samas visioon.

Tegelikult, seal oli “information industry” juba ümber aastakümneid enne 1990. Need olid ettevõtted, mis töötati välja ja avaldati hiiglane andmebaasid patendi ja õiguslik teave, bioloogilisi, keemilisi ja muid teaduse ja humanitaarteaduste teabeallikad, ajalehes ja omavalitsuse andmebaasid jne. Firmad nimed nagu Chemical Abstracts, Infotrac, Inspec, Lexis-Nexis, ja Inseneri Indeks. Need organisatsioonid olid õppinud raske tee umbes infosüsteemide ja teabe ülekanne. Kui dot-com uustulnukad tuli mööda 1990, asutatud äriühingud ei olnud umbes, et anda ära oma raskelt teenitud teadmisi, et new kids on the block. Uued äriühingud tõenäoliselt ei oleks kuulda igatahes.

Samuti on 1970-ja 1980-ndatel, raamatukoguhoidjad olid ka loodud multi-miljoni-punkt online public access raamatukogu kataloogid, kui online-juurdepääsu oli uus kontseptsioon, ja tuli välja tohutu hulk teadmisi, kuidas tulla toime suurte, räpane andmebaasid tekstilist teavet. Tegelikult, suurim neist kataloogi andmebaasides Online Computer Library Center ‘ s “WorldCat” andmebaasi hoiab üle 47 miljoni plaadi alates 41,000 raamatukogud world wide (http://www.oclc.org/about/). Kuid see on olnud peaaegu usuartikkel Interneti kultuuri, et raamatukoguhoidjad on midagi, et aidata kaasa selle uue vanuse.

See autor on uurides ja nõustamine teabe edastamise süsteemi disain aastakümneid (vt http://www.gseis.ucla.edu/faculty/bates/). Allpool on toodud mõned “pet peeves,” mõningaid probleemseid valdkondi disain Web teabe allalaadimise kuupäev. Need probleemid on kaasas pakutud lahendusi, või, vähemalt, mis suunas minna, et arendada lahendusi järgmine ring Web teabeotsing arengut.

Kasutades vanamoodne hierarhiline klassifikatsioonid

Kui liigitused kasutatakse Interneti andmebaasid, see on hierarhiline klassifikaatorid, mis on peaaegu alati kasutada. Need on tavalised “puu” kuju, laia ala, jagada, jagada, siis ikka ja jälle, iga võimaliku kategooria sisalduvad üks eespool. Raamatukoguhoidjad leiutas parema selline liigitus aastakümneid tagasi, et on nn lihvitud klassifikatsioon. See on liiga seotud, et selgitada käesoleva lühike artikkel, kuid hea analoogia on öelda, et lihvitud klassifikatsioon on hierarhiline liigitamine relatsiooniline andmebaas on, et hierarhiline andmebaasid. Kõige süsteemi disainerid ei oleks unistus, kasutades hierarhilist failid nendel päevadel, nii et miks on hierarhilist klassifikatsiooni teabe sisu ikka veel kasutatakse?

Raamatukoguhoidjad rakendanud mõned lihvitud klassifikatsioonid ajal kahekümnendal sajandil, kuid tehnoloogia kasutada faceting täielikult online-süsteeme on muutunud kättesaadavaks alles hiljuti. Seega teooria, nagu on kirjeldatud teavet organisatsiooni õpikud üldiselt ei ole täielikult kohandatud uus tehnoloogia, kuid kergesti saab. Vt näiteks Rowley ja Farrow (2000) või Ellis ja Vasconcelos (1999). Lühike võrdlus kahte tüüpi liigitamise skeemid on esitatud Bates (1988).

Langemata “ontoloogia” eksitus

Kuum uus termin info organisatsioon on “ontoloogia.” Kõik on leiutamine, ja kirjutama, ontologies, mis on klassifikaatoreid, loendeid, indekseerimine terminite või mõiste mõiste klastrid (Side ACM, 2002). Aga siin on probleem: “Ontoloogia” on mõiste, mis on võetud filosoofia; see puudutab filosoofilisi küsimusi ümbritseva looduse olla. Kui te nimi, liigitus ja sõnavara “ontoloogia”, siis see ütleb, et maailm, mida sa usud, et sa oled kirjeldab maailma sellisena, nagu see tõeliselt on, oma olemuselt, et olete leidnud universum on üks tõeline olemus ja organisatsiooni. Aga tegelikult me ei tea tegelikult, kuidas asjad “tegelikult” on. Pane kümme classificationists (inimesed, kes kavandada klassifikaatorid) ruumis koos ja sul on kümme arvamusi selle kohta, kuidas maailm on korraldatud.

Raamatukoguhoidjad pidi loobuma see “üks õige viis” lähenemisviisi klassifikatsioon kahekümnenda sajandi. Nii palju on (taas)avastanud täna, andmed indekseerimine ja kirjeldus on vaja reguleerida ja kohandada hulgaliselt erinevaid asjaolusid. Miks siis kasutage eksitav termin “ontoloogia”?

Peale filosoofiliste küsimustega, seal on teine, olulisem põhjus loobuda kasutada mõistet. Salvestatud teave ei tee loodusele teeb. Teave on esindatuse midagi muud. Raamatut või veebilehte, saab segada ja sobitada informatiivseid teemade kuidagi selle arendaja tunne teed. Ei ole sellist asja nagu olend, mis on pool orav ja pool kass, kuid seal on palju segab pool-orav/pool-kass teemasid teavet, vahendeid ja veebisaite. Meetodid teabe indekseerimine on ära tunda, mis on eristatav teave, erinevalt klassifikaatoreid, laadi, ja disaini, süsteemide vastavalt.

Näiteks, kui üks fänn luuletaja Emily Dickinsoni loob Veebilehe, mis sisaldab ühe-lõige elulugu tema, koos nimekirja iga luuletus, ta kunagi kirjutas. Teine fänn Dickinson pühendab oma veebilehte, et pildid maja ja kogukond, kus Dickinson elanud. Ikka veel on kogutud bibliograafia iga raamatu või artikli kohta kirjutatud Dickinson ja tema luule. Mujal Veebis on saite, mis group Dickinson teiste üheksateistkümnenda sajandi luuletajad või teiste naiste luuletajad või muud Ameerika luuletajad. Kaugemale lihtsalt kasutades oma nimi, kuidas võivad need kohad olla kasulikult indekseeritud, et inimesed leiaksid nurga nad tahavad, et uurida kohta, luuletaja?

Pikaajalisi lahendusi probleemidele indekseerimine Web ilmselt seotud mitu kattuvad meetodite liigitamine ja indekseerimine teadmised, nii, et inimesed tulevad iga võimaliku nurga alt võib leida moodus, kuidas ressursse, et kõige paremini nende jaoks. Selle asemel, nimetades seda “ontoloogia” märgis süsteemi kirjeldus, mis see tegelikult on – liigitus, tesaurus, komplekt mõiste klastrid, või mis iganes (vt ka Soergel, 1999.).

Kasutades standardseid sõnaraamatuid või Roget ‘ tesaurus info ülekanne

Nendel päevadel, paljud teabeotsing teadusuuringute, katsete ja kaubanduslikke rakendusi on välja töötatud, mis põhineb mõistlik näilisest eeldusel, et kui tahame, et inimesed olema võimalik hankida teksti, tuleks meil ehitada süsteemi standard, sõnastik, või Roget ‘-tüüpi tesaurus (bartletti Roget ‘ Tesaurus, 1996), või katseline kaardistamine sõnavara nagu Wordnet (http://www.cogsci.princeton.edu/~wn/). Keeleteadlased on eriti altid seda eksitus. Keeleteadlased tead kõige keelte kohta, ja nii nad endale üsna põhjendatult, et nad peaks tegema otsuseid, milliseid keelelisi vahendeid kasutada teavet ülekanne katseid.

Siiski keeleteadlased on ei eksperdid info ülekanne. Läbi aastakümnete eksperimenteerimise, on IR-ühendus on õppinud, kuidas saamatu sellise tavapärase sõnastik ja tesaurus allikad on päris-maailmas teabe ülekanne. Selle asemel, teist tüüpi tesaurus on välja töötatud spetsiaalselt juhul, kui eesmärk on teabe kirjeldus, kus seda saab hiljem uurida. Need IR thesauri arv sadu, ja on välja töötatud peaaegu iga tüüpi teema. Paljud “ontologists” on tõeliselt uuesti leiutas ratta – juba arenenud tesaurus nende sisu võib olla peidus korstnad oma kohaliku ülikooli raamatukogu.

Teabeotsing thesauri on erinevad sise-loogiline struktuur ja sisaldavad sõnu ja väljendeid, mis on mõeldud olema efektiivne informatsiooni ülekanne. Heitke pilk mõni neist IR thesauri ja erinevused põhi-sõnaraamatud ja Roget ‘ s oleks kohe selge. Näited:

  • Kunst ja Arhitektuur tesaurus, (1994)
  • Ei Tesaurus (engineering), (1992- )
  • Seadusandlik indekseerimine sõnavara, (Loo, 1998)
  • Los Angeles Times tesaurus (uudised), (1987- )
  • Tesaurus psühholoogilise indekseerimine terminite (2001)

Seal on ka tesaurus kasutada vaba teksti otsima, kus seal võib olla või mitte olla formaalne indekseerimine sõnavara (“kontrollitud sõnavara”), mis on määratud dokumendid. Knapp on Kaasaegse Tesaurus Otsingu Tingimusi ja Sünonüümid (2000) on välja töötanud otsingu ekspert üle aastakümnete pikkune kogemus, ja kus on palju sisend teiste otsijate.

Need on liiki thesauri, et tuleks kasutada indeks ja too internetis info ressursse.

Ignoreerides Bradford jaotamine

Võib-olla me nimetame seda “Sa ei saa jama Emake Loodus” Põhimõte. Kui nad kasvavad suurus, andmebaaside ja teiste organite teavet järgige midagi, mida nimetatakse Bradford Jaotus – päris palju, ükskõik, mida sa teed. Teisisõnu, igasuguseid asju, mis on seotud info ei vasta standardile Gaussi või “normaalne” levitamine, vaid pigem Bradford Jaotus. Sagedused populaarne päringuid Web otsingumootor, määrad loovutamise indekseerimine terminite või klassifitseerimise kategooriad dokumentide või saidid, suurused ülekanne komplekti, jne., kõik vastavad Bradford.

Seal on palju allikaid, mis selgitab matemaatika Bradford (Bookstein, 1990; Brookes, 1977; Chen ja Leimkuhler, 1986). Tavalises keeles, Bradford väljamakseid ei ole tavalise mõhk keskel, kuid selle asemel on väga pikad sabad. Näiteks, tavaliselt seal on mõned teemad, mis on nõudnud tohutu hulk inimesi, ajal Veebis, ja tohutu hulk teemasid saanud väga vähe või üldse mitte. Samuti, ülekanne komplekti, selle asemel, et enamik retrievals sisaldavad halvasti kui oskan arv “tabamust” mõned sisaldavad tohutu hulk hitid ja teised vähe, ei ole väga palju retrievals toodavad halvasti kui oskan numbrid.

See Bradford jaotus (seotud “Pareto Jaotus” economics) on väga tugev, ja peaaegu võimatu võita. Süsteemid peavad olema projekteeritud nii, et tee Bradford Jaotamise, mitte püüdes võidelda. Vt arutelu Bates (1998) ja viited neis artiklites.

Ignoreerides suurus-tundlikkus teabeotsing andmebaasid

Iga tüüpi indekseerimine sõnavara või liigitus on otsene või kaudne struktuur, ning see struktuur toimib hästi ainult teatud suurusega andmebaasides. See armas väike klassifitseerimise süsteem teid välja, kui te olete 1,000 dokumendid on sõidu sa hull oma puudused, mille aeg on 10,000 arvestust. Indekseerimine sõnavara, et oli hea üks-miljonit-punkt andmebaasi hangub kell viis miljonit kirjed ja nii edasi.

Pikaajaline ajalugu ja raamatukogud, interneti andmebaasid, peegeldab see suurus-tundlikkus probleem aegluubis, nagu ta oli. Raamatukogu kataloogimise süsteemid, mis töötas hästi, alguses üheksateistkümnendal sajandil tuli oluliselt muuta iga paari aastakümne jooksul alates sellest ajast tagajärgedega kasvu ressursibaasi. Pärast II maailmasõda, kui teadus kasvas kiiresti, teadus-ja kirjandus oli plahvatav kogus, kogu uute süsteemide teabele juurdepääsu tuli välja töötatud hakkama – see on uus intellektuaalomandi süsteemide, mitte ainult tehnoloogilisi uuendusi.

Veebis, see plahvatus kasv toimub kuude, mitte aastate või aastakümnete jooksul. Smart teavet arendaja peab prognoosida kasvu algusest ja disain kõigile planeeritud suurus tase andmebaasi algusest peale. Muidu, sa oled alati skrambleerimise ja alati taga kõver. Ma olen korduvalt näinud, dot-comid eeldada, et nad võivad alustada mõned lihtsad vähe klassifikatsiooni indeks sõnavara ja muretsema kasvu hiljem. Probleem on, et kasv tuleb mõne nädala jooksul! Siis, kohustust ei ole tehtud varem, väike süsteem. Keegi tahab uuesti indeks juba olemasolevaid andmeid, veel parem väljatöötamise või muutmise indekseerimise süsteem vajab uuesti indekseerimine selgus, kasutajate ja indexers samasugused. Lõpuks, klassifitseerimise või muid metaandmeid süsteem muutub hodgepodge töö-arounds ja halbu lahendusi; vt ka Bates (1998).

Sageli, peatoimetaja toote äriühing on pakkuda oma Web saidi kasutajad on mingid indekseeritud informatsiooni. Veel, figuring kuidas optimeerida indekseerimine ja väljavõtete, et teave on viimane asi, mida on käinud käigus ramp-up läheb online. Kui usute, et teie teabe ressurss kasvab, siis disain kasvu algusest peale. Muidu, usu mind: See läheb hullemaks.

Saada inimeste sisu töötlemise vale

Kas soovite, et hoida inimeste indekseerimine kulude alla? Seejärel pöörake tähelepanu disaini indekseerimise toetuste süsteem. Paljud veebilehed täna pakkuda teavet, mis on osa indekseeritud või liigitada selle järgi inimese. Ütlematagi selge, et see on kõige kallim osa paljud toimingud ja punkt, kus tõhususe toodab kõrgeima pistis. Jõupingutusi, et parandada töötlemise efektiivsus võib olla piiratud, lihtsalt survet indexers töö kiiremini. Kuid on võimalik teha rohkem, kui et aidata inimeste indexers.

Arvan, et indekseerimise toetuste süsteem, nagu eraldi infosüsteem, millel on oma nõuded ja kasutajatele. Mida indexers vaja selleks, et leida oma tee ümber oma süsteemi indekseerimine sõnavara või kategooriad on erinev sellest, mida süsteemi lõppkasutajad on vaja leida moodus, kuidas tõhusalt ümber keha teavet. Sageli on indekseerimise toetus tarkvara, mis muudab indexers ebaefektiivne, ei ole inimesed ise. See on oluline hoida kognitiivne töötlemine koormus indexers mõõdukas, nii et see ei ole igav ega tunne ülekoormus. Mis omakorda eeldab, segmenting indekseerimise arvesse kergesti hallatavaks osad toel indekseerimise süsteemi juures olulised punktid.

Näiteks, oletame, et sul on 5,000 perspektiivis indekseerimine sõnavara. Selle asemel, et lihtsalt kandmise see tähestikulises järjekorras oma töötajate, luua gruppe, mis on seotud tingimused (mõiste klastrite) lai-mõiste ” ekraanid. Siis, selle asemel, et liikuda edasi ja tagasi läbi pika tähestikulises loetellu kandmise indekseerija näen, korraga ekraanile, kõik tingimused võivad olla olulised rekordi omanik. Nüüd indekseerija ei ole, et arvan, et kuni pool tosinat soodsamatel tingimustel, ja vaadata neid iga up eraldi, et leida parim üks, vaid võib selle asemel, lühidalt, määrata õiguse mõiste ja määrata see kiiresti. Kokkuvõttes võib öelda, et uuringu indekseerimine ise kui protsessi, “kasutajad” (indexers), kes tuleb mahutada parima kvaliteedi ja rahulolu, siis on disaini sihipärane indekseerimine toetuste süsteem.

Ignoreerides teave ekspertiisi

Paljud Web ettevõtted, väljatöötamisel info-pakkudes veebilehte, koguda võimas meeskond tehnoloogia, sisu ja graafilise disaini eksperdid. Programmeerijad on pärit top koolid ja ettevõtted, Ph. D. eksperdid teema on pardale, ja top graafilised disainerid on palgatud käesoleva gorgeous liides Veeb kasutaja. Aga isegi kui eesmärk on saidil esitab informatsiooni, või “sisu”, et maailmas on keegi, kes teab midagi teave on pardale.

Mõistmise sisu ei ole sama, mõista teabe; Vt ka Bates (1999). Teabe spetsialist – isik, kes loob klassifikatsioonid, kujunduse metaandmed protokollid, käsitöö otsingu võimeid infosüsteemi kasutajad, graafilised süsteemid, mis on spetsiaalselt info ülekanne–, et inimene on täiesti erinev kogemusi kui kas sisu eksperdi või programmeerija. Kõik need inimesed peavad tegema koostööd, et luua hea süsteem; vt ka Bates (2002). Aga kui teabe ekspert on jäänud välja, tulemuseks süsteem on hea igas mõttes, välja arvatud teabe andmisele!

Kokkuvõte

Kokkuvõttes järgmisi täiustusi Veebi teabeotsing disain on soovitatav toibumas lõpust-1990 “dot-pomm”:

  1. Kasuta lihvitud klassifikatsioonid, pigem hierarhiline.
  2. Arusaamisele, mida eristab teave klassifikatsioonide ja sõnavara füüsilise maailma ekvivalendid, ja lõpetage eksitav termin “ontoloogia.”
  3. Kasuta palju sõnavara spetsiaalselt teabeotsing, mitte üldine inglise keele sõnastikke.
  4. Aru ja töö aluseks olevad statistilised omadused teave projekteerimine informatsiooni ülekanne. Ei mõista neid tegureid lihtsalt viib sub-optimaalne süsteemid.
  5. Mõistame, et süsteemid teavet kirjeldus on äärmiselt suurus-tundlik.
  6. Olema selline, et oma indexers: disain suunatud indekseerimine-toetuste süsteem konkreetselt oma inimeste töötajad, ja siis säästa palju töötajaid ajal.
  7. Kui te arendada saidi mis tahes teavet, ülekanne osa üldse, siis rendi teave ekspertiisi.

Paratamatult, kui autorid on lubatud lisada märksõnu, märksõna, väli muutub tesaurus. Seega ei peaks ilmselt olema raske piirata täiendavaid märgid (kokku arvu märke, kontrollitav poolt DKR-administraator). Muidu autorid saavad kiiresti märksõna rämpsposti.

Teave Autor
Marcia J. Bates on Professor, Department of Information Studies at University of California, Los Angeles. Ta on konsulteerinud ja avaldatud laialdaselt tema erialade teema juurdepääs, kasutaja keskendunud disain, info ülekanne süsteemid, ja teave, kes otsivad käitumist. Ta on Mehe American Association for the Advancement of Science, ja on kaks korda võitnud “Parima Teataja American Society for Information Science Paberi Auhind.”
Web: Other paberid poolt Marcia Bates (http://www.gseis.ucla.edu/faculty/bates/)

Viited

Kunst ja Arhitektuur Tesaurus, 1994. New York: Oxford University Press.

Bartletti Roget ‘ Tesaurus, 1996. Boston: Little, Brown.

Marcia J. Bates, 1999. “Nähtamatu aluspõhi infotehnoloogia,” Journal of American Society for Information Science, maht 50, number 12 (oktoober), lk 1043-1050.

Marcia J. Bates, 1998. “Indekseerimise ja Juurdepääsu Digitaalsed Raamatukogud ja Internet: Inim -, Andmebaasi -, ja Domeeni Tegurid,” Journal of American Society for Information Science, köide 49, number 13 (November), lk 1185-1205.

Marcia J. Bates, 1988. “Kuidas Kasutada Kontrollitud Sõnavara Tõhusamalt Online Otsida,” Online maht 12, number 6 (November), lk 45-56.

Marcia J. Bates, 2002. “Kaskaadi vastastikuse mõju Digitaalse Raamatukogu Liides,” Info Töötlemine ja Haldamine, köide 38, number 3 (Mai), lk 381-400.

Abraham Bookstein, 1990. “Informetric Väljamaksed, I Osa: Ühtne Ülevaade,” Journal of American Society for Information Science, köide 41, number 5 (juuli), lk 368-375.

B. C. Brookes, 1977. “Teooria Bradford Seaduse” Teataja Dokumentatsiooni; köide 33, number 3 (September), lk 180-209.
Y. S. Chen ja Ferdinand F. Leimkuhler, 1986. “Vaheline Suhe, Lotka Õiguse Bradford’ s Law, ja Zipf ‘ i Seadus,” Journal of American Society for Information Science, köide 37, number 5 (September), lk 307-314.

Side ACM, 2002. Erinumber: “Ontoloogia Rakendused ja Disain,” volume 45, nr 2 (veebruar), lk 39-65.

Ei Tesaurus, 1992- . Hoboken, N. J.: Tehnilist Teavet, Inc.

David Ellis ja Ana Vasconcelos, 1999. “Ranganathan ja Puhaskasum: Kasutades Tahk Analüüs Otsida ja Korraldada World Wide Web,” Aslib Menetluse köide 51, lk 3-10.

Sara D. Knapp, 2000. Kaasaegse Tesaurus Otsingu Tingimusi ja Sünonüümid: A Guide for Loomuliku Keele Arvuti Otsimine. Teine väljaanne. Phoenix, Ariz.: Oryx Vajutage.

Shirley Loo, (koostaja), 1998. Seadusandlik Indekseerimine Sõnavara: CRS Tesaurus. 22. edition. Washington, D.C.: Raamatukogu Teenuste Osakond, Kongressi Research Service, Kongressi Raamatukogu.

Los Angeles Times Tesaurus, 1987- . Los Angeles: Los Angeles Times Juhtkiri Raamatukogu.

H. P. Luhn, 1961. “Valikuline Levitamine Uusi Teaduslikke Andmeid Abiga Elektroonilise Töötlemise Seadmed,” Ameerika Dokumentatsiooni; maht 12, number 2 (aprill), lk 131-138.

Katherine H. Packer ja Dagobert Soergel, 1979. “Oluline on SDI Praeguse Teadlikkuse Valdkondades, kellel on Raske Hajumine Informatsiooni,” Journal of American Society for Information Science, maht 30, number 3 (Mai), lk 125-135.

Jennifer Rowley ja John Farrow, 2000. Korraldamine Teadmised: Sissejuhatus Hallata Teabele Juurdepääsu. Aldershot, Hampshire, UK: Ashgate.

Dagobert Soergel, 1999. “Tõus Ontologies või üks eneseleidmine Klassifitseerimise,” Journal of American Society for Information Science, maht 50, number 12 (oktoober), lk 1119-1120.

Tesaurus Psühholoogilise Indeks Tingimused, 2001. Üheksas väljaanne. Washington, DC: American Psychological Association.

Wordnet http://www.cogsci.princeton.edu/~wn/, kasutatud 30. Mai 2002.
Copyright © 2002, Marcia J. Bates. Kõik õigused reserveeritud.

Leave a Reply

Your email address will not be published. Required fields are marked *