Aveți nevoie de copii de rezervă –

O scanare a arhivelor arată că o mulțime de lucrări științifice nu sunt susținute.

Un set de rafturi de bibliotecă cu o mulțime de volume stivuite pe ele.

Pe vremea când publicațiile științifice au apărut sub formă de hârtie, bibliotecile jucau un rol esențial în a se asigura că cunoștințele nu vor dispărea. Copii au fost distribuite la atât de multe biblioteci încât orice eșec – un editor care dă faliment, o bibliotecă care se închide – nu ne-ar expune riscului să pierdem informații. Dar, ca și în orice altceva, conținutul științific a devenit digital, ceea ce a schimbat ceea ce este implicat în conservare.

Organizațiile au conceput sisteme care ar trebui să ofere opțiuni pentru conservarea materialului digital. Dar, conform unui sondaj publicat recent, o mulțime de documente digitale nu apar în mod constant în arhivele menite să le păstreze. Și asta ne expune riscului de a pierde cercetarea academică, inclusiv știința plătită cu banii contribuabililor.

Urmărirea referințelor

Lucrarea a fost făcută de Martin Eve, un dezvoltator la Crossref. Aceasta este organizația care organizează sistemul DOI, care oferă un indicator permanent către documentele digitale, inclusiv aproape fiecare publicație științifică. Dacă actualizările sunt făcute corect, un DOI se va rezolva întotdeauna într-un document, chiar dacă acel document este mutat la o nouă adresă URL.

Dar are și o modalitate de a gestiona documentele care dispar din locația lor așteptată, așa cum s-ar putea întâmpla dacă un editor a dat faliment. Există un set de ceea ce se numește „arhive întunecate” la care publicul nu are acces, dar ar trebui să conțină copii ale oricărui lucru căruia i-a fost atribuit un DOI. Dacă ceva nu merge bine cu un DOI, ar trebui să declanșeze accesul deschis la arhivele întunecate, iar DOI-ul să fie actualizat pentru a indica copia din arhiva întunecată.

Pentru ca acest lucru să funcționeze, totuși, copii ale tot ceea ce este publicat trebuie să fie în arhive. Așa că Eve a decis să verifice dacă acesta este cazul.

Folosind baza de date Crossref, Eve a obținut o listă de peste 7 milioane de DOI și apoi a verificat dacă documentele pot fi găsite în arhive. A inclus unele cunoscute, cum ar fi Internet Archive de la archive.org, precum și unele dedicate lucrărilor academice, precum LOCKSS (Lots of Copies Keeps Stuff Safe) și CLOCKSS (Controlled Lots of Copies Keeps Stuff Safe).

Nu este bine conservat

Rezultatele au fost… nu grozave.

Când Eve a defalcat rezultatele în funcție de editor, mai puțin de 1% din cei 204 editori au pus majoritatea conținutului lor în mai multe arhive. (Limiterea a fost de 75% din conținutul lor în trei sau mai multe arhive.) Mai puțin de 10% au pus mai mult de jumătate din conținutul lor în cel puțin două arhive. Și o treime întreagă părea să nu facă deloc arhivare organizată.

La nivel de publicație individuală, mai puțin de 60 la sută erau prezente în cel puțin o arhivă, iar peste un sfert nu părea să fie deloc în niciuna dintre arhive. (Alte 14% au fost publicate prea recent pentru a fi arhivate sau pentru a avea înregistrări incomplete.)

Vestea bună este că marile edituri academice par a fi destul de bune în ceea ce privește introducerea lucrurilor în arhive; majoritatea problemelor nearhivate provin de la editori mai mici.

Eve recunoaște că studiul are limite, în primul rând prin faptul că ar putea exista arhive suplimentare pe care nu le-a verificat. Există unele arhive întunecate proeminente la care nu a avut acces, precum și lucruri precum Sci-hub, care încalcă drepturile de autor pentru a pune la dispoziție publicului material de la editori cu scop profit. În cele din urmă, editorii individuali pot avea propriul sistem de arhivare care ar putea împiedica dispariția publicațiilor.

Ar trebui să fim îngrijorați?

Riscul aici este ca, în cele din urmă, să pierdem accesul la unele cercetări academice. După cum spune Eve, cunoștințele se extind pentru că suntem capabili să construim pe o bază de fapte pe care le putem urmări printr-un lanț de referințe. Dacă începem să pierdem acele legături, atunci fundația devine mai zguduită. Arhivarea vine cu propriul set de provocări: costă bani, trebuie organizată, trebuie stabilite mijloace consistente de accesare a materialului arhivat și așa mai departe.

Dar, într-o măsură, eșuăm la primul pas. „Un punct important de făcut”, scrie Eve, „este că nu există un consens asupra cine ar trebui să fie responsabil pentru arhivarea burselor în era digitală”.

O problemă oarecum legată este asigurarea faptului că oamenii pot găsi materialul arhivat – problema pe care DOI-urile au fost concepute pentru a o rezolva. În multe cazuri, autorii manuscrisului plasează copii în locuri precum arXiv/bioRxiv sau PubMed Centra al NIH (acest tip de arhivare devine din ce în ce mai mult o cerință de către organismele de finanțare). Problema aici este că este posibil ca copiile arhivate să nu includă DOI-ul care este menit să asigure că poate fi localizat. Asta nu înseamnă că nu poate fi identificat prin alte mijloace, dar cu siguranță face mult mai dificilă găsirea documentului potrivit.

Cu alte cuvinte, dacă nu găsești o hârtie sau nu poți fi sigur că te uiți la versiunea corectă a acesteia, poate fi la fel de rău ca să nu ai deloc o copie a hârtiei.

Nimic din toate acestea nu înseamnă că am pierdut deja documente importante de cercetare. Dar lucrarea lui Eve îndeplinește o funcție valoroasă, subliniind faptul că riscul este real. Suntem bine în era în care copiile tipărite ale revistelor sunt irelevante pentru majoritatea cadrelor universitare, iar revistele academice doar digitale au proliferat. A trecut de mult timp ca noi să avem standarde clare pentru a ne asigura că versiunile digitale ale cercetării au rezistența de care s-au bucurat lucrările tipărite.

Journal of Librarianship and Scholarship Communication, 2024. DOI: 10.31274/jlsc.16288 (Despre DOI).

×