ANNONSER

”Transcription explosion” – crowdsourcingen och pandemin

Vilka effekter har pandemin haft för arkiven, internationellt sett? Ja, på ett område har det gått att utläsa en mycket positiv utveckling: crowdsourcingen har gått kraftigt framåt. Något stort har blivit ännu större. Ett exempel på det är USA, där Martin Ståhl på en studieresa i våras kunde fastställa häpnadsväckande framsteg. 

För att arkiven ska kunna användas av fler människor i samhället måste en större del av dem digitaliseras och göras sökbara. Som släktforskare undrar jag till exempel när jag kommer att få se Faluns domböcker digitalt. Det är ett fantastiskt material som sträcker sig från 1628 och framåt och som berättar om utvecklingen av bergsstaden Falun som under stormaktstiden var vår näst största stad. Men idag finns endast en liten del av detta material tillgängligt i digital form, och då inte ens hos Riksarkivet, som äger domböckerna.

Idag används bara en liten del av arkiven, och mycket historisk information förblir därför fortfarande oåtkomlig för många människor. Men hur ska mer av arkiven nå ut till fler, när arkivens resurser ofta är begränsade, och annat måste prioriteras istället? 

En lösning på det problemet kan vara att skapa fler samarbeten med volontärer. Det har man länge gjort i många länder, och på senare tid har det blivit alltmer vanligt att detta sker digitalt, genom crowdsourcing (på svenska: användarregistrering). Crowdsourcing är numera en fast inrotad arbetsmetod hos många utländska kulturarvsinstitutioner, inte bara arkiv. 

För att förbättra åtkomsten till bestånden och samlingarna tar institutionerna hjälp av allmänheten. I organiserade projekt online sitter deltagarna hemma och hjälper till. Det kan röra sig om olika typer av arbetsuppgifter, helt beroende på vilket material det är frågan om, som att transkribera handskrivna sidor eller att förse handlingar med sökord för att göra dem lättare att hitta. 

Volontärernas insatser är ovärderliga för arkiven, och i slutändan för deras användare, helt oavsett vad volontärerna tillför eller vilken bakgrund de har. Det kan jag själv vittna om som kommunarkivarie i Huddinge, där vi med våra blygsamma resurser aldrig hade kommit tillrätta med den backlog av hundratals meter av oordnat material, om det inte hade varit för våra duktiga volontärer. 

Crowdsourcing har alltså spridit sig i och till många länder. Amerikanska kongressbiblioteket sammanfattar det så här: ”There is no deeper access to manuscripts than transcriptions and the only method for creating accurate transcriptions at a critical scale is crowdsourcing.” Det råder inget tvivel om att crowdsourcing medför stora fördelar, och efter de år som metoden har tillämpats internationellt har det funnits goda möjligheter att utvärdera och förbättra den. Lärdomar finns i överflöd om man är intresserad av att ta del av dem.

Förra året utkom till exempel boken The Collective Wisdom Handbook – Perspectives on Crowdsourcing in Cultural Heritage som är skriven av representanter från den brittiska och amerikanska kulturarvssektorn och innehåller många värdefulla erfarenheter som har gjorts på området. 

USA är ett av alla de länder som flitigt har använt crowdsourcing under en lång tid i sin kulturarvssektor. Där har antalet frivilliga ökat explosionsartat under den gångna pandemin. En tidning kallar det för en ”transcription explosion”. De största aktörerna – nationalmuseet Smithsonian, nationalarkivet och kongressbiblioteket – rapporterar enorma framgångar. Crowdsourcing visade sig nämligen snabbt vara en idealisk hemmaaktivitet för många människor vilka under pandemin fick sina rörelsemöjligheter kraftigt inskränkta. Under parollen ”Volunteer to help us unlock history!” har till exempel det amerikanska nationalarkivet lockat tusentals nya volontärer. 

Liksom arkiv, bibliotek och museer världen över, befann sig även de amerikanska kulturarvsinstitutionerna i en svår situation då pandemin bröt ut och slog till med full kraft våren 2020. En allvarlig kris hade uppstått och de fick stänga sina dörrar för allmänheten. Vad skulle man göra, och hur skulle verksamheten läggas om? Eftersom de stora institutionerna i landet redan hade en välfungerande metod för crowdsourcing fanns det något för dem att falla tillbaka på när många fler människor än tidigare sökte efter något att sysselsätta sig med därhemma, isolerade som de var av lock-down. 

Den stora tillökningen av nya frivilliga uppmärksammades flitigt i den amerikanska pressen. Washington Post rapporterade redan i maj 2020 att ”Worldwide, museums and research libraries are reporting huge spikes of do-it-yourself historians” och låter en av volontärerna komma till tals: “There is a strange meditative aspect to it (…) It’s enough to take one’s mind off of whatever else is happening in their lives – including a pandemic. A good respite from crazy times.” 

”Visst hade man kunnat ana”, säger en representant från kongressbiblioteket i samma artikel, ”att pandemin skulle leda till en tillströmning av nya volontärer, men man slogs ändå av hur många det var.” 

Crowdsourcingen har fått en viktig draghjälp av medierna när det har handlat om att sprida kunskap om den hos alltfler människor. Ett av flera exempel på detta är den pedagogiska artikeln Volunteer at Home by Transcribing Historical Documents, som publicerades redan den 9 mars 2020, alltså precis vid pandemins utbrott. Artikeln kommer från American Association of Retired Persons (AARP), som med sina 38 miljoner medlemmar (!) är en intresseförening för amerikanska seniorer och vars tidning har den största upplagan av alla tidningar i hela USA. 

Artikeln uppmanar aktivt medlemmarna att engagera sig (”The Library of Congress, National Archives and Smithsonian Institution want your help”). På ett åskådligt och intresseväckande sätt presenteras sedan vad man kan göra hos var och en av institutionerna. Artikeln illustreras med en bild på en rörelsehindrad man i rullstol, framför en dator och med en katt i famnen. ”You can volunteer without leaving home, whether you have limited mobility, few transportation options or just want to stay away from crowds. (…) Your work will last for generations to come.” 

I artikeln får läsaren reda på att det inte finns några särskilda krav att leva upp till, i fråga om hur mycket eller vad som ska registreras. Alla som vill delta är välkomna! Seniorerna får också reda på att de har en ”superpower”, eftersom de kan läsa skrivstil, vilket många yngre människor inte kan, och vilket givetvis är till stor nytta i crowdsourcingprojekten. 

I en annan artikel, The Fun of Transcribing Historical Documents from Home, även den riktad till en senior läsekrets, får vi ta del av erfarenheterna från en av nationalarkivets alla nya volontärer. Man slås av lättsamheten, den positiva tonen och det sympatiska samarbetet mellan volontärerna och institutionerna. Allt uppfattas som mycket trevligt av de inblandade (”Why Retirees Like to Do This Type of Volunteering”). Teman som återkommer i dessa värvningsartiklar är de lågt ställda kraven, det faktum att arbetet är enkelt samt att volontärerna spelar en viktig roll i ett större, historiskt sammanhang, och att de har en mission att fylla. Artiklarna är mycket psykologiskt utformade för att tilltala så många som möjligt.

Sedan pandemin utbröt har institutionerna regelbundet följt upp sitt arbete med crowdsourcingen. De har delat med sig av detta i ett stort antal egna artiklar och digitala nyhetsbrev, men även vid konferenser. Det finns ett digert och inspirerande material att ta del av, om man är intresserad. Texterna är fulla av viktiga lärdomar som har gjorts och inte minst innehåller de berättelser från en del av alla dem som deltar i projekten och hur de ser på sitt engagemang och vad som driver dem. Här följer ett sammandrag av utvecklingen hos var och en av de tre stora institutionerna:

Nationalmuseet, The Smithsonian Institution, är världens största musei- och forskningskomplex. Dess crowdsourcing-verksamhet är förlagd till Smithsonian Transcription Center. I tidningsartikeln Transcription explosion får vi en bra bild av hur crowdsourcingen sköt i höjden hos Smithsonian, då pandemin kom. Människor började anmäla sitt intresse i en rasande takt. Artikeln är skriven ett år senare, och man kan redan redovisa fantastiska framgångar. Det konstateras bland annat att ”digital volunteering has never been as popular as it is now around the world.” 

Vid pandemins utbrott hade Smithsonian 14 000 digitala volontärer. Ett år senare hade siffran mer än tredubblats till 46 000, och sommaren 2022 låg antalet på 68 500 personer. Förutom att antalet har stigit kraftigt har volontärerna också fått en bredare sammansättning och består nu av grupper som inte har deltagit tidigare, såsom studenter och lärare. Dessutom har många företag låtit anställda delta i registreringsprojekten som ett sätt att visa goodwill och engagemang för kulturarvet. Hela tiden tillkommer nya intressanta samarbetspartners i arbetet med crowdsourcingen.

Från Transcription Centers tillkomst (2013) och fram till 2019 hade en halv miljon sidor transkriberats. Bara drygt två år senare, i mars 2022, hade den miljonte sidan uppnåtts. I Smithsonians projekt har män­niskor från 75 länder deltagit. Varje Smithsonian-museum har sina egna projekt, och det går att enkelt filtrera fram dem på webben efter vad de handlar om och vilken tidsperiod som de representerar, allt för att man ska kunna hitta det som mest intresserar en. Det är inte bara volymen som ständigt har ökat i form av fler volontärer och fler registrerade sidor. Man har även på ett lyhört sätt utvecklat registreringsarbetet för att förbättra upplevelsen för volontärerna. 

Nationalarkivet, The National Archives and Records Administration, kan rapportera samma framgångar. Där inleddes dess ”Citizen Archivist”-program 2014. I programmet arbetar volontärer med att metadatasätta eller transkribera handlingar för att göra dem sökbara. Den miljonte sidan uppnåddes sex år senare, i augusti 2020. Nästa miljonte sida uppnåddes bara tio månader senare. Då hade volontärerna visserligen fått hjälp av arkivets anställda i arbetet, men volymen är ändå slående. Förutom ”Citizen Archivist”-programmet finns ytterligare ett program: Citizen Scanning Program, där över tre tusen personer har skannat in 600 000 sidor de senaste åren. 

Arkivet har fortfarande lång väg att gå. Av dess uppskattade tolv miljarder handlingar finns idag 123 miljoner inskannade och kan återfinnas i arkivets webbkatalog. Ställda mot de siffrorna är två miljoner transkriberade/taggade sidor kanske inte så mycket, men man har ändå kommit igång stort. Med rätt prioriteringar och så många volontärer kan mycket åstadkommas. Det är viktigt att materialet tas i rätt ordning och att man börjar med det som är mest efterfrågat och har störst forskningspotential.

Kongressbiblioteket, Library of Congress, världens största bibliotek, påbörjade sin crowdsourcing sist av de tre (2018) och har upplevt ett stort uppsving. Då pandemin kom hade By the People, bibliotekets crowdsourcing-program, 12 000 volontärer. Drygt ett år senare hade den siffran mer än fördubblats och stigit till 25 000 personer: ”In short, BtP volunteers and staff contributors really knocked our socks off this year.” 

Till alla de nya som anmälde sig hörde nämligen också bibliotekets medarbetare, vilka behövde ha något att sysselsätta sig med i sitt distansarbete hemma. Eftersom att crowdsourcingen redan var i full gång gick det att lösa detta enkelt. Personalen fick bland annat ägna sig åt att transkribera general Pattons dagböcker. 

Detta leder oss för övrigt in på en viktig fråga: hur förbereder vi oss för och hur agerar vi i en krissituation, liknande pandemin, då verksamheten lamslås och vi tvingas att arbeta hemifrån? Pandemin är inte över än och andra kriser kan komma i framtiden, vilka kan göra att kulturarvsinstitutionerna radikalt behöver lägga om och förändra sin verksamhet. Där fyller en digital interaktion med användarna, till exempel i form av crowdsourcing, en viktig funktion med alla de fördelar som detta innebär.

Kongressbibliotekets crowdsourcing-projekt bedrivs i en mycket strukturerad form, där man siktar på att få till ett avslut för att kunna gå vidare med nya projekt. Projekten har bedrivits med källmaterial på olika språk och kvalitetskraven är högt ställda eftersom allt som transkriberas först måste godkännas av någon annan innan det kan publiceras på webben. Mötet med volontärerna är viktigt, och man lägger stort värde på att förstå deras drivkrafter. Det är nödvändigt eftersom det rör sig om en heterogen grupp av människor med olika preferenser och läggningar. 

Kongressbibliotekets projekt uppvisar överlag en stor bredd, exempelvis när det handlar om ämnen och svårighetsgrad, vilket tilltalar volontärerna eftersom de har olika förutsättningar och intressen. Bredden är viktig för att projekten inte ska bli för ensidiga eller för svåra att medverka i. 

I bibliotekets arbete med crowdsourcing finns ett stort utrymme för kreativitet och nytänkande, för att ständigt utveckla metoderna. Bland annat har man samlat ihop deltagare för så kallade transcribe-a-thons (eller till och med ”review-a-thons”!). Vid ett sådant transcribe-a-thon som hölls på dagen då minnet av medborgarrättskämpen Frederick Douglass högtidlighölls slogs rekordet i antalet transkriberade handlingar på en och samma dag: 7 000.

Den akademiska forskningen har dragit en enorm nytta av crowdsourcingen. Kongressbiblioteket har undersökt detta närmare och låter några representanter för forskarsamhället komma till tals i sina artiklar. En av dessa är professor Jonathan White som har använt Lincolns transkriberade brev i sin forskning. Hans tankeväckande ord får avrunda denna artikel: 

”In the ‘olden days’ historians would have had to scroll through microfilm reel after microfilm reel to find these sorts of materials. And that could take months, even years. Now we can search from the comfort of our own homes, and in a matter of minutes we can find things that otherwise might never have been found. In a very real way, By the People has democratized historical research. Anyone can go on the site and find incredible treasures and can then write about them and present them to the public.” 

Crowdsourcing handlar, för att citera nationalarkivet, om att ”öppna upp historien” för människor. Det kanske kunde vara något att ta fasta på även i Sverige? Det är i så fall nödvändigt att de större kulturarvsaktörerna går i bräschen för att införa crowdsourcing i större skala och att de avsätter resurser för det arbetet. Det är viktigt att digitaliseringen av kulturarvet inte alltför mycket överlåts åt privata och ofta vinstbaserade aktörer, utan att kulturarvsinstitutionerna själva tar kommandot över sitt eget kulturarv och ser till att mer av det når ut till medborgarna. Naturligtvis på det sätt som de flesta också förväntar sig, i digital form. Då vore det dumt att inte dra nytta av all den hjälp som volontärer kan ge! ∇

ANNONSER