2. oktobrī Latvijas Nacionālā arhīva eksperte digitalizācijā Mairita Lukianska Valsts pārvaldes konferencē “Celmlauzis 2024” iepazīstināja ar LNA pieredzi, strādājot ar optiskajiem rakstzīmju un rokraksta tekstu atpazīšanas rīkiem un pilnveidojot to izmantošanu arhīva dokumentu digitalizācijas procesā. Tas ir unikāls projekts, kas ļauj izmantot mākslīgā intelekta (MI) programatūru, lai atpazītu rokrakstu un mašīnrakstu. Optiski atpazītie dati padara pieejamus vēsturiskos dokumentus, kas līdz šim bija izlasāmi tikai vēsturniekam – ekspertam ar specializāciju vēsturiskajos rokrakstos un valodās.
LNA pilotprojekta pētījumam par MI iespējām, digitalizējot arhīva krājumu, ir izvēlēta Rīgas rātes protokolu kolekcija, kas iekļauta UNESCO programmā “Pasaules atmiņa”. Šajos dokumentos ir fiksēti rātes sēdēs izskatītie jautājumi un lēmumi. Kopumā saglabājušās 386 protokolu grāmatas par laiku no 1603. līdz 1890. gadam.
Konferencē Mairita Lukianska uzsvēra: “Pateicoties MI rīkam, mēs esam atvēruši dārgumu lādi, kas sevī slēpj līdz šim nezināmus vēstures faktus, ļaujot pievērsties jaunām pētniecības tēmām. MI izmantošana arhīva dokumentu digitalizācijā padara vēsturiskos dokumentus pieejamus un izlasāmus plašākai sabiedrībai.”
M. Lukianska īsi izklāstīja MI izmantošanas procesu dokumentu digitalizācijā: “Pirmajā posmā tiek veikta teksta segmentēšana – tiek izdalīti teksta reģioni un teksta līnijas. Tikai pēc šīs darbības var uzsākt teksta atpazīšanu. Kad teksts ir atpazīts, eksperts veic tā rediģēšanu, labojot kļūdaini identificētās rakstzīmes. Vēsturniekam, kurš ir specializējies šo rokrakstu izpētē, vienas lapaspuses transkribēšana aizņem aptuveni 40 minūtes, kamēr MI to spēj paveikt vidēji 32 sekundēs. Taču, pat ar šo ievērojamo laika starpību, MI rīki nevar aizstāt rokrakstu ekspertus – atpazītais teksts vienmēr ir jāverificē. Šādi MI rīki jāuztver kā asistenti, kas palīdz ātrāk apstrādāt lielu materiālu apjomu, veicinot to ātrāku nonākšanu publiskajā vidē.”
M. Lukianska secina, ka MI izmantošanas potenciāls LNA krājuma digitalizācijā ir milzīgs, tā kā LNA ir izvietota 26 ēkās, kuru plauktu garums ir 178 km, kur glabājas dokumenti rokrakstā, mašīnrakstā un datorrakstā, kopumā veidojot 23,3 miljonus glabājamo vienību vairāk nekā 30 valodās, kur senākais dokuments ir datēts ar 1220. gadu.
Šī gada inovāciju stāstu izstādē ir iekļauta arī LNA LVKFFDA pieredze ar digitālās krātuves Redzidzirdilatviju.lv izveidi, papildināšanu un izmantošanu.
Abi LNA pieredzes stāsti ir izturējuši rūpīgu izvērtējumu un atlasi, lai iekļūtu šī gada valsts pārvaldes inovāciju konferences programmā.