Hallgasd velünk az Aktakaland podcast sorozatot öt héten át és légy részese annak a változásnak, amelynek során beszélgetéseinkkel a levéltárakat a poros iratok tárházából színes kincsesbányává formáljuk – Neked!
A sorozatból megtudhatod például, hogyan keresd meg a nagypapádat a szovjet táborok magyar hadifoglyai adatbázisunkban. Ha érdekel, miként vetettek véget a szúnyogok egy budapesti szórakozóhelynek, vagy szeretnéd megtudni, melyik az első európai városnak adott címereslevél, esetleg családkutatásod a gazdasági levéltárba vezet, de nem tudod, hogyan is kezdj hozzá, tarts velünk, és minderre fény derül!
Első adásunkban rögtön a dolgok közepébe vágunk, ugyanis egy nagyon izgalmas és modern témáról, a mesterséges intelligencia (MI) levéltári alkalmazásáról beszélgetünk. A podcast első részét videós formátumban tesszük közzé, a következő adások azonban már klasszikus formában, audio fájlként jelennek majd meg.

A mesterséges intelligenciát a közismertebb iparágakon túl – pl. autógyártás, orvostudomány stb. – a bölcsészettudományok is sikerrel alkalmazzák. A kulturális szférán belül, a levéltárak hatalmas adatvagyon birtokába vannak, amelynek feldolgozása, adatbázisba rendezése és a társadalom számára történő közzététele alapozhatja meg ezen intézmények érvényesülését.
Nem véletlen, hogy a mesterséges intelligencia a levéltárak látóterébe került. Mostanra a Magyar Nemzeti Levéltárnak több olyan projektje is van, ahol az MI használatával több százezer adat feldolgozása vált lehetővé.
Szatucsek Zoltán és Szerényi Ildikó szakértők mesélnek Szakács Annamáriának és Horváth Zitának a mesterséges intelligencia konkrét alkalmazásáról az 1828-as összeírás adatainak feldolgozása kapcsán. Az interjú a 2021. év végén készült.
Az öt legfontosabb gondolat a beszélgetésből:
1. Az MI egy olyan nehezen körülhatárolható fogalom, amely azokat a megoldásokat, döntéseket jelenti, amikor egy számítógép az emberi gondolkodáshoz hasonlóan végez el műveleteket. A filmekben vizionált gondolkodó robotoktól elszakadva, a valóságban esetünkben leginkább az ún. gépi tanulásról van szó.
2. A Magyar Nemzeti Levéltár legutóbb az 1828-as adóösszeírás íveit dolgozta fel az mesterséges intelligencia segítségével. Az alkalmazott algoritmus a kézírás-felismerést tanulás útján sajátította el, amelyhez a tanítómintát levéltárosok és önkéntesek alkották meg a következőképpen. A projektben elsőként egy 400 oldalas minta készült az írásképek felismerésére. Ezt követően az önkéntesek elvégezték az „ellenőrzést”, vagyis az algoritmus által felkínált javaslatok közül kiválasztották azt, amelyik helyes volt. Így a tanítóprogram 6700 oldalasra bővült.
3. Az MI és az önkéntesek által felépített adatbázis az Adatbázisok Online felületén keresztül lesz elérhető. Az adatbázisban a családkutatók névre is tudnak majd keresni. A Magyar Nemzeti Levéltár a mostani projekthez hasonlóan a közeljövőben is olyan adatokat kíván feldolgozni, amelyek digitalizált állományok, emellett támogatják a családkutatást, mint például a polgári anyakönyvek vagy a kataszteri iratok.
A hosszú távú cél, hogy a mesterséges intelligenciát az összefüggések felismerésére is használjuk, például a családi kapcsolatok feltárására, vagy a különböző adatbázisokból az azonos személyek összekapcsolására. Az állami anyakönyvek esetében például az adatok strukturálásával Magyarország családfájának a felépítése a végcél.
4. Kiemelten fontos a levéltári információ térben történő ábrázolása: az adatvizualizáció lehetőséget ad a kapcsolódások, hálózatok, összefüggések sokoldalú megjelenítésére.
5. Linkek:
A mesterséges intelligencia alkalmazásával létrejött első adatbázis a Magyar Nemzeti Levéltárban:
Adatvizualizációs projektek:
Gratulálok, hasznos és minőségi munka eredménye. Köszönöm az értesítés, gyakran látogatom a honlapot, követem a felkerülő anyagot.
KedvelésKedvelik 1 személy