Software zpřístupní dokumenty o represích Čechoslováků v SSSR

Odborníci z katedry kybernetiky a výzkumného centra NTIS Fakulty aplikovaných věd (FAV) Západočeské univerzity v Plzni (ZČU) ve spolupráci s Ústavem pro studium totalitních režimů (ÚSTR) zpracovávají písemné a obrazové dokumenty politických represí československých občanů, k nimž došlo v bývalém Sovětském svazu. Vzniká tak digitální archiv dokumentů NKVD/KGB k československé historii, v němž bude možné vyhledávat díky softwaru kybernetiků FAV.

Cílem projektu Digitální archiv dokumentů NKVD/KGB vztahujících se k Československu je vytvořit archiv dokumentů a fotografií sovětských bezpečnostních složek vztahujících se k československé historii, který bude přístupný online a v němž bude možné vyhledávat například podle konkrétního obsahu dokumentů, jména nebo jiných životopisných údajů osoby postižené politickými represemi v SSSR, časového a místního zařazení dokumentů a dalších kritérií.

Digitální archiv má být hotový do konce roku 2022. Už nyní jsou však v jeho testovací verzi na adrese archivkgb.zcu.cz zpřístupněny vyšetřovací spisy k takzvanému charkovskému procesu.

Dokumentaci zveřejnil ÚSTR při příležitosti 90. výročí tohoto soudního procesu, který se odehrál v Charkově od 12. do 14. června 1931 a je znám také jako proces s českými učiteli.

„Jeho cílem patrně bylo zlikvidovat kontakty české menšiny v Sovětském svazu s vlastí, přinutit ji k úplné sovětizaci a pokusit se i tímto způsobem přimět československou vládu k diplomatickému uznání SSSR,“ říká Adam Hradilek z ÚSTR. Dodává, že šlo o do té doby největší vykonstruovaný proces proti českým krajanům v Sovětském svazu.

Z celkem jednadvaceti souzených osob bylo dvanáct učitelů. Původně však tehdejší sovětská bezpečnostní služba v rámci této akce pozatýkala od července 1930 do ledna 1931 desítky českých učitelů, vedoucích krajanských spolků, rolníků a předních činitelů českých komunit. Ti byli souzeni v navazujících procesech.

Uveřejněný spis obsahuje 73 svazků čítajících více než deset tisíc stran dokumentů sovětské bezpečnostní služby. Dokumenty byly zdigitalizovány ve Státním archivu Bezpečnostní služby Ukrajiny. Kromě vyšetřovacích spisů jednotlivých osob jsou zde k dispozici přepisy soudního líčení z 12. až 14. června 1931, instruktážní brožura sestavená na základě procesu, dokumentace k rehabilitaci obětí z poloviny 60. let či zabavené dokumenty, dopisy, osobní doklady a fotografie souzených osob.

Díky zapojení desetičlenného týmu z katedry kybernetiky a výzkumného centra NTIS FAV je možné v rozsáhlých materiálech vyhledávat. Jejich software dokáže z naskenovaných obrazových a textových dokumentů, které jsou v ruštině, ukrajinštině a češtině, získat text, a to pomocí metody nazývané Optical Character Recognition (OCR). Tento elektronický text pak software uloží do databáze, v níž lze dobře vyhledávat.

„Výzva pro nás spočívá především v tom, jak dostat co nejvíce smysluplného textu z dokumentů, které jsou zmuchlané, zažloutlé nebo třeba naskenované nakřivo či v malém formátu a zároveň obsahují například směs strojopisu a ručně psaných poznámek, a to vše je ještě doplněno otisky razítek,“ přibližuje úskalí práce s dokumenty Marek Hrúz z katedry kybernetiky FAV.

Kromě úkolu získat co nejvíce textu z dokumentů je cílem kybernetiků uložit texty do databáze tak, aby v ní bylo možné rychle a přesně vyhledávat, a navrhnout uživatelské rozhraní, které bude intuitivní a přátelské pro odbornou i laickou veřejnost.

Celkem software zpracuje přes milion textových a fotografických dokumentů, které ÚSTR v rámci dokumentační činnosti digitalizoval v rozmezí let 2014 až 2020 zejména v ukrajinských a ruských archivech. Jedná se převážně o kopie vyšetřovacích spisů osob postižených represí NKVD a KGB na území Sovětského svazu, jejichž osud se váže k československé historii. Dokumenty se tak vztahují například k represím páchaným na krajanech od 20. do 50. let 20. století, k osudům Čechoslováků v Gulagu, sovětizaci Podkarpatské Rusi po roce 1945 nebo invazi vojsk Varšavské smlouvy do Československa v roce 1968.

Projekt Digitální archiv dokumentů NKVD/KGB vztahujících se k Československu probíhá od března 2020 do konce roku 2022 a finančně ho podpořilo Ministerstvo kultury ČR z programu aplikovaného výzkumu a experimentálního vývoje národní a kulturní identity NAKI II.