A kézirattól az adatvizualizációig: Gyakorlati bevezetés a digitális forrásfeldolgozásba
A kézirattól az adatvizualizációig: Gyakorlati bevezetés a digitális forrásfeldolgozásba
Hogyan lesz egy beszkennelt dokumentumból strukturált adatbázis és látványos adatvizualizáció? Workshopunkon a digitális bölcsészet ezen izgalmas folyamatába nyújtunk gyakorlati betekintést. Bemutatjuk a Transkribus nevű, mesterséges intelligencián alapuló platformot, amelyet kifejezetten történelmi dokumentumok és kéziratos források automatikus szövegfelismerésére fejlesztettek.
A közös munka során a következő lépéseken megyünk végig:
- Tesztelés: Kipróbáljuk a legújabb, magyar nyelvű iratok alapján fejlesztett kézírásfelismerő-modellt (HTR). Megnézzük és összehasonlítjuk, hogy a különböző kézírású, elrendezésű és állapotú dokumentumokon milyen hatékonysággal ismeri fel a szöveget, és közösen elemezzük a felmerülő kihívásokat.
- Javítás és annotáció: A gépi átiratokat közösen javítjuk, majd a releváns információkat (pl. nevek, helyszínek, dátumok) megjelöljük, vagyis tageljük.
- Adatkinyerés és vizualizáció: Megmutatjuk, hogyan nyerhetők ki ezek az adatok a rendszerből, és milyen elemzési, vizualizációs lehetőségek rejlenek bennük.
A workshopon gyakorlati tapasztalat szerezhető arról, hogy a digitális szöveg többé már nem csupán egy olvasható dokumentum, hanem strukturált adatbázisként kezd viselkedni. A címkézett, tagelt információk kereshetővé, szűrhetővé és elemezhetővé válnak, ami olyan műveleteket tesz lehetővé, amelyek túllépnek a hagyományos olvasáson.
Hogy mindez kézzelfoghatóvá váljon, egy korábban feldolgozott írói levelezés adatain keresztül bemutatunk egy interaktív térképes vizualizációt, amely látványosan szemlélteti, milyen új tudáshoz juthatunk a digitálisan feldolgozott forrásokból.
Időpont: 2025. november 27. 15 óra
Helyszín: MCC Nagyváradi Képzési Központ, Körös (Tudor Vladimirescu) utca 6. szám
A legfrissebb információkért kövesse Facebook-eseményeinket!