Az Országos Széchényi Könyvtár elkészítette az első magyar nyelvű kézírásfelismerő modellt
2022. július 7. 13:57
Megjelent az első publikus magyar nyelvű számítógépes kézírásfelismerő modell. Az ún. HTR- (Handwritten Text Recognition-) modellt az Országos Széchényi Könyvtár Digitális Bölcsészeti Központja (OSZK DBK) hozta létre, és mindenki számára elérhetővé tette a Transkribus nevű szoftver komponenseként. Alapját Kiss József, a 19–20. század fordulóján élt magyar költő, a Nyugat előfutáraként számontartott A Hét című hetilap szerkesztőjének szakmai és személyes levelezése képezi.
Korábban
A kézírásfelismerést mesterséges intelligencián alapuló algoritmus végzi. Ezt először be kell tanítani, hogy a különböző kézírásokat felismerje, majd a megadott minták alapján felépít egy modellt, amellyel képessé válik arra, hogy egy általa ismeretlen, még nem látott kézírásképet is értelmezzen.
Minél többféle anyagon tanítjuk, annál jobban teljesít különböző szövegeken. A jelenlegi modell először Kiss József írásán, majd a levelezőpartnerek vegyes kézírásán tanult.
Az eddig felhasznált kéziratok a Petőfi Irodalmi Múzeumban (PIM) találhatók, a tanulásra felhasznált szavak száma körülbelül 75 ezer. A dokumentumok között szerepelnek borítékok, képeslapok, hagyományos és fejléces levelek, névjegykártyák is
A levélírók Kiss József és családja, illetve a századforduló írói, újságírói és művészei, mint Ady Endre, Móricz Zsigmond vagy Tömörkény István. Ez összesen 300 darab változó hosszúságú és minőségű levelet jelent, amelyeket a DBK folyamatosan közzétesz az olvasók számára a dhupla.hu/collection/kiss-jozsef-levelezes oldalon. A levélváltások további kéziratai jelenleg is feldolgozás alatt állnak az OSZK-ban és a PIM-ben.
A modell jelenleg 9,19 hibaszázalékkal működik, ami azt jelenti, hogy a projektben közel 90%-os pontossággal meg tudja állapítani, milyen karakterekből áll a szöveg.
A különböző magyar nyelvű projekteknek, amelyek automatikus kézírásfelismertetést használnak, a jövőben össze kell fogniuk, hogy a saját szövegkorpuszokon betanított modelleket egymásba építve egyre általánosabb érvényű eszköz jöjjön létre a magyar kéziratos források digitalizációjához.
Közös érdekünk, hogy e közgyűjteményekben rejtőző kulturális kincsek a digitális térben szövegként hozzáférhetővé, olvashatóvá, kereshetővé, számítógépes eszközökkel is feldolgozhatóvá, kutathatóvá váljanak, ahogyan a dhupla.hu oldalon közzétett szövegkiadások, illetve a hozzájuk tartozó kreatív tartalmak esetében is láthatjuk. A most nyilvánosságra hozott első magyar kézírásfelismerő modell ennek a folyamatnak fontos mérföldköve.
Az új magyar kézírásfelismerő modell megtalálható a Transkribus asztali alkalmazásban és a webes felületen is (https://readcoop.eu/model/hungarian/).
Támogasd a szerkesztőségét!
történelmi magazin
legújabb számát?
kedvezményes előfizetés 1 évre (5 szám)
bankkártyás fizetés esetén 20% kedvezménnyel.
Az éves előfizetés már tartalmazza az őszi különszámot.
Az első 500 előfizetőnek.
Németország
- A hatalmas veszteségek sem állították meg a szovjet hadsereget Sztálingrádnál
- Egyetlen hajót sem süllyesztett el a rettegett német monstrum, a Tirpitz
- Pattanó bombákkal semmisítették meg a britek a Ruhr-vidék gátjait
- Megrendítő beszédet mondott a berlini fal árnyékában J. F. Kennedy
- Véletlenül jutott kulcsfontosságú szerephez a berlini fal ledöntésében Günter Schabowski
- Családját is feláldozta a propaganda mestere, Joseph Goebbels
- Még az akasztófa árnyékában is tagadta bűnösségét Hermann Göring
- Búcsúcédulák bevételeiből finanszírozták, de így sem haladt a kölni dóm építése
- Bár tudomására jutott, nem tett jelentést a Hitler ellen készülő merényletről Erwin Rommel
- Sokszor napokig viselte ugyanazt a ruhát Hetty Green, a milliárdos üzletasszony 19:05
- Többször vezette ki Franciaországot a válságból Charles de Gaulle 16:05
- Tutanhamon sírjának felfedezésével mindenkit lenyűgözött Howard Carter 15:05
- Olümpiasz sem tudta megakadályozni fia, Nagy Sándor dinasztiájának bukását 09:06
- Inspiráló nőknek is otthont adott a tiszadobi Andrássy-kastély 09:05
- Egyetlen hete maradt, hogy a forradalom hősévé váljon Gérecz Attila tegnap
- Alattvalói joviális öregúrként és zsarnokként egyaránt tekintettek Ferenc Józsefre tegnap
- Elkezdődött a nevezés a Kecskeméti Animációs Fesztiválra tegnap