2019. április 18. - A POLTEXT, a BME és a JTI közös mini-konferenciáján elhangzottak

A jogi szövegek ontológiája és hálózatai: logikai és szövegbányászati elemzések

 

A nemzetközi trendekhez hasonlóan Magyarországon is egyre gyakrabban alkalmazzák a társadalomtudományok terén a szövegbányászati módszereket. Ezek segítségével korábban nem vizsgált jelenségek is megérthetővé válhatnak a kutatók számára. A módszer lényege, hogy a szövegelemző munkákat különböző adatelemző algoritmusok segítik, melyek strukturálatlan szöveges állományokat dolgoznak fel. E kutatási irány hazai tapasztalatait összegezte 2019. április 18-án a MTA TK Politikatudományi (PTI) és Jogtudományi Intézete (JTI), valamint a BME SZKT közös szervezésében megrendezett workshop is, mely a szövegbányászati elemzések jogi területeken betöltött szerepét és jelentőségét boncolgatta. Egy olyan megújuló, intézetek közötti diskurzus létrehozásának reményében ültek össze a kutatók, amelyet a későbbiekben más szereplőkkel kiegészülve is folytatni lehet majd.

A jövőbeni együttműködést és munkát a szövegelemzők és jogászok tapasztalatainak egymáshoz való közelítésével igyekeznek majd elősegíteni. E törekvések, ahogyan arra Szakadát István, a BME SZKT tanszékvezetője a köszöntője során rámutatott, új kihívást jelentenek a társadalomtudományi kutatások területén. A konferencia során a különböző kutatási folyamatokat, felmerülő kihívásokat és problémákat, valamint a megszülető eredményeket vették szemügyre a megjelent kutatók, és folytattak élénk párbeszédet arról, hogy a jövőben a közös munkával milyen irányban haladhatnak előre.

A workshop első felszólalója, Hamp Gábor a jogszabályok belső linkjeinek gépi elemzésének terén, Szakadát Istvánnal és Markovich Rékával közösen folytatott kutatásának eredményeiről beszélt. A jogszabályokat alapul véve megállapították, hogy azok tele vannak indexikus kifejezésekkel és hivatkozásokkal, ami egy elemzés során kifejezetten zavaró tényező tud lenni. A céljuk ezen hivatkozásoknak az automatikus felismerése volt, valamint az, hogy olyan tiszta normákat és szövegeket lehessen létrehozni ezek nélkül, amelyek képesek megőrizni az eredeti, lényeges információkat. Ehhez szükséges volt egy kereső szintaxis alkalmazása, mellyel a különböző hivatkozásokat megtalálják és kiszűrik. A Regex elnevezésű keresőformula ezt a feladatot hivatott betölteni. A magyar jogszabályi rendszer feszesnek mondható, emiatt jól rá lehet illeszteni ezt a keresőt, különböző kifejezéseket gyorsan felismer és kiszűr. A Regex segítségével többek között minták, betűk, ismétlések adhatók meg, a program pedig ezek alapján szűr, ami megkönnyíti az adott jogszabály áttekintését. Hamp Gábor elmondta, hogy a kutatás során egyre nagyobb mértékű előrehaladást tapasztaltak a keresőformula alkalmazásával, és a lefuttatott hivatkozásokat jó eredménnyel kapták vissza: a sikermutatók alapján nagyjából 97%-os eredménnyel.

A beszámolót követő vita során felmerülő kérdésre, mely a kutatás értelmére vonatkozott, a következő válasz született: létezik egy praktikus igény arra, hogy ezeket a hivatkozásokat kezelni lehessen, azért is, mert a magyar jogalkotás területén sokszor fordulnak elő halott linkek a jogszabályokban, és ezzel a metódussal kezelni lehetne ezt a problémát.

A konferencia soron következő témája „A családtámogatási törvény ontológiájának építéséről” szólt, Szakadát István prezentálásában. Az ontológia görög eredetű kifejezés, alapvetően a lét legáltalánosabb törvényeiről szóló tanítást jelenti. Szakadát István előadásában az ontológiát mint tudásszervezési folyamatot írta le, mely során az összes használt fogalmat rendszerezni kell, majd kulcsfogalmakat létrehozni, melyek alá hierarchikusan be lehet sorolni a többi fogalmat. Ha a jogszabály építési ontológiáról beszélünk, természeti és társadalmi tények egymás alá rendeléséről van szó. A fogalmi hierarchia építésénél nehézséget jelent, hogy a relációs fogalmak helyett ratifikált fogalmak kerüljenek használatba. A családjogi törvény kétféle gyermekfogalmat különböztet meg: egyrészt gyermek az, aki valakiknek a leszármazottja (ebben az esetben a gyermek ekvivalens az ember fogalmával), másrészt minden 18 év alatti gyermeknek minősül, ők azok, akiket támogat a családjogi törvény. Ezáltal a gyermek fogalma két értelemben jelenik meg a törvényben, amely magában hordozza az inkonzisztencia veszélyét. Ennek a kiküszöböléséhez fontos egy harmonikus, közös munkaviszony kidolgozása az informatikusokkal.

Ezt követően Grad-Gyenge Anikó egyetemi docens tartott előadást,  „A szerzői jogi szabályozás adaptálódása az új technológiák útján való műhasznosítási/fogyasztási módokhoz” címmel. Szó esett a rendeleti úton történő szerződésharmonizációról és annak korlátairól. Amint azt Grad-Gyenge Anikó kifejtette, összpiaci érdek van a harmonizációra, azonban ezt nehezíti például az egyes tagállamok elkötelezettsége a nemzeti jogi hagyományokhoz. A korábban kötött szerződéseket megvizsgálva arra a következtetésre jutott, hogy teljeskörű harmonizációra jelenleg nincs lehetőség. Egy egységes EU-s védelmi szabályzat létrehozása kívánatos célkitűzés lehetne, amely koherenssé tenné a már meglévő szabályozásokat és a nemzeti és uniós érdekeket képes lenne közelíteni egymáshoz. Jelenleg azonban nincs meg a jogi lehetőség egy ilyen egységes jogi kódex létrehozására.

Rövid szünetet követően Lőrincz Viktor és Ződi Zsolt tartották meg előadásukat, „Szövegelemzés és hálózatkutatás az AB és a bíróságok gyakorlatában” címmel. Az ebben foglaltak szerint már a 19. században nagy jelentőséget tulajdonítottak a hivatkozásoknak az Egyesült Államokban. Eleinte egyszerű statisztikai módszerekkel kerestek választ a felmerülő kutatási kérdésekre. Az elmúlt években lefolytatott kutatások során a birosag.hu weboldalán fellelhető nagyjából 160 ezer ítéletet vizsgálták meg, és a bennük lévő hivatkozásokat.

Sebők Miklós az általa vezetett POLTEXT-projekt korpuszairól és szövegbányászati elemzéseiről beszélt. A POLTEXT-projekt és különböző testvérptojektjei, mint például a Comparative Agendas Project, egyre nagyobb nemzetközi elismertségnek örvendenek. A kutatók különböző konferenciákon, tematikus workshopok keretében foglalkoznak a szövegbányászati elemzések eredményeivel. A jogi szövegek esetében a szövegbányászat nagy segítséget nyújt a különböző kifejezések fellelésében, szövegek leszűkítésében különféle szófelhők, osztályzások, csoportosítások alkalmazásával. Alkotmánybírósági és a Kúriával foglalkozó kutatásokban is alkalmazásra kerülnek ezen szövegelemzési módszerek. A kutatások során témák alapján vagy épp szótári alapú megközelítéssel vizsgálhatók a törvények és jogszabályok, sőt már az adott törvényjavaslatok változásai is nyomon követhetők ezen szövegösszehasonlítási módszerekkel. A legfontosabb tényezője a szövegbányászati elemzéseknek a validálás – azaz a kapott eredményeket vissza kell tudni vezetni a kvalitatív tudásra is.

A workshop zárásaképp Gárdos-Orosz Fruzsina tartotta meg előadásáta jogrendszer reagálóképességének mérhetőségében folytatott kutatásairól. Vizsgálatainak fő kérdése, hogy a jognak a társadalmi igényekre kell-e reagálnia, és azt kell megvizsgálni, hogy mennyire képes reagálni ezekre a társadalmi igényekre. Azt, hogy mire reagál a jog, más, jogtól elkülönülő kutatások végzik – ahogy Gárdos-Orosz Fruzsina elmondta -, a jogi kutatások pedig a mikéntjét vizsgálják. A joggal szemben felállított igények milyenségét általában empirikus kutatásokkal igyekeznek feltárni, emellett pedig szövegelemzéses vizsgálatnak vetik alá a jogszabályokat, hogy mennyire felelnek meg az adott igényeknek. Így a jogrendszeren belüli szövegek elemzésével rengeteg információt lehet leszűrni a társadalom joggal szemben felállított igényeiről.

A szövegbányászati technikák, és az ezek köré szerveződő tudományos együttműködések előtt még hosszú út áll. Ha azonban a jövőben több, az április 18-i workshophoz hasonló eszmecserére kerül sor, számos további figyelemreméltó eredmény születhet a logikai és szövegbányászati elemzések területén.