
SHALLOW DISCOURSE PARSING FOR GERMAN
Az elmúlt néhány évtizedben a természetes nyelvi feldolgozás számos területén lenyűgöző fejlesztések történtek. Ennek ellenére továbbra is nagy kihívást jelent, hogy egy számítógépet rávegyünk arra, hogy értelmet adjon a szövegben szereplő kifejezések diskurzusának.
Számos különböző elmélet létezik, amelyek célja egy jól megírt szöveg összefüggő szerkezetének leírása és elemzése, de a gyakorlati alkalmazhatóság és megvalósíthatóság különböző mértékben. Ez a könyv a sekély diskurzuselemzésről szól, a Penn Discourse TreeBank paradigmáját követve, amely egy több mint 1 millió szót tartalmazó, diskurzusviszonyok szempontjából annotált korpusz. Ha diskurzusfeldolgozásról van szó, az angolon kívül minden más nyelvet alacsony \-forrású nyelvnek kell tekinteni.
Ez a könyv a német nyelv diskurzuselemzésével foglalkozik. A német nyelvre vonatkozó annotált adatok korlátozott elérhetősége azt jelenti, hogy az ilyen adatokra támaszkodó modern, mély \-learning\-alapú módszerek lehetőségei is korlátozottak.
Ez a könyv azt vizsgálja, hogy a gépi \-tanulás és az újabb mély \-tanulás\-alapú módszerek milyen mértékben kombinálhatók a hagyományos, nyelvi jellemzőkkel a diskurzuselemzési feladatok teljesítményének javítása érdekében. A könyv céljaira kifejlesztett német nyelvű end\-to\-end sekély diskurzuselemző nyílt forráskódú és online elérhető. Több különböző nyelvi kötőszólexikonnal is végeztek munkát.
Megvitatjuk az ilyen lexikonok létrehozásának vagy továbbfejlesztésének stratégiáit egy adott nyelvre vonatkozóan, valamint javaslatokat teszünk arra vonatkozóan, hogyan növelhető tovább a sekély diskurzuselemzésben való hasznosságuk. A könyv mindazok számára érdekes lehet, akiknek munkája a természetes nyelvi feldolgozással kapcsolatos, különösen az angolon kívüli nyelvek esetében.