
Using Python for Text Analysis in Accounting Research
Using Python for Text Analysis in Accounting Research interaktív, lépésről-lépésre felépített keretrendszert nyújt a beszélt vagy írott nyelv elemzéséhez a társadalomtudományok oktatói és doktoranduszai számára. A cél annak bemutatása, hogy a szövegelemzés hogyan javíthatja a kutatást azáltal, hogy automatikusan új és korábban ismeretlen információkat nyerhet ki a terjedelmes közzétételekből, hírcikkekből és közösségi média-bejegyzésekből. Az anyagok úgy kerülnek bemutatásra, hogy az olvasó megismerhessen egy-egy szövegelemzési koncepciót vagy technikát, és azt gyakorlatban is megismételhesse.
A monográfia azzal kezdődik, hogy bemutatja, hogyan kell telepíteni és használni a Pythont, egy népszerű általános célú programozási nyelvet, áttekintve a Python alapvető programozási szintaxisát, az operátorokat, adattípusokat, függvényeket stb.
Lehetővé teszi, hogy az olvasók először megismerkedjenek a programozási környezettel. Tárgyalja a Jupyter notebookot, amely egy nyílt forráskódú webes alkalmazás, amely lehetővé teszi a Python kód interaktív létrehozását, futtatását és tesztelését. A monográfia pedig bemutatja a Pandas csomagot a táblázatos adatokkal való munkához, amely segíti a kutatókat a strukturálatlan szöveges adatok strukturált, táblázatos adatokká alakításában. A szerzők bemutatják a reguláris kifejezéseket, amelyek a szövegek különböző elemeinek megfeleltetésére szolgáló mintákat jelentenek. Ezután a számviteli és pénzügyi tanulmányokban használt különböző szövegelemzési módszerek megvitatásával és kódolásával folytatják. Végül a monográfia áttekintést nyújt a Pythonban található webkaparási és fájlfeldolgozási funkciókról, különös tekintettel az EDGAR-beadványok letöltésére és azok egyes szakaszainak azonosítására.
A monográfia első öt fejezete együttesen segít az olvasóknak eligazodni a Pythonban, és felkészülni saját kódjuk megírására.