Statisztikai módszerek az annotációs elemzéshez

Eredeti címe:

Statistical Methods for Annotation Analysis

Könyv tartalma:

Az adatok címkézése a tudomány egyik legalapvetőbb tevékenysége, amely évtizedek óta meghatározza a gyakorlatot, különösen az orvostudományban, valamint a korpusznyelvészeti kutatásokat legalább a Brown-korpusz kifejlesztése óta. A mesterséges intelligencia (AI) gépi tanulás irányába történő elmozdulásával a mesterséges intelligencia rendszerek képzéséhez és értékeléséhez felhasználható adathalmazok (az AI-ban korpuszoknak is nevezett korpuszok) létrehozása is központi tevékenységgé vált ezen a területen.

A korai AI-adatkészletek ad-hoc alapon, konkrét problémák megoldására jöttek létre. Ahogy egyre nagyobb és több újrafelhasználható adathalmazok jöttek létre, amelyek nagyobb befektetést igényeltek, úgy vált szükségessé az adathalmazok létrehozásának szisztematikusabb megközelítése a minőség javítása érdekében. Számos - gyakran, de nem kizárólag az orvostudományokból származó - statisztikai módszert alkalmaztak annak biztosítására, hogy a használt címkék ne legyenek szubjektívek, vagy hogy a kódolók által megadott különböző címkék közül lehessen választani.

Az ilyen módszerek széles skáláját alkalmazzák ma már rendszeresen. E könyv célja, hogy áttekintést nyújtson az ilyen, a jegyzetelési gyakorlatot támogató statisztikai módszerek közül a legszélesebb körben használtakról.

A szerzők tudomása szerint ez az első könyv, amely megkísérli lefedni a szélesebb körben használt módszerek két családját. Az első módszercsalád a címkézési sémák kidolgozásával foglalkozik, és különösen annak biztosításával, hogy ezek a sémák olyanok legyenek, hogy a kódolók között megfelelő egyetértés figyelhető meg.

A második családba tartoznak azok a módszerek, amelyeket a kódolók eredményeinek elemzésére fejlesztettek ki, miután a rendszerben megállapodtak, különösen, bár nem kizárólagosan, hogy azonosítsák a kódolók által megadott címkék közül a legvalószínűbbet egy tételhez. E könyv elsősorban a természetes nyelvfeldolgozásra összpontosít, a mesterséges intelligenciának arra a területére, amely a nyelvi értelmezés és termelés modelljeinek fejlesztésével foglalkozik, de az itt tárgyalt módszerek nagy része, ha nem a legtöbbje alkalmazható a mesterséges intelligencia más területein, sőt, az adattudomány más területein is.

A könyv egyéb adatai:

ISBN:	9783031037535
Szerző:	Silviu Paun
Kiadó:	Springer International Publishing AG
Nyelv:	angol
Kötés:	Puha kötés
A kiadás éve:	2022
Oldalak száma:	197

Vásárlás:

Jelenleg kapható, készleten van.

Statisztikai módszerek az annotációs elemzéshez

Eredeti címe:

Könyv tartalma:

A könyv egyéb adatai:

Vásárlás:

A szerző további könyvei:

A szerző munkáit az alábbi kiadók adták ki: