Értékelés:
Jelenleg nincsenek olvasói vélemények. Az értékelés 2 olvasói szavazat alapján történt.
The Unicode cookbook for linguists
Ez a szöveg gyakorlati útmutató nyelvészek és programozók számára, akik többnyelvű számítógépes környezetben dolgoznak adatokkal. Bemutatjuk azokat az alapfogalmakat, amelyek szükségesek ahhoz, hogy megértsük, hogyan működnek az írásrendszerek és a karakterkódolások, és hogyan működnek együtt az Unicode-szabvány és a Nemzetközi Fonetikus Ábécé metszéspontjában.
Bár ezeket a szabványokat a felhasználók gyakran frusztráltan fogadják, mégis egységes számítási architektúrát biztosítanak a nyelvkutatók és programozók számára, amely a világ nyelveinek lexikai adatainak feldolgozásához, közzétételéhez és elemzéséhez szükséges. Így fényt derítünk azokra a gyakori, de nem mindig átlátható buktatókra, amelyekkel a kutatók szembesülnek az Unicode-dal és az IPA-val való munka során.
Miután azonosítottuk és leküzdöttük ezeket a buktatókat, amelyek az írásrendszerek és karakterkódolások szintaktikailag és szemantikailag interoperábilissá tételével kapcsolatosak (amennyire ez lehetséges), létrehoztunk egy nyílt forráskódú Python és R eszközcsomagot, amely olyan nyelvekkel dolgozik, amelyek szerző- vagy dokumentumspecifikus ortográfiai konvenciókat leíró ortográfiai profilokat használnak. Ebben a szakácskönyvben leírjuk az ortográfiai profilok formális specifikációját, és nyílt forráskódú eszközök segítségével recepteket adunk, amelyekkel bemutatjuk, hogyan szegmentálhatják a felhasználók a szöveget, elemezhetik, azonosíthatják a hibákat, és hogyan alakíthatják át azt különböző írott formákká az összehasonlító nyelvészeti kutatásokhoz.
© Book1 Group - minden jog fenntartva.
Az oldal tartalma sem részben, sem egészben nem másolható és nem használható fel a tulajdonos írásos engedélye nélkül.
Utolsó módosítás időpontja: 2024.11.13 21:05 (GMT)