
Az egészségügyi ágazatban a nagy adatelemzés rendkívül fontos, nyilvánvalóan azért, mert maga az iparág hatalmas adathalmazok tengerének ad otthont.
Az analitikát ezen adatkészletek vizsgálatára és a rejtett információk és trendek feltárására használják a tudás kinyerése és az eredmények előrejelzése érdekében. A jelenlegi meglévő megközelítések jelentős kategorizálási és előrejelzési pontossággal nem rendelkeznek, mivel a strukturált klinikai és egészségügyi adatok beszerzése időigényes, a pontos betegség-előrejelzés pedig valós idejű jelentések felhasználásával nehéz és számításigényes feladat.
Az egészségügyben alkalmazott gépi tanulási megközelítések mögött meghúzódó logika megértése ezért alapvető fontosságú, mivel a pontosság és a precizitás gyakran kritikus fontosságú az egészségügyi problémák esetében. A cél egy általánosított klinikai gépi tanulási előrejelző modell létrehozása felügyelt osztályozási algoritmusok felhasználásával, hogy több gyakori, de súlyos egészségügyi betegséget bináris pontszám segítségével előre jelezzen.