Obem obrabatyvaemyh dannyh vo vseh oblastyah chelovecheskoy deyatelnosti prodolzhaet rasti bystrymi tempami. Suschestvuyut li effektivnye priemy raboty s nim? V etoy knige rasskazyvaetsya ob Apache Spark, otkrytoy sisteme klasternyh vychisleniy, kotoraya pozvolyaet bystro sozdavat vysokoproizvoditelnye programmy analiza dannyh. C pomoschyu Spark vy smozhete manipulirovat ogromnymi obemami dannyh posredstvom prostogo API na Python, Java i Scala.
Napisannaya razrabotchikami Spark, eta kniga pomozhet issledovatelyam dannyh i programmistam bystro vklyuchitsya v rabotu. Ona rasskazyvaet, kak organizovat parallelnoe vypolnenie zadaniy vsego neskolkimi strochkami koda, i ohvatyvaet primery ot prostyh paketnyh prilozheniy do programm, osuschestvlyayuschih obrabotku potokovyh dannyh i ispolzuyuschih algoritmy mashinnogo obucheniya.