Эта книга написана ведущими специалистами в области тех-нологий баз данных и веба. Благодаря популярности интернет-торговли появилось много чрезвычайно объемных баз данных, для извлечения информации из которых нужно применять методы до-бычи данных (data mining). В книге описываются алгоритмы, которые реально использо-вались для решения важнейших задач добычи данных и могут быть с успехом применены даже к очень большим наборам данных. Из-ложение начинается с рассмотрения технологии MapReduce - важ-ного средства распараллеливания алгоритмов. Излагаются алгорит-мы хэширования с учетом близости и потоковой обработки данных, которые поступают слишком быстро для тщательного анализа. В последующих главах рассматривается идея показателя PageRank, нахождение частых предметных наборов и кластеризация. Во второе издание включен дополнительный материал о со-циальных сетях, машинном обучении и понижении размерности. Издание будет в равной мере полезна студентам и програм-мистам-практикам.
Сообщить о неточности