Конструирование признаков чрезвычайно важный этап в процессе машинного обучения, но данная тема редко обсуждается отдельно. С помощью этой книги вы научитесь тому, как извлекать и преобразовывать признаки – представлять информацию в числовом виде – в формат, пригодный для моделей машинного обучения. В каждой главе рассматривается только одна задача по обработке данных, например, как представлять текстовые данные или изображения. А вместе они представляют главные принципы конструирования признаков. Авторы этой книги - специалист по машинному обучению Amazon Элис Чжен и аналитик инновационной IT компании Concur Labs Аманда Казари. Конструирование признаков - это извлечение признаков из сырых необработанных данных и приведение их к формату, пригодному для обработки моделью машинного обучения. Это один из самых важных процессов в машинном обучении и одновременно один из самых сложных, ведь разнообразие моделей и данных не позволяет выделить общую тактику конструирования. И, тем не менее, авторам книги это удалось - здесь сформулированы более глубокие принципы работы с данными, проиллюстрированные конкретными примерами. В каждой главе описывается решение тех или иных задач: как представить текстовые данные или изображения, как понизить размерность автоматически сгенерированных признаков и т.д. В последней же главе все примеры объединяются в единую концепцию конструирования признаков в машинном обучении. Все примеры кода приведены на языке Python с использованием таких модулей, как NumPy, Pandas, Scikit-learn, Matplotlib, и выложены в репозитарии авторов на GitHub.
Сообщить о неточности