Обзор наиболее интересных материалов по анализу данных и машинному обучению №8 (4 — 11 августа 2014)
сегодня в 10:47
Представляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения. В данном выпуске достаточно много практических примеров кода на языках программирования R и Python. Также в данном обзоре есть достаточно много статей, которые будут интересны новичкам. Несколько статей посвящено онлайн-курсам. Как обычно много материалов посвящено алгоритмам машинного обученияМатериалы по анализу данных и машинному обучению Введение в машинное обучениеОтличная статья, описывающая базовые понятия машинного обучения. Линейная классификация в RТри вида линейной классификации с примерами на языке программирования R. Рекомендации в Spotify с использованием Deep LearningАвтор рассказывает как работает система рекомендаций в популярном сервисе Spotify. Новый онлайн-курс по искусственному интеллектуДостаточно интересный по описанию новый онлайн-курс по искусственному интеллекту от LIRIS под названием IDEAL MOOC стартует в октябре 2014 года. Один год участия в соревнованиях KaggleВ данной статье автор рассказывает об опыте своего участия в различных соревнованиях по машинному обучению на Kaggle за один год. До этого большого опыта по теме машинного обучения у автора не было. Учась у лучшихКрайне полезная публикация, которая содержит советы от лучших участников Kaggle о том, как достичь успеха в соревнованиях по машинному обучению. Вставка значений NA в произвольные места в векторПример полезного кода на языке программирования R. В данном примере кода решается достаточно часто возникающая задача, когда для различных целей в вектор значений необходимо вставить несколько NA-значений в произвольные места. Новый канал на YouTube, посвященный анализу данныхАвтор блога Oz Analytics в дополнение к своему блогу открыл новый канал на YouTube, в котором будет освещать различные темы, связанные с аналитикой, бизнес-аналитикой и Data Science. Визуализация цепей МарковаВеликолепная визуализация работы алгоритма цепей Маркова. Визуализация географических данных с помощью RИнтересная статья о том, как визуализировать географические данные с помощью языка программирования R и популярной библиотеки визуализации ggplot2. Цепочки операций: интересная возможность в библиотеке dplyrИнтересный пример кода использования цепочек операций при использовании популярной библиотеки dplyr для языка программирования R. Сертификаты и сертификация в области анализе данныхБольшой интересный список возможных вариантов курсов, по окончании которых можно получить сертификат в области анализа данных. Здесь есть варианты онлайн-курсов, различных вариантов сертификации и очного обучения. Удачное применение предсказательной моделиПолезный пост от автора MachineLearningMachinery о том, как можно найти интересные и удачные применения предсказательной модели. Какие навыки важны для Data ScientistОчень интересная статья о том, какие навыки важны для начинающего специалиста по анализу данных, а какие не так важны, как может показаться на первый взгляд, для вашего портфолио. NoSQL или SQL: как сделать правильный выбор? За последние годы количество различных вариантов баз данных, которые можно выбрать для своего приложения, значительно выросло. Из-за этого у разработчиков приложений появилось достаточно много вопросов, данный вебкаст постарается ответить на самые важные из них. Планы Microsoft в области машинного обученияСтатья расскажет о планах Microsoft на будущее в области машинного обучения. Microsoft запускает свою облачную платформу Azure ML, чему уделено много внимания в данной публикации. Как стать Data Scientist: MS Program, Bootcamp или MOOCИнтересные рассуждения о том, какие пути существуют, для того чтобы стать Data Scientist и какие у каждого пути есть особенности. Решение для соревнования по машинному обучению «Higgs Boson» на KaggleВариант решения задачи соревнования по машинному обучению «Higgs Boson» на Kaggle. Автор использует Python, Pandas и Scikit Learn для своего решения. Сравнение прогнозируемой продолжительности жизни женщин и мужчинХороший пример обработки данных на языке программирования R. Heiko Strathmann рассказывает о библиотеке для машинного обучения ShogunHeiko Strathmann в данной небольшой видеолекции рассказывает о библиотеке для машинного обучения Shogun, одним из автором которой он является. Основное направление данной библиотеки — это использование метода опорных векторов для решения проблем регрессионного анализа и классификации. Обработка данных по авиакатастрофамХороший пример обработки данных на языке программирования R. Параметризированные SQL-запросыХорошая статья про то как правильно писать и использовать параметризированные SQL-запросы, в том числе как их использовать в языке программирования R. Дайджест лучших ресурсов от DataScienceCentral (4 августа)Неплохой список свежих интересных статей и ресурсов от DataScienceCentral. Семь столпов статистической мудростиНебольшая статья про 7 вещей, которые крайне важны в статистической науке. Плохие привычки при написании SQL-кодаНелохая статья с небольшим списком ошибок, которые часто допускаются при написании SQL-кода. Пример использования функции glm () в RПростой пример использования функции glm () в языке программирования R из библиотеки stats. Подготовка данных для предсказательного моделированияИнтересная статья от автора MachineLearningMachinery о возможностях улучшения предсказательной модели за счет лучшей предобработки данных. 11 необходимых вещей для Data ScienceОтличная шпаргалка из 11 пунктов от портала DataScienceCentral, которая будет полезна любому кто интересуется темой Data Science. Интересные идеи из биостатистики для A/B-тестированияДанный материал может привлечь внимание тех, кто интересуется темой A/B-тестирования. В этой краткой статье предлагаются некоторые идеи из биостатистики, которые моугт быть применимы для A/B-тестирования. Машинное обучение и компьютерное зрениеОчередная статья от Microsoft Technet Machine Learning Blog, посвященная использованию машинного обучения при решении вопросов распознавания образов и применения технологий компьютерного зрения. Статья небольшая и написана простым языком, без погружения в детали данной достаточно сложной темы. Предыдущий выпуск: Обзор наиболее интересных материалов по анализу данных и машинному обучению №7 (28 июля — 4 августа 2014)
Только зарегистрированные пользователи могут оставлять комментарии.Войдите, пожалуйста.