Обзор наиболее интересных материалов по анализу данных и машинному обучению №8 (4 — 11 августа 2014)

сегодня в 10:47

4cf086e49a2b4f66a420085544e4c2e9.jpgПредставляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения. В данном выпуске достаточно много практических примеров кода на языках программирования R и Python. Также в данном обзоре есть достаточно много статей, которые будут интересны новичкам. Несколько статей посвящено онлайн-курсам. Как обычно много материалов посвящено алгоритмам машинного обученияМатериалы по анализу данных и машинному обучению EN Для новичков Введение в машинное обучениеОтличная статья, описывающая базовые понятия машинного обучения. EN R Линейная классификация в RТри вида линейной классификации с примерами на языке программирования R. EN Рекомендации в Spotify с использованием Deep LearningАвтор рассказывает как работает система рекомендаций в популярном сервисе Spotify. RU Онлайн-курс Новый онлайн-курс по искусственному интеллектуДостаточно интересный по описанию новый онлайн-курс по искусственному интеллекту от LIRIS под названием IDEAL MOOC стартует в октябре 2014 года. EN Один год участия в соревнованиях KaggleВ данной статье автор рассказывает об опыте своего участия в различных соревнованиях по машинному обучению на Kaggle за один год. До этого большого опыта по теме машинного обучения у автора не было. EN Учась у лучшихКрайне полезная публикация, которая содержит советы от лучших участников Kaggle о том, как достичь успеха в соревнованиях по машинному обучению. RU R Вставка значений NA в произвольные места в векторПример полезного кода на языке программирования R. В данном примере кода решается достаточно часто возникающая задача, когда для различных целей в вектор значений необходимо вставить несколько NA-значений в произвольные места. EN Новый канал на YouTube, посвященный анализу данныхАвтор блога Oz Analytics в дополнение к своему блогу открыл новый канал на YouTube, в котором будет освещать различные темы, связанные с аналитикой, бизнес-аналитикой и Data Science. EN Для новичков Визуализация цепей МарковаВеликолепная визуализация работы алгоритма цепей Маркова. EN R Визуализация географических данных с помощью RИнтересная статья о том, как визуализировать географические данные с помощью языка программирования R и популярной библиотеки визуализации ggplot2. RU Для новичков R Цепочки операций: интересная возможность в библиотеке dplyrИнтересный пример кода использования цепочек операций при использовании популярной библиотеки dplyr для языка программирования R. EN Для новичков Онлайн-курс Сертификаты и сертификация в области анализе данныхБольшой интересный список возможных вариантов курсов, по окончании которых можно получить сертификат в области анализа данных. Здесь есть варианты онлайн-курсов, различных вариантов сертификации и очного обучения. EN Удачное применение предсказательной моделиПолезный пост от автора MachineLearningMachinery о том, как можно найти интересные и удачные применения предсказательной модели. EN Для новичков Какие навыки важны для Data ScientistОчень интересная статья о том, какие навыки важны для начинающего специалиста по анализу данных, а какие не так важны, как может показаться на первый взгляд, для вашего портфолио. EN Для новичков Data engineering Видеолекции NoSQL или SQL: как сделать правильный выбор? За последние годы количество различных вариантов баз данных, которые можно выбрать для своего приложения, значительно выросло. Из-за этого у разработчиков приложений появилось достаточно много вопросов, данный вебкаст постарается ответить на самые важные из них. EN Планы Microsoft в области машинного обученияСтатья расскажет о планах Microsoft на будущее в области машинного обучения. Microsoft запускает свою облачную платформу Azure ML, чему уделено много внимания в данной публикации. EN Как стать Data Scientist: MS Program, Bootcamp или MOOCИнтересные рассуждения о том, какие пути существуют, для того чтобы стать Data Scientist и какие у каждого пути есть особенности. EN Python Решение для соревнования по машинному обучению «Higgs Boson» на KaggleВариант решения задачи соревнования по машинному обучению «Higgs Boson» на Kaggle. Автор использует Python, Pandas и Scikit Learn для своего решения. EN R Сравнение прогнозируемой продолжительности жизни женщин и мужчинХороший пример обработки данных на языке программирования R. EN Видеолекции Heiko Strathmann рассказывает о библиотеке для машинного обучения ShogunHeiko Strathmann в данной небольшой видеолекции рассказывает о библиотеке для машинного обучения Shogun, одним из автором которой он является. Основное направление данной библиотеки — это использование метода опорных векторов для решения проблем регрессионного анализа и классификации. EN R Обработка данных по авиакатастрофамХороший пример обработки данных на языке программирования R. EN Для новичков R Параметризированные SQL-запросыХорошая статья про то как правильно писать и использовать параметризированные SQL-запросы, в том числе как их использовать в языке программирования R. EN Дайджест лучших ресурсов от DataScienceCentral (4 августа)Неплохой список свежих интересных статей и ресурсов от DataScienceCentral. EN Семь столпов статистической мудростиНебольшая статья про 7 вещей, которые крайне важны в статистической науке. EN Для новичков Плохие привычки при написании SQL-кодаНелохая статья с небольшим списком ошибок, которые часто допускаются при написании SQL-кода. RU R Для новичков Пример использования функции glm () в RПростой пример использования функции glm () в языке программирования R из библиотеки stats. EN Подготовка данных для предсказательного моделированияИнтересная статья от автора MachineLearningMachinery о возможностях улучшения предсказательной модели за счет лучшей предобработки данных. EN Для новичков 11 необходимых вещей для Data ScienceОтличная шпаргалка из 11 пунктов от портала DataScienceCentral, которая будет полезна любому кто интересуется темой Data Science. EN Интересные идеи из биостатистики для A/B-тестированияДанный материал может привлечь внимание тех, кто интересуется темой A/B-тестирования. В этой краткой статье предлагаются некоторые идеи из биостатистики, которые моугт быть применимы для A/B-тестирования. EN Для новичков Машинное обучение и компьютерное зрениеОчередная статья от Microsoft Technet Machine Learning Blog, посвященная использованию машинного обучения при решении вопросов распознавания образов и применения технологий компьютерного зрения. Статья небольшая и написана простым языком, без погружения в детали данной достаточно сложной темы. Предыдущий выпуск:  Обзор наиболее интересных материалов по анализу данных и машинному обучению №7 (28 июля — 4 августа 2014)

Только зарегистрированные пользователи могут оставлять комментарии.Войдите, пожалуйста.

© Habrahabr.ru