Обзор наиболее интересных материалов по анализу данных и машинному обучению №20 (27 октября — 2 ноября 2014)

4cf086e49a2b4f66a420085544e4c2e9.jpgПредставляю вашему вниманию очередной выпуск обзора наиболее интересных материалов, посвященных теме анализа данных и машинного обучения.ОбщееRU HABR Russian AI Cup 2014: стратегия победителя RU HABR Московский Big Data-хакатон 15–16 ноября RU HighLoad++ 2014: Обработка данных в RTB: быстро, дешево и на 98% точно (Павел Калайдин, RuTarget)Real-time bidding требует real-time аналитики. RuTarget обрабатывает миллиард запросов на показ баннеров в день. Как определить, например, сколько в этих запросах уникальных пользователей? Слайды с доклада Павла Калайдина на HighLoad++ 2014. RU HighLoad++ 2014: Thorny path to the Large-Scale Graph Processing (Алексей Зиновьев, Тамтэк)Слайды с доклада Алексея Зиновьева с конференции HighLoad++ 2014, посвященного работе с графами больших размеров. RU HighLoad++ 2014: Как мы строили аналитическую платформу на несколько миллиардов событий в месяц (Михаил Табунов, Coub)Еще один набор слайдов с еще одного доклада с конференции HighLoad++ 2014. В данном случае Михаил Табунов из Coub рассказал о своем опыте в создании аналитической платформы. EN Новые подходы в Deep Learning для распознавания образовИнтересная статья с блога Microsoft Research о развитии использования алгоритмов машинного обучения Deep Learning для распознавания образов. EN Jeff Hawkins об ограничениях нейронных сетейПоследнее время достаточно много шума, новостей и обсуждений вокруг темы использования нейронных сетей для машинного обучения. Jeff Hawkins даёт свой небольшой экспертный комментарий об ограничениях нейронных сетей. EN Новости Data Science команды в LinkedInНемного новостей Data Science команды в LinkedIn от популярного портала Venture Beat. EN Для новичков Анализ текста с точки зрения бизнес-пользователя (часть 1)Первая часть серии статей, посвященных взгляду на анализ текста с точки зрения нетехнического специалиста. EN Для новичков Индексная страница по материалам, посвященным анализу данныхВ блоге Analytics Vidhya появилась полезная страничка, которая содержит ссылку на большое количество различных материалов, которые посвящены теме анализа данных. EN 25 фактов о Big DataНабор из 25 любопытных фактов о Big Data который может показаться интересным, от портала SmartData Collective. EN R 6000 библиотек на CRANКоличество библиотек для языка программирования R в хранилище CRAN достигло 6000. Теория и алгоритмы машинного обучения, примеры кода Онлайн-курсы, обучающие материалы и литература Видеоматериалы Data engineering EN 5 неоспоримых фактов о HadoopНебольшая статья от портала Big Data Analytics News, которая приводит 5 интересных фактов о Hadoop, которые помогут понять ситуации, когда использование Hadoop уместно и когда нет. EN Роль DBA в мире NoSQLСтатья расскажет о том, какова же роль DBA в современном мире NoSQL хранилищ. EN Использование SQL запросов в MongoDBСтатья, которая расскажет о возможности использования SQL синтаксиса для запросов к MongoDB с помощью SlamData. Обзоры Предыдущий выпуск:  Обзор наиболее интересных материалов по анализу данных и машинному обучению №19 (20 — 26 октября 2014)

© Habrahabr.ru