Дайджест статей по анализу данных №2 (26.05.2014 — 8.06.2014)
Добрый день, уважаемые читатели.Представляю вашему вниманию дайджест новостей и полезных материалов из мира анализа данных. Предыдущий дайджест пользовался большой популярностью и поэтому я решил сделать их регулярными. Периодичность таких подборок будет 1 раз в 2 недели.В сегодняшней подборки вы узнаете что общего у статистики и науке об анализе данных, как можно выявить ложную корреляцию, а также какие алгоритмы правят современным миром. Помимо этого вы получите небольшую шпаргалки по методам машинного обучения и NoSQL базам данных, ну и еще много чего интересного.
ТеорияСписок NoSQL баз данных (EN)Полный перечень NoSQL БД, с разбивкой по категориям и кратким описанием. 10 вещей из статистики применимые при анализе больших данных (EN)В статье описаны общие подходы используемые в статистике и анализе больших данных. Ложные корреляции в больших данных (EN)Еще одна статья на тему отличия ложных корреляций от истинных. Рассматривается 6 видов корреляций. Развитие в анализе данных (EN)Выделены основные вехи развития себя как специалиста по анализу данных. На мой взгляд статья будет полезна тем, кто недавно начал заниматься анализом данных, но уже обладает базовыми представлениями об этом. Станет ли Python лидером среди языков для анализа данных (EN)В статье показана динамика развития Python, в качестве инструмента для анализа данных, А также приводятся размышления, почему он сейчас пользуется большой популярностью. 3 интересных, но малоизвестных, языка программирования (EN)Приводятся краткие описания языков: Julia, Scala, Erlang. 3 тенденции в хранилищах данных для наблюдения (EN)В статье выделяется следующие тенденции: взятие данных из разных источников, прямой доступ аналитиков к данным и скорость работы с ними. 7 основных правил для проекта с большими данными (EN)Перечислены моменты, на которые надо обратить внимание при начале работы с большими данными. Строим команду аналитиков данных (EN)В статье показано, каких специалисты должны ходить в состав команды и почему. В основном разговор идет о 3 людях: специалист по работе с клиентами, контекстный аналитик, визуализатор. 5 вопросов которые надо задать перед измерением чего-либо (EN)Показаны вопросы которое надо задать себе или закачку, перед началом анализирования какого-либо показателя. Жизнь аналитика данных в небольших странах (EN)В статье описаны ряд трудностей, а также пути их решения, при работе аналитиком в небольших странах, таких как Бельгия, Швейцария и т.д. The Graphviz Cookbook (EN)Сборник рецептов по использованию Graphviz для визуализации данных. 10 советов аналитикам (EN)Эксперты в области аналитики делятся советами, которые помогут вам при анализе. Трудности использования SQL при работе OLAP (EN)В статье описаны проблемы с которыми можно столкнуться при создании систем бизнес аналитика. Априорные вероятности и распространенность «неожиданных» эффектов (EN)Интересная статья по оценке p-value и его интерпретации. Простая байесовская сеть на основе цепей маркова (EN)Показано использование PyMC для построения такой сети. Справка по структурам данных (EN) Аналитики данных: прекратите искать, начните пользоваться (EN)Интересная статья, в которой объясняется, как можно заменить аналитика данных если его нет в штате. Стройте аналитические модели на нормальном распределении (EN)В статье описаны преимущества указанного подхода. SAS делает свои курсы свободными (EN)Приятная новость для желающих ознакомиться с SAS. BigML делает машинное обучение проще (EN) 5 отличных ресурсов для изучения линейной алгебры (EN) 4 важных применения эксцесса распределения (EN) Инфорграфика противостояния языков для анализа данных (EN) 4 вещи, которые можно получить из данных заказчика (EN)Кратко рассмотрено, какую выгоду могут принести сбор и анализ данных о ваших клиентах. 20 туториалов для аналитика данных (EN) Что скрывают нейронные сети? (RU) А что действительно скрывают нейронные сети? (RU) Шпаргалка по методам машинного обучения (EN)Шпаргалка создана для пакета scikit-learn. Что такое глубокое обучение (EN) Советы по построению системы аналитики «с нуля» (EN) Литература Практика использования различных инструментов Обучающие видео Разные статьи по теме