Топ-100 статей по машинному обучению и анализу данных
Этот пост построен по аналогии с постом «Хабрасливки: золотые посты «Хабрахабра» и Geektimes», но по машинному обучению и анализу данных. Выборку пришлось корректировать вручную, т.к. попали не относящиеся к теме сообщения, имеющие высокие оценки (возможно несколько осталось) и, наоборот, не попали несколько из лучших хаба «Машинное обучение». «Сливки» получились жидкие — самая высокая оценка — 312, самая низкая — 50, поэтому включены посты, не менее 80% голосов за которые положительны, а не 98%.
Распределение оценок:
- «Как правильно лгать с помощью статистики» — 312 голосов всего, 309 положительных.
- «Увидеть незримое» — 185 голосов, 180 положительных.
- «Распознаём изображение с токена при помощи камеры» — 178 голосов, 172 положительных.
- «Нейронная сеть против DDoS’а» — 177 голосов, 174 положительных.
- «Сколько котов на хабре?» — 176 голосов, 164 положительных.
- «Machine Learning. Курс от Яндекса для тех, кто хочет провести новогодние каникулы с пользой» — 172 голоса, 166 положительных.
- «Стивен Вольфрам провёл математический анализ социальных сетей» — 165 голосов, 157 положительных.
- «Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit» — 155 голосов, 149 положительных.
- «Торговля знает, когда вы ждете ребенка» — 149 голосов, 130 положительных.
- «Внезапный диван леопардовой расцветки» — 148 голосов, 145 положительных.
- «Самое главное о нейронных сетях. Лекция в Яндексе» — 136 голосов, 133 положительных.
- «Сколько нужно нейронов, чтобы распознать сводку моста?» — 136 голосов, 133 положительных.
- «FizzBuzz на TensorFlow» — 132 голосов, 123 положительных.
- «Парсим русский язык» — 128 голосов, 124 положительных.
- «Вычисление фрактальной размерности Минковского для плоского изображения» — 128 голосов, 116 положительных.
- «Метод Виолы-Джонса (Viola-Jones) как основа для распознавания лиц» — 123 голоса, 121 положительных.
- «Обучение машины — забавная штука: современное распознавание лиц с глубинным обучением» — 121 голос, 121 положительных.
- «Анализ резюме с HeadHunter. Кто сколько зарабатывает и в каких отраслях работает» — 119 голосов, 106 положительных.
- «Детекторы углов» — 118 голосов, 116 положительных.
- «Как я заработал $500K на машинном обучении и высокочастотном трейдинге — Часть 1» — 117 голосов, 95 положительных.
- «Жизненная позиция пользователей ВКонтакте в зависимости от пола и возраста» — 111 голосов, 104 положительных.
- «Яндекс анонсирует собственную технологию прогнозирования погоды Метеум. С точностью до дома» — 110 голосов, 108 положительных.
- «Dropbox: взгляд изнутри» — 105 голосов, 103 положительных.
- «Unsupervised learning или «пойди туда, не знаю куда, найди то, не знаю что» — 105 голосов, 96 положительных.
- «Латентно-семантический анализ» — 104 голоса, 101 положительных.
- «Про котиков, собак, машинное обучение и deep learning» — 101 голос, 98 положительных.
- «Как я победил в конкурсе BigData от Beeline» — 100 голосов, 92 положительных.
- «Расшифровываем формулу Хабра-рейтинга или восстановление функциональных зависимостей по эмпирическим данным» — 99 голосов, 98 положительных.
- «Эксперимент в Яндексе. Как идентифицировать взломщика с помощью машинного обучения» — 98 голосов, 87 положительных.
- «Яндекс и Высшая школа экономики открывают факультет Computer Science» — 96 голосов, 90 положительных.
- «Яндекс открывает новое направление своей деятельности — Yandex Data Factory» — 95 голосов, 84 положительных.
- «Жизненная позиция пользователей ВКонтакте. Бонус-трек. Корреляции» — 91 голос, 74 положительных.
- «Обучаем компьютер чувствам (sentiment analysis по-русски)» — 90 голосов, 85 положительных.
- «Портрет Хабра-tutorial» — 90 голосов, 81 положительный.
- «Поиск взаимосвязей на примере Нефть-Рубль» — 90 голосов, 80 положительных.
- «Понимание компьютером текста: действительно ли всё так плохо?» — 88 голосов, 83 положительных.
- «На какие вопросы можно ответить, проанализировав 1 500 000 уникальных историй болезней?» — 88 голосов, 77 положительных.
- «Курсы Стенфордского университета» — 88 голосов, 72 положительных.
- «Прогресс в разработке нейросетей для машинного обучения» — 87 голосов, 74 положительных.
- «Энтропия и деревья принятия решений» — 86 голосов, 83 положительных.
- «Необычные модели Playboy, или про обнаружение выбросов в данных c помощью Scikit-learn» — 84 голоса, 77 положительных.
- «Байесовская нейронная сеть — потому что, а почему бы и нет, черт возьми (часть 1) » — 83 голоса, 82 положительных.
- «Курс по машинному обучению на Coursera от Яндекса и ВШЭ» — 83 голоса, 81 положительных.
- «Яндекс.Метеум — новая разработка или маркетинговый ход?» — 83 голоса, 71 положительный.
- «Обзор алгоритмов кластеризации данных» — 82 голоса, 78 положительных.
- «Стэнфордская нейросеть определяет тональность текста с точностью 85%, код отдадут в Open Source» — 82 голоса, 77 положительных.
- «Рекурентная нейронная сеть в 10 строчек кода оценила отзывы зрителей нового эпизода «Звездных войн» — 82 голоса, 75 положительных.
- «Отличаем автобус от автомобиля по GPS-трекам» — 81 голос, 70 положительных.
- «Licenzero: простые движения» — 80 голосов, 73 положительных.
- «Использование каскада Хаара для сравнения изображений» — 79 голосов, 73 положительных.
- «Нейрореволюция в головах и сёлах» — 78 голосов, 76 положительных.
- «Введение в Байесовские методы» — 78 голосов, 70 положительных.
- «Яндекс.Толока. Как люди помогают обучать машинный интеллект» — 76 голосов, 72 положительных.
- «Заочное обучение в ШАД Яндекса: 570 замечательных часов моей жизни» — 76 голосов, 62 положительных.
- «Болee 40 онлайн-курсов от Coursera и Udacity» — 74 голоса, 73 положительных.
- «ИИ — Гедель против Тьюринга или критика искусственного разума. Точка зрения технаря» — 74 голоса, 65 положительных.
- «Как программист машину покупал» — 73 голоса, 71 положительный.
- «Постановка задачи компьютерного зрения» — 72 голоса, 72 положительных.
- «Выпущена система Mathematica 10, содержащая 700+ новых функций и невероятное количество R&D» — 72 голоса, 65 положительных.
- «AlphaGo на пальцах» — 71 голос, 69 положительных.
- «Hello, TensorFlow. Библиотека машинного обучения от Google» — 71 голос, 68 положительных.
- «Распознавание речи для чайников» — 71 голос, 61 положительный.
- «Python и красивые ножки: как я бы знакомил сына с математикой и программированием» — 70 голосов, 60 положительных.
- «Формирование высокоуровневых признаков с помощью широкомасштабного эксперимента по обучению без учителя» — 68 голосов, 64 положительных.
- «Классификатор изображений» — 67 голосов, 63 положительных.
- «Машинное обучение в навигационных устройствах: определяем маневры машины по акселерометру и гироскопу» — 67 голосов, 63 положительных.
- «Kaggle — наша экскурсия в царство оверфита» — 66 голосов, 65 положительных.
- «Совсем не нейронные сети» — 66 голосов, 61 положительный.
- «Обзор методов эволюции нейронных сетей» — 65 голосов, 60 положительных.
- «Определяем веса шахматных фигур регрессионным анализом» — 64 голоса, 64 положительных.
- «Введение в многомерный анализ» — 63 голоса, 61 положительный.
- «Элементы семантической паутины» — 63 голоса, 57 положительных.
- «Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)» — 63 голоса, 56 положительных.
- «Machine learning в простом проекте» — 63 голоса, 53 положительных.
- «Попробуй R» — 62 голоса, 59 положительных.
- «Покупка оптимальной квартиры с R» — 62 голоса, 59 положительных.
- «Распознавание гильоширных элементов на примере паспорта РФ» — 61 голос, 57 положительных.
- «Машинное обучение — микроскоп современного ученого. Зачем ЦЕРНу технологии Яндекса» — 60 голосов, 54 положительных.
- «Маленькие секреты больших графов» — 60 голосов, 54 положительных.
- «Сколько нужно нейронов, чтобы узнать, разведён ли мост Александра Невского?» — 59 голосов, 59 положительных.
- «Обучение OpenCV каскада Хаара» — 59 голосов, 57 положительных.
- «Язык R в помощь хабра-статисту» — 59 голосов, 54 положительных.
- «Лекция Дмитрия Ветрова о математике больших данных: тензоры, нейросети, байесовский вывод» — 58 голосов, 57 положительных.
- «Нейропластичность в искусственных нейронных сетях» — 58 голосов, 56 положительных.
- «Ваш персональный курс по Big Data» — 58 голосов, 54 положительных.
- «Социальная сеть вселенной Звёздных войн» — 58 голосов, 49 положительных.
- «Как подобрать платье с помощью метода главных компонент» — 57 голосов, 54 положительных.
- «Исследование проектов на фриланс-бирже Odesk глазами веб-разработчика» — 55 голосов, 52 положительных.
- «Топ-10 data mining-алгоритмов простым языком» — 55 голосов, 49 положительных.
- «Обзор литературы по Data Mining» — 54 голоса, 50 положительных.
- «Математика для искусственных нейронных сетей для новичков, часть 1 — линейная регрессия» — 54 голоса, 47 положительных.
- «Байесовская нейронная сеть — теперь апельсиновая (часть 2)» — 53 голоса, 52 положительных.
- «Введение в машинное обучение с помощью Python и Scikit-Learn» — 53 голоса, 50 положительных.
- «Питерский фотограф сравнил пассажиров метро с их профилями «ВКонтакте» — 53 голоса, 44 положительных.
- «Автоматическое выделение меток» — 52 голоса, 51 положительный.
- «Дайджест статей по анализу данных №3 (09.06.2014 —22.06.2014)» — 52 голоса, 47 положительных.
- «Анализ существующих подходов к распознаванию лиц» — 50 голосов, 49 положительных.
- «Идеальный ученик, или о чем умалчивают в машинном обучении» — 50 голосов, 49 положительных.
- «Решение задачи кластеризации методом градиентного спуска» — 50 голосов, 48 положительных.
- «Об обучении нейросетей» — 50 голосов, 47 положительных.
Распределение оценок: