Data Science–дайджест: полезные статьи, сервисы и мероприятия
В свежей подборке статей и видеороликов по Data Science — свадьба с NFT-токенами вместо обручальных колец, музыкальная группа, созданная с помощью нейросети, и исследование по самым популярным именам в России (спойлер: Иванов — действительно частая фамилия).
редакция нетологии
Что почитать
«Дискриминационный» алгоритм: история скандала в Нидерландах, где тысячи семей по ошибке обвинили в мошенничестве», tjournal
Алгоритмы могут ошибаться, но иногда цена неточности становится слишком велика. Это испытали жители Нидерландов, которых обвинили в мошенничестве и заставили выплачивать государству огромные суммы. Всё дело — в ИИ, который помогал налоговой службе накладывать штрафы на тех, кто незаконно получал льготы. Ошибку в алгоритме обнаружили слишком поздно: многие лишились жилья и даже развелись, правительству же пришлось уйти в отставку. Подробнее о кейсе читайте в материале Екатерины Кузнецовой.
«Вышел обновлённый рейтинг языков программирования RedMonk», dev.by
Аналитики американской компании RedMonk рассказали о существенных изменениях в рейтинге языков программирования. Наряду с популярными JavaScript, Python и Java, позиции укрепили ещё четыре языка — TypeScript, R, Kotlin и Rust. На несколько пунктов опустились Ruby и Go, а Haskell и вовсе покинул топ. Подробности — в материале Александры Кукуть.
What Digital Advertising Gets Wrong, Harvard Business Review
В привычной логике таргета есть значительный недостаток. Зачастую аудитории, которая просматривает рекламу, заведомо интересен продукт компании, а обилие предложений лишь раздражает покупателей. Компании P&G и Unilever провели эксперимент: сократив объём рекламы, они сместили фокус с количества кликов на количество пользователей и получили органический рост продаж. Подробнее о логике эксперимента читайте в статье Синан Арал.
«Игры, которые играют в людей: что книга «Игра в цифры» рассказывает об игровой аналитике», habr.com
В конце 2020 года была опубликована книга Василия Сабирова «Игра в цифры». Это первое российское издание об игровой аналитике, в котором автор делится кухней геймдева, рассказывает об этапах анализа и оптимизации игрового процесса, а ещё — напоминает о монетизации продуктов. Подробный обзор — в блоге компании RUVDS.com.
YouTube experiment will auto-detect products in videos and provide related content links, 9to5google.com
В конце марта 2021 года Google сделал несколько важных анонсов. Во-первых, компания запустила автоматические субтитры для всех видео в Chrome. Во-вторых, было объявлено об автоматическом распознавании товаров в видео на YouTube. Функция будет реализована в виде небольшого виджета под видео с ссылкой на товары из внешних магазинов, что сочетается со стремлением Google превратить YouTube в торговую площадку. Подробности анонсов — в статье Дэмиена Уайлда.
«Мы поженились с помощью блокчейна»: пара из США на своей свадьбе обменялась NFT-токенами вместо обручальных колец», esquire.ru
Во время свадебной церемонии американская пара обменялась NFT-токенами в виде виртуальных колец вместо настоящих. Они отправили их друг другу из своих кошельков с Ethereum, где уже был составлен смарт-контракт для брака. Запись об обмене виртуальными кольцами будут всегда храниться в блокчейне как доказательство любви пары.
Курсы по теме
«Дата-журналист» — научитесь видеть истории, скрытые в массивах данных
«Машинное обучение» — получите прикладной опыт создания работающих нейронных сетей вместо обзора по верхам
«Нейрогороскопы»
Ночью в вашей квартире появится огромный краб. А вы об этом даже не узнаете. Вдобавок, пропустите симпатичного кузнеца, играющего на аккордеоне. Зовут его, кстати, Себастьян. Чтобы исправить недоразумение, рекомендуем почитать предсказания нейросети GPT-2, обученной на текстах Владимира Сорокина и Виктора Пелевина.
«Аналитика футбола: как дата-сайентисты дают новый взгляд на игру», berza.ru
Ранее мы рассказывали о выпускнике курса «Data Scientist» Владимире Герингере, авторе блога «Футбол в цифрах». Совместно с Кириллом Серых, дата-сайентистом и тренером юношеской команды U17 в берлинской «Тасмании», он поделился секретами футбольной аналитики. Подробнее о работе с ИИ, сборе данных и необходимых инструментах читайте в статье Алексея Клёсова.
Что посмотреть
«Красавица–байкерша из Японии оказалась 50-летним мужчиной», vgtimes.ru
Twitter-аккаунт azusagakuyuki обрёл популярность за считанные месяцы: увлечённая мотоциклами девушка приковала внимание тысяч подписчиков и начала монетизировать свой блог. Подозрения в подлинности фото появились, когда пользователи обнаружили на одном из кадров мужчину со смартфоном в руках. Он попал в зеркало заднего вида и… был вынужден признаться в обмане. 50-летний японец Сойя воспользовался FaceApp, чтобы обрести чарующую внешность и внимание аудитории, а заодно — и деньги.
Eternity
Это — новая айдол-группа, в которой нет ни одной реальной участницы. 11 девушек с уникальной внешностью и голосом были созданы японской компанией Pulse9 с помощью технологии Deep Real AI. В планах компании — использование участниц в качестве YouTube-блогеров, моделей и инфлюенсеров. Одна из них, Чорон, уже появилась в рекламе брокерской компании Shinhan Investment Corp.
Outlier
Data Visualization Society — это крупнейшее сообщество людей, увлечённых сбором и визуализацией данных. В феврале единомышленники организовали конференцию Outlier, призванную вдохновить визуализаторов по всему миру, а совсем недавно записи докладов опубликовали на YouTube. Участники рассуждали об искусстве, основанном на данных и автопортретах, воплощении танцевальных движений и многом другом.
Курсы по теме
«Data Scientist» — научитесь преобразовывать сырые данные в полезную информацию для принятия стратегических решений
«Big Data» — узнаете, как работать с большими данными
«Аналитик данных» — станете универсальным аналитиком и начнёте работать уже через полгода обучения
Свежие исследования
Women«s Confidence
Перед вами — крупнейшее исследование чувства уверенности у женщин. В течение трёх лет эксперты консалтинговой фирмы Eranos совместно с IT Cosmetics изучали факторы, влияющие на самоощущение респонденток по всему миру. В исследовании приняли участие 11 000 женщин из 11 стран, благодаря чему удалось определить общие источники уверенности и оценить степень чувства в разных регионах.
Lost Tapes of the 27 Club
Это — очень важный проект, который затрагивает тему ментального здоровья музыкантов. Его создатели, организация Over The Bridge, публикуют полностью созданные и исполненные нейросетью композиции артистов, которые умерли из-за проблем с психологическим здоровьем в возрасте 27 лет. ИИ слушает композиции музыкантов и на их основе генерирует ряд абсолютно новых сочетаний ритма, мелодии и текста.
Самые популярные имена и фамилии в городах-миллионниках России
Выпускница курса «Дата–сторителлинг» Алина Соломенникова подсчитала, кого в России больше — Вась Пупкиных или Артуров Пирожковых, и доказала существование того самого Ивана Иванова. Исследователи собрали имена и фамилии пользователей ВКонтакте из 16 крупных городов, подсчитали частотность сочетаний имён и фамилий и даже провели анализ псевдонимов.
Полезный сервис
Crispy Subtitles
Lay«s выпустили плагин для Google Chrome, который распознаёт звук хрустящих во рту чипсов и автоматически включает субтитры для видео на YouTube. Для обучения ИИ команда собрала 178 часов хруста со всего мира, благодаря чему вы не пропустите ни секунды просмотра, где бы ни находились!
Анонсы курсов
28 апреля приглашаем на старт курса «Аналитик данных с нуля до middle». Вы научитесь работать с Python и SQL, применять data-driven подход и строить визуализации, добавите в портфолио больше 6 кейсов и с уверенностью начнёте карьеру в сфере аналитики.
29 апреля начнётся курс «Дата-журналист: истории, основанные на данных». Вы научитесь отбирать данные и верно их анализировать, освоите необходимые инструменты и проведёте полноценное исследование.
Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.
Полный текст статьи читайте на Нетология