Data Science-дайджест: что почитать, посмотреть и попробовать в июле
Как изменилась профессия дата-сайентиста, зачем нейросеть следит за Байкалом, кто создал шлем для «чтения мыслей» — об этом и многом другом в нашем свежем дайджесте.
Дарья Тихомирова
Автор-фрилансер
Что почитать
«Нейросеть проследит за чистотой Байкала», Sysblok
Российские учёные работают над алгоритмом для анализа вод и классификации организмов в озере Байкал. Для этого нейросеть обучат на тысячах снимков планктона, которые будут поступать в базу из лаборатории Иркутского Государственного Университета. Нейросетевой анализ покажет, какие факторы влияют на качество вод, и что происходит в экосистеме прямо сейчас. Помимо ИГУ, в проекте примут участие MaritimeAI, Яндекс и фонд «Озеро Байкал».
Alias-Free GAN
Многие видели, как нейросети создают ряды плавно переходящих изображений: рассвет превращается в горный пейзаж, ретриверы становятся очаровательными лабрадорами, а вместе с этим неожиданно оживает фон и множество случайных предметов… Nvidia представила алгоритм Alias-Free GAN, задача которого генерировать правдоподобные переходы между изображениями. Кажется, компании это удалось!
Алгоритм Allias-Free Gan генерирует переходы правдоподобнее, чем его предшественник«Калифорнийский стартап Kernel начал продавать в США шлемы для «чтения мыслей» за $50 тысяч», VC
В США открылись продажи Flow и Flux — шлемов, работа которых сопоставима с аппаратами МРТ, ЭКГ и ПЭТ. Устройства можно использовать для оценки концентрации, внимания и изменения эмоционального состояния людей, а также для анализа мозга в процессе обучения. В отличие от шлемов Neuralink Илона Маска, Kernel неинвазивны, а их широкое использование планируется к 2030 году.
«На железных дорогах Индии применят российскую технологию распознавания лиц», Известия
До конца июля на ж/д станциях Индии будет внедрена система автоматического распознавания лиц. Разработчиком технологии стала российская компания Ntechlab, которая к этому времени поставит в страну 470 камер. Система определяет до 50 лиц одномоментно, что снизит нагрузку на службу безопасности вокзалов.
«Artbreeder нейросеть на вооружении художников», DTF
Artbreeder — это нейросеть, которая позволяет генерировать правдоподобные изображения. С её помощью можно создавать стилизованные портреты, объединять картинки и развивать искусство на новом уровне. Алгоритмы нейросети становятся сильнее, а сам инструмент привлекательнее: попробовать точно стоит.
«Machine Learning Engineer vs Data Scientist (Is Data Science Over?)», Towards Data Science
С каждым годом ориентироваться в сфере Data Science всё сложнее: обилие новых профессий, смена задач и парадигм вызывают чувство FOMO и лёгкое недоумение. Джейсон Джанг рассказал о том, как меняется профессия Data Scientist, какое направление выбрать и от чего отталкиваться в обсуждении зарплаты.
«Mapping the benefits of nature in cities with the InVEST software», Nature
Значение инвестиций в городскую природу велико, но определить, окупаются ли вложения, не всегда просто. Программный пакет InVEST помогает увидеть изменения в будущем и сравнить с текущей ситуацией в регионе. Технологию уже протестировали в Китае, Франции и США.
Курсы по теме
«Старт в аналитике» — сделайте первые шаги в новой сфере и освойте базовые навыки Data Science
«Машинное обучение» — научитесь создавать работающие нейтронные сети
«Deep Learning» — научитесь работать с многомерными свёртками, реализовывать NLP с нуля, строить языковые модели
Что посмотреть
Арт-проект «Общее решение»
Арт-проекты объединяют людей по всему миру, и российские города — не исключение. В рамках Волгафеста жителям Самары предложили выбрать цвета, в который покрасят стены Самарской ГРЭС. Каждый оттенок — это ассоциация горожан с родным местом: «ночной волжский», «красный Глинский», «весенний проран», «грушевая поляна» и многие другие. Результаты голосования автор проекта, Андрей Сяйлев, представил в виде инфографики, которая показывает изменения в облике города.
Что попробовать
Strolling Cities
Strolling Cities заявлен как настоящий эксперимент направления визуальной поэзии. Нейросеть генерирует изображение в соответствии с содержанием стихотворений, используя коллекцию из миллионов фотографий итальянских городов. При упоминании воды появляется изображение каналов и заливов, а если что-то в тексте «стремится ввысь», то здания простираются в небо.
Cool Walks
Приложение, которое прокладывает пешеходные маршруты только по тенистым местам. Программа подсказывает расположение питьевых фонтанчиков и места, где можно спрятаться от палящего солнца. Пользователю предлагают несколько вариантов: самый короткий маршрут, более продолжительный тенистый и «режим вампира», когда избежать прямых солнечных лучей нужно любой ценой. Приложение работает только в Барселоне, но надежда на расширение уже есть.
Dwitter
Помните космическую анимацию в проигрывателе MS Windows? Раньше мы засматривались на узоры часами, а сейчас можем написать подобный код сами. Dwitter — это площадка, где программисты соревнуются в создании анимации на JavaScript. Главное правило — уложиться в 140 символов.
GitHub Copilot
Сфера программирования развивается очень быстро: для того чтобы написать код, сегодня необязательно знать язык в совершенстве. OpenAI выпустила программу, которая генерирует строки кода на основе ваших комментариев, учитывает контекст задачи и помогает охватить множество возможных решений.
Lingtrain Alignment Studio
Книги с параллельным переводом помогают подтянуть язык, но найти их непросто, как и сделать самостоятельно. Проект Lingtrain призван решить этот вопрос: программа позволяет создавать красивые многоязычные книги с подсветкой параллельных предложений. Выравнивание происходит на основе эмбеддингов, а дополнительные алгоритмы обрабатывают случаи, когда одно предложение было переведено как несколько и наоборот.
Хотите написать колонку для Нетологии? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.
Дарья Тихомирова
Автор-фрилансер
Полный текст статьи читайте на Нетология