Data Science-дайджест: что почитать, посмотреть и попробовать в июне 2022
Разгадываем кроссворд с помощью нейросети, наслаждаемся визуализацией 100 лет аниме, изучаем события эпохи Возрождения и постигаем вселенскую мудрость вместе с мемным ботом — об этом и не только в нашем июньском дайджесте.
Дарья Тихомирова
Автор-фрилансер.
Собрала июньскую подборку
Что почитать
«Новая языковая модель Google с 540 млрд параметров способна объяснять шутки и писать код», Habr
С чувством юмора у ИИ всегда было неважно: в редких случаях технологии удавалось отличить шутку от сарказма или ответить на неё. Разработчики Google AI Research представили новую языковую модель Pathways Language Model (PaLM), которая научилась понимать и объяснять некоторые шутки. О пользе такого открытия рассказывает редакция Habr.
«Искусственный интеллект впервые разгадал кроссворд быстрее человека», НОЖ
Berkeley Crossword Solver — алгоритм, который впервые обошёл человека в турнире по разгадыванию кроссворда. Он понимает игру слов и подбирает все возможные варианты ответов, а затем отсеивает их в порядке вероятности. Подробнее о технологии — в заметке Марины Климовой.
«Нейросеть создала собственный язык, который учёные не могут расшифровать», IXBT
В апреле мы рассказывали про DALL·E 2 — алгоритм, который генерирует картинки по словесному описанию. Оказывается, если попросить его изобразить «двух китов, которые разговаривают о еде», животные на картинке действительно буду вести диалог, но на бессмысленном языке. Учёные заподозрили, что нейросеть придумала собственный язык, чтобы было проще генерировать изображения.
«Generating Long Videos of Dynamic Scenes», Тимоти Брукс
NVIDIA анонсировала модель для генерации динамичных видео, основанную на архитектуре StyleGAN. Она воспроизводит плавное движение объекта, изменения в обзоре камеры и новый контент, который появляется в кадре. Код, датасет и предобученную модель выпустят в конце лета. Примеры можно посмотреть уже сейчас в статье Тима Брукса — одного из авторов проекта.
Что посмотреть
Life Cycle
Немецкий дизайнер Хаген Райлинг сравнил среднюю продолжительность жизни человека — 80 лет — с периодами существования 34 животных и растений. Оказалось, дольше нас живут лишь немногие из этих видов.
Ролик показывает, сколько особей каждого вида в среднем умирает или выживает за 80 лет человеческой жизни. Сам человек — в центре инфографикиHistography
Перед вами — таймлайн, который охватывает 14 млрд лет истории: от Большого взрыва до информационной эры. Разработчик и дизайнер Матан Штаубер создал интерактивную карту событий: каждое из них ведёт на соответствующую статью в «Википедии» или показывает связанные события.
Can«t speak any foreign language
Исследователи сайта Landgeist создали карту, которая показывает процент европейцев, не говорящих на иностранных языках. За основу взяли данные «Евростата» о людях 25–64 лет. Спойлер: монолингвов больше, чем кажется.
Больше всего людей не знает иностранных языков в Великобритании, меньше всего — в ШвецииAnime Data Visualization
Разработчики Александр Чау, Педро Торрес да Кунья и Иоаким Данант визуализировали 100 лет аниме с 1917 по 2018 годы. Выглядит внушительно!