Что почитать и посмотреть для старта в Data Science: книги, словари и курсы
Подборка ресурсов по математике, статистике и программированию для начинающих Дата Сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.
Технический английский
Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.
- Cambridge Dictionary — толковый словарь, который поможет понять смысл слов и выражений.
- Подборка аббревиатур, которые часто используют в Data Science, с расшифровкой.
- Словарь терминов Data Science и Machine Learning.
Cambridge Dictionary
Математика
В первую очередь научитесь быстро осваивать любые математические концепции. В этом поможет обучающий ролик How to Learn Mathematics Fast
Прокачайте математическое мышление и изучите:
- книгу Introduction to Mathematical Thinking Кейт Дэвлин;
- гайды How to Develop a Mindset for Math и Learning to Learn: Math Abstraction;
- тред на Quora How do math geniuses understand extremely hard math concepts so quickly?;
- публикацию Devlin’s Angle What is conceptual understanding?
Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature.
Дополнительная теория и практика по математике
Освежить в памяти базовые понятия математики помогут следующие ресурсы:
- по производным — урок Derivatives introduction от «Академии Хана»;
- по векторной алгебре — курс по линейной алгебре «Высшей школы экономики» от Coursera (седьмая неделя), уроки Vectors в «Академия Хана»;
- по матричной алгебре — курс по линейной алгебре «Высшей школы экономики» от Coursera (шестая неделя), уроки из раздела Matrices в «Академия Хана»;
- по тригонометрии — задания из раздела Trigonometry в «Академии Хана»;
- по теории вероятностей — курс по теории вероятности для начинающих от МФТИ на Coursera, задания из раздела Probability в «Академии Хана».
Курс «Теория вероятностей» на Coursera
Статистика
Для обучения на курсе Нетологии Data Scientist, достаточно базовых знаний статистики. Их можно получить из раздела Statistics and probability в «Академии Хана». Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.
Курс Data Scientist в Нетологии
-
что такое выборка и генеральная совокупность;
-
меры центральной тенденции и изменчивости;
-
сравнение средних.
Программирование
Студенты курса Data Scientist пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:
- руководство Beginner Python3 Tutorials на Udemy;
- руководство по базовым концепциям языка Learning Python: From Zero to Hero от FreeCodeCamp;
- курс с теорией и практическими заданиями Google’s Python Class от Google;
- подборка задач от Pythontutor на русском и английском;
- обзор библиотеки Pandas, которую будем использовать для обработки и анализа данных в программе.
Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для анализа данных».
Базы данных
Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:
- SQL Exercises;
- SQL Movie-Rating Query Exercises;
- SQL Movie-Rating Query Exercises Extras;
- SQL Social-Network Query Exercises;
- SQL Social-Network Query Exercises Extras;
- SQL Movie-Rating Modification Exercises;
- SQL Social-Network Modification Exercises.
Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».
Резюмируем: ключевые рекомендации
- Если вы планируете освоить профессию Data Scientist на курсах, прокачайте технический английский. Это понадобится для изучения дополнительных материалов и документации.
- Изучите или освежите в памяти основы математики, статистики, Python и SQL.
- Читайте гайды, смотрите обучающие лекции и выполняйте практические задания для закрепления информации.
Читать еще: «Data Science для начинающих: обзор сферы и профессий»
Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.
Полный текст статьи читайте на Нетология