Что почитать и посмотреть для старта в Data Science: книги, словари и курсы

Подборка ресурсов по математике, статистике и программированию для начинающих Дата Сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.

Технический английский

Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.

  • Cambridge Dictionary — толковый словарь, который поможет понять смысл слов и выражений.
  • Подборка аббревиатур, которые часто используют в Data Science, с расшифровкой.
  • Словарь терминов Data Science и Machine Learning.


Cambridge Dictionary

Математика


В первую очередь научитесь быстро осваивать любые математические концепции. В этом поможет обучающий ролик How to Learn Mathematics Fast

Прокачайте математическое мышление и изучите:

  • книгу Introduction to Mathematical Thinking Кейт Дэвлин;
  • гайды How to Develop a Mindset for Math и Learning to Learn: Math Abstraction;
  • тред на Quora How do math geniuses understand extremely hard math concepts so quickly?;
  • публикацию Devlin’s Angle What is conceptual understanding?

Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature.

Дополнительная теория и практика по математике

Освежить в памяти базовые понятия математики помогут следующие ресурсы:

  • по производным — урок Derivatives introduction от «Академии Хана»;
  • по векторной алгебре — курс по линейной алгебре «Высшей школы экономики» от Coursera (седьмая неделя), уроки Vectors в «Академия Хана»;
  • по матричной алгебре — курс по линейной алгебре «Высшей школы экономики» от Coursera (шестая неделя), уроки из раздела Matrices в «Академия Хана»;
  • по тригонометрии — задания из раздела Trigonometry в «Академии Хана»;
  • по теории вероятностей — курс по теории вероятности для начинающих от МФТИ на Coursera, задания из раздела Probability в «Академии Хана».


Курс «Теория вероятностей» на Coursera

Задание со звездочкой. Чтобы еще больше прокачать знания по матричной алгебре, пройдите сложный курс Linear Algebra от MIT.

Статистика

Для обучения на курсе Нетологии Data Scientist, достаточно базовых знаний статистики. Их можно получить из раздела Statistics and probability в «Академии Хана». Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.


Курс Data Scientist в Нетологии

Задание со звездочкой. Дополнительно стоит пройти курс Statistics for Applications от MIT, но для этого нужно понимать:
  • что такое выборка и генеральная совокупность;

  • меры центральной тенденции и изменчивости;

  • сравнение средних.

Программирование

Студенты курса Data Scientist пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:

  • руководство Beginner Python3 Tutorials на Udemy;
  • руководство по базовым концепциям языка Learning Python: From Zero to Hero от FreeCodeCamp;
  • курс с теорией и практическими заданиями Google’s Python Class от Google;
  • подборка задач от Pythontutor на русском и английском;
  • обзор библиотеки Pandas, которую будем использовать для обработки и анализа данных в программе.

Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для анализа данных».

Базы данных

Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:

  • SQL Exercises;
  • SQL Movie-Rating Query Exercises;
  • SQL Movie-Rating Query Exercises Extras;
  • SQL Social-Network Query Exercises;
  • SQL Social-Network Query Exercises Extras;
  • SQL Movie-Rating Modification Exercises;
  • SQL Social-Network Modification Exercises.

Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».

Резюмируем: ключевые рекомендации

  • Если вы планируете освоить профессию Data Scientist на курсах, прокачайте технический английский. Это понадобится для изучения дополнительных материалов и документации.
  • Изучите или освежите в памяти основы математики, статистики, Python и SQL.
  • Читайте гайды, смотрите обучающие лекции и выполняйте практические задания для закрепления информации.

Читать еще: «Data Science для начинающих: обзор сферы и профессий»

Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.

Полный текст статьи читайте на Нетология