Что почитать и посмотреть для старта в Data Science: книги, словари и курсы

Подборка ресурсов по математике, статистике и программированию для начинающих Дата Сайентистов. Ознакомьтесь с материалами, если вы планируете учиться на онлайн-курсах. Так вы опередите одногруппников, а заодно прокачаете полезный навык — изучать дополнительные материалы самостоятельно.

Технический английский


Большинство материалов из подборки — на английском языке. Поэтому в первую очередь нужно разобраться в технической лексике и научиться понимать сложные термины. Эти ресурсы помогут сориентироваться в технической литературе, если ваш уровень английского — средний или ниже среднего.
6vgw-kzg5sk_udqqgkaiffg1z_m.png
Cambridge Dictionary

Математика



В первую очередь научитесь быстро осваивать любые математические концепции. В этом поможет обучающий ролик How to Learn Mathematics Fast
Прокачайте математическое мышление и изучите:
Чтобы осознать универсальность математики, посмотрите серию семинаров Эдварда Френкела Mathematics: the language of nature.

Дополнительная теория и практика по математике


Освежить в памяти базовые понятия математики помогут следующие ресурсы:
rfac488pijpubyocphe0jkqpfn0.png
Курс «Теория вероятностей» на Coursera

Задание со звездочкой. Чтобы еще больше прокачать знания по матричной алгебре, пройдите сложный курс Linear Algebra от MIT.

Статистика


Для обучения на курсе Нетологии Data Scientist, достаточно базовых знаний статистики. Их можно получить из раздела Statistics and probability в «Академии Хана». Ознакомиться с полным списком тем по статистике, которые будем рассматривать во время обучения, можно в подборке The 10 Statistical Techniques Data Scientists Need to Master. Для поступления разбираться в них детально не нужно, но лучше получить общее представление.
yymimamdgxlfbs0cout0npxapj4.png
Курс Data Scientist в Нетологии

Задание со звездочкой. Дополнительно стоит пройти курс Statistics for Applications от MIT, но для этого нужно понимать:

  • что такое выборка и генеральная совокупность;
  • меры центральной тенденции и изменчивости;
  • сравнение средних.


Программирование


Студенты курса Data Scientist пишут код на языке Python. Чтобы писать код во время обучения, достаточно освоить основные понятия языка: операторы, типы данных, переменные, циклы, функции, классы. Быстро разобраться в основах и попрактиковаться самостоятельно помогут следующие ресурсы:
Если вы хотите разобраться в Python подробнее и под руководством наставника, можете параллельно проходить курс «Python для анализа данных».
tjpl7wcbjbvua29du4fgselaj90.png

Базы данных


Чтобы мыслить в контексте данных, нужно разобраться, как устроены и работают базы реляционных данных. Для этого достаточно освоить основы SQL — пройти третью неделю курса по основам анализа данных для бизнеса от Колорадского университета в Боулдере. Отработать знания на практике можно в следующих заданиях:
Углубленные знания по базам данных можно получить на курсе «SQL для аналитика».
yckrdlxa63mw4vbufdyqvcfmz0o.png

Резюмируем: ключевые рекомендации


  • Если вы планируете освоить профессию Data Scientist на курсах, прокачайте технический английский. Это понадобится для изучения дополнительных материалов и документации.
  • Изучите или освежите в памяти основы математики, статистики, Python и SQL.
  • Читайте гайды, смотрите обучающие лекции и выполняйте практические задания для закрепления информации.

© Habrahabr.ru