Что нужно для начала карьеры в Data Science

Если лет десять-пятнадцать назад в списке самых высокооплачиваемых профессий одну из лидирующих позиций занимал программист, то в последние годы появился новый фаворит — специалист по Data Science. У этого направления нет однозначного перевода на русский; зовётся такой профессионал и датасаентистом, и специалистом по обработке и анализу данных, и аналитиком данных; ещё больше усугубляется ситуация тем, что у разных людей разные мнения по поводу того, где пролегает граница между, скажем, датасаентистом и инженером данных, и есть ли такая граница вообще.

Мы будем исходить из того, что специалист по Data Science — это тот, кто занимается анализом и подготовкой данных, а потом с их помощью обучает модели для решения конкретных задач. Что же нужно для того, чтобы начать строить карьеру в этой области?

Что требуется для создания карьеры в Data Science

Первое качество датасаентиста — усидчивость. Зачастую над одной проблемой придётся проводить очень много времени: выискивая показатели в имеющейся информации и наилучший способ её обработки, изучая специфику тематики, подбирая метрики для обучения модели и так далее. Техническую сторону можно освоить, но, если перспектива подобного долгосрочного и въедливого изучения проблемы вас не прельщает, с большой вероятностью датасаентист — не самая лучшая для вас профессия.

Технические предпосылки для роста в Data Science

С технической стороной тоже не всё гладко. Датасаентист — профессия с очень высоким порогом вхождения. Вступительный курс поможет вам освоить основные компетенции, но уже к тому времени у вас как минимум должно быть:

  • Хорошее знание математики. Потребуется как минимум математическая статистика, линейная алгебра и теория вероятностей, и не надо надеяться на то, что встроенные в библиотеки функции вам чем-то помогут. Для сколько-нибудь значимой работы в этой области нужно реальное знание математики, без вариантов;
  • Определённые познания в программирования. Например, Python, Scala или R; иными словами, язык, на котором вы будете строить своё решение. А поскольку оно потом будет работать в связке с бэкендом, нужно уметь говорить на одном языке с бэкендерами, потому что им может понадобиться помощь при внедрении вашей разработки;
  • Soft skills или социальные компетенции, иными словами — умение общаться с представителями бизнеса, чтобы понимать, что именно им нужно и для чего.

Data Science вполне может стать для вас работой мечты; но перед тем, как предпринимать что-то в этом направлении, нужно чётко понимать собственные возможности и предрасположенности.