Фоновый баннер

Python для анализа данных

Подробнее о курсе

Цель курса
Научиться автоматизировать свою рутинную работу с помощью Python, обрабатывать большие объемы информации без администрирования и баз данных, освоить ключевой инструмент в мире аналитики и машинного обучения

Целевая аудитория курса
Разработчики, продакт-менеджеры, аналитики

Получаемые знания и навыки

  • Работа с сырыми данными и их подготовка для анализа
  • Работа с аналитическими библиотеками numpy, scipy и pandas
  • Визуализация данных с помощью библиотек seaborn, plotly, matplotlib
  • Статистический анализ данных
  • Применение математических моделей
  • Выбор и создание фич
  • Применение основных алгоритмов для обработки данных
  • Парсинг данных с сайтов и внешних источников
  • Автоматизация процессов получения данных для отчетов

Краткое содержание курса

  • Основные определения: базовые типы данных и циклы, функции и классы
  • Продвинутые типы данных: массивы, множества, словари
  • Основы Python и Git: синтаксис и функции
  • Основные библиотеки дял анализа данных: numpy и scipy, pandas
  • Визуализация данных: seaborn, plotly, matplotlib
  • Получение данных с внешних сайтов и API
  • Основы описательной статистики, виды распределений в Python
  • Центральная предельная теорема и статистический анализ данных в Python
  • Основные статистические тесты и проверка гипотез
  • Кейс-стади. Статистические показатели в Python
  • Feature engineering и предобработка данных: проверка и очистка данных
  • Проведение анализа и рекурсивного feature selection и на базе моделей
  • Методы оценки значимости и отбора признаков и их использование
  • «Проклятие размерности», основные алгоритмы и принципы их работы
  • Использование алгоритмов sklearn
  • Итоговые практические задания: подготовка датасета к анализу, выбор основных признаков и параметров, тестировние статистических гипотез, создание алгоритма вероятности событий

Отзывы по курсу