Python для анализа данных
Подробнее о курсе
Цель курса
Научиться автоматизировать свою рутинную работу с помощью Python, обрабатывать большие объемы информации без администрирования и баз данных, освоить ключевой инструмент в мире аналитики и машинного обучения
Целевая аудитория курса
Разработчики, продакт-менеджеры, аналитики
Получаемые знания и навыки
- Работа с сырыми данными и их подготовка для анализа
- Работа с аналитическими библиотеками numpy, scipy и pandas
- Визуализация данных с помощью библиотек seaborn, plotly, matplotlib
- Статистический анализ данных
- Применение математических моделей
- Выбор и создание фич
- Применение основных алгоритмов для обработки данных
- Парсинг данных с сайтов и внешних источников
- Автоматизация процессов получения данных для отчетов
Краткое содержание курса
- Основные определения: базовые типы данных и циклы, функции и классы
- Продвинутые типы данных: массивы, множества, словари
- Основы Python и Git: синтаксис и функции
- Основные библиотеки дял анализа данных: numpy и scipy, pandas
- Визуализация данных: seaborn, plotly, matplotlib
- Получение данных с внешних сайтов и API
- Основы описательной статистики, виды распределений в Python
- Центральная предельная теорема и статистический анализ данных в Python
- Основные статистические тесты и проверка гипотез
- Кейс-стади. Статистические показатели в Python
- Feature engineering и предобработка данных: проверка и очистка данных
- Проведение анализа и рекурсивного feature selection и на базе моделей
- Методы оценки значимости и отбора признаков и их использование
- «Проклятие размерности», основные алгоритмы и принципы их работы
- Использование алгоритмов sklearn
- Итоговые практические задания: подготовка датасета к анализу, выбор основных признаков и параметров, тестировние статистических гипотез, создание алгоритма вероятности событий
Отзывы по курсу
Февраль 2023 года
Слушатель: Зверева Ольга Игоревна (Старший инженер)
Отзыв: Понравилось больше всего обилие курсов. Профессиональные преподаватели
Февраль 2023 года
Слушатель: Денисламова Диана Тахировна (Эксперт управления анализа данных)
Отзыв: Очень интересный курс, преподаватель объяснял все очень подробно