Data Science: Анализ данных и визуализация в R
Подробнее о курсе
Краткое описание курса
В процессе обучения слушатели узнают, как загружать, сохранять и преобразовывать данные, а также как писать функции, создавать графики и сопоставлять базовые статистические модели с данными. В дополнение к изучению теоретических основ процесса анализа данных, этот курс фокусируется на практических инструментах, необходимых для анализа и визуализации больших данных
Целевая аудитория курса
- специалисты по работе с большими данными, бизнес аналитиков и руководителей, желающих получить расширенную теоретическую и практическую подготовку по использованию R-Studio в проектах анализа больших данных
Получаемые знания и навыки
По окончании курса слушатели научатся основным навыкам обработки, манипулирования и анализа данных различных типов, навыками создания отчетов и документирования кода
Необходимая предварительная подготовка
- Опыт построения корпоративных локальных сетей
- Базовые знания о маршрутизации в корпоративной сети и принципах построения беспроводной локальной вычислительной сети
- Базовые знания в области использования скриптов Python
Краткое содержание курса
Модуль 1 — Основы статистики и простая линейная регрессия
- Что такое ваши данные
- Статистические выводы
- Введение в машинное обучение
- Простая линейная регрессия
- Диагностика и трансформация
- Коэффициент определенности
Модуль 2 — Базовое программирование с R
- Что такое ваши данные
- Статистические выводы
- Введение в машинное обучение
- Простая линейная регрессия
- Диагностика и трансформация
- Коэффициент определенности
Модуль 3 — Базовые элементы данных
- Преобразование данных (Reshape, Split, Combine)
- Символы. Обработка строк. Даты и временные метки
- Сбор Веб-данных
- API источники данных
- Подключение к внешней базе данных
Модуль 4 — Манипулирование данными с помощью «dplyr»
- Подмножество, преобразование и переупорядочение наборов данных
- Объединение наборов данных
- Групповые операции над наборами данных
Модуль 5 — Графика данных и визуализация данных
- Основные подходы к визуализации данных и графики данных. Base, Grid, Lattice, ggplot2
- Построение графиков больших данных с ggplot2
Модуль 6 — Расширенная визуализация в R
- Настраиваемая графика с помощью ggplot2
- Титулы, системы координат, масштабы, темы, метки, легенда scatterplot с многоразмерными данными, визуализация временной последовательности, карты
- Интерактивная визуализация в R