Фоновый баннер

Data Science: Анализ данных и визуализация в R

Подробнее о курсе

Краткое описание курса
В процессе обучения слушатели узнают, как загружать, сохранять и преобразовывать данные, а также как писать функции, создавать графики и сопоставлять базовые статистические модели с данными. В дополнение к изучению теоретических основ процесса анализа данных, этот курс фокусируется на практических инструментах, необходимых для анализа и визуализации больших данных

Целевая аудитория курса

  • специалисты по работе с большими данными, бизнес аналитиков и руководителей, желающих получить расширенную теоретическую и практическую подготовку по использованию R-Studio в проектах анализа больших данных

Получаемые знания и навыки
По окончании курса слушатели научатся основным навыкам обработки, манипулирования и анализа данных различных типов, навыками создания отчетов и документирования кода

Необходимая предварительная подготовка

  • Опыт построения корпоративных локальных сетей
  • Базовые знания о маршрутизации в корпоративной сети и принципах построения беспроводной локальной вычислительной сети
  • Базовые знания в области использования скриптов Python

Краткое содержание курса
Модуль 1 — Основы статистики и простая линейная регрессия

  • Что такое ваши данные
  • Статистические выводы
  • Введение в машинное обучение
  • Простая линейная регрессия
  • Диагностика и трансформация
  • Коэффициент определенности

Модуль 2 — Базовое программирование с R

  • Что такое ваши данные
  • Статистические выводы
  • Введение в машинное обучение
  • Простая линейная регрессия
  • Диагностика и трансформация
  • Коэффициент определенности

Модуль 3 — Базовые элементы данных

  • Преобразование данных (Reshape, Split, Combine)
  • Символы. Обработка строк. Даты и временные метки
  • Сбор Веб-данных
  • API источники данных
  • Подключение к внешней базе данных

Модуль 4 — Манипулирование данными с помощью «dplyr»

  • Подмножество, преобразование и переупорядочение наборов данных
  • Объединение наборов данных
  • Групповые операции над наборами данных

Модуль 5 — Графика данных и визуализация данных

  • Основные подходы к визуализации данных и графики данных. Base, Grid, Lattice, ggplot2
  • Построение графиков больших данных с ggplot2

Модуль 6 — Расширенная визуализация в R

  • Настраиваемая графика с помощью ggplot2
  • Титулы, системы координат, масштабы, темы, метки, легенда scatterplot с многоразмерными данными, визуализация временной последовательности, карты
  • Интерактивная визуализация в R

Отзывы по курсу