Data Science: Анализ данных и визуализация в R
	
		
	
	
		
					
				
	Подробнее о курсе
Краткое описание курса
В процессе обучения слушатели узнают, как загружать, сохранять и преобразовывать данные, а также как писать функции, создавать графики и сопоставлять базовые статистические модели с данными. В дополнение к изучению теоретических основ процесса анализа данных, этот курс фокусируется на практических инструментах, необходимых для анализа и визуализации больших данных
Целевая аудитория курса
- специалисты по работе с большими данными, бизнес аналитиков и руководителей, желающих получить расширенную теоретическую и практическую подготовку по использованию R-Studio в проектах анализа больших данных
 
Получаемые знания и навыки
По окончании курса слушатели научатся основным навыкам обработки, манипулирования и анализа данных различных типов, навыками создания отчетов и документирования кода
Необходимая предварительная подготовка
- Опыт построения корпоративных локальных сетей
 
- Базовые знания о маршрутизации в корпоративной сети и принципах построения беспроводной локальной вычислительной сети
 
- Базовые знания в области использования скриптов Python
 
			 
		
			 
		
					Краткое содержание курса
Модуль 1 — Основы статистики и простая линейная регрессия
- Что такое ваши данные
 
- Статистические выводы
 
- Введение в машинное обучение
 
- Простая линейная регрессия
 
- Диагностика и трансформация
 
- Коэффициент определенности
 
Модуль 2 — Базовое программирование с R
- Что такое ваши данные
 
- Статистические выводы
 
- Введение в машинное обучение
 
- Простая линейная регрессия
 
- Диагностика и трансформация
 
- Коэффициент определенности
 
Модуль 3 — Базовые элементы данных
- Преобразование данных (Reshape, Split, Combine)
 
- Символы. Обработка строк. Даты и временные метки
 
- Сбор Веб-данных
 
- API источники данных
 
- Подключение к внешней базе данных
 
Модуль 4 — Манипулирование данными с помощью «dplyr»
- Подмножество, преобразование и переупорядочение наборов данных
 
- Объединение наборов данных
 
- Групповые операции над наборами данных
 
Модуль 5 — Графика данных и визуализация данных
- Основные подходы к визуализации данных и графики данных. Base, Grid, Lattice, ggplot2
 
- Построение графиков больших данных с ggplot2
 
Модуль 6 — Расширенная визуализация в R
- Настраиваемая графика с помощью ggplot2
 
- Титулы, системы координат, масштабы, темы, метки, легенда scatterplot с многоразмерными данными, визуализация временной последовательности, карты
 
- Интерактивная визуализация в R