Тема 1. Консолидация данных
Введение в ETL.
Data Engineer.
Извлечение данных в ETL
Очистка данных в ETL
Преобразование данных в ETL
Загрузка данных в хранилище
Загрузка данных из локальных источников
Обогащение данных
Практические занятия
Работа с векторами и матрицами в NumPy.
Агрегирование данных массива.
Тема 2. Трансформация данных
Введение в трансформацию данных
Трансформация упорядоченных данных
Группировка данных
Слияние данных
Квантование
Нормализация и кодирование данных
Практические занятия
Работа с таблицами pandas.
Агрегирование данных из нескольких таблиц.
Тема 3. Визуализация данных
Подготовка данных.
Методы и инструменты визуализации.
Обзор возможностей Python для визуализации.
Практические занятия
Построение графиков с помощью внешних модулей.
Тема 4. Очистка и предобработка данных
Оценка качества данных
Технологии и методы оценки качества данных
Очистка и предобработка
Фильтрация данных
Обработка дубликатов и противоречий
Выявление аномальных значений
Восстановление пропущенных значений
Введение с сокращение размерности
Сокращение числа признаков
Практические занятия
Очистка данных с помощью возможностей pandas.
Тема 5. Введение в машинное обучение на языке Python
Знакомство с библиотекой Scikit-learn.
Представление данных в Scikit-learn.
Проверка модели.
Классификация.
Регрессия.
Тема 6. Аттестация