+7 (812) 703-02-02 info@hse.spbstu.ru

Семестр 5. Обработка данных, машинное обучение и нейронные сети на Python

C 10 класса | 12 занятий | Очно или онлайн

Длительность курса: 78 ак. часов (12 занятий по 4 ак. часа + 30 часов домашней работы)

О чём курс

Современный мир наполнен информацией, обрабатывать которую становится всё сложнее и сложнее, причём не только человеку, но и компьютеру. Большие данные (Big Data) – это структурированные и неструктурированные данные действительно больших объёмов, работать с которыми старыми инструментами уже невозможно.

На смену стандартным разделам информатики пришли загадочные Data Mining, Machine Learning и Deep Learning, а нейронные сети незаметно обосновались в нашей жизни в виде рекомендаций наYoutube, спам-фильтров в контакте, приложений-фоторедакторов, описаний товаров на AliExpress и переводчиках от Яндекс и Google.

Данный курс позволит ознакомиться с основными алгоритмами машинного обучения на Python, разобраться в том, как происходит обработка изображений и аудиоданных и как устроены нейронные сети.

Для того, чтобы освоить курс, потребуются хорошие познания в области функционального программирования, навыки разработки программ на Python, а также готовность окунуться в новые разделы математики (на школьном уровне).

Чему научим

Знания и представления:

  • Понятия "искусственный интеллект", "машинное обучение", "нейронные сети".
  • Классы задач, решаемые с помощью машинного обучения.
  • Существующие библиотеки для построения моделей машинного обучения в Python.
  • Основные алгоритмы машинного обучения, их область применения.
  • Классификация архитектур нейронных сетей.
  • Основные термины, применяемые в машинном обучении.
  • Методология решения задач машинного обучения с помощью библиотек Scikit-learn и PyTorch (на примере задач прогнозирования данных, распознавания образов, классификации музыки по жанрам, классификации текстов и т.д.).
  • Типовые проблемы моделей машинного обучения.
  • Методы оценки качества построенных моделей.

Умения и навыки:

  • Подключение внешних библиотек в Google Colaboratory.
  • Построение моделей машинного обучения в Google Colaboratory.
  • Поиск и использование информационных ресурсов по машинному обучению.
  • Поиск и подготовка данных для алгоритмов машинного обучения.
  • Основы программной обработки изображений и аудиоданных с помощью библиотек Python.
  • Поиск наилучшей модели машинного обучения (выбор алгоритма, архитектуры нейронной сети).
  • Визуализация результатов обучения модели.

Занятие 1

Входная проверочная работа.

Знакомство с основными библиотеками и инструментами:

  • Google Colaboratory, Jupyter Notebook.
  • Библиотеки для работы со структурами данных.
  • Упражнения – работа со встроенными в Python структурами данных.

Занятие 2

Введение в машинное обучение:

  • Основные задачи, которые могут быть решены с помощью алгоритмов машинного обучения.
  • Виды обучения: с учителем и без учителя.
  • Первичная обработка данных.
  • Знакомство c библиотекой Scikit-learn.
  • Упражнения – построение первой модели машинного обучения.

Занятие 3

Основные алгоритмы машинного обучения:

  • Существующие алгоритмы машинного обучения: отличительные особенности, сравнение.
  • Способы оценки построенных моделей.
  • Упражнения – реализация различных алгоритмов, сравнение результатов их работы.

Занятие 4

Проверочная работа по алгоритмам машинного обучения.

Матрицы:

  • Определение матрицы, основные действия над матрицами.
  • Понятия конволюции и деконволюции, их место в машинном обучении.
  • Знакомство со встроенными функциями Python для совершения действия над матрицами.
  • Упражнения – разработка собственных функций для совершения действий над матрицами.

Занятие 5

Обработка изображений:

  • Что такое изображение с точки зрения программиста.
  • Импорт изображений в матрицу.
  • Совершение простейших действий над изображениями (удаление помех, изменение размеров, повышение резкости и контрастности и т.д.).
  • Упражнения – обработка изображений с помощью библиотек Python.

Занятие 6

Введение в нейронные сети:

  • Изучение строения простейшей нейронной сети.
  • Знакомство с библиотекой PyTorch, сравнение PyTorch с другими библиотеками на Python для работы с нейронными сетями.
  • Упражнения – создание простейшей нейронной сети без использования дополнительных библиотек; решение задачи классификации изображений с помощью библиотеки PyTorch.

Занятие 7

Предобученные нейронные сети:

  • Предобученные нейронные сети: что это такое, где найти, как использовать.
  • Способы дообучения нейронных сетей для решения конкретной задачи.
  • Упражнения – решение задачи классификации изображений с использованием предобученных нейронных сетей.

Занятие 8

Виды нейронных сетей:

  • Строение нейронной сети, выбор архитектуры нейронной сети в зависимости от конкретной задачи.
  • Проблема переобучения нейронной сети и методы её решения.
  • Алгоритм градиентного спуска.
  • Упражнения – классификация текстов с помощью нейронных сетей.

Занятие 9

Тест по терминологии, применяемой в машинном обучении и глубоком обучении.

Обработка аудиоданных:

  • Что такое звук с точки зрения программиста.
  • Библиотеки для работы с аудио в Python.
  • Упражнения – разработка программ, обрабатывающих аудиоданные.

Занятие 10

Применение нейросетей в задачах классификации аудиоданных:

  • Извлечение различных признаков из аудиоданных.
  • Задачи классификации аудиоданных и распознавания речи.
  • Упражнения – применение нейросетей для работы с аудиоданными.

Занятие 11

Систематизация знаний по машинному обучению:

  • Факторы, влияющие на качество построенной модели.
  • Последние достижения в области машинного обучения и нейросетей.
  • Повторение пройденного материала, упражнения для подготовки к экзамену.

Занятие 12

Итоговое занятие:

  • Экзаменационный тест.
  • Экзаменационное задание.
  • Подведение итогов курса, варианты дальнейшего обучения.

Стоимость

22 800 ₽

Социальные скидки для многодетных и других категорий семей.
Скидки призёрам открытых мероприятий АИШ.
Оплата материнским капиталом. Можно оформить налоговый вычет по расходам на обучение - 13%.

Как поступить

Для тех, кто еще не учится в АИШ:

  • Вступительное тестирование.

Для уже обучающихся в АИШ:

  • Семестр 4. Функциональное программирование на языке Python – промежуточная аттестация не менее 80 баллов или итоговая оценка не ниже «отлично».
Тест № АИШ-324 Вступительный тест для поступления на курс "Обработка данных, машинное обучение и нейронные сети на Python"

Необходимые знания и умения для успешного прохождения тестирования:

  • Базовые типы данных
  • Базовые алгоритмические конструкции: циклы, ветвления
  • Ввод и вывод данных
  • Создание собственных функций, вызов функций
  • Встроенные функции для работы со строками
  • Встроенные математические функции: abs, pow, max, min, sum и т.д.
  • Структуры данных: одномерные и многомерные массивы, списки, кортежи, словари, множества
  • Анонимные функции, лямбда-выражения
  • Функции map, filter, zip, reduce
  • Решение стандартных задач (поиск максимума в массиве, сортировка массива и т.д.) как с использованием, так и без использования встроенных функций

По результатам сдачи теста необходимо набрать 50 и более баллов

Для сдачи теста предоставляется 1 попытка.

Как записаться на занятия

О дате начала набора будет объявлено дополнительно.

Академия информатики для школьников в цифрах

20 лет

успешной работы
в Политехническом университете Петра Великого

10

направлений обучения

83

учебные программы

3 500

школьников
проходят обучение
ежегодно

151

выпускник АИШ
в 2023 году поступил
в Политехнический университет

4

учебные площадки

36

компьютерных классов