Курс «Инженер данных»

Инженер данных

Технический специалист, который работает с большими данными, организует их сбор, трансформацию, хранение и готовит для удобного использования при решении бизнес-задач.

Получите дополнительное профессиональное образование в области искусственного интеллекта

3 месяца обучения по 2-3 часа в день. Всего 260 часов

диплом по окончании

помощь в трудоустройстве

зарплата
от 120 тыс.  в месяц

Курс включает изучение основ инженерии больших данных, современных технологий анализа данных и машинного обучения, языков программирования, методов искусственного интеллекта, нейросетевых технологий. Программа нацелена на получение практических навыков по созданию систем анализа больших данных, разработки баз данных, моделирования данных, разработки алгоритмов и программных средств, в том числе с использованием современных интеллектуальных технологий, созданию и внедрению сквозных цифровых субтехнологий искусственного интеллекта.

Программа построена по модульному принципу, предполагает изучение теоретического материала и практическую отработку полученных знаний.

Для оценки уровня знаний вы выполните практические кейсы и пройдете тестирование.

курс подойдет

для студентов колледжей и вузов

для начинающих специалистов в области IT

для получения прибыльной IT-специальности

для всех желающих, имеющих высшее или среднее профессиональное образование (базовое математическое или техническое образование)

чему вы научитесь
кто может учиться

Граждане РФ старше 18 лет, которые:

  • имеют среднее профессиональное / высшее образование или являются студентами вуза / колледжа
  • имеют достаточный уровень базовых знаний в сфере ИТ и могут справиться со вступительным испытанием
Стоимость обучения
84 500 
Программа курса
Раздел 1. Введение в инженерию данных
  1. Введение в профессию инженер данных
  2. Введение в Git
  3. Введение в Docker
Раздел 2. DWH
  1. Введение в базы данных и теорию хранения данных. Реляционная модель данных
  2. Знакомство с реляционной СУБД Postgres. Введение в SQL
  3. Углубленное изучение SQL
  4. Введение в DWH
  5. DWH. Витрины данных
  6. Погружение в DWH. Архитектура хранилищ данных
  7. Современные модели данных. Data vault
  8. Введение в колоночные СУБД. Clickhouse
  9. Что такое BI-системы и зачем нужны. Введение в Superset. Построение дашбордов
Раздел 3. Работа с данными
  1. Введение в Python. Базовые операции
  2. Работа с базами данных на языке Python. Работа с внешними API
  3. Введение в оркестрацию данных. Обзор Airflow
  4. Погружение в Airflow
Раздел 4. Работы с большими данными
  1. Введение в теорию больших данных
  2. NoSQL хранилища данных. MPP-системы
  3. Введение в Data Lake
  4. Введение в Hadoop
  5. Hive
  6. Введение в теорию ETL/ELT-процессов. Обзор стека технологий
  7. Введения в Scala
  8. Apache Spark
  9. Углубленное изучение Spark
Модуль 5. Машинное обучение. Искусственный интеллект
  1. Введение в анализ данных. Базовые инструменты анализа данных на языке Python. Разведочный анализ данных
  2. Введение в машинное обучение
  3. Способы улучшения качества моделей в машинном обучении
  4. Разработка моделей машинного обучения с использованием Pyspark
  5. Введение в теорию ИИ и нейронных сетей
  6. Погружение в теорию нейронных сетей. Разработка простой нейронной сети на языке Python
модули

Модуль 1.

Базовый

Модуль предполагает знакомство с профессией «Инженер данных», введение в инженерию данных и изучение основных концепции Git и Docker, и включает знакомство с базами данных, реляционной моделью данных, изучение методов работы с реляционной СУБД Postgres и SQL. В рамках модуля изучаются DWH и архитектура хранилищ данных, современные модели данных, такие как Data Vault, колоночные СУБД Clickhouse и BI-системах и их значении, а также создание дашбордов с помощью Superset.

Модуль 2.

Профильный

Модуль включает в себя изучение основ программирования на языке Python, работу с базами данных и внешними API, а также оркестрацию данных с использованием Airflow. Рассматривается теория больших данных, NoSQL хранилища данных, Data Lake, Hadoop, Hive и технологии ETL/ELT-процессов. В рамках модуля предусмотрено знакомство с основами анализа данных на языке Python, введение в машинное обучение и способы улучшения качества моделей. Также ведется разработка моделей с использованием Pyspark и введение в теорию нейронных сетей с разработкой простой нейронной сети.

Отзывы выпускников