Курс «Архитектор данных»

Архитектор данных

Специалист, который отвечает за проектирование и создание инфраструктуры данных в организации, а также занимается разработкой и оптимизацией баз данных, созданием алгоритмов обработки данных и обеспечением их безопасности

Получите дополнительное профессиональное образование в области искусственного интеллекта
Более 80% от стоимости обучения оплатит Государство!

3 месяца обучения по 2-3 часа в день. Всего 260 часов

удостоверение по окончании

помощь в трудоустройстве

зарплата
от 120 тыс.  в месяц

Курс нацелен на получение компетенций, необходимых для профессиональной деятельности архитектора данных для разработки и применения технологических решений в области искусственного интеллекта и в смежных областях.

Курс включает изучение принципов работы с большими данными, технологий анализа данных и основных библиотек Python, необходимых для обработки, вычислений и визуализации данных, введение в системное администрирование больших данных, погружение в машинное обучение и нейронные сети. Вы погрузитесь в теорию хранения данных, научитесь потоковой обработке данных, управлению ресурсами и обеспечению масштабирования архитектур больших данных. Программа нацелена на получение практических навыков работы с данными, проектирования и построения архитектур данных в области искусственного интеллекта.

Программа построена по модульному принципу, предполагает изучение теоретического материала и практическую отработку полученных знаний.

Для оценки уровня знаний вы выполните практические кейсы и пройдете тестирование.

преимущества курса

курс подойдет

для студентов колледжей и вузов

для начинающих специалистов в области ИТ

для получения прибыльной ИТ-специальности

для всех желающих, имеющих высшее или среднее профессиональное образование (базовое математическое или техническое образование)

чему вы научитесь
кто может учиться
Граждане РФ – жители всех регионов России, если:
  • старше 18 лет и не достигли пенсионного возраста
  • имеют среднее профессиональное / высшее образование или являются студентами вуза / колледжа
  • имеют достаточный уровень базовых знаний в сфере ИТ и могут справиться со вступительным испытанием

Выпускники программы «Цифровые профессии» в 2022-23 годах (выпускники всех курсов 1Т Спринт) также могут подать заявку и обучаться на курсах по программе «Искусственный интеллект»

Стоимость обучения
10 000 
80 000 

*70 000 оплачивает государство

В рамках федерального проекта
«Искусственный интеллект»

Как записаться на курсы
01
Оставьте заявку на нашем сайте.
02
Заполните анкету участника и пройдите диагностику.
03
Дождитесь успешной проверки анкеты и запишитесь на программу в каталоге проекта.
04
По итогам успешного вступительного испытания заключите договор на обучение со скидкой от государства с ООО «1Т».
Программа курса
Раздел 1. Введение в архитектуру больших данных
  1. Введение в профессию. Основные принципы работы с большими данными
  2. Технологии анализа данных. Статистический и описательный анализ данных
  3. Введение в основные инструменты для работы с данными. Основы GIT на примере GitLab/GitHub
  4. Введение в контейнеризацию с Docker. Управление контейнерами и создание образов, Docker-compose
  5. Введение в языки программирования. Основные популярные языки для ИИ. Введение в Python
  6. Работа с основными библиотеками Python для обработки, вычислений и визуализации данных (Pandas, NumPy, SciPy, Matplotlib, Seaborn, Plotly)
Раздел 2. Введение в системное администрирование больших данных
  1. Знакомство с Linux и его история. Различные дистрибутивы Linux и выбор подходящего для конкретной задачи. Установка Linux
  2. Основа работы с командной строкой Linux. Управление пользователями, группами и правами доступа
  3. Введение в пакетные менеджеры и установка пакетов обработки больших данных. Работа со сторонними репозиториями
  4. Управление процессами и службами обработки больших данных. Мониторинг системы и журналы
  5. Основы безопасности больших данных. Настройка сети и брандмауэры
  6. Создание и редактирование скриптов на Bash для обработки больших данных. Использование утилиты Cron для планирования задач
Раздел 3. Проектирование архитектур: большие данные, машинное обучение, искусственный интеллект
  1. Введение в базы данных и теорию хранения данных. Реляционные базы данных, использование SQL
  2. Введение в Hadoop. DWH, Data Lake, NoSQL хранилища данных
  3. Массово параллельная обработка и анализ данных Работа с PySpark. Потоковая обработка данных (data streaming, event processing). Шины данных (kafka)
  4. Введение в ML. Основные задачи, виды классических моделей, метрики качества моделей. BI-системы и визуализация данных
  5. Погружение в ML. Обучение с учителем
  6. Погружение в ML. Обучение без учителя
  7. Введение в нейронные сети. Процесс, стадии и методологии разработки решений на основе искусственного интеллекта
  8. CV - компьютерное зрение
  9. NLP – обработка естественного языка
Раздел 4. Построение архитектур больших данных
  1. Введение в Kubernetes и установка Minikube. Управление ресурсами архитектур больших данных в Kubernetes
  2. Масштабирование и автомасштабирование архитектур больших данных. Мониторинг в Kubernetes
  3. Управление пакетами обработки больших данных с Helm
  4. СI\CD пакетов обработки больших данных в Kubernetes. Основы CI\CD на примере Gitlab CI
  5. DataOps в Kubernetes с Apache Airflow
  6. MLOps в Kubernetes с Kubeflow
модули

Модуль 1.

Базовый

Модуль предполагает введение в архитектуру больших данных, содержание профессии «Архитектор данных». Отдельные темы посвящены изучению языков программирования: Python, JAVA; основных инструментов для работы с данными: Git, Docker. Будут рассмотрены современные методы и инструментальные средства анализа больших данных, методы математического и числового анализа с помощью библиотек NumPy, SciPy; основные библиотеки Python для визуализации данных, Matplotlib, Seaborn, Plotly. Будут изучены основы системного администрирования больших данных, включая работу в Linux, введение в пакетные менеджеры и установку пакетов обработки больших данных. Также в модуле рассматривается работа со сторонними репозиториями, основы безопасности больших данных и создание скриптов на Bash для обработки больших данных, использование утилиты Cron для планирования задач.

Модуль 2.

Профильный

Модуль предполагает погружение в проектирование и построение архитектур больших данных. Отдельные темы посвящены введению в базы данных и теорию хранения данных, работе с Hadoop и хранилищами данных, массовой параллельной обработке данных и анализу данных с помощью PySpark. Модуль содержит введение в основы машинного изучения, обучение с учителем и без учителя, нейронные сети, включая знакомство с компьютерным зрением и обработкой естественного языка. Также в модуле изучаются управление ресурсами архитектур больших данных в Kubernetes, масштабирование архитектур больших данных, основы CI\CD, DataOps и MLOps.

Преподаватели

Отзывы выпускников