Листай ниже, чтобы узнать больше о программе
Бесплатная образовательная программа для тех, кто начинает свой путь в Инженерии Данных
BEEINTERNS
Школа Инженерии Данных
ЧЕМ ЗАНИМАЕТСЯ ИНЖЕНЕР ДАННЫХ?
Ждем тебя в Школе Инженерии Данных — новой программе от проекта beeinterns. Всего за три месяца ты сможешь освоить актуальный стек технологий, прокачать навыки и применить свои знания на реальных кейсах компании, а также открыть для себя новые возможности, став частью продуктовых команд!
Формат участия
Бесплатная образовательная программа в онлайн-формате из восьми модулей с теоретической и практической частью
  • Старт программы — 14 февраля
  • Продолжительность — 3 месяца
Даты
ЭТАПЫ ОТБОРА
Результаты придут на почту, которую ты укажешь при регистрации
Вступительные задания (тестирование по SQL и написание мини-эссе)
Регистрация и выбор интересующего продукта
до 6 февраля включительно
до 6 февраля включительно
до 9 февраля включительно
ПРЕИМУЩЕСТВА ШКОЛЫ
Практика на реальных кейсах
Ты погрузишься в задачи и освоишь навыки профессии Инженера Данных
Новая роль
IT-профессия
Вместе с экспертами и наставниками ты закрепишь полученные знания на практике
После успешного прохождения программы у тебя будет достаточно навыков, чтобы выполнять роль инженера данных в продуктовой команде
ТВОИ БУДУЩИЕ НАСТАВНИКИ
Балакирева Александра
Team Lead команды инженеров данных (Модуль SQL)
Лидер чаптера инженеров данных и разработчиков (Модуль Linux/Bash, Модуль компоненты Hadoop)
Петров Максим
Team Lead команды разработчиков (Модуль CI/CD)
Чершембеев Алексей
Team Lead команды инженеров данных (Модуль IDE)
Афутин Егор
Team Lead команды инженеров данных (Модуль Scala)
Грибков Сергей
Team Lead команды инженеров данных (Модуль Spark)
Тоцкий Дмитрий
Team Lead команды инженеров данных (Модуль Airflow)
Хилов Никита
регистрация
Подай заявку до 6 февраля включительно.
*Ты можешь выбрать продукт по ссылке
Нажимая на кнопку «Отправить заявку», ты принимаешь условия «Пользовательского соглашения» и даешь согласие на обработку персональных данных ООО «СЛ Капитал».
TIMELINE И ПРОГРАММА ШКОЛЫ
Стажировка
Сдача практического задания
Сдача практического задания
IDE
Аттестация
1 месяц
1 месяц
1 месяц
Программа модуля SQL:
Самостоятельное изучение материала:
  • DML-операции
  • Выборки
  • Фильтрация
  • Использование операторов IN, BETWEEN, LIKE, IS NULL (NOT)
  • Сортировка
  • Функции агрегирования
  • Соединения и их виды
  • Объединение таблиц
  • Вставка, удаление и обновление данных
  • DDL-операции
  • Создание, изменение и удаление таблиц
  • Ограничения в таблицах
  • Создание и удаление ключей
  • Партицирование
Модуль завершается QA-сессией и тестированием.
Программа модуля Linux/Bash:
Самостоятельное изучение материала:
  • Организация файлов в Linux
  • Права доступа на файлы и директории
  • Поиск по файлам и директориям
  • Просмотр содержимого и поиск
  • Текстовые утилиты
  • Планировщик и автоматизации задач
  • Bash scripts
Модуль завершается QA-сессией и тестированием.
Программа модуля CI/CD:
Самостоятельное изучение материала:
  • Создание простых Dockerfile
  • Основные команды git: init, commit, status, branch, checkout, log, pull/push/fetch, remote add, revert, reset, rebase, diff, rm, cherry-pick
  • Настройка .gitignore
Модуль завершается QA-сессией и тестированием.
Программа модуля IDE:
Самостоятельное изучение материала:
  • Альтернативные IDE способы разработки
  • Компоненты IDEA
  • Поддержка scala
  • Способы создания нового проекта
  • Навигация по проекту
  • Структура проекта по умолчанию
  • Способы написания кода, готового к исполнению в jvm
  • Подготовка к работе и базовые настройки
  • Возможности использования scala plugin
  • Основные способы перехода между участками кода
Модуль завершается QA-сессией.
Программа модуля Scala:
Самостоятельное изучение материала:
  • Сбор проекта
  • Планирование необходимых объектов и их сигнатуры под задачу
  • Прямое использование свойств ООП в коде (абстракция/наследование)
  • Результаты работы методов ООП на разных коллекциях
  • Основные характеристики и цель использования ООП
  • Написание кода с простейшими операциями
  • Использование подходов ООП при разработке
  • Использование traits (extends ... with)
  • Базовые операции над коллекциями map/flatmap, fold, aggregate
  • Case classes
  • Поддержка языком базовых операций (сравнение, присвоение)
Модуль завершается QA-сессией и тестированием.
Программа модуля Hadoop:
Самостоятельное изучение материала:
  • Основные компоненты экосистемы Hadoop
  • Архитектура hdfs
  • Архитектура Yarn
  • Файловые форматы: parquet, avro, orc
Модуль завершается QA-сессией и тестированием.
Программа модуля Spark:
Самостоятельное изучение материала:
  • Что позволяет делать spark-shell
  • Что такое driver, executor
  • Отличие SQL от HQL
  • Что такое Spark SQL
  • Где можно писать код на Scala
  • Чем отличается сборка Spark-приложения
  • Чем отличается «fat jar» от обычного
  • Что такое объект SparkSession
  • Состав таблиц в базе Hive
  • Обращение к данным через Spark SQL-запрос
  • Использование global temporary view
  • Создание и сбор проекта в Intellij IDEA
  • Применение sbt-плагина assembly
Модуль завершается QA-сессией и тестированием.
Программа модуля Airflow:
Самостоятельное изучение материала:
  • Архитектура Airflow
  • UI airflow
  • Определение и базовые элементы DAG
  • Установка и настройка
  • Базовые операторы
  • Настройка расписания
  • Сенсоры
  • Кастомные операторы
  • Переменные
  • Макросы
  • Написание DAG из одного из базовых операторов (Bash, Spark, Python)
  • Просмотр логов, перезапуск задачи или оператора
Модуль завершается QA-сессией и тестированием.
Создано при поддержке
DATA ENGINEERING