Ждем тебя в Школе Инженерии Данных — новой программе от проекта beeinterns на базе чаптера DE&DEV. За три месяца интенсивной работы ты сможешь освоить современный стек технологий, прокачать навыки, применить знания на реальных кейсах компании и открыть для себя новые возможности, став участником одной из продуктовых команд!
Даты
Регистрация — до 15 февраля включительно
Отбор — до 28 февраля включительно
Старт программы — 14 марта
Бесплатная образовательная программа в онлайн-формате из восьми модулей с теоретической и практической частью
Формат участия
Возраст 18+, гражданство РФ
Знание SQL на начальном уровне
Умение работать с данными в табличной форме
Требования к участникам
ПРЕИМУЩЕСТВА ПРОГРАММЫ
Оплачиваемое обучение
Вместе с экспертами и наставниками ты погрузишься в задачи инженера данных и закрепишь полученные знания на практике
Оффер в команду
Практика на реальных кейсах
При успешном обучении ты будешь получать стипендию
Лучшие участники школы смогут попасть в команду «билайн»
Chapter Lead (модуль Linux/Bash, модуль «Компоненты Hadoop»)
Алексей Чершембеев
Team Lead (модуль CI/CD)
Егор Афутин
Team Lead (модуль IDE)
Сергей Грибков
Team Lead (модуль Scala)
Дмитрий Тоцкий
Team Lead (модуль Spark)
Никита Хилов
Team Lead (модуль Airflow)
Александра Балакирева
Team Lead (модуль SQL)
Chapter Lead (модуль Linux/Bash, модуль «Компоненты Hadoop»)
Максим Петров
Team Lead (модуль CI/CD)
Алексей Чершембеев
Team Lead (модуль IDE)
Егор Афутин
Team Lead (модуль Scala)
Сергей Грибков
Team Lead (модуль Spark)
Дмитрий Тоцкий
Team Lead (модуль Airflow)
Никита Хилов
Программа модуля SQL
Самостоятельное изучение материала: (материал собран из открытых источников)
DML-операции
Выборки
Фильтрация
Использование операторов IN, BETWEEN, LIKE, IS NULL (NOT)
Сортировка
Функции агрегирования
Соединения и их виды
Объединение таблиц
Вставка, удаление и обновление данных
DDL-операции
Создание, изменение и удаление таблиц
Ограничения в таблицах
Создание и удаление ключей
Партицирование
Модуль завершается QA-сессией и тестированием. Продолжительность модуля — 7 дней.
Программа модуля Linux/Bash
Самостоятельное изучение материала: (материал собран из открытых источников)
Организация файлов в Linux
Права доступа на файлы и директории
Поиск по файлам и директориям
Просмотр содержимого и поиск
Текстовые утилиты
Планировщик и автоматизация задач
Bash Scripts
Модуль завершается QA-сессией и тестированием. Продолжительность модуля — 7 дней.
Программа модуля CI/CD
Самостоятельное изучение материала: (материал собран из открытых источников)
Создание простых Dockerfile
Основные команды Git: init, commit, status, branch, checkout, log, pull/push/fetch, remote add, revert, reset, rebase, diff, rm, cherry-pick
Настройка .gitignore
Модуль завершается QA-сессией и тестированием. Продолжительность модуля — 7 дней.
Программа модуля IDE
Самостоятельное изучение материала: (материал собран из открытых источников)
Альтернативные IDE способы разработки
Компоненты IDEA
Поддержка Scala
Способы создания нового проекта
Навигация по проекту
Структура проекта по умолчанию
Способы написания кода, готового к исполнению в jvm
Подготовка к работе и базовые настройки
Возможности использования Scala plugin
Основные способы перехода между участками кода
Модуль завершается QA-сессией. Продолжительность модуля — 7 дней.
Программа модуля Scala
Самостоятельное изучение материала: (материал собран из открытых источников) Введение в Computer science • Вычислительная сложность • Структуры данных • Алгоритмы • Основы программирования Основы Scala • Классы и объекты • Наследование • Трейты • Case классы • Коллекции • Функции высшего порядка • Параметризованные типы
Модуль завершается QA-сессией и тестированием. Продолжительность модуля — 7 дней.
Программа модуля Hadoop
Самостоятельное изучение материала: (материал собран из открытых источников)
Основные компоненты экосистемы Hadoop
Архитектура HDFS
Архитектура Yarn
Файловые форматы: parquet, avro, orc
Модуль завершается QA-сессией и тестированием. Продолжительность модуля — 7 дней.
Программа модуля Spark
Самостоятельное изучение материала: (материал собран из открытых источников)
Spark-shell и spark-submit
Driver, executor
Spark SQL
Объект SparkSession
Structured API (виды, преимущества, недостатки, кейсы использования)
Shuffle
Форматы файлов(csv, json, avro, parquet, orc)
Трансформации и действия
Модуль завершается QA-сессией и тестированием. Продолжительность модуля — 7 дней.
Программа модуля Airflow
Самостоятельное изучение материала: (материал собран из открытых источников)
Архитектура Airflow
UI Airflow
Определение и базовые элементы DAG
Установка и настройка
Базовые операторы
Настройка расписания
Сенсоры
Кастомные операторы
Переменные
Макросы
Написание DAG из одного из базовых операторов (Bash, Spark, Python)
Просмотр логов, перезапуск задачи или оператора
Модуль завершается QA-сессией и тестированием. Продолжительность модуля — 7 дней.
Все наставники являются сотрудниками чаптера инженеров данных и разработчиков.
регистрация закрыта
Обрати внимание: участвовать в программе могут только граждане РФ в возрасте от 18 лет.
TIMELINE И ПРОГРАММА ШКОЛЫ
Март — апрель
Самостоятельное изучение материалов следующих модулей:
Компания «билайн» была основана в 1992 году и стала первым телеком-оператором на российском рынке. Сейчас «билайн» — это почти 50 миллионов клиентов и 27 тысяч сотрудников. С 2009 года мы входим в международную группу компаний Veon, которая работает по всему миру.
А еще мы: Работаем на удаленке с 2016 года. Первыми построили полноценную инфраструктуру связи в Арктике. Работаем в Agile-командах. Даем возможность быть собой и развиваться как захочешь.