Онлайн-хакатон «Северстали» и McKinsey

Большие данные в металлургии: онлайн-хакатон от «Северстали» и McKinsey

Высокие технологии проникают во все отрасли бизнеса и промышленности, не исключая, конечно же, металлургию. Благодаря разным технологиям металлургические предприятия более эффективно используют ресурсы, мониторят качество продукции, улучшают показатели непрерывности процесса производства.
Но нет предела совершенству! И поэтому мы в ПАО «Северсталь» совместно с McKinsey и при поддержке Russian Hackers решили провести онлайн-хакатон для аналитиков и разработчиков в сфере поиска и анализа данных. Может быть, это как раз вы или ваши друзья?

Кто может участвовать

Для участия в нашем хакатоне есть всего три условия:

Во-первых, анализ данных или разработка – это ваша профессия или хобби.
Во-вторых, участвовать можно как одному человеку, так и команде до 5 человек.
В-третьих, для получения приза в команде должен быть хотя бы один гражданин РФ старше 18 лет.

Если у вас ещё нет тиммейтов, но вы хотели бы с кем-то объединиться, можно поискать их в чате хакатона в Telegram или в разделе «Поиск команды» на платформе регистрации. Кроме того, помочь могут и организаторы.
Важный момент – для работы не нужен мощный ноутбук или ПК. Вполне достаточно рабочего ПК и выхода в интернет. Участвовать можно из любой точки мира.

Задачи для участников

Мы подготовили четыре задачи для участников хакатона.

Задача 1. Управление ликвидностью

Суть задачи:

Провести исследование данных по затратам на энергоресурсы за несколько лет, проанализировать возможности обогащения внешними данными, определить значимые факторы влияния, построить прогнозную модель с пошаговым разъяснением принципов построения.
На выходе – понятный как для аналитика, так и для бизнес-пользователя Jupyter Notebook с подробным Exploratory Data Analysis (EDA).

Ключевые вопросы участникам:

Какие закономерности движения денежных потоков в разрезе балансовых единиц удалось выделить в результате EDA? Какие связи были найдены при исследовании?
Можно ли предположить, в какие дни будут происходить транзакции в будущем? Проверьте свои результаты на имеющихся данных, какой МАРЕ у вас получился?
Попробуйте составить график движения денежных средств на основе выявленных закономерностей на 1-2 квартал 2021 года (будет предложен пример).
Какие данные могли бы, на ваш взгляд, помочь построить более точный прогноз? Предложите схему сбора новых данных: частота, гранулярность и другие необходимые параметры. Отразите в презентации, как вы предполагаете использовать эти данные для решения задачи.

Почему это важно:

«Северсталь» непрерывно улучшает качество планирования, что дает возможности более эффективно распределять финансовые ресурсы и экономить на финансовых затратах.
Наша задача на этом хакатоне – найти инсайты для увеличения точности прогноза доходов и расходов по статьям ликвидности.

Задача 2. Мониторинг цен

Суть задачи:

Разработать инструмент, помогающий специалисту планировать цену на закупку запасных частей к спец. технике.
Подойти к задаче творчески: создать инструмент прогнозирования в будущем либо "сервис-шпаргалку" пользователю с анализом конкретных товаров и вариантов определения цен (should cost model).
В задаче предстоит разработать принципы алгоритмического мэппинга имён и характеристик товаров, исследовать зависимости между данными.
На выходе – воспроизводимый код и презентация сервиса.

Ключевые вопросы участникам:

Вы разработали инструмент, который позволит специалисту на основе внутренних и внешних факторов планировать цену на закупку. Расскажите, какие внешние данные вам удалось собрать? Как на ваш взгляд эти данные могут повлиять на планирование и мониторинг цен на товары?
Как будет выглядеть процесс использования инструмента для специалиста по планированию? Опишите бизнес-процесс с иллюстрациями.
Разработанный инструмент должен позволять как визуализировать данные по товарам, так и выгружать данные в Excel для «быстрого» построения отчета. Продемонстрируйте варианты информативной визуализации и подготовьте код для формирования отчета, а также пример отчета.
Каких внутренних данных не хватает для улучшения качества планирования?

Почему это важно:

«Северсталь» массово обрабатывает десятки товарных групп при планировании бюджетов на закупку. Для увеличения скорости и точности обработки рассматривается альтернативный сценарий планирования цен на закупку по наиболее популярным категориям товаров с использованием алгоритмов, основанных на поиске данных.

Задача 3. Автоматический поиск поставщиков

Суть задачи:

Задача состоит из нескольких блоков:

разработка алгоритма для парсинга товаров
исследование возможных данных во внешних источниках
разработка программы подготовки информации в требуемом разрезе (товар vs поставщик vs рейтинг поставщика)

На выходе – воспроизводимый код и презентация сервиса.

Ключевые вопросы участникам:

Опишите ваше решение в таком разрезе: список найденных факторов, алгоритм поиска этих факторов во внешней среде, критерии ранжирования по ним контрагентов в связке с каждым товаром (возможно, не все факторы релевантны всем товарам). Опишите бизнес-процесс с иллюстрациями.
В рамках вашего решения должна быть дополнена информация о контрагенте, принадлежащем к номенклатуре. В частности, это могут быть ИНН/КПП, юр. адрес, статус, фин. показатели, отзывы о компании и др.
Какие инсайты по поиску информации о поставщиках и подходы для проведения ранжирования вы нашли?
Разработанный инструмент должен позволять визуализировать данные по поставщикам с привязкой (с учетом ранжирования) к товарам.

Почему это важно:

Автоматизация процесса поиска, первичной проверки и базового ранжирования поставщиков в разрезе каждой товарной группы – задел в сторону дополнительной прозрачности в принятии решений по закупкам и упрощения бизнес-процесса.

Задача 4. Анализ контрагентов

Суть задачи:

Провести исследование имеющихся данных и попробовать спрогнозировать просрочку по контрагенту, предложить, как обогатить модель иными данными.
На выходе – понятный как для аналитика, так и для бизнес-пользователя Jupyter Notebook с подробным Exploratory Data Analysis (EDA) и воспроизводимым кодом решения, предобработки, моделирования, а также выводами.
С нас — данные по контрагентам за 2 года, список показателей для анализа, выборка для обучения модели.

Ключевые вопросы участникам:

Вам представлены данные за разные годы с различным набором информации. Проведите EDA, постарайтесь определить и визуализировать взаимосвязи и выделите самые значимые факторы, опишите свои выводы.
Возможно ли на данных за предыдущие годы спрогнозировать по контрагенту на следующий год: a) факт просрочки; б) просрочку более 30 дней; с) просрочку в диапазоне от 60 до 90 дней?
Какие дополнительные данные можно было бы добавить для повышения точности прогноза?

Почему это важно:

Повышение точности прогнозирования просрочек позволяет более точно планировать доходность и возможные риски.

Когда можно приступать?

Подать заявку можно по этой ссылке до 8 марта. Нужно заполнить анкету, создать команду и пригласить единомышленников или же участвовать самостоятельно.
С 22 февраля по 8 марта пройдёт отборочный этап, нужно будет отправить решение одной из четырёх предложенных задач. 14 марта мы объявим итоги отбора.
Финальный этап хакатона пройдёт 18-20 марта. Финалисты смогут доработать свои решения бок о бок с бизнесом. В течение этого этапа команды участвуют в онлайн чек-поинтах с экспертами и загружают итоговое решение на платформу регистрации.
20 марта все финалисты приглашаются на питчи своих решений в офис. Можно будет выступить онлайн. После оглашения результатов планируется награждение, афтерпати и нетворкинг в офисе при участии экспертов «Северстали» и McKinsey.

Что получают участники?

Призовой фонд включает как денежные призы, так и мерч:

700 000 рублей – общий призовой фонд хакатона.
4 приза по 100 тыс. рублей за лучшее решение каждого трека
200 тыс. рублей получит лучшее решение всего хакатона, а 100 тыс. рублей – лучшее решение по версии участников.
160 наборов мерча получат участники по итогам отборочного этапа.
5 плюшевых маскотов уйдут победителям конкурса.

Призы ждут победителей! Осталось только зарегистрироваться по ссылке и принять участие. Дополнительную информацию можно получить на сайте хакатона или в Telegram-чате.

Хочешь узнавать о новых хакатонах первым?
Подписывайся на нашу группу в ВК: https://vk.com/hackathoncom
Также, наш Telegram-бот, где мы присылаем хакатоны по параметрам, которые интересны вам: https://t.me/hackathons4ubot

Большие данные в металлургии: онлайн-хакатон от «Северстали» и McKinsey

Кто может участвовать

Задачи для участников

Задача 1. Управление ликвидностью

Задача 2. Мониторинг цен

Задача 3. Автоматический поиск поставщиков

Задача 4. Анализ контрагентов

Когда можно приступать?

Что получают участники?

Услуги экосистемы Хакрус

Организовать хакатон

Платформа для хакатона

Онлайн-хакатон по поиску и анализу данных от Северстали и McKinsey

Большие данные в металлургии: онлайн-хакатон от «Северстали» и McKinsey

Кто может участвовать

Задачи для участников

Задача 1. Управление ликвидностью

Задача 2. Мониторинг цен

Задача 3. Автоматический поиск поставщиков

Задача 4. Анализ контрагентов

Когда можно приступать?

Что получают участники?

Услуги экосистемы Хакрус

Организовать хакатон

Платформа для хакатона