Top.Mail.Ru
хакатоны.рус - открой с нами мир хакатонов

Data Fusion Contest

DS/ML/AI Регистрация закрыта online
Cоревнование по машинному обучению с уникальным датасетом и задачами: находить одних и тех же пользователей по их поведению на данных транзакций и кликстрима.

Общий призовой фонд 2 000 000 ₽

Основные задачи
Задача №1 MATCHING
Необходимо построить алгоритм для решения задачи матчинга. По данным транзакций и кликстрима, требуется построить обезличенные вектора для пользователей. Затем, на основе созданных векторов, сопоставить каждому вектору транзакций клиента Банка вектор на основе кликстриминга от партнера и отранжировать их по вероятности матчинга.
Метрика - R1
Формат решения - Контейнер с кодом
Призовой фонд: 1 450 000 ₽

Задача №2 PUZZLE
Необходимо построить алгоритм, решающий задачу матчинга в случае, когда все кандидаты в пары заранее известны, но сами пары не предоставлены. Участникам нужно решить всё ту же задачу соотнесения, но в постановке, близкой к составлению пазла.
Метрика - R1
Формат решения - Размеченный файл
Призовой фонд: 300 000 ₽


Дополнительные задачии активности
Номинация 1 COMPANION
Награда за лучшие публичные решения, опубликованные до окончания соревнования. Номинация публичная, в ней участвуют публично открытые решения и материалы участников соревнований
Призовой фонд: 150 000 ₽

Номинация 2 INSIGHT
Награда за самые интересные, прорывные и нестандартные решения задач соревнования.
Призовой фонд: 100 000 ₽

Образовательная задача
EDUCATION
Упражнение для тех, кто хочет научиться работать
с индустриальными данными транзакций: создать алгоритм, способный предсказывать наличие высшего образования у клиента.
Подарки


Уникальность датасета
С помощью инструментов Platforma, а также технологии безопасного матчинга data exchange был сформирован синтетический датасет на обезличенных данных от ВТБ и Ростелекома.
При этом данные генерировались таким образом, чтобы сохранить необходимую для решения задачи информацию о пользовательском поведении.

Как будут оцениваться решения соревнования?
Решения задач соревнования (1-3) оцениваются автоматически, на основе сопоставления с истинными тестовыми метками, которые доступны только организаторам. Заявки в специальные номинации оцениваются жюри из представителей организатора соревнования, а также приглашенных экспертов и исследователей после окончания приёма решений.

Как выбираются финальные решения?
В каждой задаче можно выбрать до 2 своих финальных решений. На протяжении всего соревнования можно выбирать финальные решения, в том числе менять свой выбор. Если финальные решения не были выбраны, то автоматически выбираются 2 лучших решения на публичной части тестовых данных. Результаты на публичных тестовых данных доступны в течение хода соревнования, но не используются при определении победителей соревнования.

Можно ли решать сразу несколько задач?
Можно. Принимать участие разрешено как в какой-то одной задаче или активности, так и в любой их возможной комбинации.

Можно ли участвовать в командах?
Участие во всех задачах возможно в командах от 1 до 4 человек.

Как определяются победители задач соревнования?
В каждой из задач, которые решает участник, необходимо выбрать до 2 своих финальных решений. Эти решения будут запущены и оценены на закрытых приватных тестовых данных. Именно результат на приватных данных считается официальным финальным результатом соревнования. Победителями в каждой из задач становятся участники или их команды, получившие лучшие результаты в рейтинг финальных результатов.

Узнать как прошел Data fusion 2021 > https://hcklink.ru/4802

Регистрация на соревнование до 15 мая 2022https://hcklink.ru/4801



Хочешь узнавать о новых хакатонах первым?
Подписывайся на нашу группу в ВК: https://vk.com/hackathoncom
Также, наш Telegram-бот, где мы присылаем хакатоны по параметрам, которые интересны тебе: https://t.me/hackathons4ubot