хакатоны.рус - открой с нами мир хакатонов

Semrush Cup 1.0

DS/ML/AI Регистрация закрыта online

Semrush Cup 1.0


Semrush приглашает вас принять участие в соревновании по машинному обучению. Участникам предстоит решить задачу по определению источника трафика.

Расписание
11.04.2022 – 12.06.2022

Вознаграждение

Общий призовой фонд – 700 000 рублей

1 место – 350 000 рублей

2 место – 250 000 рублей

3 место – 100 000 рублей

*Указаны финальные суммы выигрышей после вычета налогов.


Первые 20 участников в турнирной таблице получат мерч: фирменная футболка Semrush + головоломка



Задача: Traffic sources based on clickstream
В сети Интернет ежедневно совершается бесчисленное количество переходов на сайты с самых разных устройств.
Эти посещения можно представить как последовательность событий, каждое из которых можно описать набором параметров:
- "device_id" – id устройства, с которого было совершено посещение.
- "timestamp" – дата и время события.
- "domain" – текущий домен.
- "referrer_domain" – домен, с которого случился переход. Поле может быть пустым в случае, если на "domain" был совершен директный вход (примечание: открытие страницы из сохраненной закладки).
- "url" – текущая страница.
- "referrer_url" – страница, с которой случился переход.

Дано событие и список предшествующих ему событий.
Требуется определить, с какого домена был совершен переход.

Поля: "domain", "referrer_domain", "url", "referrer_url" захэшированы. Хэши уникальны в разрезе групп:
- Domain&subdomains.
- TLD.
- Url path.

Пример хэширования “https://www.google.com/search?q=semrush” -> “https://domain_hash_1.domain_hash_2.tld_hash/path_hash”

Бизнес-польза найденного решения задачи
  • Возможность размечать реферальные переходы в данных от поставщиков, у которых отсутствует возможность собирать такую информацию напрямую.
Это увеличит объем данных, которые используются в отчетах по источникам и каналам трафика, а значит улучшит качество этих отчетов. Также полученные данные повысят точности других метрик: средняя продолжительность сессии на сайте, количество просмотренных за визит страниц, показатель отказов.
  • Валидация качества данных, получаемых от поставщиков.
Эта информация послужит дополнительным критерием для их проверки.

О компании
Semrush — продуктовая IT-компания, которая создает SaaS-платформу для управления видимостью бизнеса в интернете. Сервис содержит более 50 инструментов: можно оптимизировать выдачу сайта в поисковиках, создавать контент, вести социальные сети, настраивать рекламные кампании и исследовать конкурентов.
Все это значительно облегчает работу маркетологов по всему миру.

Data Science-направление в Semrush
В компании Data Scientists входят в состав команд разработки — вместе с frontend- и backend-разработчиками, владельцами продуктов и Data-инженерами.
У ребят свобода в выборе и использовании технологий. Они ежедневно осваивают новинки в области обработки и хранения данных, машинного обучения.

Основные задачи Data Scientist специалистов — создание выводов на основе множества разнородных данных и предсказание вероятности результатов. А если конкретнее, в обязанности включено всё, что связано с классификацией данных:
- Категоризация пользовательских действий, источников трафика, кейвордов и доменов по тематике и индустрии.
- Кластеризация аудитории по разным сегментам, характеристикам.
- Предсказательная аналитика (расчет вероятности следующего пользовательского действия).


Регистрация на соревнование: https://hcklink.ru/4201




Хочешь узнавать о новых хакатонах первым?
Подписывайся на нашу группу в ВК: https://vk.com/hackathoncom
Также, наш Telegram-бот, где мы присылаем хакатоны по параметрам, которые интересны тебе: https://t.me/hackathons4ubot