Semrush Cup 1.0
Semrush приглашает вас принять участие в соревновании по машинному обучению. Участникам предстоит решить задачу по определению источника трафика.
Расписание
11.04.2022 – 12.06.2022
Вознаграждение
Общий призовой фонд – 700 000 рублей
1 место – 350 000 рублей
2 место – 250 000 рублей
3 место – 100 000 рублей
*Указаны финальные суммы выигрышей после вычета налогов.
Первые 20 участников в турнирной таблице получат мерч: фирменная футболка Semrush + головоломка
Задача: Traffic sources based on clickstream
В сети Интернет ежедневно совершается бесчисленное количество переходов на сайты с самых разных устройств.
Эти посещения можно представить как последовательность событий, каждое из которых можно описать набором параметров:
- "device_id" – id устройства, с которого было совершено посещение.
- "timestamp" – дата и время события.
- "domain" – текущий домен.
- "referrer_domain" – домен, с которого случился переход. Поле может быть пустым в случае, если на "domain" был совершен директный вход (примечание: открытие страницы из сохраненной закладки).
- "url" – текущая страница.
- "referrer_url" – страница, с которой случился переход.
Дано событие и список предшествующих ему событий.
Требуется определить, с какого домена был совершен переход.
Поля: "domain", "referrer_domain", "url", "referrer_url" захэшированы. Хэши уникальны в разрезе групп:
- Domain&subdomains.
- TLD.
- Url path.
Пример хэширования “https://www.google.com/search?q=semrush” -> “https://domain_hash_1.domain_hash_2.tld_hash/path_hash”
Бизнес-польза найденного решения задачи
- Возможность размечать реферальные переходы в данных от поставщиков, у которых отсутствует возможность собирать такую информацию напрямую.
- Валидация качества данных, получаемых от поставщиков.
О компании
Semrush — продуктовая IT-компания, которая создает SaaS-платформу для управления видимостью бизнеса в интернете. Сервис содержит более 50 инструментов: можно оптимизировать выдачу сайта в поисковиках, создавать контент, вести социальные сети, настраивать рекламные кампании и исследовать конкурентов.
Все это значительно облегчает работу маркетологов по всему миру.
Data Science-направление в Semrush
В компании Data Scientists входят в состав команд разработки — вместе с frontend- и backend-разработчиками, владельцами продуктов и Data-инженерами.
У ребят свобода в выборе и использовании технологий. Они ежедневно осваивают новинки в области обработки и хранения данных, машинного обучения.
Основные задачи Data Scientist специалистов — создание выводов на основе множества разнородных данных и предсказание вероятности результатов. А если конкретнее, в обязанности включено всё, что связано с классификацией данных:
- Категоризация пользовательских действий, источников трафика, кейвордов и доменов по тематике и индустрии.
- Кластеризация аудитории по разным сегментам, характеристикам.
- Предсказательная аналитика (расчет вероятности следующего пользовательского действия).
Регистрация на соревнование: https://hcklink.ru/4201
Хочешь узнавать о новых хакатонах первым?
Подписывайся на нашу группу в ВК: https://vk.com/hackathoncom
Также, наш Telegram-бот, где мы присылаем хакатоны по параметрам, которые интересны тебе: https://t.me/hackathons4ubot