В отдельных файлах есть:
- факты просмотра контента пользователями
- описание контента
- описание пользователей
Что нужно сделать?
Наиболее качественно порекомендовать список из 10 объектов для каждого пользователя из тестовой выборки.
Код базовых моделей для этих данных уже есть.
Как сделать предсказание (сабмит)?
Примеры базовых моделей и создания сабмита вы сможете найти в ноутбуке
RecSys notebook Baseline.ipynb
.
Пример сабмита вы найдете в файле под названием
sample_submission.csv.
Это id пользователей, для которых сделаны предсказания контента, максимально совпадающие с реальными фильмами/сериалами, с которыми пользователи взаимодействовали за 7 дней теста.
Формат файла sample_submission.csv:
Id - список ID пользователей, по которым нужно сделать прогноз
Predicted - список ID контента, отсортированного по релевантности, которые нужно предсказать. Это строка, где разделитель для ID - это запятая.
Формат сабмита
Ваш submission.csv - должен содержать 2 столбца: Id and Predicted.
Ограничения:
- В сабмите должны присутствовать все пользователи тестовой выборки
- Количество item_id должно быть 10
- Они должны быть отсортированы по убыванию релевантности для пользователя.
Регистрация и данные: https://hcklink.ru/7201
Хочешь узнавать о новых хакатонах первым?
Подписывайся на нашу группу в ВК: https://vk.com/hackathonsrus
Также, наш Telegram-бот, где мы присылаем хакатоны, соревнования по параметрам, которые интересны тебе: https://t.me/hackathons4ubot