Top.Mail.Ru
хакатоны.рус - открой с нами мир хакатонов

Brand Analytics 
ML Сontest

DS/ML/AI Регистрация закрыта online
Компания Brand Analytics - разработчик лидирующей системы мониторинга соцсетей и СМИ на рынках России и СНГ, приглашает всех желающих принять участие в контесте и разработать решение, способное генерировать текст суммаризации комментариев под постами в социальных сетях.

Контест - формат соревнования, предназначенный для решения реальных задач по программированию за установленный период времени. На протяжении практически трёх недель участники будут работать над решением поставленной перед ними задачи в удобное время!

Что ждёт участников?
  • Борьба за призовой фонд размером в 200 000 рублей;
  • Обратная связь от с экспертов крупной IT-компании;
  • Возможность проявить себя и продемонстрировать свои скиллы;
  • Новый кейс в портфолио, созданный в рамках решения реальной задачи.

Как принять участие:
  1. Пройти регистрацию на платформе ЗаводIT;
  2. Присоединиться к контесту;
  3. Подтвердить свое участие на платформе;
  4. Подписаться на канал контеста в Telegram, задать интересующие вопросы;
  5. Решать задачу контеста 4-20 декабря.

Требования к участникам:
  • Команды не больше 3 человек.
  • Участником может быть любой гражданин Российской Федерации старше 18 лет.
  • К участию приглашаются участники любого уровня подготовки.

Задача:

Суммаризация комментариев в социальных медиа

В социальных медиа (vk, ok и т.п.) пользователи как правило могут оставлять посты, посты в группе, сообществе или на своей странице. Посты можно комментировать, однако комментарии при этом могут как иметь отношение к тексту поста, так и нет. Комментарий может содержать смысл или быть бессмыслицей или спамом в целом.

Необходимо реализовать решение которое сможет генерировать (генеративная суммаризация) текст суммаризации (главного, смысла обсуждения) комментариев под каждым постом.

Входные данные:

Файл в формате .jsonl с постами и комментариями, а также мета-информацией. Данные в файле не структурированы, участникам в первую очередь необходимо будет связать комментарии и посты по внешним идентификаторам, которые указаны в качестве отдельного поля каждого объекта исходного файла.

Правила суммаризации по уровню сложности:

  • Суммаризация всех комментариев под каждым постом;
  • Суммаризация только тех комментариев, которые имеют явное отношение к тексту каждого поста;
  • Суммаризация не только тех комментариев которые имеют явное отношение к тексту поста, но и косвенное (пример: пост про технологию компании, а комментарий про обсуждение самой компании)

Требования к решению:

  1. Использование только открытых технологий;
  2. Запрещено использование в конечном результате
(но допускается в процессе разработки) облачных решений: OpenAI и т.п.
  3. Конечное решение должно иметь инструкцию по запуску и установке всех зависимостей. Все внешние файлы, словари, модели и т.п. должны предоставляться вместе с самим решением;
  4. Приложение должно иметь одну точку входа и формат вывода результата;
  5. Ограничений по стеку технологий нет, но предпочтителен стандартный набор современного DS/ML: Python.

Важно:

  • Качество решения;
  • Ресурсоэффективность (чем меньше потребляется ресурсов — тем лучше);
  • Скорость работы;
  • Предпочтительны решения, способные эффективно работать на CPU, допускаются решения с работой на GPU.

Таймлайн

до 15 декабря 23:59 МСК
Регистрация (Приём заявок);

4 декабря
17:00-17:30
Открытие контеста;
17:30-18:00
Презентация задачи;
18:00
Старт и работа над задачей;

20 декабря 23:59
Стоп-код (подгрузка финальных решений) и старт проверки;

25 декабря 18:00-19:00
Подведение итогов.

Призовой фонд - 200 000 рублей!

Формат - онлайн

Регистрация до 15 декабря:

Хочешь узнавать о новых хакатонах, соревнованиях первым?
Подписывайся на наши социальные сети:
Также, подписывайся на наш Telegram-бот, где мы присылаем хакатоны, соревнования по параметрам, которые интересны тебе: