Top.Mail.Ru
Хакатоны.рус — открой с нами мир хакатонов!

Хакатон ФИЦ 2024

online offline DS/ML/AI Москва Регистрация закрыта
Прими участие во Всероссийском хакатоне и получи возможность представить своё решение на площадке ИНТЦ МГУ в Москве!

Что даст участие?
1. Карьера
Хакатон — это шанс проявить себя перед топ-менеджерами. Добавь успешный кейс в своё портфолио. Представь свой проект на питч-сессии на площадке Форума инновационных центров
2. Нетворкинг
Познакомься с людьми со схожими интересами, участвуй во всех активностях конференции!
3. Развитие
Прокачивай свои hard и soft skills, решай задачи от топовых ИТ-компаний и получай обратную связь от профессионалов!
4. Призы
Общий призовой фонд хакатона 6 000 000 рублей
+ подарки самым активным участникам, мерч и сертификаты

Требования к участникам:
  • Минимальные требования: в команде должно быть от 2 до 6 человек.
  • Участником может быть любой гражданин Российской Федерации старше 18 лет.

Кейсы хакатона:

1. Информационная система управления проектами в строительстве

Стек
Не ограничен
Задача
Разработать информационную систему управления строительными проектами, которая позволит планировать экономические показатели, сроки производства работ или потребность в трудовых ресурсах, контролировать факт выполненных работ и движения денежных средств по направлениям затраты и поступления, а также корректировать планы с учетом фактической ситуации.
  • Frontend
  • Backend
  • Fullstack
  • DevOps

2. БухПульс

Дополнительная задача
Разработать алгоритм сбора обратной связи от пользователей о сервисе «Бухэксперт8» для дальнейшего использования в маркетинговых целях.
Выявление трендов в сфере бухгалтерского учета, поиск «болей» бухгалтера
Основная задача
Используя вводные данные, разработать алгоритм для поиска новых трендов и проблем бухгалтера. Полученная информация будет использоваться для оперативного создания контента.
  • DataScience
  • Machine Learning


3. Разработка модуля классификации опор ЛЭП

Предполагаемые технологии
Сервис может быть представлен как сайт или приложение. Mожно использовать Python+TensorFlow (Keras), PyTorch, OpenCV и аналоги. Можно также написать свой алгоритм детектор и классификатор.
Создание сервиса для классификации опор ЛЭП по снимку.
Проблема
Практически все магистральные ЛЭП построены в СССР. Это были героические впечатляющие стройки, давшие нашей стране мощную энергетическую систему. Однако сейчас многие сети требуют обновления и для это необходимо привести тех документацию к фактическому состоянию. Часто типы опор ЛЭП на планах не совпадают c фактическими. В рамках задания мы попросим Вас провести классификации опор ЛЭП по фото-снимку.
Данные
Для проверки работоспособности системы необходимы входные тестовые данные, включающие набор фотографий опор ЛЭП с разных ракурсов:
  • с земли вверх;
  • с БЛА горизонтально;
  • с БЛА сверху.
Оценка
Оцениваться будут:
  • сложность реализации, используемый стек технологий;
  • удобство интерфейса;
  • функциональные возможности: возможность загрузить фото и получить маску или bound-box опоры и ee тип;
  • точность детекции и классификации.

4. Погонщик нейронок

Чем меньше написано кода руками, чем выше процент автоматизации, чем дешевле нейронки и ИИ помощники, тем лучше.
Задание будет состоять из 2 этапов:
  1. Собираем приложение по макету — для тестирования автоматизации.
  2. Собираем приложение по макету + ui кит используем — для проверки автоматизации.
Потребуется запись экрана с комментариями, чтобы было видно, как разработчик собирает приложение и какие средства использует.
Задача
Как можно быстрее сделать react приложение по макету из Figma, используя любые ИИ помощники, как можно меньше кодить самостоятельно.
Вводные данные
Ключ к платному ChatGPT и VPN

5. Оценка уровня экспертности по резюме

Необходимо разработать систему оценки уровня эксперта по резюме.
Оценка должна должна учитывать:
  • Рейтинг организаций, в которых работал кандидат
  • Годы релевантного опыта
  • Компания, куда собеседуется кандидат
  • Грейд внутри компании, где работал кандидат
Также для подсчёта финальной оценки можно учитывать любые другие факторы, информацию о которых дана в резюме.
Для реализации можно использовать как готовые модели с подключением по API, так и дообучать open-source модели или создавать свои.
Стек
Без ограничений
Предоставляемые данные
Датасет из резюме кандидатов и оценок уровня экспертности
  • Machine Learning
  • DataScience
  • Developement

6. Контекстный перевод названий научных работ

Стек
Без ограничений
Предоставляемые данные
Датасет:
  • Русский вариант названия научной работы
  • Переведённый вариант названия научной работы
  • Факультет
Задача
Разработать и реализовать переводчик, который будет переводить названия научных работ с русского на английский. Переводчик должен учитывать терминологию научной области и её специфику. Для реализации переводчика можно использовать как готовые модели с подключением по API, так и дообучать open-source модели.
  • Machine Learning
  • DataScience
  • Developement

7. Прогнозирование бизнес драйверов

Прогнозы нужны не только метеорологам. Правительства прогнозируют экономический рост. Ученые пытаются предсказать численность населениz. А предприятия прогнозируют спрос на продукцию — обычная задача специалистов по анализу данных.

Прогнозы особенно актуальны для обычных магазинов, будь то продуктовые магазины или торговые точки сотовых операторов. В частности, прогнозы помогают рассчитать потребность в персонале. Как раз этим и занимается наша компания. Мы формируем графики работы сотрудников магазинов, основываясь на прогнозах бизнес-драйверов. Под «бизнес-драйверами» мы понимаем ключевые показатели, которые определяют финансовую и операционную деятельность торговой точки. Типичными примерами бизнес-драйверов являются трафик (количество вошедших человек), количество чеков, количество проданных товаров и т. д. Если

прогнозировать немного больше, то придется вывести больше людей на смену и увеличится фонд оплаты труда. Если прогнозировать немного меньше, то возникнет нехватка персонала, что приведет к очередям и потере дохода. Более точное прогнозирование, благодаря машинному обучению, может помочь ритейлерам угодить клиентам, формируя гибкие графики работы.


Задача

Необходимо разработать решение для задачи прогнозирования временных рядов бизнес-драйверов и произвести прогноз на следующий календарный месяц. Лучшие решения послужат дополнением к уже существующему решению.


Стек
Python, pandas, любые библиотеки для прогнозирования
  • DataScience
  • Analytics

Предоставляемые данные
В качестве данных будут предоставлены csv-файлы, содержащие исторические данные по бизнес-драйверам. Все данные
представлены с гранулярностью 1 день.
  1. data1.csv — файл с данными по количеству чеков из торговой точки продуктовой розницы.
  2. data2.csv — файл с данными по трафику (числу вошедших людей) торговой точки непродуктовой розницы (сотовые операторы, магазины одежды, магазины игрушек, DIY).
  3. data3.csv — файл с данными по трафику (числу вошедших людей) торговой точки непродуктовой розницы (сотовые операторы, магазины одежды, магазины игрушек, DIY).
  4. data4.csv — файл с данными по трафику (числу вошедших людей) торговой точки непродуктовой розницы (сотовые операторы, магазины одежды, магазины игрушек, DIY).
  5. data5.csv — файл с данными по трафику (числу вошедших людей) торговой точки непродуктовой розницы (сотовые операторы, магазины одежды, магазины игрушек, DIY).

Помимо предоставленных данных можно использовать любые дополнительные данные из открытых источников.
Ограничения
Так как нам приходится работать с более чем 10 000 рядов, нам очень важна скорость формирования прогноза. Поэтому мы вводим ограничение на скорость работы алгоритма. На формирование прогноза на один временной ряд должно отводиться не более 4-х минут (240 секунд). Этот аспект также будет учитываться при оценке решений.
Из-за того, что эксперты будут проверять работоспособность решения, оно должно быть воспроизводимым.

8. Формирование фото и видео контента с использованием нейросетей на основе биографии и фото персоны

Задача
Разработать функционал генерации иллюстрации и коротких видео на основе промта из биографии памятной страницы и короткой биографической истории, которую пользователь вводит по запросу.
Стек
Неограничен, результат должен нативно интегрироваться с нашим сервисом. Сервис написан на Laravel, php.
Предоставляемые данные
Предоставляем пустую базу postgres, API для авторизации и страницы, тестовые учетные записи, страницы для генерации.
Предполагаемый результат
Полностью рабочий прототип генерации персонализированной иллюстрации и видео на основе исходного фото и заполненной истории и всего контента на заполненной странице памяти.
Вся коммуникация с пользователем ведется через Telegram-бот.
  • Нейросети
  • Fullstack

9. Разработка алгоритма трекинга людей в видеопотоке с нескольких камер

Задача

Необходимо разработать алгоритм трекинга людей в видеопотоке с нескольких камер, расположенных в офисе. Для реидентификации людей между камерами запрещается использовать распознавание лиц.

Стек
Без ограничений. Предпочтительно Python/Pytorch
Вводные данные
Размеченный датасет треков, собранный с камер из офиса. В тестовом датасете присутствуют как камеры из тренировочного набора, так и новые, но расположенные в тех же помещениях.
Предполагаемый результат
Компьютерная программа, скрипт или jupyter ноутбук, реализующие алгоритм трекинга людей по нескольким камерам с реидентификацией по косвенным признакам.
  • Computer Vision
  • Middle +

10. Цифровая карта подземных коммуникаций с использованием Cesium

  • Fullstack
  • UX/UI
  • Frontend
Задача
В рамках хакатона участникам предстоит разработать веб-приложение для визуализации подземных коммуникаций города (или промышленного объекта) на трехмерной карте с использованием библиотеки Cesium. Приложение должно позволять пользователям взаимодействовать с картой, просматривать подробную информацию о подземных коммуникациях, а также выполнять основные операции, такие как поиск и фильтрация объектов. Это поможет инженерам, городским службам и строителям лучше понимать расположение коммуникаций и планировать работы с минимальным риском.
Стек
Без ограничений
Предполагаемый результат
  • Интерактивная 3D-карта с отображением подземных коммуникаций.
  • Поиск и фильтрация объектов по типу и другим параметрам.
  • Возможность приближения, отдаления и вращения карты для лучшего обзора коммуникаций.
  • Интерактивные подсказки и информация о каждом объекте при клике на него.
  • Загрузка данных о подземных коммуникациях из заранее подготовленных файлов (например, GeoJSON).
  • Поддержка слоев: возможность переключаться между различными типами коммуникаций (водопровод, электричество, связь и т. д.).

11. Симуляция записи в расписание

Описание
В учреждениях, где клиентов принимают по записи, всегда стоит вопрос о том, как более оптимально его составить, для того чтобы его заполняемость была наиболее оптимальным. Заранее неизвестно как будет заполняться тот или иной вид разбивки расписания и насколько оптимальным оно окажется. Предлагается создать инструмент для симуляции клиентопотока. Инструмент будет заполнять расписания алгоритмом или нейронной сетью, результат которой будет максимально похожим на поведение реальных людей.
Задача
Необходимо создать инструмент заполняющий расписание подобно человеку для тестирования различных видов переменных, которые можно настраивать для расписания.
Вводные данные
При необходимости, возможно предоставление данных о записях, которые можно использовать для обучения нейронных сетей или анализе для написания алгоритма.
Данные могут содержать:
  • расписание специалистов;
  • хронология записей и отмен.
Предполагаемый результат
Разработан инструмент как минимум для симуляции записи, как максимум для полного цикла проверки всех вариаций параметров на оптимальность заполненности расписания.
Для симуляции записи можно указать два API-endpoint-а:
  • куда обращаться за расписанием
  • куда отправлять симуляцию записи.

12. Цифровой сервис для ведения реестра зеленых насаждений города Москвы

Описание

Зеленые насаждения являются одним из ключевых факторов, определяющих уровень комфортности городской среды. Зеленые насаждения улучшают качество воздуха, снижают уровень шума, формируют уникальный эстетический облик города. Важными характеристиками зеленых насаждений в этом контексте являются их плотность, состав, разнообразие, распределённость по городским территориям. В связи с этим перед городскими службами встает задача перманентного учета зеленых насаждений. Результаты процесса учета аккумулируется в информационном сервисе «Реестр Зеленых Насаждений». В настоящее время обследование городских территорий с целью учета зеленых насаждений проводится очно с выездом необходимых специалистов непосредственно на место.

Мы предлагаем участникам хакатона решить задачу автоматизации процесса учета деревьев на территориях города Москвы.

Задача
Разработать сервис по работе с панорамами города Москва c возможностью разметки и подключению существующих open-source моделей для решения задач:
  • подсчет количества деревьев;
  • определения породы деревьев;
  • определение высоты дерева;
  • определения диаметра ствола.
Стек

Без ограничений

Вводные данные
Панорамы территорий г. Москвы
Предполагаемый результат
Сервис с web-интерфейсом, предоставляющий следующие функциональные возможности в полном объеме или частично:
  • загрузка и открытие фотопанорамы,
  • автоматический подсчет количества деревьев на фотопанораме,
  • автоматическое определение породы каждого из деревьев на фотопанораме,
  • автоматическое определение высоты деревьев на фотопанораме,
  • автоматическое определение диаметра ствола,
  • функционал оператора для корректировок и (или) исправления ошибок
  • функционал оператора для выполнения ручной разметки,
  • сохранение результатов автоматического распознавания и (или) работы оператора.

13. Предсказание необходимого количества средств досмотра

Описание
Повышенные требования безопасности и необходимость 100% досмотра багажа, ручной клади требуют от служб транспортной безопасности серьезной переоценки имеющегося оборудования и постановки перед ними задачи использования принципиально новых линий досмотра, обеспечивающих оперативный, эффективный и удобный контроль.
Установки, работающие в автоматическом режиме, даже с томографическим принципом получения изображения, имеют высокий уровень ложных тревог — (20−30%) и требуют использования средств для анализа паров и частиц ВВ, эффективно справляющиеся со своей задачей, если ВВ находится не в герметичном корпусе, в противном случае такие варианты обнаружения становятся не эффективными.
Все вышеуказанное подтверждает необходимость разработки новой технологии досмотра багажа.
Задача
В целях функционирования новой технологии досмотра необходимо разработать ПО, которое позволяет оценить потребное количество средств досмотра: РТУ (рентгенотелевизионная установка), установок НРА и анализаторов паров и следов (ETD).
Стек
Без ограничений
Предполагаемый результат
ПО, которое позволяет оценить потребное количество средств досмотра: РТУ (рентгенотелевизионная установка), установок НРА и анализаторов паров и следов (ETD).

14. Система контроля и управления доступом

Описание
Разработка системы контроля и управления доступом в реальном времени. Система будет включать API для управления сотрудниками, точками доступа и интеграцию с системой видеонаблюдения.
Задача
Создание API для управления сотрудниками:
  • Создание и удаление карточек сотрудников с фотографиями лиц.
  • Управление точками доступа.
  • Проверка нахождения сотрудника на объекте.
Предполагаемый результат
Обработка данных из камер в режиме реального времени.
  • Определение доступа на объект с использованием модели распознавания лиц.
  • Управление объектами и устройствами через REST API.
Стек
Java, Spring Boot, Spring WebSocket, PostgreSQL, OpenCV, Docker
Дополнительные материалы
API с аннотацией curl для интеграции с системой распознавания лиц

15. Семантический делитель текстов

Описание
Реализовать алгоритм, который будет определять оптимальное деление монолитных текстов на части, с сохранением смысловой связности каждого из них в отдельности. Должна четко фиксироваться законченность смысловой нагрузки в рамках выбранного блока без захвата посторонних сведений.

Задача
Разработать алгоритм, который сможет обеспечить точное разделение текста на блоки в рамках произвольно заданных ограничений размера блока.
  • Алгоритм должен быть способен обнаруживать и обрабатывать структурное и смысловое наполнение текстового, табличного и кодового источника.
  • Алгоритм должен минимизировать переток информации между блоками.
  • Средний размер блока должен быть приближен к заданному ограничению максимального размера или минимизирована дисперсия размеров блоков в рамках одного документа.
  • Обеспечить высокую точность и скорость обработки, чтобы система могла работать с потоком поступающих документов в реальном времени.
Стек
Python, PyTorch, Keras, scikit-learn, pandas, numpy, matplotlib, Vectorstore, FAISS, LangChain, FastAPI, Docker
Предполагаемый результат
Рабочее решение для точного и быстрого деления информации на блоки.
  • Демонстрация чем разработанное решение превосходит существующие.
  • Подробный отчет с метриками точности, скорости и описанием использованных методов, результатов тестирования и предложениями по улучшению.
Дополнительные материалы
API для интеграции с другими системами (эмбеддинг моделями, векторными базами)

16. Разработка сервиса печати этикеток для производителей одежды

Описание
У производителей одежды есть необходимость создавать макеты этикеток и вшивных ярлыков для своей продукции. По требованию государства такие макеты должны содержать определенную информацию. Также каждая компания разрабатывает свои шаблоны — порядок представления этой обязательной информации на этикетке конкретной формы и размера.
Задача
Разработать веб-компонент, который будет встроен в интерфейс системы Cosmic PLM, в котором пользователь сможет реализовать ряд функций.
Стек
TypeScript, ReactJS
Вводные данные
  • Примеры текстовых полей;
  • Примеры этикеток различных производителей.

Кейсы идеатона:

1. Разработка стратегии продвижения и позиционирования комплексного подхода к вопросу пожарной безопасности здания от ГК ПАТ

Задача
Сформировать уникальное предложение и разработать стратегию продвижения, позиционирования комплексного подхода к вопросу пожарной безопасности, которая будет включать продукты, производимые компаниями входящими в ГК ПАТ.

2. Архитектура высоконагруженного распределенного приложения

Описание
Поиск архитектурных решений для создания высоконагруженного территориально-распределенного веб-приложения, способного обслуживать не менее 100 000 одновременных пользователей.
Задача
Разработать концептуальную архитектуру веб-приложения с учетом требований к безопасности, защитой от кибератак, масштабируемости и высокой доступности на всей территории России.
Предполагаемый результат
  • Полный аналитический отчет по архитектурному решению для высоконагруженного приложения.
  • Визуализированные схемы архитектуры и диаграммы.
  • Документация по выбору технологий, сущестующим платформ и баз данных по каждому из финальных решений.
  • Рекомендации по обеспечению безопасности и защиты от кибератак.

Таймлайн:
До 28 ноября
Регистрация
29 ноября
Торжественное онлайн-открытие и презентация кейсов
29 ноября — 4 декабря
Хакатон
3-4 декабря
Демо и защита решений
4 декабря
Награждение победителей

Призовой фонд - 6 000 000 рублей!

Формат: онлайн/офлайн финал в г. Москва

Регистрация до 28 ноября:

Хочешь узнавать о новых хакатонах, соревнованиях первым?
Подписывайся на наши социальные сети:
Также, подписывайся на наш Telegram-бот, где мы присылаем хакатоны, соревнования по параметрам, которые интересны тебе: