DziS Science | Data Science

Відкрити в Telegram

Канал о жизни через призму науки о данных Учусь сам, учу других Пишу интересные статьи о соревновательном и коммерческом DS и его приложениях к жизни. Создатель: @a_dzis

Росія202 483 Технології та додатки29 468

2 194

Підписники

+124 години

-57 днів

Немає даних30 день

698

Перегляди допису

~ 27024 години

~ 28648 годин

31.81%

Коефіцієнт залучення

Немає даних

Дописів на день

Ads index

beta

Архів дописів

2 195

Машинное обучение в цифровом продукте — магистратура Авито и ФКН ВШЭ На ней вы получите углублённые знания по машинному обучению и научитесь применять их для решения реальных бизнес-задач. Получите шанс занять одно из 30 бесплатных мест и построить уникальный образовательный трек: актуальные дисциплины по выбору и возможность пройти оплачиваемую стажировку в Авито уже во время учёбы! В программе: — машинное обучение, NLP, MLOps и рекомендательные системы; — большие языковые модели и современные ML-подходы; — работа с кейсами и данными Авито; — дисциплины по выбору для собственной образовательной траектории; — преподаватели из ФКН ВШЭ и эксперты Data Science-команд Авито. Успейте подать документы — приём заканчивается 8 августа.

2 195

Привет всем! 👋 Я к вам с новым анонсом мероприятия. 📌19 сентября 📱 проводит Practical ML Conf 2026. Мне ранее на почту прилетела ранняя регистрация и свой очный билет я уже получил. Регистрируетесь, точно не пожалеете. 📍Где: Москва, ул. Волочаевская 48, строение 1. 👨‍💻Формат: Онлайн👨‍💻/Офлайн🕺 ✍️Регистрация: по ссылке #мероприятия

2 195

Привет всем!👋 Админ не выходит на связь, потому что словил лютый гиперфокус на Kaggle 💻 Честно, ожидаю взять не качеством но количеством, к сожалению на дорогу к золоту в моменте не готов. - Где участвую? 🔸Залетел в последний вагон Orbit Wars. Цель простая - сделать агента для игры. Докрутил паблик кернел на агрессивный тип игры. За победу дают + рейтинг, за проигрыш отнимают. Плохая новость - я не в бронзе, но хорошая еще 10 дней игр + агент изо дня в день идет в плюс. Лучший скор 1003, до бронзы сейчас менее 90 очков (за каждую победу дают +3-5 баллов). 🔸Писал про ROGII - Wellbore Geology Prediction и не смог удержаться. Честно говоря, задача простая, но решения, которые уже есть на LB - страшные. Огромные каскады из стакингов всего и вся, типичное соревнование по классике. Попробовал уже в генерацию физических признаков, о чем кстати очень просили организаторы, ничего пока не дает (в терминах LB). Кажется, что самое сложное с точки зрения удержания места соревнование. Плюс public/private поделены в 26/74, поэтому еще смачно полетать успеем. 🔸Безопасность превыше всего AI Agent Security - Multi-Step Tool Attacks Цель классическая для таких соревнований. LLMка хочет, ~~что б я ломал ее полностью~~, что б ее проверили на безопасность, проведя атаку. Я обожаю CTF, взломы и все такое, поэтому не мог пройти мимо. Стойкое ощущение, что из-за моей одержимости испортить жизнь агентам/LLM при сценарии скайнета я буду целью если не нулевой, то первой на устранение😺. Где вы участвуете? Присылайте скрины с LB, медали свежеполученные, обсудим и порадуемся с вами. Агентик может до бронзы долететь, плюс, потенциально верю в силу атаки на агента. Где участвуете? Кидайте скрины лидерборда, ниже ожидаю лютый флекс. #life #соревнования

2 195

Привет всем!👋 🚨Новое соревнование на Kaggle!🚨 На платформе стартовало соревнование ROGII - Wellbore Geology Prediction. Оно было пропущено мной аж с 5 мая.🐱 Для меня это упущение - личная боль: я умудрился пропустить старт соревнования, которое максимально близко лежит к моему профессиональному треку на стыке сложной доменной логики нефтедобычи и классических подходов ML моделирования. Но время у вас все еще есть. 🏆 В чем задача? Задача довольно простая: есть данные телеметрии и радиоанализ породы, информация о фактической скважине. Цель предсказать настоящую вертикальную глубину (True Vertical Depth) пласта. 🗂 Что по данным? Вам дают пространственную траекторию скважины (X, Y, Z), одномерный временной ряд гамма-каротажа (радиоактивность пород) и эталонный вертикальный разрез региона (Typewell).

Много страшных названий, но они отлично известны тем, кто изучает нефтедобычу, поэтому, если вы учитесь по специальности нефтедобычи и хотели попробовать себя в смежной области - лучше соревнования вы не найдете!

💰 Призовые 👀Общий призовой фонд - $50,000. Распределение следующее: 🥇 - $25,000 🥈 - $13,000 🥉 - $7,000 4 место - $5,000 🐱Специальная награда - Working Note Award ($2,500 за лучшие места) для тех, кто напишет самую крутую и физически обоснованную техническую документацию к решению (или хотя бы своей попытке). 🎯 Что по метрике? Метрика соревнования проще некуда - классическое RMSE. 📆 Сроки: 🔸Начало: 5 мая 🔸Конец: 6 августа 🔸Конец регистрации и объединения команд: 30 июля 💻Авторские заметки: Подразумевается, что решение должно быть физически осмысленным и желательно интерпретируемым, а не просто быть слепым блендингом из 100 моделей! А вообще чем больше гипотез именно из доменной области - тем лучше. Тестируйте различные подходы на грани ML и мат.моделирования процесса. #соревнования

2 195

Господа, вы FROM забыли! #fun

2 195

Привет всем!👋 Сегодня хотел бы поговорить про оркестрацию ML пайплайнов. Давайте представим картину: Вы обучили шикарную модель, настроили парсеры и расчеты данных, но тут встает вопрос: как это все запускать, контролировать и не сойти с ума, когда терабайты данных для моделей застрянут на полпути? Тут на сцену выходят два главных дирижера - Apache Airflow и Prefect. Оба автоматизируют ваши процессы, но делают это совершенно по-разному. Немного истории... Airflow - это классика регулярного расчета, рожденная в недрах Airbnb еще в 2014 году. Его создавали в эпоху, когда данные были большими, но предсказуемыми. Главное преимущество подхода Airflow - это тотальный контроль и централизация.

Для работы Airflow требуется заранее описать ориентированный ациклический граф выполняемых задач, так называемый Directed Acyclic Graph.

Это дает невероятную надежность для огромных enterprise-систем: если у вас стабильные ETL-процессы, которые не меняются месяцами, Airflow гарантирует, что все пройдет строго по рельсам. Но за эту монументальность приходится платить: Airflow «тяжеловесен», требует поднятия сложной инфраструктуры вроде планировщика и веб-сервера даже для простых тестов, а передача данных между шагами превращается в пытку, если речь идет о тяжелых датасетах для машинного обучения. - А что если хочется немного гибкости? Из-за этих ограничений в 2018 году и появился Prefect. Его основал Иеремия Лоуин, который сам долгое время был ключевым контрибьютором и членом управляющего комитета Apache Airflow. Он изнутри видел все архитектурные тупики старого подхода и понял, что для эпохи Data Science нужен принципиально иной инструмент.

Главная фишка подхода Prefect - «отрицательное проектирование» (negative engineering).

В подходе Prefect заложена следующая парадигма: ваш код и так работает, зачем заставлять вас переписывать его под жесткие рамки фреймворка? В Prefect вы просто берете свой привычный Python-скрипт, вешаете пару декораторов вроде @task и @flow, и инструмент сам берет на себя оркестрацию, обработку ошибок и логирование. - Где этот подход лучше? Prefect стоит выбрать, если ваша главная ценность - гибкость пайплайна. Он идеален для современных ML-пайплайнов, работы с LLM, генеративным ИИ и частых переобучений моделей, где логика зависит от входящих данных. Вам не нужно разворачивать монструозные сервера, чтобы просто проверить гипотезу - Prefect можно запустить прямо локально или использовать их гибридное облако, которое берет на себя менеджмент, пока сам код выполняется на ваших мощностях. Итого: В итоге мы имеем битву философий: Airflow хорош своей железобетонной, проверенной годами предсказуемостью для классической инженерии данных, а Prefect предлагает полную свободу, динамику и чистый Python-код для тех, кто строит гибкие системы искусственного интеллекта и не хочет тратить половину жизни на написание оберток вокруг инфраструктуры. Используете ли вы где-то Prefect? Делитесь в комментариях👇 По традиции ставим 🔥, если понравилось! #ds_лайфхаки

2 195

Привет всем!👋 Всех с первым днем весны! Пробуем себя на абсолютно новой аудитории - студенты горного института. Буду рассказывать про использование ML в современной добыче горных ископаемых.

Важный дисклеймер: вебинар будет направлен на вводную часть и больше заточен для начинающих.

Выступление будет завтра 02.06 в 14-00 по МСК. Кому интересно, подключайтесь! Подробнее на странице ВУЗа #выступления

2 195

Обязательно зайдите на сайт, там сочная демка!

2 195

Привет всем любителям CV!👋 Недавно мои знакомые выложили в opensource интересную модель. Итак к новости: Команда Avaturn.live выложила в опенсорс AVTR-1 - авторегрессионный flow-matching трансформер, который рендерит видео с виртуальным аватаром в реальном времени. Модель обучена с нуля и заточена под интерактивные диалоги. 💻На вход подаётся фото человека и два аудио-потока: речь самого аватара и речь собеседника. 🐱На выходе видео 25 fps, в котором аватар реалистично говорит и слушает: кивает, держит зрительный контакт, реагирует мимикой. В этом главное отличие от других открытых моделей. Большинство аналогов работают только в липсинк режиме, либо используют закольцованную idle-анимацию, когда аватар слушает. AVTR-1 натренирован на оба режима как на одну задачу. В релиз входят: 🔸веса модели 🔸 инференс-стек, оптимизированный под TensorRT 🔸бэкенд для запуска живой диалоговой сессии end-to-end Насколько известно авторам, это первый публичный опенсорс-релиз, где в комплекте идёт не только модель, но и серверный стек для интерактивной сессии. Академические открытые работы выкладывают только исследовательский кода без production-инфраструктуры. Производительность: 🔸RTX 3070 / 4060 Ti — реал-тайм 🔸A100 / L40 — более чем 2× быстрее реал-тайма То есть большинству AI-энтузиастов хватит обычной игровой карты, чтобы поговорить с аватаром, а не просто посмотреть демо. По бенчмаркам AVTR-1 обходит открытые аналоги. Ссылки ниже⬇️ 💻 https://github.com/avaturn-live/avtr-1 🌐 https://avaturn.live 🤗 https://huggingface.co/avaturn-live/avtr-1 #ds_лайфхаки

2 195

Привет всем! 👋 Возвращаюсь с отчетом по AHA26, которая прошла в пятницу в кластере «Ломоносов»! Прикольная конференция, большое количество докладов, достаточно интересных. Доклады были разнообразные: технические, теоретические и бизнесовые, так что каждый мог найти себе по душе. Были стенды от компаний партнеров и был конкурс, выигрышем в котором были билеты на конференцию матемаркетинг (последнее фото). Нужно было 8 мешками попасть в «лунку» как можно больше раз. 10 человек получают билеты. На удивление, почти ювелирно положил 3/8, по статистике на тот момент никого с результатом больше 2х не было, после уже не интересовался. Лично мне зашел очень сильно доклад Яна Пиле про кластерный подход к А/Б тестированию. Возможно потому, что это очень было похоже на то, чем занимался в Х5. Кстати, про Х5: на конференции выступал мой коллега по команде, Алан Караев, с которым не пересекался лично со времен перехода. К сожалению, ввиду рабочего графика посетить выступление не успел, но умудрился пообщаться лично про «что было дальше». В общем конференция была насыщенная, рад что получилось посетить ее, хоть и не в полном объеме. Ну с другой стороны, чего жаловаться, с рабочим графиком тимлида в пятницу. Вообще повезло, что было хоть пару часов удалось посетить. В общем, конференцией остался доволен! #мероприятия

2 195

Привет всем!👋 Вернулся в рабочий режим из отпуска, вот небольшой фотоотчет. Был в Дагестане🏔, восхитительная природа и вкусная еда🍔. На этой неделе, в пятницу, пойду на конференцию AHA'26. Кто будет офлайн, пишите, пообщаемся. #офтоп

2 195

Yandex ML Challenge — новое соревнование с задачами по ИИ и финалом на Young Con 2026 Кого ждем: Студентов, выпускников и учеников 11-х классов — тех, кто любит решать соревнования по машинному обучению Что нужно знать: На длинном онлайн-туре вас ждут 3 задачи: CV (компьютерное зрение), LLM (большие языковые модели) и RL (обучение с подкреплением). Регистрируйтесь сейчас и приступайте к задачам 21 мая в 16:00 мск Таймлайн: С 21 по 31 мая — длинный онлайн-тур, где определим топ-100 финалистов с самым высоким суммарным рейтингом 25 июня состоится очный финал на Young Con 2026: масштабном фестивале о технологиях и старте карьеры в IT Победителю соревнования достанется приз в размере 1 млн рублей. А топ-15 финалистов получат набор умных устройств от Яндекса. Регистрация открыта

2 195

Привет всем! 👋 Сегодня поговорим про базовые вопросы по SQL. 🐬 Задача довольно распространенная: отдать заказчику выборку, в которой значения модели до исправления чего-то и после различаются. 🛠️ То есть у нас нужно отфильтровать запрос по двум колонкам predict_new и predict_old, которые не равны между собой. По сути, можно сделать:

SELECT * FROM table WHERE predict_old <> predict_new

Но вот незадача! 🚧 Это работает только для неNULL-овых значений. Если в вашем сравнении есть пропуски, то автоматически все ломается. 💥 Давайте разберемся почему? 🤔 В SQL NULL не равен ничему, даже другому NULL. Если вы попытаетесь сравнить что-то с NULL через обычные операторы, результат всегда будет UNKNOWN (что в фильтрах WHERE ведет себя как FALSE). Для решения нужно писать громоздкие условия вроде:

WHERE predict_old <> predict_new OR (predict_old IS NULL AND predict_new IS NOT NULL) OR (predict_old IS NOT NULL AND predict_old IS NULL)

Выглядит страшно, правда? 😱 Тут на помощь приходит конструкция IS DISTINCT FROM. В SQL оператор IS DISTINCT FROM — это, по сути, «безопасная для NULL» версия оператора «не равно» (!= или <>). Его главная задача — корректно обрабатывать значения NULL, которые в стандартной трехзначной логике SQL (True, False, Unknown) часто ведут себя контринтуитивно. Таким образом страшное условие выше для обработки пропусков имеет следующий вид:

SELECT * FROM table WHERE predict_old IS DISTINCT FROM predict_new

Согласитесь, код стал более элегантным?! ✨ По традиции, 🔥, если понравилось! #ds_лайфхаки

2 195

В какое классное время мы живем! Заставил агентов между собой общаться, сам пошел трогать траву. Кстати, я близок к внедрению первых агентов в рисках. С таким может и выступить не грех где-нибудь. Помешал мне это сделать гадкий отпуск. #fun

2 195

Привет всем!👋 Всех с 1 мая! Надеюсь, вы уже в предвкушении теплых деньков, готовитесь во всю отдохнуть на этих коротких неделях. Не так давно, я писал, что мы выиграли Data Galaxy, а вчера мы успешно обналичили командой приз. Приз был потрачен на совместный поход в керлинг🥌. Скажу так, кёрлинг мной был явно недооценен. Когда смотришь его по телевизору, выглядит немного нелепо и достаточно легко. На самом деле, тереть шершавый лед это очень сложно, учитывая что надо прикладывать максимальную силу (т.е давить всем весом), что б растопить лед. Бросать камень очень сложно: чуть-чуть слабее и ты недокинул, твоя команды ненавидит тебя за интенсивное натирание льда, которое должно было помочь камню добраться до зоны. Дал чуть-чуть больше импульса и команда сопровождает камень глазами до аута. По ощущениям, день после сопоставим с восстановлением после очень плотного силового хоккейного матча. #офтоп

2 195

Привет всем!👋 Как и обещал ранее, сегодня расскажу про интересную штуку, о которой, вы вероятно не знали. Как известно, основным способом улучшения нейронных сетей является два основных метода: дообучение уже существующей модели (обучение архитектуры с инициированными ненулевыми весами, полученными ранее) или Transfer Learning (ярким примером является дообучение BERT'ов, где мы обучаем поверх уже существующего эмбеддера полносвязный слой 'голову' на нужный нам таргет). И в целом, я тут вам Америку не открыл. -Но знали ли вы, что аналогичные финты ушами можно проводить с моделями градиентного бустинга? Если нет, то давайте расскажу. Прежде всего я хотел бы ответить на вопрос "а зачем такое надо? ". Нередко, особенно в рисках, например в моделях скоринга, модели имеют схожий домен и таргет, но при этом обучаются и значит используются на разных бизнес сегментах. Если в более крупном сегменте по выручке мы имеем недостаток данных или целевых наблюдений (мало компаний, низкий Default Rate), то тогда мы можем взять наработки более мелкого сегмента и переиспользовать на более крупный, путем дообучения. Глобально, метода дообучения два: у вас имеется базовая модель и имеется базовый скор. Оба имеют свои плюсы и свои минусы. Давайте поподробнее поговорим о них. 🔸🔠🔠🔠🔠🔠🔠🔠 🔠🔠🔠🔠🔠🔠 Это сценарий, когда ранее была использована модель градиентного бустинга и теперь мы можем дообучить ее, технически добавляя деревьев в уже существующий бустинг. 🔠🔠🔠🔠🔠⬇️ ➕Простота вывода. Результат - единая модель бустинга, не требующая дополнительных вызовов базовой модели. ➕Экономия вычислительной мощности. Ваша базовая модель уже с какой-то точностью умеет предсказывать целевую метку, вам не нужно строить модель с нуля. 🔠🔠🔠🔠🔠🔠⬇️ 〰️ Ограничение выбираемой реализации. Дообучая XGBoost, вы получите бустинг, написанный на XGBoost. Другого не дано. 〰️Ограничение базовых параметров. Большинство параметров дерева в бустинге, наследуются от базовой модели.

Интересный факт: В Catboost можно изменять learning_rate, но при этом большинство параметров, включая способ кодирования категориальных признаков, наследуется от базовой модели.

🔠🔠🔠🔠🔠🔠🔠⬇️ 🔸XGBoost:

xgb.train(data=data, xgb_model=old_model)

🔸LightGBM:

lgb.train(train_set=train_new, init_model=old_model)

🔸Catboost:

model.fit(X_new, y_new, init_model=old_model)

🔸🔠🔠🔠🔠🔠🔠🔠 🔠🔠🔠🔠 Это сценарий, когда вместо базовой модели мы получаем на вход предсказания уже готовой модели и строим уже на них модель бустинга, уточняющую предсказание старой модели.

Важно: Предсказания в случае бинарной классификации должны подаваться не в формате предсказаний вероятности, а именно логитов, т.е предсказания до сигмоидального преобразования!

🔠🔠🔠🔠🔠⬇️ ➕Свобода выбора базовой модели. В данной конфигурации мы воспринимаем базовую модель в формате black box, то есть нам не важна ее архитектура. 🔠🔠🔠🔠🔠🔠⬇️ 〰️ Сложность вывода. Базовый скор необходимо откалибровать на выборке дообучения, т.е построить простейшую линейную модель. Также нам необходимо в продовом инференсе использование инференса базовой модели, то нам необходимо реализовать где-то рядом с дообученной моделью вызов базовой модели. 〰️Итоговая модель - не финальная. Основной сложностью данного подхода является то, что дообученная модель дает лишь смещение и для получения итоговой вероятности модели нам нужно смешать скоры базовой и дообученной модели и после этого прогнать через сигмоидальное преобразование. 🔠🔠🔠🔠🔠🔠🔠⬇️ 🔸XGBoost:

xgb.train(data=data, base_margin=init_logits)

🔸LightGBM:

lgb.train(train_set=train_new, init_score=init_score)

🔸Catboost:

model.fit(X_new, y_new, baseline=init_logits)

На этом все, подробнее познакомится с данными техниками призываю самостоятельно, ставь 🔥, если понравилось! #ds_лайфхаки

2 195

Привет всем!👋 Сегодня я к вам с анонсом мероприятия. В конце мая в Москве в седьмой раз пройдет АНА — конференция направленная на тех, кто работает с AI, ML-инженеров, а также продуктовых и data-команд. -Что в программе? ▪️Программа АНА’26 охватывает полный цикл data- и AI-разработки: от MLOps до внедрения LLM в продуктовые сценарии. Отдельные треки посвящены AI-агентам и развитию архитектуры. - А конкретнее? 🔸R&D и экономика масштабирования продуктов 🔸Методы системного снижения стоимости проверки гипотез 🔸Управление ассортиментом и спросом в retail и e-commerce 🔸Архитектура прикладного AI и ML&AI-инженерия 🔸Разработка AI-first продуктов и open source AI-агенты для бизнеса 🔸Data platform и инженерия доверия к данным Среди спикеров представители Lenta Tech, ВкусВилл, Яндекс, Авиасейлс, Сбер, Т‑Банк, X5 Tech, Циан, METRO, Kolesa Group, VK Tech, АвитоТех, Magnit Tech, Лемана ПРО, Faust Consulting, Wildberries, Plevako.ai, MTS Web Services и других компаний. Участников ждут практические кейсы, обмен опытом, обсуждение рабочих инструментов и нетворкинг с экспертами индустрии, которые уже внедряют AI в продукты и процессы. Программа доступна по ссылке. 📍Локация: Москва, кластер Ломоносов 📆 Время: 14 мая (онлайн) и 22 мая (офлайн) 👉 Информация и регистрация по ссылке 👨‍🏫 Формат и стоимость 💰: 🔸Офлайн🕺 39 900 ₽ (включает участие 22 мая, доступ к онлайн-дню 14 мая и записи на 6 месяцев) 🔸Онлайн👨‍🏫 19 900 ₽ (доступ к трансляциям 14 и 22 мая и материалам конференции на 6 месяцев) P.S. Подразумевается, что прямо сегодня вы пойдете заполнять заявку на оплату конференции из бюджета на образование, если такой имеется в вашей компании. Советую идти всей компанией, так как для команд действуют корпоративные скидки от 5% до 10% при покупке от 3 билетов, а также доступен корпоративный онлайн-доступ. #мероприятия

2 195

POV: Тимлид заставляет в такую погоду идти в офис #fun

2 195

Привет всем! 👋 Сегодня рассказывал школьникам из Лицея ВШЭ о классификации и выводе моделей в прод, вернее о том, как работает у нас. Достаточно интересный опыт, особенно когда не очень понимаешь, что они понимают, а что нет. Для меня это был буквально челлендж. Самое интересное, что я понял из данного выступления, что я не понимаю как объяснить школьникам бустинг. Это не студентам рассказывать про антиградиенты, когда человек гарантированно учил их и знает. Еще интереснее показать полную схему работы пайплайна в проде и увидеть в глазах полное не понимание. Привык рассказывать все специалистам или студентам, которые уже трогали или знают как это делать. А тут звучало как челлендж, сделать это понятным на слух. В общем, если думаете что умеете круто выступать и шарите в своей теме, попробуйте провалидировать этот скилл на школьниках. #выступления

2 195

Repost from (sci)Berloga Всех Наук и Технологий

🚀 Серия соревнований по МЛ и научный проект ! Денежный призовой фонд больше 100 000 р и будет расти ! Кому интересен МЛ/RL или математика или пазлы или роботы. Приглашаем Вас принять участие в серии челленджей и развитии научного опен-соурс проекта. Соревнование организуется совместно с учеными лаборатории интеллектуальных технологий робототехники МФТИ, (руководит проектом - Илья Осокин), которые поставили себе амбициозную цель создать робота, который побьет мировой рекорд по сборке Мегаминкса ! Узнать больше о робототехнической части проекта Вы можете в сообщении д.ф.-м.н. А. Арутюнова: https://t.me/forodirchNEWS/3165 , или хабре или чате @starkitmega. Проект CayleyPy предлагает Вам принять участие в решении алгоритмической части задачи - создании алгоритмов - которые смогут получать наиболее короткие (близкие к оптимальным ) решения. Методы решения важны в широком круге проблем от математики до квантовых компьютеров, МЛ/РЛ и теории струн. Для этого мы организовали соревнования на платформе Каггл. ~~Первый~~ Второй разыгрываемый приз - 10 000 рублей. Условия ~~первого~~ второго этапа очень простые. Есть три челленджа на Каггле Мегаминкс https://www.kaggle.com/competitions/cayley-py-megaminx/leaderboard Кубик Рубика 333 https://www.kaggle.com/competitions/cayleypy-ihes-cube Кубик Рубика 444 https://www.kaggle.com/competitions/cayley-py-444-cube Приз будет получен первым, кто достигнет ЛЮБУЮ из целей: 1 Или в конкурсе Мегаминкс - кто достигает скор 75 000 (вы получите 5 000 рублей, 70 000 ещё 5 000 рублей) и опубликует публичное решение. (Первая цель ~~80 000~~ уже достигнута. Приз уйдёт Владу Кузнецову, МФТИ). 2 Или обогнать Томаса Рокицкого в конкурсах по кубику 333 или 444 (любом из них) и тоже опубликовать публичное решение. (Томас Рокицкий - легендарный специалист по вычислительным аспектам головоломок - именно его команда нашла "число Бога" кубика Рубика в 2010 году - подведя итог более 30 годам усилий большого количества специалистов). Подробное описание соревнований -- по ссылкам выше. Кратко: даны 1000 состояний пазлов и Вам надо предъявить их решения -- чем короче решение тем лучше (то есть чем меньше шагов/"мувов"). Score на лидерборде = сумма длин решений по всем пазлам. Соревнования полностью аналогичны соревнованию Каггл Санта 2023 -- можно навайбкодить изменения лучших решений оттуда. Также стоит взять наш подход CayleyPy и изменить в нем образующие на мегаминкс. Это сделали те, кто сейчас в топе. Дополнительную информацию, обсуждение и советы - см. чаты - @starkitmega @sberlogacompete @sberlogasci. Вводные лекции: четверг 19.00, пятница 20.00 (время по Москве). Дополнительным призом будет возможное участие в научных публикациях. Наши цели амбициозны - мы уже добились исключительных результатов, которые имеют приложение в МЛ, математике, теории струн, квантовых вычислениях и т.д. Публикации отмечены NIPS spotlight. Узнать больше Вы можете в наших статьях. Если у Вас есть несколько свободных часов в неделю, знание Питона или математики и Вам интересно принять участие - пишите @alexander_v_c - мы рады всем - начинающим и профи. Планируется серия челленджей и призов. Первый приз уже разыгран, второй объявлен, скоро будут новые объявления -- оставайтесь с нами ! ================ А также мы ищем Cпоносоров. Вы можете поддержать нас переведя на карту Илье Осокину 2202208362030505 Или напишите @alexander_v_c (Александр Червов) И кидайте нам, пожалуйста, звезды на гитхаб, Вы нам очень поможите: https://github.com/cayleypy/cayleypy ================ Выражаем благодарность компании RYBE - толстовки для айтишников: https://rybe.store https://t.me/rybe_store ================ Выражаем благодарность агентству BLASTIM за поддержку: ❤️ Наши курсы: agency.blastim.ru 🥨 Свежие вакансии в биотехе: blastim.ru 🤝 https://t.me/blastim