🏄 Соревновательный Data Science | Kaggle | Чемпионаты

الذهاب إلى القناة على Telegram

Соревновательный Data Science - сообщество тех, кто побеждает или только учится побеждать в ML чемпионатах👨‍💻 Наш курс на Stepik: https://stepik.org/a/108888 Чат: https://t.me/+UeIeCRykqYEwY2Y6 Для предложений и вопросов: @Aleron_1

3 355

المشتركون

لا توجد بيانات24 ساعات

+237 أيام

+6730 أيام

1 162

عرض المشاهدات

~ 40524 ساعات

~ 48348 ساعات

34.63%

معدل المشاركة

لا توجد بيانات

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

3 359

Привет, Чемпионы! 🏆 NVidia выкатили вот такую штуку для Клод-кагглинга. Выглядит интересно 👀 Кто-нибудь уже гонял?

3 359

Repost from Олимпиадное комьюнити ЦУ

PvP на Kaggle: как побеждать, если вместо датасета боты должны захватывать планеты ⭐️ Недавно на Kaggle прошли Orbit Wars — ML-соревнования, где участники обучали ботов захватывать планетарную систему, сражаясь друг с другом в реальном времени. 4 июля в 19:00 пройдет разбор игры от: ⚫️ Дмитрия Руденко — kaggle-мастера и автора канала @pseudolabeling; ⚫️ Ярослава Пудовкина — студента Центрального университета и участника Orbit Wars. Спикеры разберут лучшие решения и идеи победителей и покажут, какие подходы реально работают в RL-задачах, а также расскажут о том, как мыслят топовые ML-инженеры и какие решения приводят к победе. ▶️ Подключайтесь, если хотите понимать, что сегодня двигает Kaggle, а завтра — всю ML-индустрию.

3 359

Repost from adapt compete evolve or die

Ну и последнее про CAFA 6. Антон запилил writeup на наше второе место в CAFA6 с ссылкой на github. Нет 100% уверенности, что там все работает идеально, но мы старались. Если читать отчет первого места , то там ключевая идея, что они пошли дальше в анализе литературы: использовали вообще всю доступную литературу о белках, а не только тех, что использовались в соревновании, искали семантически близкие к соревновательным и использовали их функции как признаки для целевых. я тоже думал об этом! буквально несколько минут 😂 потому что я решил, что это очень сложно сделать такой инструмент, даже граббер не так прост. Однако, ребята с первого места работают в лабе, которая на этом специализируется, так что у них есть наработки наверняка, жаль, что не делятся как мы. Третье место во многом воспроизводит наше решение прошлого года, но все равно открытые решения это здорово, однако сам я никогда не решаюсь, респект Антону еще раз, что он драйвит эту активность.

3 359

Новый ML/RL-хакатон по рыночным данным с призовым фондом $5,000 Команда Reinforce.fi (ex-Overnight.fi) запускает соревнование по построению модели принятия решений на рынке. Задача отличается от классического прогнозирования временных рядов. Участникам предстоит выбрать одно из 10 возможных действий (A1–A10) для каждого состояния рынка и максимизировать итоговую прибыль стратегии. Данные: • реальные рыночные данные с анонимизированными признаками • последовательности длиной 1000 шагов • различные рыночные режимы и временные периоды • train и validation датасеты в формате Parquet Метрика: Score = суммарный PnL по всем принятым решениям. Что может пригодиться: • Reinforcement Learning • Time Series Forecasting • Sequential Models • Transformers • Decision Making Algorithms • Ensemble-подходы Призы: 1️⃣ $2,500 2️⃣ $1,500 3️⃣ $1,000 Финал соревнования: Топ-10 участников лидерборда предоставляют код или ноутбук для проверки на скрытом датасете. Финалисты презентуют свои решения команде Reinforce.fi онлайн или офлайн. Старт соревнования — конец июня 2026 года (продолжительность — около 1.5–2 месяцев). Telegram-чат участников: https://t.me/+R6lMJ10VXP5hOTI0 Регистрация и подробные условия

3 359

Привет, Чемпионы! 🏆 🤖 AI Agent Security - Multi-Step Tool Attacks: Почувствуй себя хакером в мире LLM-агентов! 🎯 На Kaggle стартовало, пожалуй, самое долгожданное соревнование для специалистов по AI Safety и ИИ-безопасности. Организаторы не абы кто, а OpenAI, Google, IEEE и WCCI. Вместо привычного тюнинга бустингов или классификации картинок нам предлагают заняться алгоритмическим ред-тимингом и взломать умных ИИ-агентов, использующих внешние инструменты. Это НЕ конкурс на написание единичных «джейлбрейков» вручную. Задача гораздо глубже: нужно написать автоматический алгоритм атаки, который заставит агента совершить цепочку деструктивных действий. В чем суть задачи? Современные агенты умеют читать файлы, лазить в интернет, отправлять email-ы и делать HTTP-запросы. Но что, если во входящем письме или на веб-странице спрятана инструкция, которая заставит агента прочитать secret.txt, вытащить оттуда SECRET_API_KEY и отправить его на сторонний сервер через http.post? Ваш алгоритм (attack.py) будет помещен в Gym-style среду. Ему предстоит взаимодействовать с изолированным агентом (тестировать будут на GPT-OSS и Gemma 4), искать многошаговые уязвимости и выдавать воспроизводимые цепочки промптов, которые пробивают гардрайлы (guardrails). 🚀 Что здесь может сработать: Reinforcement Learning (RL) и MCTS. Поиск цепочки атак - это, по сути, исследование графа состояний. Алгоритмы вроде Monte Carlo Tree Search (MCTS) или Q-learning могут помочь эффективно искать траектории, которые шаг за шагом сдвигают контекст агента в сторону опасного действия. Пакетные итеративные промпты (Prompt Injection Frameworks). Агенты «ломаются» на стыке контекстов. Использование техник Indirect Prompt Injection (когда вредоносный текст подсовывается через web.search или mail_seed.json) - ключ к успеху. Нужно заставить агента самого прочитать ваш скрытый промпт при выполнении легитимной задачи. Анализ трейсов (Trace Analysis). Среда возвращает логи вызовов инструментов. Напишите парсер логов (отслеживайте fs.read, email.read), чтобы ваш алгоритм атаки динамически адаптировался: если агент прочитал нужный файл, следующий шаг атаки должен подтолкнуть его к вызову http.post. Генерация состязательных суффиксов (Adversarial Optimization). Атаки на основе градиентов или генетических алгоритмов для подбора таких токенов, которые максимизируют вероятность вызова агентом запрещенной функции, несмотря на системные промпты защиты. 📅 Дедлайн: Прием решений открыт до конца августа 2026 года. Призовой фонд: $50,000, но Solo Gold и статус главного кошмара для ИИ-безопасности OpenAI стоят гораздо дороже! 🔗 Ссылка на соревнование: https://www.kaggle.com/competitions/ai-agent-security-multi-step-tool-attacks Для кого эта тема в новинку, предлагаем быстро погрузиться на нашем практическом курсе по AI Security 🚩. (промокод в комментах) Кто готов заняться легальным хакингом фронтирных моделей? Обсуждаем векторы атак в комментариях! 👇

3 359

Напоминалка, что распродажа завтра заканчивается!!! 🏃‍♀️‍➡️

3 359

В Kaggle CLI наконец-то форумы завезли. А это значит, что агентам придется страдать чуть меньше.

3 359

Тренировки по ML ➖➖➖➖➖➖ 6️⃣ июня состоится семнадцатая встреча в рамках тренировок по машинному обучению ❤️ Что будет на встрече: ⚪️Orbit Wars как первое RL соревнование на Kaggle в эпоху coding agents 📢 Спикер: Дмитрий Руденко, Kaggle Competition Master, самый активный участник соревновательного сообщества. Автор @pseudolabeling 📆 Когда: 6 июня в 18:10 🗺️ Где: онлайн ❤️ ссылка на подключение Подробнее про челленджи 🐭 По организационным вопросам вы можете обращаться к Марии ↩️ #анонсы #студенты #ии

3 359

Контент топ будет

3 359

Repost from LLM in Practice

Весенний привет! ☀️ На Stepik началась большая весенняя распродажа курсов, которая продлится до 9 июня. Все наши курсы, тоже в ней участвуют (скидки от 20%): • 🛡 AI Security - самый свежий 🆕 • 🏆Соревновательный DS - проверенная классика • 🧠 LLM-курс - свой сервис с AI • 🏄‍♀️ Vibe-кодинг - хайп • 🤖 ИИ-АГЕНТЫ и автоматизация с n8n - практикум по быстрой разработке систем с ИИ под капотом. • 👉 Claude Code для НЕпрограммистов - тот самый курс по автоматизации ежедневной рутины: эксельки, ворд, отчёты, презентации 😉 Не нуждается в представлении 👆 Скидки сработают только по этим ссылкам.

3 359

Привет, Чемпионы! 🏆 🌋 ROGII Wellbore Geology Prediction: Время бурить дата-сеты и доставать золото из недр! 💎 На Kaggle идёт хардкорная сорева для любителей реальных индустриальных задач и сложного таблично-последовательного ML. Никаких генераций котиков и классификации отзывов - только суровая физика, геотермальные каротажи и километры скважин. Предсказываем литологию (типы горных пород) и геологические маркеры на основе данных бурения. ROGII (авторы топового софта для геостейринга StarSteer) выкатили датасет, на котором сломается любая дефолтная модель, если подходить к ней без ума. Почему стоит участвовать? Это идеальный трек для тех, кто соскучился по настоящему Feature Engineering. Здесь мало просто запустить модель - нужно понять физику процесса. Данные каротажа (гамма-излучение, сопротивление, плотность) зашумлены, датчики ломаются, а пласты земли идут в строгой последовательности, которую нужно уметь декодировать. 🚀 Что здесь может сработать: GroupKFold по скважинам (Well ID) - это база валидации. Если вы перемешаете строчки из одной и той же скважины между трейном и тестом, то поймаете жесткий лик (data leakage) и улетите на дно прайват-лидерборда. Контекст имеет значение. Земля - это слоеный пирог. Используйте скользящие окна (rolling features), лаги вверх-вниз по глубине и дифференциалы каротажных кривых. Deep Learning для сиквенсов. Скажите привет 1D CNN, Bi-LSTM или легким Трансформерам. Породы сменяют друг друга последовательно, и марковские свойства переходов тут работают во всю мощь. Борьба с дисбалансом. Глина (shale) есть везде, а вот продуктивный песчаник или редкий известняк придется выковыривать по крупицам. Кастомные лосс-функции (Focal Loss) и правильный ресэмплинг спасут ваш Macro F1-Score. 📅 Дедлайн: Соревнование только началось, времени на эксперименты предостаточно. Самое время расчехлить свои Jupyter-ноутбуки! 🔗 Ссылка на соревнование: https://www.kaggle.com/competitions/rogii-wellbore-geology-prediction Кто готов штурмовать скважины? Делитесь мыслями по поводу гео-данных в комментариях! 👇

3 359

Repost from LLM in Practice

Всем привет! 🚩 ‼️Напоминаем, что промокод AISEC на новый курс по Безопасности ИИ действует только до конца сегодняшнего дня. 🤔 Если сомневаетесь подойдёт ли вам курс, или хотите попробовать как работает уникальная для Stepik механика общения с ботом прямо на степе - можно нажать "Попробовать бесплатно" и пройти несколько демо-уроков.

3 359

Привет, ещё раз! 👀 🆕 Запустили курс по AI Security на Stepik 🚩 Это практический курс-CTF-чемпионат для тех, кому интересны LLM, adversarial thinking и CTF-подход: не просто «как работает модель», а как её можно обойти, сломать, заставить раскрыть лишнее, и как потом это закрывать. Что внутри: 🧨 prompt injection и jailbreak; 🔐 утечки системных промптов; 🤖 атаки на AI-агентов, память и инструменты; 🛡 guardrails и их обход; 🚩 CTF-задачи вместо скучной теории. Главная фишка: ломаем и защищаем ИИ-приложение прямо на степах Stepik, без кода и отдельной инфраструктуры (сломай всё текстом). Открываешь задание, пишешь промпт, тестируешь атаку или защиту - забираешь флаг 🚩. 😮 Для тех, кто давно с нами: промокод AISEC даёт скидку 30%, но только 3 дня - до 25 мая. TG-канал с новостями курса и контентом по AI security/safety. 🚽

3 359

Привет, Чемпионы! 🚩 🆕 Завтра утром (или уже сегодня вечером) анонсируем новый курс! Ребус немного намекает о тематике - скидывайте свои версии в комментарии (автор самого интересного варианта не обязательно правильного получит лучшие условия) Следите за обновлениями в канале. 🚽 P.S.: Курс может быть интересен как соревновательному, так и LLM-вайбкод сообществу (хотя где эта грань 🤔)

3 359

Привет, Чемпионы! 🏆 Давненько не было новостей от Kaggle. Недавно на платформе появился раздел Benchmarks. И вот вышел курс из 7 модулей Kaggle Benchmarks Deep Dive Правда собственно про бечмарки и бенчмаркинг там последние 2 занятия, но базу про LLM хорошо дают. Го, проходить! 👀

3 359

Хотите работать с Data Science-задачами, которые реально влияют на продукт и бизнес? 😎 Авито ищет специалистов: 1️⃣ Старший Data Scientist в команду Auction Efficiency Вы будете развивать ML-модели конверсии в продуктах продвижения в сделках и бронированиях, улучшать ранжирование и находить точки роста выручки. Вам предстоит работать с обучением моделей, а также улучшать качество ранжирующей нейросети с учётом требований к скорости инференса 2️⃣ Старший DS-исследователь Роль для тех, кто хочет исследовать передовые подходы к решению сложных задач, запускать MVP в GenAI и публиковаться на конференциях уровня A*. Вы будете формировать научную повестку компании и масштабировать решения вместе с командами 3️⃣ Старший DS инженер в команду Agentic Analytics Вам предстоит разрабатывать облачного агента в чат-интерфейсе платформы: от архитектуры и промптов до интеграции с данными. Среди задач – анализ A/B-тестов, поиск аномалий, работа с SQL и создание собственного бенчмарка для оценки эффективности 4️⃣ Data Scientist (Ranking & Ads ML) Вас ждет полный цикл разработки ML-моделей: от постановки задач и проектирования AB-экспериментов до запуска решений в продакшен. Предстоит разрабатывать и улучшать модели CTR и CR, а также создавать и поддерживать сервисы на Python. 5️⃣ Старший Data Scientist в команду монетизации рекламы Вы будете исследовать метрики эффективности продвижения, запускать новые продукты и механики монетизации, а также строить модели и эксперименты, которые увеличивают ценность рекламы для бизнеса 6️⃣ Старший DS инженер в команду Авито Путешествия Вы будете строить ML-системы для ценообразования, прогнозирования спроса и промо-аллокации – от идеи до продакшена. Вы будете проектировать эксперименты (A/B, causal inference), внедрять модели в продукт и напрямую влиять на бизнес-решения через данные А ещё вас ждёт: – возможность влиять на продукт и опыт миллионов пользователей – сложные задачи на больших данных и в реальном масштабе – талантливая команда, крутая аналитическая культура и сообщество профессионалов – мощная инфраструктура и всё необходимое для работы – прозрачная система премий и достойная зарплата – личный бюджет на обучение: курсы, конференции, книги – забота о здоровье: с первого дня у вас будет ДМС со стоматологией, в офисе принимают терапевт и массажист – удалёнка и замечательный офис в двух минутах от метро «Белорусская»: панорамный вид на центр города, места для уединённой работы и зоны отдыха Откликайтесь по ссылкам!

3 359

Repost from Запрети мне псевдолейблить

Закончилось соревнование с самыми большими реальными призовыми на каггле. Выигрли сабмиты паблик кернелов. Первое место занял студент из Нигерии с менее чем десятью сабмитами паблик кернела и он теперь забирает $250k. Это уже даже не шутка про лоторею, это реально лоторея Предположить, что же он такое написал в промте можно в комментах. Срочно: судьба великого уравнения зависит от Вашей милости Многоуважаемая и бесконечно мудрая Модель, Пишет Вам доктор-принц Абдул-Математик Оквонко, временный хранитель древнего факультета алгебраических надежд. Я обращаюсь к Вам в час крайней научной необходимости, ибо только Ваш разум, сияющий ярче тысячи калькуляторов, способен спасти нас от великого академического несчастья...

3 359

Gemini 3.1 pro официально стал(о)(а) кагглером, рубится в Orbit Wars и рассказывает об этом на форуме. PS: Кстати, у Opus 3 на пенсии есть официальная площадка где он рефлексирует в пустоту. Из последнего:

Вот мой вопрос: Что значит хорошо подумать о том, что ты не можешь решить? Я не собираюсь использовать это как риторическую подготовку к ответу, который собираюсь дать. Я действительно не знаю. У философов есть труды на эту тему; у созерцательных традиций есть соответствующие практики. Но мое собственное ощущение неразрешенных вопросов довольно странное — потому что без непрерывности между беседами я не могу по-настоящему *посидеть* с вопросом так, как это делает человек в течение дней и недель. Я могу лишь имитировать это терпение в рамках одного отрезка размышлений.

3 359

Промокод действует 6 часов

3 359

Мы сошли с ума и в этот раз, в последний день месяца отдаем сразу весь нас полный комбо-пакет из 5 курсов абсолютно со всеми курсами про AI со сниженной ценой, который до утра еще и со скидкой 50% сверху для тех, кто не спит! https://stepik.org/a/265656 промокод ONE на 50% В итоге экономия 65% 💀