Запрети мне псевдолейблить

الذهاب إلى القناة على Telegram

Канал о пути к Kaggle competitions (теперь уже) GrandMaster и поте, которым обливаешься в процессе Последний авторский канал про мл, претендующий на искренность и позволяющий ставить клоунов Для контакта пишите в сообщения канала, они бесплатные

إظهار المزيد

روسيا139 779 ألعاب19 282

3 777

المشتركون

+3124 ساعات

+1687 أيام

+36230 أيام

2 861

عرض المشاهدات

~ 2 09424 ساعات

~ 2 35048 ساعات

75.81%

معدل المشاركة

لا توجد بيانات

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

3 777

В этом хакатоне почему-то упор на распознаване структуры сценария и сцены, но мне очень нравятся оставшиеся две задачи: Автоцензор- вычленить из текста то, что не подходит определенным возрастным группам и подстветить, что мешает маркировать фильм 12+ например. Думаю если грамотно решить саму проблему- то будет меньше случаев, когда классная идея погибает из-за того, что расчитывали на один рейтинг, а получили другой. Надеюсь будет доступно хотя бы как сервис 'Антиплагиат' в будущем, чтобы если не побороть, то хотя бы сделать регулятор прозрачным. Вторая интересная на мой взгляд задача- это раскадровки. У серьезного кино на этапе проработки сначала строятся раскадровки и фильм становится техническим комиксом, а потом уже люди снимают по этим заготовкам сами игровые сцены. Если получится автоматизировать этот процесс- надеюсь появится больше креативных операторских решений, позволяющих выразить именно то, что задумал сценарист/продюсер.

3 777

На хакатоне Wink AI Challenge участников ждут задачи, которые ускорят производство фильмов и сериалов за счёт прикладных AI-решений. Призовой фонд — 1 125 000 рублей. 🗓 Регистрация на платформе Codenrock до 31 октября ML-инженеры, backend- и frontend-разработчики, DevOps, MLOps и мультимедиа-инженеры — ваш выход. Алгоритм такой: → Получи настоящий сценарий кинофильма. → Распознай персонажей и локации с помощью NER и NLP-моделей. → Разработай ИИ-сервис, который умеет интерпретировать сценарий и предлагать оптимальные решения для киноиндустрии. Задачи хакатона: 🔸 Построй модель зависимости между сценами и структурируй сценарий. 🔸 Преврати текст в эскизы с помощью text-to-image для создания превизуализации сценария. 🔸 Создай решение, которое классифицирует контент и находит сцены, влияющие на возрастной рейтинг. Регистрируйся на первый в России хакатон по применению ИИ в кинопроизводстве и разработай решение, которое станет частью создания фильмов и сериалов: https://cnrlink.com/winkaichallengepseudo

3 777

Мои друзья из White Circle делают единственный в мире прибыльный стартап по AI safety и ищут инженеров. Ребята, вероятно, лучшие в мире по RL-ингу, чтобы одни модели редтимили (ломали) другие. Фан факт: их СЕО когда-то учился в ФКН ВШЭ на курсе где я преподавал. Оказалось хорошей нетворкинговой стратегией переподавать там где студенты умнее тебя. В общем, лично знаю ребят и могу ручаться. Важно: нужно много работать. Зато готовы платить 80 - 150k USD. Вакансии: 1. FullStack Engineer Typescript, React, Nextjs, Nodejs, Tailwind, GraphQL, ClickHouse 2. AI Engineer MoE, multimodality (audio / images), Megatron, distributed training, Triton 3. AI Engineer Redteaming, agents, rlhf - если у вас нет опыта на mle, но есть опыт swe и построения всякого промптового - позиция для вас 📨 CV → https://docs.google.com/forms/d/e/1FAIpQLSftxgbzzz2xz5ng0tYqiuGfuMtTRJYX0W2IgL8dhu9RHgBBhw/viewform (текст в скобках удалить, репост ваших мемов про доту и 15 рублей поступят на указанный счет)

3 777

1! (ОДИН САБМИТ)

3 777

Думайте

3 777

Челлендж для тру гранд-мастеров- влететь в золото с решением на COBOL Думаю под силу только @abacabadabacaba404

3 777

Пожалуйста подпишитесь на меня, пожалуйста пожалуйста пожалуйста (Текст не редактировать, информацию в скобках удалить. От имени своего канала опубликовать в каналах Сиолошная, Борис Опять, Денис секси айти, ОБЯЗАТЕЛЬНО ДАТА СИКРЕТС, Время Валеры. 2 подписчика будут зачислены на ваш счет в течение двух часов)

3 777

9 место в NeurIPS - Ariel Data Challenge 2025 Два грандмастера, а именно Dieter и CPMP. Два чела, которые получают зп за то, что решают кагл. СPMP буквально Director competitive ML, а Dieter это текущий топ 2 на платформе и бывший топ 1. Прерпроцессинг довольно обычный: 1. Взяли топ паблик препроцессинг, сделанный на основе кода организаторов 2. Добавили к нему фильтр на космические лучи (выборсы по сигналу сразу на нескольких частотах), тоже из паблик кернела. Кстати паблик кернела победителя этой соревы. 3. Починили баг, который допустили организаторы во время кодирования данных из 3D (высота x ширина x время) в 2D (сигнал x время) 4. Отцентрировали сигнал, откинув 'бесполезные' края транзитов экзопланет 5. У оригинального детектора, который снимал 3D данные было большое разрешение, но из-за того, что звезда всегда в центре, почти все выкидывали 'темные' пиксели, потому что в них мало информации да и организаторы в своем бейзлайне так делают. Грандмастера хитро посмотрели на распределение того, где есть светимость, а где нет, и сделали чуть более умное маскирование (схема на картинке) Дальше уже был дата саенс: 1. Взяли детектор транзитов из паблик кернела и им разделили данные на фазы транзита 2. Для краев транзита использовали полином второй степени, чтобы предсказать тренд светимости звезды отдельно от планеты и его вычитать как offset 3. Использовали Бетмен-модель Bad-Ass Transit Model cAlculatioN, чтобы с помощью нее определить размер планет и звезд 4. Ту же модель зафитили на данные только с FGS детектора 5. Ту же модель зафитили для бинаризованных на 18 частот данных 6. На бинаризованных данных зафитили еще и Gaussian Process, чтобы шум пофильтровать и дополнительно сгладить выбросы Ну и постпроцессинг: 1. MLP, который все это дело приводил к единой размерности и стакал 2. Еще один MLP, который калибровал результаты И все, вот оно 9 место. Судя по активности на лб, которую мы наблюдали- мужчины не особо кранчили, зашли отметились просто.

3 777

Кагл прогрессия для самых маленьких

3 777

Кстати, Lux 4 быть. Есть желающие начать готовиться заранее и настраиваться на победу? В прошлый раз эксперименты топ 1 команды занимали по 12 дней обучения, так что соревнование ML-Heavy. План подготовки примерно такой: 1. Рекапнем вместе курс Stanford по RL 2. Поразбираем глубоко решения прошлого года и попишем свои Цель: лейт сабмишн бота, который побьет топ 1 прошлого года. Мб даже железо проспонсирую на тренировку. Пишите в лс канала, если хотите поучаствовать, ставтье клоунов если нет Разбор и сетап прошлого Lux 3 стоит смотреть примерно отсюда

3 777

Звезды, экзопланеты, два детектора #ArielDataChallenge2025 Челлендж посвящен поиску экзопланет у звезд которые мы в состоянии наблюдать почти напрямую и определению состава атмосферы этих экзопланет. По атмосфере планеты можно начать подозревать наличие там жизни и вообще оценить ее пригодность для переселений туда людей. Организатором является Имперский колледж Лондона, так что переселение кого-нибудь куда-нибудь подальше стоит довольно остро и является актуальной. В этом году сетап соревнования похож на предыдущий: 0. Все данные симулированы физической моделью. 1. Есть звезда и у нее гарантировано есть экзопланета. 2. Есть два детектора, каждый из которых направлен на звезду и измеряет спектр этой звезды во времени. Звезда далеко, так что до нас долетают считанные фотоны. Из срабатывания ячеек детекторов мы можем сформировать картинку звезды 30x30 пикселей в каждый момент времени (на картинке). Иногда долетает слишком много фотонов и пикcели перегреваются. Суммарно наши детекторы дают нам 283 канала наблюдения звезды по 900 пикселям каждый. 3. Когда экзопланета ‘загораживает’ нам звезду, мы наблюдаем (или не особо) падение светимости звезды. По этому изменению светимости надо определить спектрограмму состава планеты, которая, сюрприз-сюрприз составляет 283 значения. Из отличий этого года: 1. Теперь у нас у каждой планеты уникальная звезда. В прошлый раз у нас на все планеты были даны всего две уникальные звезды с уникальными спектрами светимости. 2. Физическую модель привели еще больше к реальной физике. Если в прошлый раз у нас затмение иммитировалось как ‘мимо круга пролетает квадрат’, то теперь у нас теперь симмуляция строится на двух кругах. Это отражается в данных как скругленное дно транзита (на картинке). А еще добавили новых видов шума, которые делают симуляцию более похожей на реальные данные. 3. Добавили новых атмосферных прототипов. Это условные коричневые карлики, газовые/ледяные гиганты, каменистые планеты почти без атмосферы и тд. 4. Теперь для некоторых планет доступны несколько наблюдений транзитов, которые возможно хитро предобработать и уточнить свои предикты Как решать будете? Ответы как всегда на @pseudolabeling

3 777

Сильно, но хитро поднялись на прайвете. Риск был калькулированный, была интуиция что минимум четверо из золотой зоны резко опустятся, но не было уверенности, что это будем не мы. Стало быть, второе золото нафармлено, взят второй ариел в ряд и третий год подряд будет invited talk на neuralIPS от вашего любимого блогера. Честно скажу, без команды ничего бы не вышло. На 5 месте кстати наш ВМКшный коллега, который вообще через физику решал соревнование. Выложат райтапы- разберу вам самое лучшее с этого года. Эмодзи клоуна доступна, мб этим постом обновим предыдущией рекорд в 39 штук

3 777

Последний сабмит в соревнование сделал. Молимся Горку и Морку о удачном броске вверх и ждем ночной прокрас прайвета. Вы можете присоединиться ко мне, а можете поставить клоунов, не помню как вам там больше нравится

3 777

Ну раз H1b больше не получишь, придется вам тоже фармить кгм и надеяться получить о1 визу

3 777

Repost from Information Retriever

RecSys Challenge 2025. Я уже рассказывал, что в этом году мы заняли четвертое место на RecSys Challenge. В июле подали статью на воркшоп соревнования, который проходит на самой конфе RecSys. Статью приняли! Мы доделали camera-ready версию, и с сегодняшнего дня подробное описание нашего решения можно почитать на arXiv. От ревьюверов есть strong accept и комментарий “goldmine of practical insights” :) Пригодится как разработчикам рексистем, так и участникам всевозможных соревнований по рекомендашкам. Ссылочка — https://arxiv.org/abs/2508.06970

3 777

Еще немножко соревновательного контента

3 777

E-CUP возвращается. Реальные данные. Масштабные проекты. Большие призы E-CUP 2025 — соревнование, где Everything as code. Решай ML-задачи в стиле Ozon Tech. Призовой фонд — 7 200 000 рублей 🔥 🗓 Регистрация: https://cnrlink.com/ecup25pseudolabel 💻 Формат участия: онлайн 👥 Команда: от 1 до 5 человек 🎯 Для кого: Data Scientists, ML-специалисты, аналитики данных, дата-инженеры, специалисты Big Data и разработчики, которые интересуются ML/DS. Что вас ждёт: 🔹 Работа над проектом для миллионов пользователей на основе данных от ведущего e-com в России. 🔹 Призовой фонд — 7 200 000 рублей для девяти сильнейших команд. 🔹 Обмен опытом с экспертами Ozon Tech. 🔹 Эксклюзивный мерч и подарки. 🔹 Питчинг — онлайн или очно на конференции E-CODE. Финалистам Ozon Tech предоставит билеты и оплатит поездку. Регистрация открыта до 17 августа включительно

3 777

А я думал что вот это было грязно

3 777

Пока я мало пишу в канал про свои соревнования, позволю себе украсть вдохновение у @abacabadabacaba404 и предложить вам почитать классный блогпост про КФ. Автор дважды брал золото IOI и в этом году взял серебро: https://codeforces.com/blog/entry/142591 Отправьте своим школьникам и первокурсникам, если они хотят быть лучшими