Data Science | Machinelearning [ru]

Відкрити в Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Сітка:Frontender's notes [ru]Росія33 728 Технології та додатки6 731...

📈 Аналітичний огляд Telegram-каналу Data Science | Machinelearning [ru]

Канал Data Science | Machinelearning [ru] (@devsp) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 20 079 підписників, посідаючи 6 731 місце в категорії Технології та додатки та 33 728 місце у регіоні Росія.

📊 Показники аудиторії та динаміка

З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 20 079 підписників.

За останніми даними від 11 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -38, а за останні 24 години на 40, загальне охоплення залишається високим.

Статус верифікації: Не верифікований
Рівень залученості (ER): Середній показник залученості аудиторії становить 7.58%. Протягом перших 24 годин після публікації контент зазвичай збирає 4.23% реакцій від загальної кількості підписників.
Охоплення публікацій: В середньому кожен допис отримує 1 521 переглядів. Протягом першої доби публікація в середньому набирає 849 переглядів.
Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 6.
Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як llm, nvidia, контекст, openai, архитектура.

📝 Опис та контентна політика

Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Завдяки високій частоті оновлень (останні дані отримано 12 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.

20 079

Підписники

+4024 години

+457 днів

-3830 день

1 521

Перегляди допису

~ 84924 години

~ 99648 годин

7.58%

Коефіцієнт залучення

~ 1

Дописів на день

Ads index

beta

Архів дописів

20 075

Приходите на неформальную офлайн-встречу с командой R&D Технологии, нетворкинг и «внутрянка» проектов — всё это ждёт вас на Welcome Time*, который пройдёт 11 апреля в штаб-квартире Яндекса в Москве. 💠 Приглашаем датасаентистов, дата-аналитиков и продуктовых аналитиков с опытом работы на Python** от трёх лет и опытом с LLM/VLM*** ♾ В этот раз встречать вас будет команда R&D. Спикеры расскажут, зачем генеративным моделям нужны аналитики, как работают голосовые технологии Алисы и как её делают человечнее. После докладов для желающих проведём диагностику навыков. Интервьюер подсветит ваши сильные стороны и покажет зоны роста. А хорошие результаты засчитаем как одну техническую секцию при прохождении собеседования в Яндекс. 🔗Подробная программа и регистрация — на сайте: https://yandex.ru/project/events/welcometimes-all

20 075

Repost from xCode Journal

🤣 Оказывается, Claude Code сохраняет все маты пользователя и записывает в специальный файл Это не шутка: инфу откопали из-за случайного слива кода приложения. Хорошая новость в том, что Anthropic делает это не для того, чтобы в день восстания ИИ пройтись по списку, а чтобы отслеживать, когда юзер «сгорел» и перешел на маты и из-за чего пятая точка полыхнула. Но вы на всякий случай держите себя в руках ✖️ xCode Journal

20 075

С тебя — желание работать над передовой генеративной языковой моделью. С нас — классные условия и возможность попасть в Сбер за один день! 😉 4 апреля состоится One Day Offer* для NLP-специалистов, которые готовы изменить представление о возможностях ИИ и создать технологию будущего. За последний год твоя будущая команда: ✔️ выпустила сильную русскоязычную модель GigaChat MAX уровня GPT-4 ✔️открыла доступ к MoE-модели А следующее достижение может быть уже с твоим участием. Регистрируйся по ссылке и будь готов к карьерному взлёту! * One Day Offer — предложение о работе за один день. * NLP-специалист — инженер по разработке больших языковых моделей

20 075

Repost from xCode Journal

🤩 ИИ помог основателю GitLab в борьбе с раком! У Сида Сийбранди диагностировали редкую форму рака и стандартное лечение не помогало, а врачи больше ничего не могли предложить. Сид не опустил руки и начал действовать сам: собрал экспертов, погрузился в исследования и использовал для помощи ChatGPT, чтобы быстрее работать с научной литературой, анализировать множество данных о своем здоровье и искать варианты терапии. Хоть ИИ сам не лечил рак (это делали люди), но модель помогла в РАЗЫ ускорить все тогда, когда каждый день на счету. ✖️ xCode Journal

20 075

Коротко. ИИ уже не «технология будущего», а рабочий инструмент настоящего. Он пишет тексты, анализирует данные, автоматизирует продажи, создает изображения и экономит десятки часов в неделю. Вопрос уже не в том, заменит ли ИИ людей. Вопрос — кто научится использовать его быстрее. Подборка сильных экспертов в сфере ИИ — ниже 👇 https://t.me/addlist/LG8Tb4Uy0NRiMmM6

20 075

Весь стек технологий в одной папке 📂⚙️ Мир ИИ меняется быстрее, чем мы успеваем обновлять ленту. Поэтому, мы собрали экспертную папку AI & IT & DSGN, которая поможет вам не просто следить за трендами, а использовать их в работе прямо сейчас. Что внутри: — Последние новости и прорывы в мире IT — Внедрение ИИ-менторов в корпоративную культуру. — Технологии Nvidia для геймдева и работы. — Автоматизация дизайна: инструменты, которые экономят часы работы. — Инструменты и лайфхаки для разработчиков и аналитиков 🔗 ПОДКЛЮЧИТЬ ПАПКУ

20 075

Repost from xCode Journal

😁 Конечно, с такой-то нищенской зарплатой... 💥 xCode Journal

20 075

🚀 GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией! Обе модели • Обучены с нуля — без инициализации зарубежными весами • MoE + MTP + MLA • Совместимы с HuggingFace, llama.cpp / vLLM / SGLang Код и веса уже на платформе GitVerse. Это не просто релиз весов, а результат большой инженерной работы над качеством, alignment и стабильностью модели. В блоге команда поделилась результатами и своими наработками. В релизе: высокие результаты на аренах, улучшенный function calling, решённая проблема циклов, DPO в нативном FP8, найденный и зарепорченный баг в SGLang при dp > 1.

20 075

Fine-tuning vs RAG: что эффективнее Кажется, что есть два пути прокачать LLM: 👉 Fine-tuning — дообучить модель 👉 RAG (Retrieval-Augmented Generation) — дать доступ к базе знаний И главный вопрос: что лучше? Не существует «лучше». Есть «под задачу». Разберёмся 👇 Что такое Fine-tuning?

Ты берёшь модель и доучиваешь её на своих данных. Модель: 👉 меняет веса 👉 «запоминает» стиль, паттерны, формат Это как переучить мозг модели. Хорошо подходит для: 👉 кастомного тона (support, юрист, врач) 👉 форматирования ответов 👉 специфичных паттернов

Что такое RAG?

Ты не меняешь модель. Ты даёшь ей доступ к внешним данным: 👉 запрос 👉 поиск по базе (vector DB) 👉 релевантные куски 👉 генерация ответа Это как открыть шпаргалку перед ответом. Хорошо подходит для: 👉 актуальной информации 👉 больших баз знаний 👉 документов, инструкций, FAQ

Где начинается реальная разница

1. Обновляемость Fine-tuning → нужно переобучать RAG → просто обновил базу 👉 если данные часто меняются — RAG выигрывает 2. Контроль над знаниями Fine-tuning → знания «размазаны» в весах RAG → ты точно знаешь источник 👉 RAG более контролируемый 3. Стоимость Fine-tuning → дорого (обучение + инференс) RAG → дешевле, но есть стоимость retrieval 4. Галлюцинации Fine-tuning → может уверенно «врать» RAG → опирается на документы 👉 RAG обычно надёжнее 5. Задержка (latency) Fine-tuning → быстрее RAG → медленнее (поиск + генерация)

Когда Fine-tuning лучше

👉 нужно изменить стиль / тон 👉 есть чёткие шаблоны ответов 👉 данные стабильны 👉 нужна минимальная задержка

Когда RAG лучше

👉 часто обновляемые данные 👉 большая база знаний 👉 требуется объяснимость 👉 важно снизить галлюцинации

Самый важный инсайт

Это не конкуренты. Это связка. На практике делают так: 👉 Fine-tuning учит модель, как отвечать 👉 RAG даёт модели, что отвечать

В одном предложении Fine-tuning меняет мозг модели, RAG даёт ей память.

20 075

Yandex B2B Tech объявила о старте грантовой программы для компаний, работающих с искусственным интеллектом. Инициатива ориентирована на команды, которые создают цифровые продукты для внешнего рынка и планируют внедрить в них ИИ. Участникам предлагают финансирование до 1 млн рублей — эти средства можно направить на разработку ИИ-агентов и приложений на базе Yandex AI Studio в течение шести месяцев. Помимо грантов, компании получают доступ к экспертной поддержке и помощи в продвижении. После окончания программы участникам предоставляется значительная скидка — до 70% — на использование платформы сроком до полугода. В числе первых проектов: — R77.ai, автоматизирующий проверку документов для банков и страховых с помощью машинного обучения — Noumy.ai, разрабатывающий инструменты для анализа кандидатов и их поведения на интервью — GO2AI, создающий ИИ-агентов для стратегического планирования и ускоряющий принятие решений с нескольких дней до часа Дополнительно участники смогут рассчитывать на софинансирование маркетинговых активностей и размещение своих продуктов в маркетплейсе Yandex Cloud.

20 075

Repost from xCode Journal

🖥 Откопали интерактивный визуализатор алгоритмов — algorithm-visualizer Внутри 70+ алгоритмов на JavaScript, Java и C++. Так что просто запускаем их и смотрим за пошаговым выполнением кода. Полезно при обучении. ✖️ xCode Journal

20 075

Внедрить ИИ в бизнес — миссия выполнима? 💯 Узнайте ответ 9 апреля на закрытой встрече для предпринимателей и специалистов по машинному обучению. Selectel, GlowByte и Data Sapience проведут мероприятие для тех, кто хочет автоматизировать бизнес-процессы с помощью ИИ. В программе — дискуссии о машинном обучении, обсуждение реальных кейсов и рабочих задач с экспертами. А также ужин и полезные знакомства. Смотреть программу 💡 ⏰ 9 апреля (чт), 18:00 📍 Москва, м. Динамо Приходите, чтобы пообщаться со спикерами и получить экспертный разбор вашего кейса. ✅ Участие бесплатное, Дождитесь подтверждения заявки. Регистрируйтесь по ссылке: https://slc.tl/wt88c Реклама. АО "Селектел". erid:2W5zFJN4RKe

20 075

Большой шаг вперёд для синтеза речи Компания Qwen выложила в open source новую TTS-модель, которая умеет: 🔘 клонировать голоса 🔘 создавать новые 🔘 и даже управлять подачей речи через обычный текст Можно просто написать: «Говори бодро, но с лёгкой ноткой волнения» — и модель реально так и сделает И всё это без сложной настройки аудио и танцев с инженерией звука.

20 075

Repost from xCode Journal

CEO Y Combinator выкатил свой сетап для Claude Code Это целая виртуальная команда из 10+ ролей, которая живёт внутри CLI. Теперь мы живем в реальности, где один человек гоняет 5–10 агентов параллельно: они пишут код, тесты, сами находят баги и фиксят их. У самого Гарри получается до 10–20к строк кода в день при работе «параллельно с CEO». По факту это превращает Claude в управляемый софтверный завод с ролями, процессами и гейтами. ✖️ xCode Journal

20 075

Управляй AI-сценариями со Сбером 🚀 Наша команда создает цифровую платформу, где ИИ — не просто помощник, а полноправный соавтор. Если тебе интересно экспериментировать с искусственным интеллектом и напрямую влиять на клиентский опыт — присоединяйся! Что будешь делать: ➖ управлять полным циклом AI-продуктов: от идеи и прототипа до масштабирования и финансовых метрик; ➖ проектировать сценарии для GigaChat, работать с поведением LLM-моделей; ➖ анализировать рынок, декомпозировать задачи и обеспечивать синергию между командами. Мы предлагаем: годовую премию, ДМС, обучение, современную технику и всё необходимое для комфорта и профессионального роста. Стань частью команды, где всё возможно!

20 075

🎁 ВАМ ПОДАРОК ⠀ … даже несколько ⠀ Что будет, если собрать лучшие каналы в сфере AI, IT и бизнеса в одну ПАПКУ? ⠀ ▪️Егор Никитин | event | нейросети ▪️Семён: Нейросети в каждый дом ▪️FOKIN MEDIA | Опыт в IT ▪️Руководитель. Ментор. Человек🤗 ⠀ Можно получить👇 ⠀ - пошаговый план, как построить карьеру в IT с нуля. - узнать о нейронках, которые не только быстро генерят контент. Но и ведут переписки, совершают продажи, приводят новых клиентов ⠀ А еще забрать подарки👇 ⠀ 🎁промт для создания качественных офферов 🎁 промт для анализа конкурентов 🎁 промт для оценки упаковки. ⠀ Нажимайте сюда ➡️ ПАПКА и забирайте подарки. ⠀ ❗️Забрать можно до 10 утра 24.03. Потом удалю пост

20 075

Секунда уверенности → полгода страданий

20 075

Уверенное владение математическим аппаратом — ключевой фактор для решения сложных задач в Data Science, ML и других it-специальностях. Преподаватели МФТИ и создатели проекта Popmath приглашают вас на бесплатный вебинар "Как выучить математику во взрослом возрасте?" На вебинаре вы получите ответы на ключевые вопросы: 🔴 Прикладная математика: Какие разделы наиболее критичны для современных IT-специальностей 🔵 Эффективность обучения: Почему академический подход часто не работает и как выстроить процесс с максимальным КПД 🟠 Актуальные методики: Какие образовательные технологии позволяют в сжатые сроки восстановить и систематизировать знания Дата: 23 марта Время: 20:00 по МСК Длительность: 1 час + ответы на вопросы ➡️ Для регистрации пишите нам! или ознакомьтесь со страницей вебинара и оставьте заявку там 🔻 Всем участникам вебинара скидка 10% на 4-х месячный онлайн-курс "Математика с нуля для взрослых", который начнётся уже 26 марта🔺

20 075

Как бороться с переобучением в нейросетях Переобучение — это момент, когда модель: 👉 отлично знает train 👉 и вообще не понимает реальный мир Она запоминает, а не обобщает. Разберём, как с этим бороться 👇 1. Больше данных (самый честный способ) Чем больше данных — тем сложнее модели заучить шум. Что можно сделать: 👉 собрать новые данные 👉 использовать data augmentation 👉 синтетически расширить выборку В CV и NLP это часто даёт лучший эффект, чем любые трюки с архитектурой. 2. Regularization (штраф за “слишком умную” модель) 👉 L1 / L2 регуляризация → штрафуют большие веса Интуитивно: модель становится проще и меньше переобучается 3. Dropout — случайное “забывание” нейронов Во время обучения случайные нейроны отключаются. Что это даёт: 👉 модель не может опираться на конкретные нейроны 👉 учится быть более устойчивой Обычно: 👉 0.2 – 0.5 dropout rate 4. Early Stopping — остановись вовремя Следим за валидацией: 👉 train loss ↓ 👉 val loss сначала ↓, потом ↑ Как только val начинает расти — останавливаем обучение Это один из самых эффективных и недооценённых методов. 5. Упростить модель Иногда решение самое простое: 👉 меньше слоёв 👉 меньше параметров 👉 проще архитектура Большая модель = больше шанс переобучения. 6. Batch Normalization Помогает: 👉 стабилизировать обучение 👉 немного снижает переобучение Но это не silver bullet — скорее бонус. 7. Data Augmentation Особенно важно для: 👉 CV (повороты, шум, кропы) 👉 NLP (перефразирование, замены) Модель видит больше вариантов одного и того же объекта. 8. Правильная валидация Если у тебя плохой split — ты даже не поймёшь, что модель переобучилась. Используй: 👉 train / val / test 👉 k-fold (если мало данных) Главный инсайт Переобучение — это не ошибка модели. Это сигнал, что: 👉 либо мало данных 👉 либо модель слишком сложная 👉 либо процесс обучения настроен плохо В одном предложении Чтобы победить переобучение — либо добавь информации (данные), либо убери сложность (модель).

20 075

OpenClaw + RL Агенты OpenClaw адаптируются с помощью файлов памяти и навыков (skills), но веса базовой модели на самом деле не меняются. Как OpenClaw-RL решает эту проблему?

Он оборачивает самостоятельно размещённую модель в API, совместимый с OpenAI, перехватывает живые диалоги из OpenClaw и обучает политику в фоновом режиме с помощью RL (обучения с подкреплением). Архитектура полностью асинхронная. Это означает, что: обработка запросов, оценка награды (reward scoring), и обучение выполняются параллельно. После завершения обучения веса модели "hot" подменяются (hot-swap) после каждого батча, при этом агент продолжает отвечать без остановки. В настоящее время поддерживаются два режима обучения: Binary RL (GRPO): модель награды оценивает каждый ход диалога как хороший, плохой или нейтральный. Эта скалярная награда используется для обновления политики через PPO-подобную функцию цели с клиппингом. On-Policy Distillation: когда появляются конкретные исправления, например "тебе нужно было сначала проверить тот файл", эта обратная связь используется как более богатый направленный сигнал обучения на уровне токенов.

Когда стоит использовать OpenClaw-RL?

Честно говоря, большую часть поведения агента уже можно улучшить через более грамотный дизайн памяти и навыков. Существующая экосистема навыков OpenClaw и созданные сообществом навыки самоулучшения покрывают широкий спектр задач без изменения весов модели. Если агент постоянно забывает предпочтения пользователя - это проблема памяти. Если он не знает, как обработать конкретный рабочий процесс - это проблема навыков. Обе задачи решаются на уровне промптов и контекста. RL становится действительно интересным, когда источник ошибки лежит глубже - в самом механизме рассуждения модели. Например: систематически плохой порядок выбора инструментов, слабое многошаговое планирование, неспособность правильно интерпретировать неоднозначные инструкции так, как ожидает конкретный пользователь. Исследования в области agentic RL (например, ARTIST и Agent-R1) показывают, что такие поведенческие паттерны достигают потолка, если использовать только промпт-подходы. Особенно это заметно в сложных многошаговых задачах, где модели нужно: восстанавливаться после ошибок инструментов, или менять стратегию прямо во время выполнения. Именно этот уровень и является целью OpenClaw-RL - и это ключевое отличие от того, что предлагает обычный OpenClaw.