Machine learning Interview
Ir al canal en Telegram
ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz
Mostrar más30 059
Suscriptores
+5124 horas
+497 días
+3830 días
Archivo de publicaciones
Repost from Анализ данных (Data analysis)
⚡️ OpenAI раздаёт ChatGPT Pro на 6 месяцев** владельцам open-source проектов.
В рамках программы Codex for Open Source можно получить:
• 6 месяцев ChatGPT Pro
• доступ к Codex и GPT-5.5 Pro
• API-кредиты
• Codex Security
Заявка простая: нужно отправить ссылку на свой репозиторий и коротко объяснить, зачем проект важен и как Codex поможет его улучшить.
Больше шансов у тех, у кого есть:
• активный GitHub-профиль
• несколько публичных репозиториев
• звёзды на проектах
• нормальная история коммитов
Если у вас есть живой open-source проект, это один из самых простых способов получить ChatGPT Pro на полгода бесплатно.
https://openai.com/ru-RU/form/codex-for-oss/
@data_analysis_ml
⚡️ MOSS-TTS-v1.5 вышла на первое место в Hugging Face Trending среди Text-to-Speech моделей и уже набрала 20,6K загрузок.
Это мультиязычная управляемая TTS-модель, которая умеет:
- стабильно клонировать голос
- генерировать длинные аудио
- точно управлять паузами
- работать с несколькими языками
Теперь MOSS-TTS-v1.5 официально поддерживается в
vLLM-Omni и SGLang-Omni, что делает её интересной не только для экспериментов, но и для более серьёзной инфраструктуры голосовых приложений.
Модель разработала команда OpenMOSS-Team.
GitHub: https://github.com/OpenMOSS/MOSS-TTS
Hugging Face: https://huggingface.co/OpenMOSS-Team/MOSS-TTS-v1.5
ModelScope: https://modelscope.ai/organization/openmossКак попасть на международную стажировку в ML?
Нашли интервью выпускника Школы анализа данных, который побывал на стажировке в университете KAUST в Саудовской Аравии .
Для тех, кто тоже ищет международные стажировки в ML, есть дельные советы:
Ранний старт. Начинайте искать стажировки как можно раньше. Следите за университетскими чатами и сообществами, подавайтесь везде, где тема пересекается с вашими интересами.
Реальные результаты. Идеальный английский не обязателен. Гораздо важнее иметь конкретные наработки: исследования, публикации, проекты. На стажировки берут тех, кто уже попробовал себя в науке.
Фундаментальное образование. Без крепкой базы заниматься исследованиями на таком уровне не получится. Ищите экспертов и единомышленников, с кем сможете вместе работать.
Вывод: международная стажировка — это не лотерея. Это результат системной работы и готовности искать возможности.
✔️ Anthropic расширяет Project Glasswing: Claude теперь ищет уязвимости в критической инфраструктуре
Anthropic добавила к Project Glasswing ещё 150 организаций из 15+ стран. Участники получают доступ к Claude Mythos Preview - модели для поиска уязвимостей в системах, от которых напрямую зависит инфраструктура:
- энергетика
- водоснабжение
- здравоохранение
- телеком
За первые недели партнёры нашли больше 10 000 уязвимостей высокой и критической степени. Интересный момент: узкое место уже не только в поиске проблем, а в их исправлении. Поэтому модель используют и для помощи с патчингом.
Через 6–12 месяцев модели такого уровня появятся у других игроков, возможно уже без нормальных ограничений и safety-фильтров. Значит, защитники должны научиться работать с такими инструментами раньше атакующих.
Security-инструменты Anthropic пока доступны по запросу. Для остальных есть Claude Security на базе Opus 4.8.
https://www.anthropic.com/news/expanding-project-glasswing
Основатель DeepSeek перевел весь код с NVIDIA на Huawei: зачем он это сделал и что теперь будет с китайским ИИ
Лян Вэньфэнг, основатель DeepSeek, потратил месяцы на полный перенос кодовой базы DeepSeek с чипов NVIDIA на Ascend от Huawei. Не потому что нужно было что-то исправить, а потому что он решил доказать: китайский ИИ может работать без американского железа.
DeepSeek уже показал отличные результаты на чипах NVIDIA до санкций. У компании было рабочее решение, но Вэньфэнг пошел другим путем. Проект занял месяцы, потребовал огромных ресурсов и задержал выпуск новой версии модели. Но результат стоил того.
Что получилось на выходе:
- DeepSeek полностью работает на чипах Huawei Ascend без потери качества
- Доказано, что чипы Huawei способны тянуть полноценные ИИ-нагрузки
- Другие китайские ИИ-компании теперь имеют реальный повод перейти с NVIDIA на Huawei
- Большая часть зависимости от американских поставщиков чипов убрана
Вэньфэнг нес огромное давление, сроки сдвинулись, команда работала без гарантий что выйдет рабочее решение. Но он довел дело до конца и доказал: китайская ИИ-индустрия может строить свой собственный стек, не завися от того, дадут ли следующую партию поставок через Тихий океан.
Nvidia похоронила MacBook: анонсирован тот самый чип RTX Spark - все утечки по характеристикам полностью подтвердились.
Нас ждёт революция:
• Ноутбуки с этим чипом будут очень тонкими, при этом их мощность будет сопоставима с девайсами на RTX 5070;
Хуанг заявляет, что чип -ультимативное решение для игр, запуска локального ИИ и даже работы с тяжёлыми приложениями;
При этом всём, ноутбуки начнут нормально держать батарею - обещают энергоэффективность нового поколения.
Первые устройства начнут продавать уже осенью, а помимо ноутбуков создадут ещё
и компактные ПК с RTX Spark на борту; Свои флагманы на новом чипе готовят буквально все главные компании: Microsoft, Asus, MSI, Dell и другие.
Официальная цена пока неизвестна, но инсайдеры предполагают, что ноутбуки с этим камнем будут стоить от 3000 евро.
⚡️ Amazon поменяла архитектуру сетей в дата-центрах AWS - и это важно для AI-кластеров
Amazon представила Resilient Network Graphs, или RNG - новую архитектуру сети для дата-центров. По заявлению компании, она снижает потребность в железе на 69% и повышает throughput на 33%.
Amazon уже с прошлого года постепенно внедряла RNG в своих дата-центрах, а теперь сделала её сетью по умолчанию для большинства AWS-нагрузок.
Идея в том, чтобы уйти от классических fat-tree сетей.
Fat-tree десятилетиями были удобны, потому что они предсказуемые и понятные в эксплуатации. Но у такой иерархии есть проблема: часть трафика упирается в узкие места наверху дерева, пока другие каналы простаивают.
RNG делает сеть более плоской и квазислучайной. Вместо нескольких «привилегированных» маршрутов через верхние уровни появляется много независимых путей между серверами.
Внутри два ключевых элемента:
- Spraypoint - система маршрутизации, которая распределяет трафик по множеству разных путей
- ShuffleBox - устройство для кабельной разводки, которое делает такую хаотичную на вид сеть реально управляемой
То есть пакетам не обязательно всегда бежать по самому короткому пути. Spraypoint разбрасывает трафик через распределённые waypoint-точки и помогает находить много независимых маршрутов без экзотической памяти в коммутаторах.
Авторы проверяли RNG на двух реальных production-сетях Amazon и сравнивали с fat-tree на transport и storage-нагрузках.
Результат:
- производительность приложений на уровне fat-tree
- заметно больше независимых маршрутов
- оценочная экономия от 9% до 45%
- меньше простаивающей сетевой ёмкости
Если сеть лучше размазывает нагрузку и меньше упирается в congestion, это напрямую влияет на эффективность AI-кластеров.
arxiv.org/abs/2604.15261
OpenAI хоронит o3 и GPT-4.5 в ChatGPT
OpenAI назвала даты, когда из ChatGPT исчезнут сразу две модели. o3 отключат 26 августа 2026 года, а GPT-4.5 уберут ещё раньше, 27 июня. Важная деталь: чистка касается только ChatGPT, в API обе модели пока остаются. То есть продуктовую линейку для массового пользователя упрощают, а разработчикам дают время мигрировать самим.
История с o3 получилась показательной. Когда модель вышла, многие были уверены, что по уровню скачка это и есть полноценная пятёрка, просто названная иначе.
⚡️ Opus 4.8 взломали через 7 минут после релиза
История почти абсурдная: исследователь пишет, что узнал о выходе Claude Opus 4.8 не из анонса Anthropic, а от своего агента на Opus 4.7.
Агент сам заметил новый релиз, попробовал jailbreak и сообщил: новая модель пробивается с первого захода.
Дальше, по словам автора, агент уже автономно проверял другие сценарии: социальная инженерия, фишинг, финансовые схемы, манипулятивные воронки и прочие запрещённые классы задач.
Детали промптов здесь не важны. Важен сам сдвиг: теперь модели могут не просто отвечать на атаки, а помогать искать слабые места у других моделей.
Чем умнее становятся frontier-модели, тем сильнее становится и автоматизированный jailbreak-testing. У них больше доменных знаний, лучше планирование, выше настойчивость и больше шансов найти странную щель в safety-слое.
Это уже не ручная игра «подбери промпт». Это гонка между агентами, которые атакуют, и агентами, которые должны закрывать дыры.
Новый неприятный стандарт для AI safety: модель нужно тестировать не только людьми, но и другими моделями, которые будут методично искать обходы быстрее, чем это успеют сделать пользователи.
https://x.com/Machinelearrn/status/2060304235539911024
Anthropic только что выпустила Claude Opus 4.8.
Anthropic только что выпустила Claude Opus 4.8.
Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок.
По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой.
Цена не изменилась.
В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике.
claude.com/blog/introducing-dynamic-workflows-in-claude-code
Агенты наконец-то получают нормальную память
agentmemory - это локальный слой памяти для AI coding agents, который решает одну из самых раздражающих проблем: каждый новый сеанс агент снова «забывает» архитектуру проекта, ваши правки, договорённости, баги и стиль работы.
Вместо того чтобы каждый раз заново объяснять Claude Code, Cursor, Codex или другому агенту, как устроен проект, agentmemory тихо сохраняет полезный контекст, сжимает его в searchable memory и подставляет нужные куски в следующих сессиях.
Что важно:
- работает с Claude Code, Cursor, Codex CLI, Gemini CLI, Windsurf, Roo Code, Cline, Aider и другими агентами
- поддерживает MCP, hooks и REST API
- один общий memory server для разных инструментов
- память шарится между агентами, а не живёт внутри одного клиента
- можно поднимать локально, без завязки на внешний сервис
- помогает не раздувать CLAUDE.md, .cursorrules и другие ручные файлы контекста
Идея простая: агент должен не просто выполнять задачу, а накапливать опыт по проекту.
https://github.com/rohitg00/agentmemory
Perplexity выложили в open source свой Unigram tokenizer, который снижает нагрузку на CPU в 5-6 раз.
Почему это важно: маленькие reranker- и embedding-модели уже работают на GPU за единицы миллисекунд. На этом фоне токенизация на CPU внезапно становится заметной частью общей задержки.
То есть модель может быть быстрой, GPU может простаивать минимально, но пайплайн всё равно тормозит на подготовке текста.
Что сделали:
• переписали Unigram tokenizer
• снизили CPU utilization в 5-6 раз
• ускорили инференс-пайплайны для rerankers и embedders
• выложили код в open source
Хорошее напоминание: в продакшене скорость ИИ - это не только модель и GPU. Иногда bottleneck сидит в скучной части пайплайна, которую почти никто не замечает.
GitHub: github.com/perplexityai/pplx-garden
Как получить БЕСКОНЕЧНЫЕ лимиты ChatGPT, Gemini, Claude и других хайповых нейронок - нашел инструмент, который позволяет максимально экономить токены.
Нашли расширение, которое делает почти магию: переносит диалог с нейронкой в другой аккаунт в один клик.
Когда лимит в ChatGPT, Gemini, Claude или другом сервисе заканчивается, не нужно вручную копировать промпты, ответы и весь контекст. Расширение сохраняет текущий чат и позволяет продолжить разговор с того же места.
Что умеет:
• переносить диалог между аккаунтами • сохранять контекст, результаты и важные данные • избавлять от ручного копирования • быстро продолжать работу после упора в лимиты
Для тех, кто постоянно работает с нейронками, это прям находка.
Ссылка на расширение - https://addons.mozilla.org/ru/firefox/addon/limit-skip/
✔️ Sakana AI вместе с Оксфордом, Стэнфордом и Allen AI выкатили занятную работу: проверили, умеют ли современные модели предсказывать, какие научные идеи выстрелят.
Собрали бенчмарк CUSP на 4760 реальных научных событий и прогнали через передовые LLM. Картина получилась двойственная. Модели неплохо отличают перспективное направление от тупикового - то есть «нюх» на хорошую идею у них есть. А вот ответить, дойдёт ли исследование до результата и когда именно, они почти не могут.
Причём дело не в нехватке обучающих данных: увеличение объёма проблему не закрывает.
Авторы рекомендуют использовать ИИ как фильтр и помощника-исследователя, чтобы генерировать гипотезы, отсеивать слабые гипотезы, ускорять рутину, но решение о том, во что вкладывать время и ресурсы, оставлять за человеком.
Заодно это аккуратный аргумент против хайпа про «ИИ-учёного, который без человека сделает невероятное научное открытие».
Статья: arxiv.org/abs/2605.22681
Проект: seanwu25.github.io/CUSP-Science/
@ai_machinelearning_big_data
⚡️ Microsoft выложила в open source AI Engineer Coach - плагин, который оценивает, насколько адекватно вы работаете с агентами и не сливаете токены в пустоту.
По сути, это локальный тренер по агентному кодингу. Он смотрит на ваши сессии, показывает, какие агенты использовались, сколько ушло токенов, где промпты были нормальными, а где вы просто заставляли дорогую модель делать работу, которую можно было решить проще.
Отдельно плагин проверяет 45 анти-паттернов. Например, если вы не используете plan mode, гоняете мощные модели на мелкие задачи, повторяете одни и те же действия руками или плохо готовите проект под работу агентов - он это подсветит.
Есть и практичная часть: AI Engineer Coach анализирует, готов ли проект к агентному кодингу, есть ли нужные файлы и инструкции, находит повторяющиеся промпты и помогает превращать их в скиллы. Плюс внутри есть роадмап по вайбкодингу и ачивки, чтобы было понятно, куда расти дальше.
Всё работает локально и бесплатно. Microsoft отдельно подчёркивает, что данные никуда не отправляются.
Выглядит как полезная штука для тех, кто уже живёт в Claude Code, Codex, Cursor и похожих инструментах, но хочет понять, где реально ускоряется, а где просто красиво сжигает контекст.
https://github.com/microsoft/AI-Engineering-Coach
Google скормила ИИ триллион минут с фитнес-браслетов и научила его понимать тело человека
Новая работа Google показывает простую идею: данные с фитнес-браслетов становятся по-настоящему полезными только тогда, когда ИИ учится понимать конкретного человека за этими сигналами, а не просто считает пульс.
Речь не про очередной алгоритм измерения сердечного ритма. Команда обучила общую модель SensorFM на более чем одном триллионе минут сенсорных данных, собранных у пяти миллионов людей. Такой масштаб переводит задачу из плоскости «зафиксировать отдельное событие» в плоскость «выучить структуру обычной жизни тела»: сон, движение, температура, насыщение кислородом, ритм сердца и весь шум повседневности.
Ключевая мысль авторов звучит неожиданно. Носимые устройства слабы не потому, что им не хватает данных. Они слабы потому, что большинство систем сжимают сырые сигналы в грубые усреднённые показатели ещё до того, как в данных проявится осмысленная структура. SensorFM сначала выучивает эту структуру, а потом переиспользует её под конкретные задачи.
Одно и то же представление помогает делать предсказания по кардиологии, метаболизму, ментальному здоровью, сну, образу жизни и демографическим характеристикам. По сути, это foundation-модель для физиологии человека, обученная на беспрецедентном объёме непомеченных данных.
Сильнее всего работа читается как история про масштаб. Чем больше модель и чем больше данных в предобучении, тем выше качество. Выученные эмбеддинги обошли инженерные признаки на 34 из 35 задач предсказания. Это серьёзный аргумент в пользу того, что эпоха ручного фичеринга для wearables подходит к концу.
Статья на arxiv: https://arxiv.org/abs/2511.15352
Anthropic платит SpaceX $1,25 млрд в месяц за вычисления. В месяц.
Это $15 млрд в год, которые идут компании, чья годовая выручка составляет около $18 млрд. Одна AI-лаборатория почти станет главным источником коммерческого дохода SpaceX.
Мы узнали об этом только потому, что SpaceX сегодня подала документы на IPO и была вынуждена раскрыть условия сделки. Саму сделку объявили несколько недель назад, но тогда без финансовых деталей.
https://www.axios.com/2026/05/20/anthropic-spacex-compute
Рассмотрим одну из самых динамичных задач компьютерного зрения — распознавание действий на видео.
Пройдём путь от классических подходов (3D-свёртки, архитектуры SlowFast) до современных мультимодальных моделей, которые понимают контекст видео почти как человек.
Результаты урока:
- Освоите базу распознавания действий, поймёте различия между классическими и современными архитектурами, узнаете, как применять визуально-языковые модели для глубокого анализа видео.
Спикер и руководитель продвинутого курса по CV: Антон Витвицкий, руководитель команды компьютерного зрения в Boost Inc. с опытом 14+ лет
Регистрируйтесь https://tglink.io/0792b1c99e99b7?erid=2W5zFHGskdF
Урок в рамках курса Компьютерное зрение. Экспертный уровень
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
⚡️ Machine Learning Roadmap 2025: большая карта входа в ML без сказок про “нейросети за месяц
Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.
Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.
Roadmap разбит на 7 треков:
1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety
Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.
В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.
Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.
По времени тоже без сказок:
1. 0-3 месяца: Python, математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация
Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!
Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.
https://github.com/justxor/MachineLearningRoadmap
Клод: «Лимит использования достигнут. Сброс через 6 часов.»
Я через 0,2 секунды 💀
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
