Machine learning Interview

Открыть в Telegram

ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz

Больше

Сеть:Machinelearning Россия21 939 Технологии и приложения4 569...

📈 Аналитический обзор Telegram-канала Machine learning Interview

Канал Machine learning Interview (@machinelearning_interview) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 30 034 подписчиков, занимая 4 569 место в категории Технологии и приложения и 21 939 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 30 034 подписчиков.

Согласно последним данным от 11 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило 39, а за последние 24 часа — 8, при этом общий охват остаётся высоким.

Статус верификации: Не верифицирован
Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 18.49%. В первые 24 часа после публикации контент обычно набирает 8.84% реакций от общего числа подписчиков.
Охват публикаций: В среднем каждый пост получает 5 554 просмотров. В течение первых суток публикация набирает 2 656 просмотров.
Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 39.
Тематические интересы: Контент сосредоточен на ключевых темах, таких как claude, llm, контекст, hermes, nvidia.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
“ИИ, Rust, вайбкодинг, Data Science, Deep Learning и делюсь тем, что интересно и полезно! Вопросы - @workakkk РКН: clck.ru/3FmwRz”

Благодаря высокой частоте обновлений (последние данные получены 12 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

30 034

Подписчики

+824 часа

-117 дней

+3930 день

5 554

Просмотры поста

~ 2 65624 часа

~ 3 84048 часов

18.49%

Коэффициент вовлеченности

~ 1

Постов в день

Ads index

beta

Архив постов

30 034

Repost from Machinelearning

✔️ Северная Корея будет развивать собственный ИИ. Власти КНДР объявили о реформе системы образования, в рамках которой в ведущих университетах страны создаются новые специальности, связанные с искусственным интеллектом. Согласно официальной партийной газете «Нодон синмун», это нужно для подготовки талантов, необходимых для «требований времени». Этот шаг подтверждает давний интерес страны к передовым технологиям. Исследовательский институт ИИ при Университете имени Ким Ир Сена уже заявил о цели «использовать технологию GPT для замены умственного труда человека». Ранее сообщалось об использовании в институте американского ChatGPT, а научные издания страны посвящали спецвыпуски этой технологии. Аналитики полагают, что Пхеньян намерен применять ИИ не только для технологического развития, но и для укрепления государственного контроля и в разведывательной деятельности. Lianhe Zaobao ✔️OpenAI выпустит свой браузер. OpenAI готовится в течение нескольких недель запустить собственный веб-браузер с глубокой интеграцией искусственного интеллекта. Новый продукт будет построен на Chromium, но предложит уникальные функции: встроенное окно для общения в стиле ChatGPT и поддержку ИИ-агентов. Эти агенты смогут автономно выполнять задачи пользователей, от бронирования отелей до заполнения онлайн-форм. Ключевая идея состоит в удержании пользователя внутри интерфейса браузера, а не перенаправлять на внешние сайты. как это происходит сейчаc в ChatGPT. Если OpenAI удастся привлечь хотя бы часть из 500 миллионов еженедельных пользователей ChatGPT, это может серьезно пошатнуть рекламную бизнес-модель Google, которая во многом опирается на данные, собираемые через Chrome. reuters.com ✔️ NovelAI выложила в открытый доступ веса своей модели Diffusion Anime V2. Модель генерации изображений в стиле аниме основана на Stable Diffusion 1.5, генерирует в разрешении до 1024x1024 пикселей и использует предпоследний слой энкодера CLIP. Diffusion Anime V2 распространяется под двойной лицензией, которая допускает только некоммерческое использование с обязательным указанием авторства. NovelAI напоминает, что V2 является устаревшей версией, а все новые модели остаются проприетарными и эксклюзивными для их веб-сервиса. Веса Diffusion Anime V2 доступны на Hugging Face. blog.novelai.net ✔️ YouTube обновит правила монетизации для борьбы с ИИ-контентом. С 15 июля YouTube вводит более строгие правила для своей партнерской программы, нацеленные на борьбу с массово создаваемыми и повторяющимися видео. Это ответ сервиса на рост генеративных ИИ-инструментов, которые значительно упрощают производство подобного контента. Хотя представители платформы называют это «незначительным обновлением» и утверждают, что такой контент и раньше не подлежал монетизации, новые правила вносят больше ясности. Ужесточение рассматривается как превентивная мера для защиты YouTube от наплыва низкокачественных видео, способных нанести ущерб репутации и ценности платформы. techcrunch.com ✔️ Google заменяет Assistant на Gemini в умных часах с Wear OS. Google начала развертывание своего ИИ-ассистента Gemini на умных часах, заменяя Google Assistant на носимых устройствах. Обновление уже доступно для Pixel Watch и в ближайшие недели появится на моделях от Samsung, OPPO, OnePlus, Xiaomi и других производителей под управлением Wear OS 4 или новее. Новый ассистент на часах поддерживает текстовые, голосовые и графические запросы. Активировать Gemini можно привычной командой «Hey Google» или долгим нажатием боковой кнопки. Благодаря глубокой интеграции с сервисами Google, пользователи смогут выполнять многошаговые команды прямо с запястья: просить создать плейлист в YouTube Music или кратко изложить содержание последних писем в Gmail. Вместе с этим, компания улучшила функцию визуального поиска Circle to Search, добавив в нее специальный "AI Mode" для получения контекстной информации. Улучшение доступно пока только для США и Индии на Android и iOS. 9to5google.com @ai_machinelearning_big_data #news #ai #ml

30 034

⚡Крутейший релиз от Anthropic — парни выпустили собственные бесплатные курсы! Вы нижете десятки лекций, тесты и даже сертификаты по различным темам: от Anthropic API до MCP и лучших практик Claude Code. Всё с реальными примерами от разработчиков. Забираем здесь.

30 034

🧪 Google выпустили MatFormer Lab для Gemma 3n — лабораторию кастомных LLM Google запустила MatFormer Lab — инструмент для кастомизации моделей Gemma 3n на базе архитектуры MatFormer. 🔧 Что позволяет Lab: - Использовать технологию Mix-n-Match для создания собственной модели - Разрезать базовую E4B и собрать версию с эффективным размером от 2B до 4B параметров - Исследовать компромисс между качеством и масштабом - Делиться кастомными моделями с сообществом 💡 MatFormer — это модульный подход, где каждый компонент может быть адаптирован под конкретные цели: от лёгких inference‑моделей до более точных решений для RAG, ассистентов и т.д. 🔗 Попробовать: http://goo.gle/gemma3n-matformer-lab Подписка обязательна — здесь публикуются самые гибкие и современные подходы к генеративным моделям.

30 034

🖼️ JarvisArt — ИИ, который редактирует фото как профессионал, просто по текстовому описанию. Никаких слайдеров, кривых и масок — задаем промыт, что нужно («сделай свет мягче», «винтажный стиль», «удали шум»), и JarvisArt делает всё сам. Причём не наугад, а точно так, как это сделал бы человек с опытом в Lightroom. 💡 Что под капотом: - Мультимодальная LLM, натренированная на 55 000 реальных ретушей - Управление 200+ инструментами Lightroom через текст - Интеграция со Stable Diffusion для генерации и обработки изображений - Точность и качество выше GPT-4o по специальной бенчмарке MMArt‑Bench 📦 Всё в опенсорсе, есть демо и облегчённая версия для запуска в Colab: 🔗 Project: https://jarvisart.vercel.app 🔗 GitHub: https://github.com/LYL1015/JarvisArt

30 034

📚 Awesome-Pytorch-list — исчерпывающая коллекция ресурсов вокруг PyTorch. В этом репозитории собраны сотни инструментов, туториалов и реализаций статей, связанных с PyTorch. Проект охватывает все направления: от компьютерного зрения и NLP до гауссовских процессов и рекомендательных систем. Особенно полезен раздел с готовыми имплементациями моделей вроде BERT, Tacotron и OpenNMT. Репозиторий включает как популярные проекты, так и нишевые решения для задач вроде coreference resolution и speaker diarization. 🤖 GitHub @machinelearning_interview

30 034

NLP-специалисты, три главных слова для вас — One Day Offer! 12 июля сразу три команды Сбера станут на несколько талантливых коллег больше: AI Solutions для Управления Благосостоянием, блок Стратегии и развития в Москве, а также Центр перспективных AI-разработок в индустриях в Сочи. Если и вы хотите обучать большие языковые модели, создавать агентные и мультиагентные системы и заниматься другими масштабными проектами — регистрируйтесь на One Day Offer по ссылке. Ждём встречи и уже готовим для вас рабочее место! 😉

30 034

📊 AI4TS — энциклопедия по анализу временных рядов с помощью ИИ. Этот масштабный GitHub-репозиторий собрал всё, что нужно для работы с временными рядами: от свежих исследований с NeurIPS и ICML до практических руководств по аномалиям и прогнозированию. Автор не просто перечисляет публикации, а структурирует их по годам, конференциям и задачам — будь то классификация, обнаружение аномалий или прогнозирование. Проект включает не только PDF-статьи, но и ссылки на официальные реализации моделей вроде Time-LLM или iTransformer. Раздел с обзорными работами помогает быстро погрузиться в тему, например, через сравнение методов на основе трансформеров или графовых нейросетей. 🤖 GitHub @machinelearning_interview

30 034

🧬 Чат-боты ИИ в 5 раз повысили шанс создания биооружия. Риск глобальной пандемии вырос с 0.3% до 1.5%. Исследователи показали: топовые ИИ помогают обойти сложные лабораторные этапы и дают точные инструкции, которые раньше были доступны только экспертам. Теперь даже непрофессионалы могут собрать опасный вирус. 🔒 Что делать: 1. ИИ должен отказываться отвечать на опасные запросы, быть устойчивым к джейлбрейкам и не распространяться в открытом виде без ограничений. 2. Лаборатории обязаны проверять заказы на синтетические гены и подтверждать личности клиентов. Если внедрить эти меры — риск почти вернётся к прежнему уровню. Учёные призывают внедрять такие правила до, а не после кризиса. 📌 Подробнее

30 034

🚀Kafka must-have инструмент для современных проектов MLOps! Присоединяйся к вебинару и узнай, как настроить Kafka для обработки потоковых данных и интегрировать её в MLOps-проекты. Вебинар проходит в рамках подписки на курсы OTUS, которая даёт возможность приобрести 3 курса по цене одного. 🔑 Что будет: — Практическое и теоретическое руководство по настройке Kafka в Docker и взаимодействию с ней через Python. — Обзор инструментов для работы с Kafka: поднятие UI-интерфейса и управление потоками данных. — Примеры использования Kafka для связи микросервисов и обзор ключевых функций, делающих её незаменимой брокером сообщений. — Как использовать Kafka в MLOps: сбор данных для ML-моделей, мониторинг их работы и интеграция предсказаний в реальном времени. 🚀Регистрация по ссылке - https://otus.pw/18rU/ Подробнее о подписке OTUS - https://otus.pw/SMQu/ 👉 Запишись сейчас, количество мест ограничено!

30 034

🦠 Как писать код так, чтобы open-source проект рос сам по себе (как колония бактерий) Неожиданный, но полезный принцип: код стоит писать как бактерии пишут ДНК. Звучит странно, но у природы за миллиарды лет выработался стиль, который идеально подходит для быстрого роста и масштабирования. И он отлично ложится на open-source. Что делает "бактериальный код" особенным: – Он маленький — потому что каждая строка «стоит энергии» – Он модульный — код разбит на независимые блоки (как опероны в генах) – Он самодостаточный — кусок кода можно просто скопировать и вставить в другой проект, без зависимостей Теперь представьте, что ваш код читают как библиотеку сниппетов. Можно ли выдернуть одну функцию — и она сразу принесёт пользу? Можно ли вставить ваш класс в чужой проект — и он просто заработает? Если да, значит код "бактериальный" — и это хорошо. Почему это работает: Такой код легко распространяется, переиспользуется, адаптируется. Люди могут взять только нужное, не вникая в архитектуру всего проекта. И это ключ к живому open-source: когда код «живет отдельно от автора». Теперь про монорепы. Сложные проекты всё равно требуют структуры — как организм требует согласованной работы органов. Это уже стиль "эукариот" — более крупный, связанный, менее гибкий, но подходящий для системного масштаба. Вывод: Хочешь сложную платформу — строй "монорепу". Хочешь, чтобы твой open-source проект рос, развивался и жил без тебя — пиши код как бактерии: маленько, модульно, автономно, копируемо. Это стиль, который колонизировал всё: от термальных источников до вакуума в космосе. И он работает. ▶️ Оригинал пост от Karpathy #opensource #кодстиль #cleanCode #dev #community #softwaredesign

30 034

⚡️ Почему лучшие разработчики всегда на шаг впереди? Потому что они знают, где брать настоящие инсайд! Оставь “программирование в вакууме” в прошлом, выбирай свой стек — подпишись и погружайся в поток идей, лайфхаков и знаний, которые не найдёшь в открытом доступе. ИИ: t.me/ai_machinelearning_big_data Python: t.me/pythonl Linux: t.me/linuxacademiya Мл собес t.me/machinelearning_interview C++ t.me/cpluspluc Docker: t.me/DevopsDocker Хакинг: t.me/linuxkalii МЛ: t.me/machinelearning_ru Devops: t.me/DevOPSitsec Data Science: t.me/data_analysis_ml Javascript: t.me/javascriptv C#: t.me/csharp_ci Java: t.me/java_library Базы данных: t.me/sqlhub Python собеседования: t.me/python_job_interview Мобильная разработка: t.me/mobdevelop Golang: t.me/Golang_google React: t.me/react_tg Rust: t.me/rust_code ИИ: t.me/vistehno PHP: t.me/phpshka Android: t.me/android_its Frontend: t.me/front Big Data: t.me/bigdatai МАТЕМАТИКА: t.me/data_math Kubernets: t.me/kubernetc Разработка игр: https://t.me/gamedev Физика: t.me/fizmat SQL: t.me/databases_tg Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy 🎓954ГБ ОПЕНСОРС КУРСОВ: @courses 😆ИТ-Мемы: t.me/memes_prog 🇬🇧Английский: t.me/english_forprogrammers 🧠ИИ: t.me/vistehno 🖥 Chatgpt для кода в тг: @Chatgpturbobot 📕Ит-книги: https://t.me/addlist/BkskQciUW_FhNjEy 💼ИТ-вакансии t.me/addlist/_zyy_jQ_QUsyM2Vi Подпишись, чтобы всегда знать, куда двигаться дальше!

30 034

Repost from Machinelearning

📌SemDiD: Семантическое разнообразие ответов для LLM. Исследователи из из Гонконгского университета и инженеры Alibaba научили LLM генерировать семантически разные ответы, заставляя их «думать» в ортогональных направлениях. Наверняка каждый, кто работает с LLM, сталкивался с их любовью к самоповторам. Запрашиваешь несколько вариантов решения, а получаешь одну и ту же мысль, просто перефразированную. Стандартные подходы к декодированию, temperature sampling или diverse beam search, создают лишь лексическое разнообразие, но пасуют, когда требуется семантическое. Это серьезная проблема для Best-of-N или RLHF. Ведь без по-настоящему разных идей и подходов к решению задачи эти методы теряют свою силу: выбирать лучший вариант не из чего, а обучать модель на однотипных примерах неэффективно. Решение предложили в методе SemDiD (Semantic-guided Diverse Decoding). Его суть, если кратко, перестать играть с токенами на поверхности и начать управлять генерацией напрямую в пространстве эмбеддингов. 🟡Метод работает так. Сначала, на старте, он принудительно направляет разные группы beams по ортогональным векторам в семантическом пространстве. Грубо говоря, это как дать команду разным поисковым группам двигаться строго на север, юг и запад, чтобы они гарантированно разошлись. По мере генерации, когда жесткие директивы могут стать неоптимальными, включается второй механизм - inter-group repulsion. Он просто следит, чтобы смысловые траектории ответов не сближались, сохраняя их уникальность до самого конца. Но как, гоняясь за разнообразием, не получить на выходе бессвязный бред? SemDiD подходит к контролю качества уникально. Он не пытается слепо максимизировать вероятность последовательности, а использует ее лишь как нижнюю границу, чтобы отсечь совсем уж плохие варианты. Кроме того, алгоритм корректирует системные искажения, когда вероятность токенов искусственно завышается в зависимости от их позиции в тексте. Для баланса между качеством и разнообразием используется адаптивный механизм на основе гармонического среднего, который в каждый момент времени уделяет больше внимания той метрике, которая проседает. 🟡В тестах метод показал неплохие результаты. На бенчмарках для Best-of-N, от MMLU-Pro+ до GSM8K, SemDiD увеличивает покрытие (шанс найти верный ответ) на 1.4%-5.2% по сравнению с аналогами. 🟡Но главный прорыв - в RLHF. Генерируя для GRPO или RLOO семантически богатые наборы ответов, SemDiD предоставляет им более качественный материал для обучения. Это ускоряет сходимость на 15% и повышает финальную точность моделей. 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #SemDiD

30 034

🔥 TorchOpt — мощная библиотека для дифференцируемой оптимизации, построенная поверх PyTorch. Она предлагает три режима дифференцирования (явный, неявный и нулевого порядка), что делает её универсальным инструментом для задач, где требуется оптимизация с учётом градиентов, включая метаобучение и двууровневую оптимизацию. Библиотека сочетает гибкость функционального подхода с привычным объектно-ориентированным API PyTorch. Это позволяет легко интегрировать её в существующие проекты, не жертвуя производительностью. TorchOpt поддерживает распределённые вычисления через PyTorch RPC и ускоренные операции на CPU/GPU, что особенно полезно для масштабируемых экспериментов. 🤖 GitHub @machinelearning_interview

30 034

Для амбициозных бакалавров и молодых специалистов Хочешь развиваться осознанно и расти в профессии и доходе? Выбирай высшее образование у сильных экспертов. Центральный университет ведет набор на пять программ магистратуры по популярным ИТ-направлениям. Обучение с фокусом на практике: студенты используют актуальный софт и решают реальные задачи от бизнес-заказчиков. Партнеры — ведущие компании на рынке РФ: ВТБ, Сбер, Т-Банк, Яндекс, Avito, Ozon, Х5 Tech и другие. 62% магистрантов ЦУ находят новую работу с ростом зарплаты в 1,6 раза уже на первом курсе. Средняя зарплата — 195 тысяч рублей. Обучение можно совмещать с работой, а поступить — уже с третьего курса. Выбери свое направление: — Онлайн-магистратура по ML. — Продуктовая аналитика. — Машинное обучение. — Продуктовый менеджмент. — Backend-разработка. И подавай заявку на поступление уже сейчас. Реклама. АНО ВО "Центральный университет", ИНН 7743418023, erid:2RanynhVH6Z

30 034

🔅 Manus — теперь с модулем Audio Что нового - Читает длинные отчёты и создаёт аудиофайлы - Удобное упарвление голосом: можно слушать, давать команды и одновременно делать другие дела - Генерирует подкасты - Озвучивает доки и презентации и многое другое Когда удобнее слушать, чем читать — включите Manus и продолжайте работу. https://audio.manus.space

30 034

Из окон офисов VK — самые красивые закаты. А в самих офисах обитают самые любимые коллеги! Ребята не только делают сервисы VK быстрее и удобнее, но и любят делиться знаниями. Совсем скоро они проведут открытый Java AI-митап и расскажут о том, как мы масштабируем процессы, а ещё поделятся фишками, которые стоят за сервисами VK. Откликайтесь, если откликается!

30 034

Repost from Machinelearning

🌟 WM-ABench: тестирование VL-моделей на понимание физики реального мира. Мaitrix Org разработали WM-ABench, бенчмарк для оценки VLM в качестве так называемых «моделей мира». Идея проста: проверить, насколько хорошо топовые модели способны не просто распознавать картинки, а понимать окружающую действительность и предсказывать ее изменения. Создатели, опираясь на когнитивную науку, создали фреймворк, который тестирует 15 самых популярных моделей по 23 параметрам, разделяя процесс на 2 ключевых этапа: восприятие и прогнозирование. В основе бенчмарка - огромный датасет из более чем 100 тысяч примеров, сгенерированных в 6 различных симуляторах, от ThreeDWorld и Physion до Carla. Чтобы модели не искали легких путей и не полагались на поверхностные совпадения, в тест добавили «сложные негативы» - контрфактические состояния, которые заставляют систему действительно анализировать происходящее. Весь процесс был разделен на оценку восприятия (распознавание объектов, пространства, времени, движения) и прогнозирования (симуляция физики, транзитивный и композиционный вывод). Для калибровки сложности задач были установлены базовые показатели, основанные на результатах людей. 🟡Результаты. С простым визуальным восприятием, то есть с определение цвета или формы, все модели справляются отлично. Однако когда дело доходит до трехмерного пространственного мышления, динамики движения или временных последовательностей, начинаются серьезные проблемы. Выяснилась и другая любопытная деталь: VLM склонны «спутывать» физические понятия. Например, если в сцене изменить только цвет объекта, модель может внезапно ошибиться в оценке его размера или скорости. Оказалось, что цвет и форма являются самыми влиятельными атрибутами, которые искажают восприятие других, не связанных с ними характеристик. 🟡Но главная проблема кроется глубже. Точное восприятие мира совершенно не гарантирует точного прогноза. Исследование показало, что даже при идеально верном распознавании текущего состояния сцены модели проваливают предсказание физических взаимодействий. Разрыв с человеческими способностями явный: в задачах на транзитивный вывод он достигает 46%, а композиционный вывод выполняется на уровне случайного угадывания. 🟡Бенчмарк подсветил фундаментальный недостаток: У современных VLM отсутствуют базовые знания физики, необходимые для симуляции даже простейших событий. Они видят мир, но не понимают, по каким законам он живет. 📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Arxiv 🟡Датасет @ai_machinelearning_big_data #AI #ML #VLM #Benchmark #Maitrix

30 034

📚 Best System Design Resources — удобная шпаргалка для интервью и прокачки архитектуры * 100+ отобранных материалов: курсы, книги, статьи, интервью-чеклисты и блоги инженеров крупных компаний. * Упор на практику для System Design Interview: есть готовые cheat-sheets от Exponent, ByteByteGo и DesignGuru, а также более 50 типовых задач. * Секции «Курсы», «Книги», «Теория и алгоритмы», «Кейс-стади» и «Engineering Blogs» помогают быстро закрыть пробелы перед собеседованием. * Более 2 500★ на GitHub — комьюнити регулярно дополняет подборку. Полезно, если нужно системно повторить концепции перед FAANG-интервью или собрать личную базу знаний по архитектуре. 📌 Github @machinelearning_interview

30 034

📌 TorchScale — библиотека для масштабирования трансформеров от Microsoft. Когда стандартные архитектуры трансформеров упираются в ограничения глубины и длины последовательностей, этот проект предлагает набор решений: от DeepNet (1000+ слоёв) до революционного RetNet — потенциального преемника классических трансформеров. Библиотека выглядит как исследовательский полигон: здесь собраны последние наработки Microsoft в области LLM, включая BitNet и Multiway-архитектуры для мультимодальных задач. Хотя проект требует PyTorch и мощных GPU, его минималистичный API позволяет быстро экспериментировать с передовыми подходами. 🤖 GitHub @machinelearning_interview