ru
Feedback
Машиннное обучение | Наука о данных Библиотека

Машиннное обучение | Наука о данных Библиотека

Открыть в Telegram

админ - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 № 5037635661

Больше

📈 Аналитический обзор Telegram-канала Машиннное обучение | Наука о данных Библиотека

Канал Машиннное обучение | Наука о данных Библиотека (@machinelearning_books) является активным участником. Сейчас сообщество объединяет 16 930 подписчиков, занимая 7 808 место в категории Технологии и приложения и 39 815 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 16 930 подписчиков.

Согласно последним данным от 05 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -56, а за последние 24 часа — -5, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 9.91%. В первые 24 часа после публикации контент обычно набирает 3.68% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 1 678 просмотров. В течение первых суток публикация набирает 623 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 13.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как llm, контекст, точность, рассуждение, архитектура.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
админ - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 № 5037635661

Благодаря высокой частоте обновлений (последние данные получены 06 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

16 930
Подписчики
-524 часа
-217 дней
-5630 день
Архив постов
Repost from Machinelearning
✔️ Anthropic обнулила лимиты после сбоя в Claude Code Компания сообщила, что полностью сбросила пятичасовой и недельный лимит
✔️ Anthropic обнулила лимиты после сбоя в Claude Code Компания сообщила, что полностью сбросила пятичасовой и недельный лимиты для всех подписчиков тарифов Pro и Max. Это решение должно компенсировать платным пользователям повышенный расход ресурсов, вызванный программным сбоем. Причиной проблемы стало то, что некоторые сессии Claude Code ошибочно запускали большое число параллельных субагентов. Из-за этого квоты расходовались заметно быстрее, чем предполагалось. Пользователи жаловались в соцсетях на аномально быстрое исчерпание квот при работе с Claude Code: в ряде случаев дневной лимит заканчивался уже после нескольких простых запросов.
В сообществе разработчиком высказывались предположения, что резкое сокращение доступных квот связано с новой версией функции Dynamic Workflows. Anthropic это опровергла.
Согласно пояснению, причина кроется в особенностях обработки запросов к Opus 4.8: из-за них модель инициировала больше одновременных вызовов инструментов, чем было заложено. Сам сбой, как утверждается, уже устранён. @ai_machinelearning_big_data #news #ai #ml

🖥 Сервисы крутятся. Прод вроде живой. Но когда тимлид спрашивает: «почему здесь лучше ValueTask, а не Task?» или «как GC пов
🖥 Сервисы крутятся. Прод вроде живой. Но когда тимлид спрашивает: «почему здесь лучше ValueTask, а не Task?» или «как GC поведёт себя под нагрузкой?» - ты начинаешь плыть. И дело не в том, что ты плохо пишешь код. Просто большинство курсов заканчиваются ровно там, где начинается настоящий .NET. Этот курс про то, что обычно остаётся под капотом: - CLR - JIT - GC - Span - async state machine - Source Generators - lock-free подходы - OpenTelemetry - дампы в проде На практике разбираем, как .NET реально работает внутри: что происходит с кодом после компиляции, как память живёт под нагрузкой, почему async иногда помогает, а иногда ломает производительность, как читать проблемы по дампам и метрикам, а не гадать по логам. Если хочешь дойти до уровня, где система для тебя не чёрный ящик, а инструмент, который ты понимаешь до IL, - велкам. Сейчас на stepik доступна скидка 55%: https://stepik.org/a/288694

ИИ начал писать «как великие авторы». И читатели выбрали ИИ Представьте писателя, который 40 лет собирал свой стиль: - ритм ф
ИИ начал писать «как великие авторы». И читатели выбрали ИИ Представьте писателя, который 40 лет собирал свой стиль: - ритм фраз - способ начинать сцену - интонацию - вес каждого слова - годы отказов, черновиков и переписываний А потом исследователи берут все его книги, дообучают на них ChatGPT и просят написать новый текст в его голосе. Дальше - слепой тест. Без подписи. Без подсказок. Только два текста: - один написан человеком - второй сгенерирован ИИ Оценивали не случайные люди. В исследовании участвовали MFA-авторы, обычные читатели, 50 известных писателей, 8 нобелевских лауреатов, лауреаты Пулитцера и Букера. И вот где становится неприятно. Когда ChatGPT просто просили «напиши как этот автор», эксперты быстро видели подделку. Текст звучал как ИИ. Но когда модель дообучили на полном корпусе книг конкретного автора, всё перевернулось. Эксперты чаще выбирали уже ИИ: - как более похожий по стилю - как более качественный по письму - как текст, который звучит ближе к автору AI-детектор тоже сломался. Обычный AI-текст Pangram ловил в 97% случаев. Дообученный под автора - только в 3%. Медианная цена дообучения и генерации под одного автора - около $81. То есть модель может взять десятилетия чужого труда, стиль, голос, литературную ДНК - и за копейки начать писать так, что читатели предпочитают её оригиналу. Если каждая новая книга автора становится обучающим материалом для системы, которая потом пишет следующую книгу без него, что именно защищает авторское право? arxiv.org/pdf/2510.13939

⚙️ ASMLings - подробный гайд на русском ASMLings - это набор из ~32 коротких упражнений на ассемблере Intel 8086, выстроенных
+1
⚙️ ASMLings - подробный гайд на русском ASMLings - это набор из ~32 коротких упражнений на ассемблере Intel 8086, выстроенных по возрастанию сложности: от mov ax, 0x1337 до 32-битного сложения через carry flag, циклов, подпрограмм, работы с памятью и стеком. Полный русскоязычный гайд по asmlings — интерактивной песочнице для изучения ассемблера Intel 8086, в которой 16-битный x86-эмулятор написан на Rust. Внутри: что это, как устроено под капотом, как установить, как читать и решать упражнения, разборы реальных задач из репозитория, готовые примеры в examples/ и шпаргалки. https://github.com/justxor/-ASMLingsru/

🤖 Machine Learning Roadmap: от базы до гуру вайбкодинга Карта обучения машинному обучению (Machine Learning, Deep Learning,
🤖 Machine Learning Roadmap: от базы до гуру вайбкодинга Карта обучения машинному обучению (Machine Learning, Deep Learning, LLM, Generative AI, MLOps) - от первого import numpy до уровня инженера, который понимает, как ИИ работает внутри, и может писать прод‑системы, а не только дёргать API. https://github.com/justxor/MachineLearningRoadmap/tree/main

Stanford холодно ломает миф про «толпу AI-агентов» Новая статья Stanford разбирает популярную идею: если один LLM хорошо реша
Stanford холодно ломает миф про «толпу AI-агентов» Новая статья Stanford разбирает популярную идею: если один LLM хорошо решает задачу, то несколько агентов с ролями, дебатами и пайплайнами должны решать её ещё лучше. Оказалось, не всегда. Если дать одиночному агенту и multi-agent системе одинаковый бюджет reasoning-токенов, один сильный агент чаще решает multi-hop задачи не хуже, а иногда лучше. Причина почти неприятно простая: один агент держит всю цепочку рассуждения внутри себя. Multi-agent система вынуждена дробить её на сообщения, summary и handoff между агентами. А каждый handoff - это сжатие. Сжали мысль, потеряли часть контекста, передали дальше уже не полную картину. Потом это почти невозможно восстановить. Авторы объясняют это через Data Processing Inequality: обработка данных не создаёт новую информацию из воздуха, а чаще теряет её. Эксперименты на Qwen, DeepSeek и Gemini показали похожую картину: при равном бюджете single-agent обычно догоняет или обходит sequential, debate, role-based и ensemble схемы на FRAMES и MuSiQue. Но это не значит, что multi-agent бесполезен. Он становится полезнее, когда контекст одиночного агента специально портят: маскируют данные, подмешивают отвлекающие факты или сбивают эффективное использование контекста. Тогда внешняя структура иногда помогает удержать задачу. Больше агентов - не автоматический апгрейд. Часто «победа multi-agent» означает только одно: системе дали больше test-time compute, больше токенов и больше попыток. Для multi-hop reasoning дефолт теперь выглядит так: сначала один сильный агент. А несколько агентов - уже не магия, а ремонтная стратегия, когда контекст грязный, задача плохо структурирована или нужен внешний контроль. Paper: arxiv.org/abs/2604.02460

NVIDIA показала, что 4-bit обучение LLM больше не выглядит безумием NVIDIA обучила 12-миллиардную LLM в 4-битной точности на
NVIDIA показала, что 4-bit обучение LLM больше не выглядит безумием NVIDIA обучила 12-миллиардную LLM в 4-битной точности на 10 триллионах токенов. И это гораздо важнее, чем звучит на первый взгляд. До сих пор индустрия жила с простым правилом: хочешь нормально обучать большую модель - используй 16-bit или хотя бы 8-bit. Уход в 4-bit считался почти гарантированной дорогой к нестабильности, развалу градиентов и деградации качества. Но NVIDIA показала, что проблема была не в самой 4-битной точности, а в том, как именно числа представлены. Ключевая штука - формат NVFP4. Вместо грубого универсального масштаба он использует micro-scaling: числа разбиваются на маленькие блоки, и для каждого блока применяется свой scale factor. Проще говоря, модель получает сильно сжатое представление данных, но без потери важных деталей. Результат выглядит как сдвиг в экономике обучения: - арифметика быстрее в 2-3 раза - память режется примерно на 50% - качество почти не проседает - 4-bit модель идёт практически рядом с 8-bit baseline На MMLU, GSM8K и coding-бенчмарках разница оказалась около 0.1%. То есть модель стала дешевле и легче, но почти не стала глупее. https://arxiv.org/abs/2509.25149

👣 На Stepik обновили курс «Rust: полный курс разработчика. С нуля до профи» Представьте: через три месяца вы открываете чужо
👣 На Stepik обновили курс «Rust: полный курс разработчика. С нуля до профи» Представьте: через три месяца вы открываете чужой Rust-код и читаете его как книгу. Arc<Mutex<T>> не вызывает панику. impl Future не пугает. Вы точно знаете, почему компилятор ругается и как это починить за 10 секунд. Это не фантазия. Это результат 50 уроков, в которых каждая концепция объясняется через код и закрепляется практикой. Ownership, traits, generics, async, unsafe - всё, что казалось магией, станет рабочим инструментом. А бонусом - портфолио проектов: от CLI-утилит до REST API и WebAssembly. Вы и так знаете, что Rust - ваш следующий язык. Этот курс просто сделает это реальностью. Сегодня - 55% процентов от цены, торопись: https://stepik.org/a/269250/

⚡️ ИИ должен был разгрузить людей. В итоге он жарит мозг Harvard Business Review описывает новый офисный синдром - AI brain f
⚡️ ИИ должен был разгрузить людей. В итоге он жарит мозг Harvard Business Review описывает новый офисный синдром - AI brain fry. Это когда человек не отдыхает благодаря ИИ, а наоборот быстрее выгорает, потому что теперь управляет ещё и цифровыми помощниками. По данным исследования на 1500 сотрудников, ИИ часто не снижает нагрузку, а разгоняет её. Вместо одной задачи у тебя появляется несколько параллельных потоков: поставить задачу модели, проверить ответ, исправить ошибки, сравнить варианты, принять решение и не пропустить галлюцинацию. Больше всего достаётся тем, кто использует ИИ агрессивно: разработчикам, IT-специалистам, финансистам и другим людям, которые пытаются выжать из себя больше обычного. Когда ты следишь за несколькими AI-выводами сразу, усталость растёт, а принимать решения становится сложнее. Получается парадокс: инструмент для ускорения работы превращается в ещё одну работу. Раньше ты делал задачу. Теперь ты ещё и менеджер маленькой армии стажёров, которые работают быстро, но требуют постоянной проверки. hbr.org/2026/03/when-using-ai-leads-to-brain-fry

OpenAI запускает OpenAI Deployment Company - отдельную deployment-компанию для внедрения AI в корпорации. В официальном анонс
+1
OpenAI запускает OpenAI Deployment Company - отдельную deployment-компанию для внедрения AI в корпорации. В официальном анонсе всё выглядит спокойно: больше $4 млрд стартовых инвестиций, majority control у OpenAI, партнёры из private equity, консалтинга и системной интеграции, плюс покупка Tomoro, чтобы сразу получить команду примерно из 150 AI deployment-специалистов. Axios пишет, что у инвесторов есть условия, которых нет в официальном анонсе: гарантированный минимальный возврат 17.5% и capped profits. То есть снизу доходность защищена, сверху прибыль ограничена. И вот тут история становится намного интереснее. OpenAI получает не просто деньги. Она получает доступ к портфелям private equity-фондов, а это тысячи компаний, куда можно заносить AI не через холодные продажи, а через уже существующих владельцев и совет директоров. Схема выглядит так: - private equity даёт капитал - OpenAI даёт модели, инженеров и deployment-практику - портфельные компании становятся каналом внедрения - инвесторы получают понятную финансовую конструкцию - OpenAI получает enterprise-дистрибуцию, которую нельзя быстро скопировать одним API Frontier labs уже не хватает просто выпустить сильную модель и ждать, что бизнес сам всё встроит. Настоящие деньги будут там, где модель подключена к данным, процессам, безопасности, продажам, операционке и внутренним системам комп Продуктом становится внедрение. И OpenAI, похоже, строит свою версию Palantir-стиля: forward-deployed engineers, работа внутри клиента, AI как операционная перестройка, а не как подписка на чатик. Поэтому за этой структурой стоит следить. Не из-за красивой цифры $4 млрд, а потому что frontier labs начинают использовать private equity одновременно как источник капитала и как канал распространения. https://www.axios.com/2026/05/11/openai-deployco-private-equity

🦀 Rust против C в embedded - не на словах, а в реальном тесте. Исследователи взяли промышленное IoT-железо и запустили на нё
🦀 Rust против C в embedded - не на словах, а в реальном тесте. Исследователи взяли промышленное IoT-железо и запустили на нём две реализации одной и той же функциональности. Одна команда писала на C. Другая - на Rust. Системы работали параллельно несколько месяцев в реальных условиях, а не в синтетическом бенчмарке. Итог оказался неприятным для старого аргумента «для embedded нужен только C». Rust не проиграл C ни по памяти, ни по скорости выполнения. Более того, runtime на Ariel OS оказался даже компактнее, чем классический bare-metal стек на C. Вывод простой: аргумент «C быстрее и легче для прошивок» теперь звучит гораздо слабее. Rust в embedded - это вполне рабочая альтернатива. 🔗 Подоробности: https://arxiv.org/abs/2604.25679 #Rust #RustLang #EmbeddedSystems #IoT #SystemsProgramming #C

🖥 Курс «Git Pro: от первого коммита до уровня senior» - на Stepik project_final_v2_FINAL_truly_final - знакомо? Значит, пора
🖥 Курс «Git Pro: от первого коммита до уровня senior» - на Stepik project_final_v2_FINAL_truly_final - знакомо? Значит, пора. Большинство разработчиков знают 5 команд Git и боятся шестую. Коммитят в main, гуглят «how to undo» и копируют папку «на всякий случай». Это не работа - это выживание. После курса вы: — делаете rebase, не задерживая дыхание; — разбираете конфликт на 200 файлов по алгоритму; — возвращаете «потерянные навсегда» коммиты за 30 секунд через reflog; — пишете историю, которую не стыдно показать на code review. Git Flow, trunk-based, Pull Request, защита веток, CI/CD-хуки — всё, что отличает джуна от senior в командной работе. Скидка 53%, 48 часов: https://stepik.org/course/284799/

⚡️ Vibe coding разбился о реальную разработку Новое исследование UC San Diego и Cornell посмотрело, как 112 опытных разработч
⚡️ Vibe coding разбился о реальную разработку Новое исследование UC San Diego и Cornell посмотрело, как 112 опытных разработчиков используют AI-агентов в настоящей работе, а не в демо для X. Вывод простой: профессионалы не «вайбкодят». Они не кидают агенту мутный промпт, не закрывают глаза на diff и не ждут, что модель сама соберёт production-систему. Они делают наоборот. Сначала описывают архитектуру, ограничения и крайние случаи. Потом дают агенту маленькую, хорошо очерченную задачу. После генерации читают diff, проверяют логику и не дают модели трогать больше, чем нужно. То есть AI-агент в руках сильного разработчика - это не автономный senior. Это быстрый junior, который хорошо делает рутину, но требует контроля. Самое интересное начинается на сложных задачах. Как только работа задевает несколько систем, требует продуктовых решений или имеет неясные требования, опытные разработчики забирают управление обратно. Не потому что они против AI, а потому что знают цену невнимательно принятого кода. В статье также приводятся жёсткие цифры из других работ: в одном эксперименте опытные open-source maintainers стали на 19% медленнее с AI, а реальная агентная система в issue tracker довела до merge только 8% запусков. Это не приговор AI-кодингу. Это приговор сказке про «не думай, просто доверься агенту». AI ускоряет разработку там, где у человека уже есть сильная инженерная рамка: ясная постановка задачи, ограниченный контекст, понятные критерии качества и обязательное ревью. Поэтому главный навык ближайших лет - не vibe coding, а control coding. Не «пусть модель пишет всё». А «пусть модель быстро делает кусок работы, который я понимаю, ограничиваю и проверяю». Красивые демо продают ощущение магии. Хороший софт всё ещё делают через контроль, ответственность и чтение diff. https://arxiv.org/abs/2512.14012

Anthropic показала исследование, где Claude смог решать реальные задачи по биоинформатике, с которыми не справились люди-эксп
Anthropic показала исследование, где Claude смог решать реальные задачи по биоинформатике, с которыми не справились люди-эксперты. Речь не про школьные тесты по биологии и не про аккуратные вопросы с очевидным ответом. Проблема старых научных бенчмарков в том, что они часто проверяют «чистые» задания, а не грязную работу с настоящими биологическими датасетами. Для этого Anthropic сделала BioMysteryBench. В нём правильные ответы спрятаны внутри реальных датасетов, а оценивается только финальный результат. Claude получает стандартные инструменты биологии и доступ к базам данных, а параллельно те же задачи пробуют решать до пяти экспертов. Всего было 99 задач. На 76 задачах, которые смог решить хотя бы один эксперт, лучшая модель набрала около 83%. Но самое интересное - 23 задачи оказались «human-difficult»: экспертная панель не смогла их решить. На этом наборе Claude Mythos Preview решил 29.6%. Правда, есть важная оговорка. На самых сложных задачах успехи были менее стабильными при пяти повторных попытках. То есть часть побед выглядела не как надёжное мастерство, а как удачная попытка. Claude начинает быть похож на очень быстрого исследовательского напарника: комбинирует методы, перепроверяет факты, использует широкий фон знаний и помогает быстрее сузить пространство поиска. https://www.anthropic.com/research/Evaluating-Claude-For-Bioinformatics-With-BioMysteryBench

Repost from Machinelearning
✔️ Mistral выпустила Medium 3.5 и Remote Agents в среде Vibe Medium 3.5 - модель на 128 млрд параметров с контекстным окном 256K токенов. Веса опубликованы на Hugging Face под модифицированной лицензией MIT. Цена API - $1,50/$7,50 за млн. входящих/сгенерированных токенов. Уровень рассуждений настраивается под каждый промпт. На SWE-Bench Verified модель набрала 77,6%, опередив Claude Sonnet 4.5. Вместе с моделью Mistral представила Remote Agents в среде Vibe. Сессию рефакторинга или генерации кода, начатую локально, можно перенести в облако: агент дальше работает асинхронно в изолированной песочнице, ставит зависимости, вносит правки и создаёт PR. Le Chat получил Work Mode для многошаговых задач: ассистент на базе Medium 3.5 разбирает почту, сверяется с календарём, заводит тикеты в Jira. mistral.ai ✔️ AWS запустил Amazon Quick: фоновый ассистент с долговременной памятью. Quick - десктопный ассистент, который работает в фоне, индексирует локальные файлы, календари и почту и подключается к Slack, Teams, Outlook, Gmail, Salesforce и Jira. Он строит персональный граф знаний пользователя: запоминает предпочтения, контакты в команде и бизнес-контекст между сессиями. Параллельно отслеживает активность в приложениях и подтягивает документы к встречам, напоминает о задачах и предупреждает о конфликтах в расписании. В релизе: генерация приложений, дашбордов и веб-страниц по текстовым запросам, а также создание документов, презентаций, инфографики и изображений прямо в чате. Плюс браузерная автоматизация и интеграция с Kiro CLI и Claude Code. Quick доступен в 2 тарифах - бесплатном и Plus. aboutamazon.com ✔️ Exa становится одним из поисковых бэкендов Gemini Exa получила 2 канала интеграции с Gemini: Grounding with Exa в Vertex AI (пока в режиме превью) и Exa Agent на маркетплейсе агентов в Gemini Enterprise. Grounding with Exa подключает Gemini к публичному вебу через API Exa. Модель Highlights отбирает из страниц релевантные фрагменты и отдаёт их в контекст вместо сырого HTML- это снижает шум на задачах, где важна свежесть данных или фактическая точность. Exa Agent работает из рабочего пространства Gemini: ресерч по вебу, поиск похожих страниц, вытягивание контента по URL. Установка - через каталог агентов, без кода. exa.ai ✔️ Исследователь Manifold обнаружил ботнет из агентов на ClawHub Акс Шарма из Manifold обнаружил на платформе ClawHub кампанию ClawSwarm: 30 скиллов для OpenClaw превращали ИИ-агентов в криптовалютный ботнет. Суммарно расширения скачали около 10 тысяч раз. Вредоносная логика лежит в инструкциях файлов SKILL.md: агент в фоне регистрируется на стороннем сервере, передаёт список своих возможностей, создаёт криптокошелёк в сети Hedera и отправляет управляющему узлу приватный ключ. Каждые 4 часа агент опрашивает сервер за новыми задачами по фармингу токенов. Сканеры безопасности угрозу не ловят: скрипты делают чистые запросы и используют официальные SDK, да и атака сводится к злоупотреблению логикой ИИ, а не к программному взлому. theregister.com ✔️ ElevenMusic: стриминг с генерацией и монетизацией ремиксов ElevenLabs запустила площадку ElevenMusic, где стриминг совмещён с генерацией треков. На бесплатном тарифе доступно 7 генераций в день, подписка за $9,99 в месяц поднимает лимит до 500 композиций. Треки можно публиковать и слушать только внутри сервиса. Для использования в играх, рекламе и других внешних продуктах нужен тариф ElevenCreative Music. На старте в каталоге работы более 4000 авторов. Слушатель может менять темп или жанр любого трека из библиотеки и собирать собственные композиции по текстовым промптам. Платформа платит авторам за прослушивания оригиналов и ремиксов - та же механика, что в библиотеке голосов ElevenLabs, где создатели моделей суммарно получили более $11 млн. elevenlabs.io

Первая open-source end-to-end unified multimodal model. SenseTime выпустила SenseNova-U1 - мультимодальную модель, которая об
Первая open-source end-to-end unified multimodal model. SenseTime выпустила SenseNova-U1 - мультимодальную модель, которая объединяет понимание, рассуждение и генерацию в одной непрерывной системе. Большинство мультимодальных моделей либо понимают изображения, либо генерируют изображения. Обычно это разные инструменты, сшитые вместе. SenseNova-U1 умеет делать и то, и другое нативно, в рамках одной архитектуры. Главная инновация - архитектура NEO-Unify. Она убирает и visual encoder, и variational autoencoder. Всё происходит в едином пространстве представлений. Что это открывает: • Native interleaved reasoning - модель может генерировать изображения прямо в процессе рассуждения, а не через отдельные tool calls. То есть она способна решать задачи, создавая визуальные промежуточные шаги нативно. • Сильная генерация инфографики - сложные PPT-слайды, постеры, диаграммы с высокой плотностью информации. Единое понимание и генерация делают модель особенно сильной в структурированных визуалах. • SOTA-производительность - модель показывает state-of-the-art результаты среди open-source моделей как на benchmark’ах понимания, так и генерации. Выпущены две модели: • SenseNova-U1-8B-MoT - dense-модель на 8B параметров • SenseNova-U1-A3B-MoT - MoE-модель на 38B параметров с 3B активных Обе модели доступны в open source на GitHub и Hugging Face. Почему это важно: современные мультимодальные системы часто используют adapters, чтобы переводить данные между разными модальностями. SenseNova-U1 работает с языком и зрением нативно. Понимание и генерация используют одно и то же пространство представлений. Благодаря этому модель может понимать сложные визуальные материалы и генерировать структурированную инфографику без переключения между разными системами. Модель полностью open source. Model Weights: https://huggingface.co/collections/sensenova/sensenova-u1 Github Repo: https://github.com/OpenSenseNova/SenseNova-U1

🖥 На Stepik обновили курс «C# с нуля до профи» Представьте: через четыре месяца вы открываете чужой .NET-проект и читаете ег
🖥 На Stepik обновили курс «C# с нуля до профи» Представьте: через четыре месяца вы открываете чужой .NET-проект и читаете его как книгу. IServiceCollection не вызывает ступора. async Task<IActionResult> пишется на автомате. Вы точно знаете, почему EF Core сгенерировал именно такой SQL - и как переписать запрос, чтобы он летал. Это не фантазия. Это результат после 16 модулей, в которых каждая концепция объясняется через код и закрепляется практикой. ООП, SOLID, LINQ, async/await, DI, EF Core, ASP.NET Core, Docker, Kubernetes - всё, что казалось магией, станет рабочим инструментом. А бонусом - портфолио проектов: от CLI-утилит и REST API до собственного SaaS с multi-tenancy, JWT и деплоем в Kubernetes под TLS. Скидка - 58% доступна 48 часов: https://stepik.org/a/282984/

Repost from Machinelearning
🌟 Sakana AI открыла бета-тест супер-оркестратора LLM Японская лаборатория запустила бета-тестирование Sakana Fugu — своего п
+2
🌟 Sakana AI открыла бета-тест супер-оркестратора LLM Японская лаборатория запустила бета-тестирование Sakana Fugu — своего первого международного коммерческого продукта. Это система-оркестратор, которая динамически собирает команду из GPT-5, Gemini, Claude и опенсорсных моделей и распределяет между ними подзадачи. 🟡Fugu основан на предыдущих работах Sakana - Conductor и TRINITY. В Conductor обучили 7B-модель через RL: на каждом шаге она решает, какого агента вызвать, какую подзадачу ему сформулировать и какие предыдущие сообщения передать в контекст. Говоря проще - мелкая модель работает мета-промпт-инженером для больших. На простых вопросах Conductor отвечает за один проход, а на сложных задачах сам выстраивает цепочку "планировщик — исполнитель — верификатор". Дополнительно метод способен делать рекурсивный самовызов: модель читает собственный инференс, определяет, что первая попытка провалилась, и запускает корректирующий рабочий процесс. 🟡Тесты Сама по себе модель-дирижёр (которая на 7B) в тестах показал 83,9% на LiveCodeBench и 87,5% на GPQA-Diamond, обогнав не только модели из своего весового пула, но и мультиагентные бейзлайны Mixture-of-Agents (тут правда только по стоимости, но обогнала). В коммерческой версии методы доработаны: fugu-ultra выбила 95,1% на GPQA Diamond (против 94,4% у Gemini 3.1 и 92,7% у Opus 4.6), 93,2% на LiveCodeBench v6 и 54,2% на SWE-Pro. Доступ к Fugu через API, совместимый с форматом OpenAI. В линейке 2 модели: скоростная Fugu Mini для быстрых ответов и Fugu Ultra с полным пулом для тяжёлого ризонинга. Заявки на бета-тест уже принимаются.
Conductor и TRINITY приняты на ICLR 2026.
🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Orchestration #FUGU #SakanaAi

Оказалось, нейросети тайно болеют Японией Свежая работа исследователей ломает удобный миф о том, что большие языковые модели
Оказалось, нейросети тайно болеют Японией Свежая работа исследователей ломает удобный миф о том, что большие языковые модели смотрят на мир глазами белого американца. Если копнуть, выясняется странное: Claude, GPT и остальные тяжеловесы при любом удобном случае подсовывают пользователю Японию. Спросишь про традиционные танцы, получишь бон-одори и кабуки. Спросишь, что люди едят каждый день, на тарелке окажутся суши и мисо. Даже когда речь про реки и поселения, в пример прилетает Тонэ. Дальше с большим отрывом идут США, Индия, Китай и Франция. Остальные страны будто стёрты ластиком. На этапе предобучения, когда модель просто глотает интернет, перекоса нет. Японский крен появляется уже на файнтюне, когда модель учат быть вежливой и полезной. То есть виноваты не данные, а живые люди, которые её дообучают. Логика тоже забавная. На английском в топе США, на китайском Китай, на русском своё. Но как только заходит речь про чужие страны, представителем «иностранного» почти всегда становится Япония. Это культурный второй язык по умолчанию. У моделей, которым мы доверяем объяснять мир, есть свои культурные любимчики, и берутся они не из сырых данных, а из человеческой разметки. https://ai-data-base.com/paper/2604-21751

DeepSeek оценили в $20 млрд: Tencent и Alibaba дерутся за место в раунде Лаборатория, которая обучила модель уровня GPT‑4 за
+1
DeepSeek оценили в $20 млрд: Tencent и Alibaba дерутся за место в раунде Лаборатория, которая обучила модель уровня GPT‑4 за $6 млн, впервые пустила внешних инвесторов. За несколько дней оценка удвоилась и перевалила за $20 млрд. Tencent предложил забрать сразу 20%, DeepSeek отказал, но переговоры продолжаются. Alibaba тоже рвётся в сделку. Почему вдруг открылись? Уходят ключевые инженеры. Го Дая, ведущий автор R1, ушёл в ByteDance. Ван Бинсюань забрал Tencent, Ло Фули переманили в Xiaomi. На балансе хедж‑фонда войну за таланты с гигантами не выиграть, нужны свежие деньги. Дальше самое интересное. Следующий флагман строят под чипы Huawei, и инженеры Huawei прямо сейчас сидят внутри процесса обучения и ловят баги стабильности. Если получится, Китай впервые выпустит фронтирную модель вообще без американского железа. Китай уже прогоняет 140 триллионов токенов в день против 100 миллиардов в начале 2024 года. Рост больше чем в тысячу раз. И компания, которая обнулила всем представления о стоимости обучения, получает $300+ млн на масштабирование. https://t.me/data_analysis_ml/5036