Machinelearning

前往频道在 Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

显示更多

网络:Machinelearning 俄罗斯1 258 技术与应用323...

📈 Telegram 频道 Machinelearning 的分析概览

频道 Machinelearning (@ai_machinelearning_big_data) 俄语语言赛道中的是活跃参与者。目前社区聚集了 297 740 名订阅者，在 技术与应用 类别中位列第 323，并在 俄罗斯 地区排名第 1 258 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 297 740 名订阅者。

根据 13 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -7 002，过去 24 小时变化为 -157，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 8.06%。内容发布后 24 小时内通常能获得 5.70% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 24 001 次浏览，首日通常累积 16 986 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 182。
主题关注点： 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

凭借高频更新（最新数据采集于 14 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

297 740

订阅者

-15724 小时

-1 5127 天

-7 00230 天

24 001

帖子浏览量

~ 16 98624 小时

~ 19 16148 小时

8.06%

参与率

~ 6

每日帖子数

Ads index

beta

帖子存档

297 740

✔️ OpenAI запустила ChatGPT Health. ChatGPT Health — отдельный раздел чат-бота исключительно для запросов, связанных со здоровьем, с возможностью интеграции с сервисами трекинга: Apple Health, MyFitnessPal, а также с личными медицинскими записями для анализа результатов анализов и истории болезни. Вопросы приватности и безопасности данных решены с помощью многоуровневого шифрования и отдельной инфраструктуры; данные из ChatGPT Health по умолчанию не используются для обучения основных моделей ChatGPT. Доступ к бета-версии открыт через лист ожидания для пользователей за пределами ЕС, Швейцарии и Великобритании; интеграция с медицинскими картами пока доступна только в США. openai.com ✔️ Китай проверяет сделку по покупке Manus на нарушение экспортного контроля. Министерство торговли КНР начало расследование приобретения стартапа Manus. Власти подозревают, что релокация сотрудников и технологий компании из Китая в Сингапур с последующей продажей американскому техно-гиганту могла быть попыткой обхода требований по лицензированию экспорта технологий. Команда и основатели Manus покинули Китай летом 2025 года, чтобы дистанцироваться от геополитических рисков. Этот маневр позволил привлечь $75 млн. от американского фонда Benchmark, что ранее уже вызывало вопросы у Минфина США. Компания Цукерберга утверждает, что на момент закрытия сделки в Manus не осталось китайского капитала, однако Пекин намерен выяснить, легально ли технологии покинули страну до того, как стартап сменил юрисдикцию. ft.com ✔️ Siemens и NVIDIA создадут ИИ-ОС для заводов. Компании объявили о расширении партнерства ради создания единой среды Industrial AI Operating System. Она построена на концепции централизованного интеллекта, который позволит непрерывно анализировать цифровые двойники и валидировать любые производственные изменения в виртуальной среде до их реализации в поле. Эталоном такого производства станет завод Siemens в немецком Эрлангене. Для инженеров альянс готовит новые инструменты. В середине 2026 года выйдет Digital Twin Composer на движке NVIDIA Omniverse для построения промышленных мета-вселенных, а интеграция библиотек CUDA-X в программный стек Siemens обещает кратный прирост производительности в проектировании полупроводников и тяжелых инженерных симуляциях. press.siemens.com ✔️ OpenAI, Anthropic и Google разделили лидерство в Intelligence Index 4.0. Artificial Analysis представила 4-ю версию рейтинга ИИ-моделей, зафиксировав жесткую конкуренцию между топовыми игроками. Формальное лидерство досталось GPT-5.2 (Х-High), однако Claude Opus 4.5 и Gemini 3 Pro отстают от нее с минимальным разрывом, фактически образуя тройку равных лидеров. В новой итерации индекса заметно просели абсолютные показатели: лучшие модели теперь набирают в районе 50 баллов против 73 в прошлой версии. Это связано с ужесточением методологии и ротацией тестовых наборов. На смену AIME 2025 и MMLU-Pro пришли более суровые тесты: AA-Omniscience для проверки эрудиции и склонности к галлюцинациям, GDPval-AA для прикладных задач в 44 сферах и CritPt, оценивающий способности в физических исследованиях. Итоговый балл формируется из 4-х категорий: агенты, программирование, научное мышление и общие задачи. Artificial Analysis в сети Х ✔️ Учёные из Ватерлоо научились бэкапить квантовые данные. Команда из Университета Ватерлоо решила одну из фундаментальных проблем квантовых вычислений — невозможность прямого копирования информации. Суть метода, описанного в Physical Review Letters, заключается в шифровании квантовой информации в процессе ее копирования. Как поясняют авторы, запрет на клонирование можно обойти, если создавать неограниченное количество зашифрованных дубликатов кубитов. Механизм защиты работает через одноразовые ключи: как только пользователь расшифровывает одну из копий, ключ автоматически аннулируется. Это открытие фактически легализует создание «квантового облака». Технология позволяет хранить квантовые данных на распределенных серверах и создать аналог квантового Dropbox или Google Drive. uwaterloo.ca @ai_machinelearning_big_data #news #ai #ml

297 740

🌟 Открытые модели и инструментарий для автопилотов от NVIDIA. NVIDIA, сдержала обещания c NeurIPS 2025 и сделала еще один шаг к тому чтобы автомобили наконец научились понимать контекст вождения, а не просто детектировать разметку. Современные автопилоты неплохо справляются со стандартными ситуациями. Но главная головная боль инженеров — это редкие, сложные сценарии, которые почти невозможно предугадать. Традиционные архитектуры, где восприятие отделено от планирования, часто пасуют, когда случается что-то нестандартное. И вот здесь предлагается подход, где модель учится рассуждать причинно-следственными связями, почти как человек, разбирая ситуацию шаг за шагом. А это важный фактор для безопасности и доверия к системе. 🟡NVIDIA выкатила целую экосистему, которую можно пощупать руками: 🟢Alpamayo - первая в индустрии 10 миллиардная VLA-модель с поддержкой СoT, созданная специально для исследований. Она берет на вход видеопоток и генерирует не только траекторию движения, но и "reasoning traces" — то есть буквально объясняет логику своего решения. Модель позиционируется как модель-учитель, которая может быть использована для обучения более компактных моделей или для авто-разметки данных. 🟢AlpaSim - полностью открытый, end-to-end фреймворк для симуляции, который позволяет моделировать реалистичные сенсоры и трафик, создавая идеальную песочницу для тестов. 🟢Physical AI Open Datasets - пожалуй, самый богатый датасет для автономного вождения на сегодняшний день. Туда входит более 1700 часов записей вождения из самых разных географических зон и условий. И, что важно, там куча тех самых редких кейсов, о которых мы говорили выше. На практике, NVIDIA предлагает применять эти инструменты в своих решениях NVIDIA Cosmos и NVIDIA Omniverse. В них можно дообучать модели на своих данных, валидировать их в симуляции и затем деплоить на железо. @ai_machinelearning_big_data #news #ai #ml

297 740

✔️ NVIDIA представила на CES 2026 платформу нового поколения Vera Rubin. Компания анонсировала архитектуру, которую индустрия ждала лишь к концу года. Ядром системы стал GPU Rubin, который дает 5х-прирост вычислительной мощности в задачах обучения ИИ по сравнению с Blackwell. Платформа объединяет 6 компонентов: центральный процессор Vera, сам GPU Rubin, коммутатор NVLink шестого поколения, DPU BlueField4 и сетевой адаптер Connect-X9. В NVIDIA говорят, что переход на Vera Rubin позволит сократить необходимый парк видеокарт на 75% и уменьшить итоговые затраты в 7 раз относительно Blackwell. Продукты и сервисы на базе нового железа станут доступны через партнеров компании во второй половине 2026 года. theverge.com ✔️ Boston Dynamics встроит ИИ-модели Google в гуманоида Atlas. Компании объявили о стратегическом партнерстве, которое объединит аппаратную платформу Boston Dynamics с базовыми моделями Gemini Robotics. Цель коллаборации — превратить робота Atlas из исполнителя в интеллектуального агента, способного воспринимать окружающую среду и обучаться новым задачам на лету. Благодаря системам DeepMind, обновленный Atlas сможет понимать команды на естественном языке и самостоятельно выстраивать логику действий. Первые серийные образцы поступят в пилотную эксплуатацию на объекты Hyundai и Google DeepMind уже в этом году. Полноценное внедрение роботов в промышленные процессы намечено на 2028 год с плановым тиражом до 30 000 единиц ежегодно. bostondynamics.com ✔️ Из OpenAI уходит глава команды Reasoning Models и один из создателей GPT-4. Джерри Творек, проработавший в компании почти 7 лет, объявил об увольнении. Он был одной из ключевых фигур в технической команде OpenAI: участвовал в создании GPT-4, ChatGPT и первых моделей для генерации кода. В последнее время Творек руководил направлением «Reasoning Models», отвечая за ризонинг-системы. Именно его группа стояла за разработкой архитектур o1 и o3, которые стали фундаментом последних релизов компании. В прощальном сообщении Джерри сообщил, что хочет заняться исследованиями, которые «трудно реализовать внутри OpenAI». О новом месте работы Творека не сообщается. Jerry Tworek в сети Х ✔️ Amazon запустила веб-версию обновленного ассистента Alexa+. Alexa.com — браузерный интерфейс генеративного чат-бота, поддерживающего бесшовную синхронизацию контекста и истории диалогов с физическими устройствами Amazon Echo и Fire TV. На этапе раннего доступа взаимодействие ограничено текстовым вводом, голосовые функции в веб-версии пока отсутствуют. Главной фишкой Alexa+ стала интеграция с экосистемой Amazon для решения прикладных задач. Помимо стандартной генерации контента и поиска информации, ассистент управляет умным домом, оформляет заказы продуктов и бронирует услуги. Монетизация сервиса в 2026 году будет гибридной: Alexa+ войдет в подписку Amazon Prime без доплат, а для остальных пользователей доступ обойдется в $19.99 в месяц. aboutamazon.com ✔️ C# стал языком 2025 года по версии TIOBE. Индекс TIOBE подвел итоги года: звание «Язык 2025 года» досталось C#, который показал рекордный рост популярности (+2.94%)? однако в общем зачете он по-прежнему занимает 5-ю строчку. Абсолютным лидером остается Python с 22.61% долей рынка. В первой пятерке произошли перестановки: язык C поднялся на 2 место, сместив C++ на 4-ю позицию; 3 место досталось Java, а R вернулся в топ-10. Провал года - Go, который неожиданно сдал позиции, опустившись сразу на 16-е место. Индекс оценивает популярность технологий на основе поисковых запросов, активности комьюнити и количества обучающих материалов. tiobe.com @ai_machinelearning_big_data #news #ai #ml

297 740

🌟 Technology Innovation Institute выпустила компактную модель Falcon H1R 7B. Falcon H1R 7B — языковая ризонинг-модель с открытыми весами на 7 млрд. параметров и контекстным окном в 256 тыс. токенов. Разработчики утверждают, что их модель способна на равных тягаться с конкурентами от 14 до 47 млрд. параметров. То есть, речь идет о сопоставимой эффективности при разнице в размерах от 2 до 7 раз. Архитектурно - это гибрид классического Transformer и Mamba. Такое решение принято не ради эксперимента, а ради скорости обработки данных, где Mamba традиционно сильна. Фундаментом стала базовая модель Falcon H1 Base, которую прогнали через SFT, затем подключили масштабирование через RL с использованием GRPO. Одной из фишек новинки стало использование механизма Deep Think with confidence (DeepConf) на этапе test-time scaling. Он позволяет модели повышать точность ответов, при этом снижая общее количество генерируемых токенов. Если смотреть на метрики эффективности, то Falcon H1R 7B выдает до 1500 токенов в секунду. Для сравнения, это почти в 2 раза быстрее, чем показатели Qwen3-8B. В тесте AIME 24 модель показала точность 88,1%. В математическом бенчмарке MATH-500 результат - 97,4%. И даже в сложном GPQA-D Falcon выбил 61,3 балла. Веса уже на Hugging Face, причем доступны как полные чекпоинты, так и квантованные версии в формате GGUF. С запуском проблем быть не должно: заявлена поддержка всех основных фреймворков: Transformers, vLLM и SGLang. 📌Лицензирование: Falcon LLM License. 🟡Статья 🟡Модель 🟡Набор GGUF 🟡Техотчет 🟡Demo 🟡Сообщество в Discord @ai_machinelearning_big_data #AI #ML #LLM #FalconH1R #TII

297 740

✔️ Science Context Protocol: научное расширение стандарта MCP. Шанхайская лаборатория ИИ выложила в опенсорс спецификации SCP — протокола, созданного для формирования глобальной сети автономных исследовательских систем. Новинка развивает идеи стандарта MCP от Anthropic, добавляя к нему критически важный слой для взаимодействия с физическим миром науки. В отличие от MCP, ориентированного на подключение данных, SCP поддерживает подключение лабораторного оборудования, расширенные метаданные экспериментов и API для оркестрации сложных рабочих процессов. Фактически это позволяет ИИ-агентам напрямую управлять приборами и обмениваться результатами между различными институтами. Технология уже обкатана на платформе Internal Discovery, где доступно более 1600 инструментов, преимущественно для биологии, физики и химии. arxiv.org ✔️ OpenAI переводит производство своего первого гаджета на заводы Foxconn. Компания Сэма Альтмана меняет стратегию выпуска дебютного аппаратного устройства под кодовым именем «Gumdrop». По данным Economic Daily News, OpenAI отказалась от услуг китайской Luxshare и передала контракт тайваньскому гиганту Foxconn, чтобы исключить материковый Китай из цепочки поставок - сборка будет развернута на мощностях во Вьетнаме или США. Gumdrop находится на стадии проектирования и, вероятно, это будет умная ручка или носимый аудио-гаджет. Устройство получит камеру и микрофон, а его киллер-фичей станет нативная интеграция с ChatGPT для оцифровки и анализа рукописных заметок. Релиз устройства запланирован на 2026–2027 годы. money.udn.com ✔️ Попытка главы Microsoft защитить репутацию ИИ обернулась вирусным трендом «Microslop». Сатья Наделла непреднамеренно спровоцировал имиджевый кризис, опубликовав в конце 2025 года призыв к обществу «перерасти» использование термина «slop» в отношении генеративного контента. Реакция сообщества оказалась мгновенной: эффект Стрейзанд вывел в тренды тег «Microslop», ставший символом отторжения агрессивной политики компании по повсеместному внедрению ИИ. Пользователи выражают недовольство тем, что Microsoft принудительно встраивает Copilot в каждый продукт, игнорируя реальные потребности аудитории. Пока руководство Big Tech обещает глобальные прорывы, рынок фиксирует негативные побочные эффекты: от дефицита и удорожания памяти и сокращения рабочих мест до засорения экосистемы бесполезными функциями. windowscentral.com ✔️ Neuralink запускает серийное производство нейро-чипов. Илон Маск подтвердил планы компании начать массовый выпуск интерфейсов «мозг-компьютер» в 2026 году. Технологический процесс станет полностью автономной хирургической процедурой: роботы будут устанавливать импланты без прямого участия людей-нейрохирургов. Проект уже вышел за рамки лабораторных экспериментов - база пациентов с активными имплантами достигла 12 человек. Устройства позволяют людям с тяжелыми нарушениями моторики управлять цифровыми интерфейсами и игровыми контроллерами напрямую через нейронную активность. reuters.com ✔️ Армия США ввела специальность по ИИ и ML для офицеров. С 5 января Пентагон официально открыл прием заявок на новую специализацию, позволяющую офицерам строить карьеру в ИИ и ML. Приоритет при отборе отдается кандидатам с профильным образованием и опытом разработки. Офицеры пройдут углубленную подготовку, после чего займутся созданием, развертыванием и поддержкой военных ИИ-систем. Инициатива реализуется на фоне жестких дедлайнов по внедрению ИИ-управления в штабах к 2027 году и обеспечению армии автономными системами до конца 2026 года. Параллельно Минобороны США запустило платформу GenAi.mil с Gemini for Government на борту, чтобы предоставить армии доступ к передовым языковым моделям. Таким образом, ИИ перестает быть экспериментальным направлением и становится штатной функцией офицерского состава. federalnewsnetwork.com @ai_machinelearning_big_data #news #ai #ml

297 740

Repost from Анализ данных (Data analysis)

🔥 Год ChatGPT Plus бесплатно: экономим 20 000 рублей Нашли рабочую лазейку в правилах OpenAI. Вы получаете полноценный аккаунт без лимитов и с доступом ко всем топовым моделям. Инструкция (займет 2 минуты): 1️⃣ Переходим на сервис временной почты: https://em.bjedu.tech/en/ 2️⃣ Важно: в списке доменов выбираем erzi me. 3️⃣ Регистрируем новый аккаунт ChatGPT на этот адрес. 4️⃣ Получаем код подтверждения в почту - готово! ⚡️ Проверили, пока еще работает Или всегда можно воспользоваться ботом в тг 😂 @data_analysis_ml

297 740

📌Как делали MiniMax М2.1 и что будет дальше. Когда говорят, что одна модель пишет код лучше другой, обычно имеется ввиду бенчмарк SWE-Bench. Модель получает реальный баг из настоящего проекта с Github, который она должна прочитать, найти ошибку и исправить её. Это частично повторяет ежедневную работу программиста. Но у этого бенча, как и у любого другого, есть свои недостатки. 🟠SWE-Bench работает только с Python. В реальном мире разработчики имеют дело с Java, Go, TypeScript, Rust, C++ и еще кучей других. 🟠Бенчмарк только про исправление ошибок, а программисты еще пишут новые функции, занимаются рефакторингом и оптимизацией. 🟠Его результаты сильно зависят от того, в каком окружении работает модель. И вот здесь MiniMax-AI задалась вопросом: как создать по-настоящему универсального ИИ-программиста? Ответ они нашли и реализовали его в своей свежайшей модели M2.1. 🟡Масштабирование окружения. За этим расплывчатым термином кроется огромная система, которая оперирует популярными языками: JS, TS, Python, Java, Go, C++ и Rust. Для этого с GitHub были собраны более 100 тыс. реальных задач с описанием проблемы, кодом и тестами. Это было непросто, так как сложные языки (Java или C++) требуют настройки и у каждого языка свои фреймворки и системы управления зависимостями. Чтобы обучить модель на таком массиве данных, MiniMax построил инфраструктуру, способную запускать более 5 тыс. изолированных сред выполнения за максимально короткое время - 10 секунд. 🟡Выход за рамки баг-фиксов. MiniMax-M2.1 обучали и генерации тестов и в результате оказалось, что это критически важный навык. Предыдущая версия, M1, писала слишком простые тесты и часто выбирала неверные решения. M2.1 в этом преуспела и сравнялась по результатам с мощным конкурентом Claude Sonnet 4.5. Еще она научилась оптимизировать производительность кода — на SWE-Perf показала средний прирост эффективности в 3.1%. И наконец, M2.1 научили делать Code Review, для чего создали внутренний бенчмарк SWE-Review. 🟡Обобщение на незнакомых окружениях (Generalization on OOD Scaffolds). Модель должна одинаково хорошо следовать длинным инструкциям и адаптироваться к разным способам управления контекстом диалога. Команда провела тесты в mini-swe-agent, Droid и Claude Code и если посмотреть на цифры из их сравнительной таблицы, то можно увидель, что модель стала гораздо более гибкой и универсальной. На том же SWE-Bench, при использовании Claude Code, MiniMax-M2.1 выбила 74 балла, что выше, чем у модели M2 с ее 69.2 баллами, и практически наравне с Claude Sonnet 4.5 и DeepSeek V3.2. На другом тесте, OctoCodingBench, разрыв еще больше: 26.1 у новой модели против 13.3 у старой. 🟡Планы на 2026. Во-первых, MiniMax планирует научить модель оценивать не только правильность кода, но и читаемость кода, качество комментариев, прозрачность процесса работы. Во-вторых - повысить эффективность решения задач, чтобы модель не делала лишних шагов, например, не перечитывала один и тот же файл по несколько раз. Но самое интересное — это их планы по RL Scaling, и создание так называемой Coding World Model.

Идея в том, чтобы построить модель-симулятор, которая сможет предсказывать результат выполнения кода, не запуская его в реальности.

Наконец, они планируют расширяться в узкоспециализированные области: разработка GPU Kernel, компиляторов и смарт-контрактов. Похоже, концепция "ИИ-кодера" становится все более реальной. Успех MiniMax-M2.1 показал, что дело уже не в написании отдельных строк кода, а в комплексном понимании всего процесса разработки. @ai_machinelearning_big_data #AI #ML #LLM #MiniMaх

297 740

🎾 Твой новый роботозированный партнёр по теннису. UBTECH показали как их гуманоид Walker S2 вышел на корт и провёл полноценный розыгрыш против человека в прямом эфире. Наблюдать, как робот уверенно держит баланс, ловит темп и отбивает мячи с точностью, - ощущение почти сюрреалистическое. Похоже, время обычных машин для подачи подходит к концу. @ai_machinelearning_big_data #Robotics #Tennis #AI #UBTECH #Future

297 740

🌟 IQuest-Coder-V1: китайская модель, которая обошла лидеров в кодинге. Quest Research, поддержанная фондом Ubiquant, представила 40-миллиардную модель c контекстным окном в 128K токенов, которая, со слов авторов, выбивает 81,4% на SWE-Bench Verified, 49,9% на BigCodeBench и 81,1% на LiveCodeBench v6. Это превосходит показатели Claude Sonnet 4.5 и GPT-5.1, несмотря на значительно меньшее количество параметров. Модель использует технику "code-flow" — обучение на эволюции репозиториев и коммитах, и разделена на 2 ветки: 🟠Dense Models : Base и Instruct версии для дообучения и следованию инструкциям 🟢Loop Models: оптимизированная версия с максимальной эффективностью по VRAM (int4 может запускаться на 3090\4090) Архитектура LoopCoder использует циклическую конструкцию трансформера, где одни и те же параметры модели используются в 2-х последовательных проходах обработки данных. На первом проходе модель обрабатывает эмбеддинги через свои слои с учетом позиций слов. На втором проходе модель одновременно использует два типа внимания: глобальное внимание, которое обращается ко всей информации из первого прохода для понимания общего контекста, и локальное внимание, которое смотрит только на предыдущие слова во втором проходе для сохранения последовательности текста. Оба типа внимания комбинируются с помощью механизма, который решает, сколько веса дать глобальному контексту, а сколько локальной последовательности. В техотчете заявлены еще 7B и 14B версии, но сроки их публикации неизвестны. 📌Лицензирование: Modified MIT License 🟡Страница проекта 🟡Техотчет 🟡Набор моделей 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #IQuest #QuestResearch

297 740

📌Как ИИ-гиганты обеспечивают себя энергией. Semianalysis выпустили любопытный материал о том, как ИИ-компании преодолевают энергетический кризис. 🟡Американская энергосистема не выдерживает напора ИИ. Еще 2 года назад эксперты предсказывали, что спрос на мощность для ИИ-ЦОДов вырастет с 3 ГВт в 2023 до 28 ГВт к 2026 году. Уже сейчас в Техасе ежемесячно поступают заявки на десятки гигаватт, но за год одобряют не более гигаватта. Электросети перегружены. ИИ-компании не могут ждать много лет на подключение к сетям. Задержка в полгода для дата-центра мощностью 400 МВт означает потерю миллиардов долларов. Поэтому они адаптируются: строят собственные газовые электростанции прямо на территории дата-центров. Первой удивила индустрию xAI, запустив кластер из 100 тыс. GPU всего за 4 месяца на полностью независимых от общих сетей мобильных газовых турбинах. На конец 2025 года детище Илона Маска развернуло суммарно более 500 МВт таких мощностей. И за ними пошли OpenAI с Oracle в Техасе и Марк Цукерберг в Огайо. 🟡Концепция альтернативного питания ЦОДов получила свое название - BYOG (Bring your own generation) Она объединяет 3 основных типа генерации: 🟢Аэродеривативные турбины от GE Vernova LM2500 (34 МВт) и LM6000 (57 МВт). Самые дорогие, но быстро запускаемые (5-10 минут от старта до полной мощности); 🟢Промышленные газовые турбины (Siemens SGT-800 и Solar Titan), включая адаптированные под выработку электричества поршневые двигатели Enbacher J624 (4,5 МВт) и Wärtsilä (7-20 МВт). Они дешевле, но медленнее запускаются. 🟢Твердооксидные топливные элементы от Bloom Energy, которые не требуют согласования от агентства по охране окружающей среды США. 🟡Подводный камень BYOG - надежность. Чтобы достичь 99% аптайма как в общих электросетях, приходится серьезно перестраховываться. Для дата-центра на 200 МВт устанавливают 26 двигателей по 11 МВт или 9 турбин по 30 МВт, а, например, ЦОД в Огайо на гибридном решении: 3 типа турбин и 15 поршневых двигателей для максимального покрытия аварий. 🟡Драйвер кризиса - экономика. Стоимость собственной генерации обычно выше сетевой, но для ИИ-бизнеса скорость ввода в эксплуатацию важнее. Один ГВт ИИ-вычислений приносит $10-12 млрд годового дохода. Так что ускоренный запуск ЦОДа окупает любые затраты на энергетическую независимость. Производители BYOG-решений борются с дефицитом. GE Vernova и Siemens Energy принимают заказы уже только на 2028-2029 годы. 🟡Спрос не остался незамеченным - появились новые игроки. Boom Supersonic (производитель самолетов) использует свои авиационные наработки для создания турбин на базе двигателей самолётов Mach 2, а корейская Doosan Enerbility, благодаря опыту производства паровых турбин запустила производство турбин H-класса. Пока в перспективе ИИ-гиганты выбирают гибридные решения где собственная генерация сначала выводит ЦОД в работу, а потом становится резервом при подключении к сетям, это однозначно повлияет еще на пару-тройку смежных сфер деятельности. Так что "энергетический" и "чиповый" кризис - не последние, кого породила ИИ-гонка. @ai_machinelearning_big_data #news #ai #ml

297 740

📌Интервью 23-летнего сотрудника OpenAI, который выучил DL без учебы в университете. Интересная история, которая заставляет задуматься об образовании и карьере. Знакомьтесь - Габриэль Петерссон. Ему всего 23 года, он бросил школу в глухом шведском городке, не учился в ВУЗе, но прямо сейчас работает научным сотрудником в OpenAI, в команде Sora. 🟡Мы живем во время, когда монополия ВУЗов на фундаментальные знания пошатнулась. Традиционное образование - это путь "снизу вверх". Хочешь заниматься машинным обучением? Сначала выучи линейную алгебру, потом матан, потом тервер. Это долго и зачастую теряется мотивация и понимание, зачем тебе это нужно прямо сейчас. Масла в котел демотивации подливают компании, которые тоже не очень хотят ждать. Palantir, например, уже нанимает старшеклассников, минуя вузы. И история Габриэля — показательный пример тенденции. Он не проходил классический путь "школа — бакалавриат — магистратура". Вместо этого он использовал ChatGPT как персонального ментора. И речь не о том, чтобы попросить чат-бот «напиши код за меня». Габриэль использовал метод, который он сам называет «рекурсивным заполнением пробелов». Его суть том, чтобы идти как бы "сверху вниз". Он берет сложный проект: например, хочет разобраться, как работают модели диффузии. Он просит ChatGPT написать код. Естественно, сначала он ничего не понимает. И вот тут он начинает задавать вопросы к каждому непонятному модулю. «Что делает этот блок?». Допустим, это блок ResNet. Он спрашивает: «Почему это помогает модели учиться?». И копает глубже. Если всплывает незнакомое понятие - он просит объяснить математическую базу, лежащую в его основе. Это и есть рекурсия: слой за слоем, пока не заполнятся все пробелы в знаниях. Он не учит математику впрок, он учит ту математику, которая нужна ему прямо сейчас для работы кода. 🟡Но как иностранец без диплома получил визу в США и работу в Кремниевой долине? Для получения визы талантов (O1) он использовал свою репутацию на Stack Overflow и рекомендации, которые просмотрели миллионы людей, как доказательство вклада в индустрию. Габриэль советует: забудьте про HR. Резюме и дипломы не важны, если вы можете показать результат. Его стратегия — MVP или демо продукта и написать напрямую топ-менеджменту компании с предложением бесплатной работы на неделю. Это снимает риски для нанимателя и дает вам шанс показать себя. Его главный посыл: если вы готовы активно задавать вопросы и не боитесь выглядеть глупо перед ИИ, изучая основы, вы уже входите в 1% лучших. Потому что большинство людей просто плывут по течению. 🔜 Посмотреть полное интервью @ai_machinelearning_big_data #AI #ML #Interview #OpenAI

297 740

🚨 DeepSeek уже в первый день года выкатывает сильное обновление: важное улучшение архитектуры трансформеров. Китайцы редложила способ сделать shortcut-путь ( это когда выход слоя прибавляется к его же входу, то есть сеть не «заменяет» информацию, а добавляет к ней улучшенную версию) в трансформерах гибче, но при этом сохранить стабильность даже у очень больших моделей. В обычном трансформере каждый блок что-то считает, а потом просто добавляет результат к исходному сигналу. Это помогает информации проходить через много слоёв, не теряясь. Hyper-Connections меняют shortcut-путь. Был один поток, а стало несколько.

Перед блоком модель выбирает, какие потоки подать на вычисления. Во время блока часть сигнала идёт «в обход», чтобы ничего не потерять. После блока всё снова аккуратно объединяется.

То есть shortcut превращается из простого «input + output» в умный маршрутизатор сигналов. Проблема в том, что без ограничений такие смешивания могут усиливать сигнал слишком сильно или, наоборот, гасить его и большие модели начинают вести себя нестабильно. mHC решает это так: потоки остаются, но каждое смешивание работает как аккуратное усреднение. Сигнал не может «взорваться» или исчезнуть - он остаётся под контролем. Что это даёт на практике: - модели остаются стабильными даже на масштабе 27B, дают лучшее качество и не страдают от скачков лосса. Там, где обычные Hyper-Connections раздували сигнал до 3000×, mHC держат его примерно на уровне 1.6×. Если коротко: был один shortcut,. сделали несколько, но заставили их смешиваться безопасно. И трансформеры стали гибче и стабильнее. https://arxiv.org/abs/2512.24880 @ai_machinelearning_big_data #AI #DeepSeek #MachineLearning #NeuralNetworks #Research

297 740

🎄🎄 Qwen-Image: обновление как раз к Новому году Свежая версия Qwen-Image получила заметный апгрейд качества. Модель стала генерировать намного реалистичнее и аккуратнее, особенно в сложных сценах. Что изменилось: • более естественные генерации людей, меньше «искусственного» эффекта • детальнее лица и мимика • улучшены натуральные текстуры: вода, шерсть, материалы, пейзажи • намного аккуратнее текст на картинках: лучше верстка и точность в композиции Модель прошла более 10 000 слепых сравнений на AI Arena и показала результат уровня топов среди open-source, оставаясь конкурентной даже рядом с закрытыми решениями. ▪Qwen Chat: https://chat.qwen.ai/?inputFeature=t2i ▪Hugging Face: https://huggingface.co/Qwen/Qwen-Image-2512 ▪ModelScope: https://modelscope.ai/models/Qwen/Qwen-Image-2512 ▪GitHub: https://github.com/QwenLM/Qwen-Image ▪Блог: https://qwen.ai/blog?id=qwen-image-2512 ▪Демо HF: https://huggingface.co/spaces/Qwen/Qwen-Image-2512 ▪Демо ModelScope: https://modelscope.cn/aigc/imageGeneration ▪API: https://modelstudio.console.alibabacloud.com/?tab=doc#/doc/?type=model&url=2840914_2&modelId=group-qwen-image-max @ai_machinelearning_big_data #qwen #qwenimage #openaimodels #imagemodels

297 740

✔️ Компания Марка Цукерберга купила Manus. По информации WSJ, сумма сделки превысила $2 млрд, что соответствует оценке, которую стартап рассчитывал получить в ходе нового раунда финансирования. Manus показал феноменальную динамику, выйдя на уровень годовой выручки более $100 млн. всего через 8 месяцев после запуска. Флагманский продукт Manus — агент общего назначения, способный самостоятельно выполнять многоступенчатые задачи: написание кода, анализ больших данных и маркетинговые исследования. Критическим условием поглощения стало полное сворачивание операций в Китае, где компания была изначально основана, и исключение любых китайских интересов в структуре собственности. Действующие сервисы и подписки Manus продолжат работать. wsj.com ✔️ США одобрили поставки оборудования для Samsung и SK Hynix на 2026 год. Власти США выдали Samsung Electronics и SK Hynix лицензии, разрешающие ввоз оборудования для производства чипов на их заводы в Китае в 2026 году. Это решение обеспечит непрерывность технологических процессов на фоне ужесточения правил экспортного контроля. Ранее южнокорейские вендоры, наравне с TSMC, обладали статусом «проверенных компаний», который освобождал их от ограничений Вашингтона. Срок действия этой привилегии истекает 31 декабря, после чего начинает действовать система ежегодного лицензирования поставок. Для Samsung и SK Hynix китайские площадки остаются ключевыми в производстве памяти, цены на которую растут из-за дефицита и высокого спроса со стороны дата-центров для ИИ. reuters.com ✔️ FAL Ai сделали FLUX.2 Dev Turbo. FLUX.2 [dev] Turbo — оптимизированная версия модели от Black Forest Labs в формате LoRA, которая сокращает инференс до 8 шагов. FAL обещает шестикратный прирост скорости по сравнению со стандартной 50-шаговой версией, при этом сохраняя высокую детализацию изображений и точность следования промпту. Сразу после релиза инструмент возглавил рейтинг Artificial Analysis Image Arena, обойдя по ELO-баллам даже крупные коммерческие закрытые модели. Веса доступны на Hugging Face под некоммерческой лицензией Black Forest. Fal в сети X ✔️ Tencent релизнула диффузионную языковую модель, которая в 6 раз быстрее классических LLM. WeDLM 8B Instruct использует диффузионный подход к генерации текста вместо привычного для LLM авторегрессионного метода. Преимущество архитектуры в радикальном приросте производительности. В задачах математического рассуждения WeDLM работает в 3–6 раз быстрее, чем Qwen3-8B с оптимизацией vLLM. Релиз опровергает стереотип о том, что диффузионные модели не подходят для точных текстовых задач и доказывает их способность превосходить трансформеры в скорости инференса. Модель доступна на HuggigingFace под максимально свободной лицензией Apache 2.0. wedlm.github.io ✔️ Алгоритмы YouTube рекомендуют новым пользователям ИИ-слоп. Компания Kapwing проанализировала выдачу для новых аккаунтов и выяснила, что 21% рекомендаций приходится на слоп, созданный в ИИ исключительно для фарма просмотров. Этот контент представляет собой автоматизированный поток мусорных видео, который рекомендательные системы платформы активно продвигают в топы. Экономика этого сегмента процветает: лидеры ниши собирают миллиарды просмотров и зарабатывают миллионы долларов на рекламе. Основными потребителями такого контента оказались зрители из Южной Кореи, Пакистана и США. Ситуация наглядно иллюстрирует проблему «мертвого интернета»: пока подобные видео генерируют высокую вовлеченность - будь то от реальных людей или ботов, платформа продолжает их рекомендовать, создавая финансовый стимул для дальнейшего замусоривания хостинга. kapwing.com @ai_machinelearning_big_data #news #ai #ml

297 740

⚡️ Tencent выпустили новые open-source модели перевода HY-MT 1.5 Модель доступна в двух версиях: 1.8B и 7B. Обе работают как на устройстве, так и в облаке и показывают высокую скорость и точность. Модель идет в двух размерах: 1) 8B для устройств Оптимизирована под потребительское железо, занимает около 1 ГБ памяти. Благодаря on-policy distillation достигает задержки 0.18 секунды на 50 токенов, обходя многие коммерческие API. 2) 7B новая SOTA Превосходит большинство средних по размеру open-source моделей и сопоставима с закрытых решений. Поддержка 33 языков и 5 китайских диалектов с высокой точностью. Модели уже используются в сервисах Tencent. Связка двух моделей обеспечивает стабильную работу как на устройствах, так и в облаке. 🔹 Попробовать: https://hunyuan.tencent.com/modelSquare/home/list 🔹 GitHub: https://github.com/Tencent-Hunyuan/HY-MT 🔹 Hugging Face: https://huggingface.co/collections/tencent/hy-mt15 @ai_machinelearning_big_data #opensource, #Tencent,

297 740

💰 Forbes назвал самых молодых миллиардеров в мире и это основатели AI-платформы Сказанная история трёх 22-летних сооснователей AI-стартапа Mercor. До успеха они были друзьями со школы и начали компанию сразу после учёбы. Для них этот стартап стал первой работой и он сделал каждого из них миллиардером. 📈 Оценка компании: около $10 млрд, 💰 состояние каждого: примерно $2,2 млрд. Mercor это платформа, которая с помощью ИИ автоматизирует подбор персонала и помогает компаниям находить разработчиков по всему миру. В эпоху ИИ можно построить глобальный бизнес даже без опыта или крутых связей. https://www.forbes.com/sites/alexyork/2025/11/07/a-startup-was-their-first-ever-job-now-theyre-the-worlds-youngest-self-made-billionaires/ @ai_machinelearning_big_data

297 740

В Петербурге воссоздали разрушительное наводнение 1824 года, но без ущерба для города. В онлайн-кинотеатре «Триколор Кино и ТВ» состоялась премьера фильма на базе искусственного интеллекта. «Медный всадник» — экранизация поэмы Александра Сергеевича Пушкина, представленная в новом ключе. Сюжет совмещает элементы фэнтези, фильма-катастрофы, исторического фильма и лавстори. Весь фильм, включая видео, голос и музыку, сделан при помощи технологий ИИ. Увидеть документальный проект бесплатно и без регистрации можно в онлайн-кинотеатре «Триколор Кино и ТВ» по ссылке #реклама О рекламодателе

297 740

📌GPU Glossary: исчерпывающая база по GPU. Modal Labs составили подробный глоссарий, чтобы решить проблему, с которой сами столкнулись при работе с графическими процессорами в сервисе Modal : документация фрагментирована и зачастую очень сложно сопоставить концепции на разных уровнях стека.

Modal Labs (бренд Modal) – компания, основанная в 2021 году, которая предоставляет высокопроизводительную серверную вычислительную платформу для разработчиков, работающих с данными, ИИ и машинным обучением.

Они прочитали PDF-документацию от NVIDIA, порылись в тематических Discord-сообществах и даже купили бумажные учебники, чтобы составить базу знаний, охватывающую весь стек в одном месте: 🟢Ядра CUDA, SM, тензорные ядра, warp-планировщики; 🟢Потоки, PTX, иерархию памяти; 🟢Roofline, дивергенцию; 🟢Nvcc, nvidia-smi, cuBLAS, Nsight, libcuda. В руководстве все страницы связаны между собой, поэтому вы можете перейти к разделу о Warp Scheduler , чтобы лучше понять потоки, о которых вы читали в статье о модели программирования CUDA. Сам проект открыт и доступен на Github. 🟡Страница 🖥GitHub @ai_machinelearning_big_data #AI #ML #GPU #Glossary #Modal

297 740

✔️ Nvidia закрыла сделку по покупке акций Intel на 5 млрд. долларов. Компания выполнила условия сентябрьского соглашения, приобретя более 214,7 млн. акций Intel. Для Intel это вливание капитала стало критически важной финансовой поддержкой: производитель серьезно истощил свои резервы из-за многолетних стратегических просчетов и затрат на расширение производственных мощностей. Инвестиция уже прошла проверку американских регуляторов - Федеральная торговая комиссия одобрила сделку. Теперь, когда все формальности улажены, Intel получает необходимую ликвидность для стабилизации бизнеса на фоне жесткой конкуренции в полупроводниковой отрасли. reuters.com ✔️ CEO Microsoft раскритиковал качество Copilot и лично возглавил работу над продуктом. Сатья Наделла выразил жесткое недовольство текущим состоянием потребительской версии ИИ-ассистента. В письме менеджерам он заявил, что интеграции Copilot с Gmail и Outlook «по большей части не работают», назвав их реализацию «недостаточно умной». Чтобы исправить ситуацию, глава компании фактически перешел в режим антикризисного управления продуктом, делегировав часть коммерческих задач, чтобы сосредоточиться на технологиях. Теперь Наделла глубоко погружен в инженерную рутину: он состоит в рабочих чатах с ведущими разработчиками, проводит еженедельные разборы полетов и дает прямые технические указания, вплоть до требований по консолидации процессов тренировки моделей. theinformation.com ✔️ Китайская AgiBot запустила сервис посуточной аренды гуманоидных роботов. Компания представила платформу Qingtian Rent, на которой можно нанять роботов для работы на выставках, конференциях и частных мероприятиях. Флагманская антропоморфная модель Yuanzheng A2 обойдется в $1380 в день, а в качестве бюджетной альтернативы предлагается робопес Unitree Go2 за $138 в сутки. Запуск сервиса происходит на фоне роста интереса к коммерческому использованию робототехники в Китае. По данным аналитиков, объем местного рынка аренды роботов в 2025 году составил $140 млн., однако уже в следующем году ожидается десятикратный скачок до $1,4 млрд. interestingengineering.com ✔️ Крупнейшая мировая ассоциация бухгалтеров отменяет онлайн-экзамены из-за ИИ. Ассоциация сертифицированных бухгалтеров (ACCA), объединяющая более полумиллиона студентов, полностью сворачивает практику дистанционной сдачи тестов с марта 2026 года. Руководство организации признало поражение в технологической гонке. Генеральный директор ACCA Хелен Брэнд пожаловалась, что изощренность методов списывания опережает любые внедряемые защитные меры. Студенты используют чат-боты, способные решать сложные задачи по фотографии экрана быстрее, чем это фиксирует система наблюдения. Интересно, что одновременно с запретом удаленного тестирования ассоциация обновляет учебную программу, добавляя туда изучение того самого ИИ и блокчейна, но проверять знания теперь будут исключительно в офф-лайне. ft.com ✔️ Звезды Голливуда объединились для создания правил использования ИИ в медиа-индустрии. Организация под названием «Creators Coalition on AI» (CCAI), будет разработать единые стандарты внедрения нейросетей в кино и музыке. Участники коалиции не выступают против технологий как таковых, но требуют прозрачных правил игры. Ключевые пункты повестки касаются датасетов: использование чужих работ для обучения моделей должно происходить только с согласия авторов и за справедливое вознаграждение. Кроме того, CCAI намерена бороться с бесконтрольным распространением дипфейков, защищать рабочие места в индустрии и отстаивать приоритет человеческого творчества над генерацией. creatorscoalitionai.com @ai_machinelearning_big_data #news #ai #ml

297 740

🤖 На BiliBili вышло видео: парень управляет роботом через motion-capture. …и из-за лага робот возвращает команду ему прямо в … 😬 — «Пацаны, откатите… ОТКАТИТЕ!» 🤖🔥 @ai_machinelearning_big_data