Machinelearning

Kanalga Telegram’da o‘tish

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya1 323 Texnologiyalar & Aralashmalar331...

📈 Telegram kanali Machinelearning analitikasi

Machinelearning (@ai_machinelearning_big_data) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 288 007 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 331-o'rinni va Rossiya mintaqasida 1 323-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 288 007 obunachiga ega bo‘ldi.

02 Avgust, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -5 417 ga, so‘nggi 24 soatda esa -206 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 7.77% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.91% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 22 374 marta ko‘riladi; birinchi sutkada odatda 17 009 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 153 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent openai, claude, api, gemini, контекст kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 03 Avgust, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

288 007

Obunachilar

-20624 soatlar

-1 4197 kunlar

-5 41730 kunlar

22 374

Post ko'rishlar

~ 17 00924 soatlar

~ 18 69048 soatlar

7.77%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Ma'lumot yuklanmoqda...

O'xshash kanallar

Data Science by ODS.ai 🦜

19.9K

Data Science | Machinelearning [ru]

11.5K

Neural Networks | Нейронные сети

Ko'proq kanallar

Kirish va chiqish esdaliklari

---

Obunachilarni jalb qilish

Avgust '26

+11

6 kanalda

Iyul '26

+87

90 kanalda

Get PRO

Iyun '26

+15

57 kanalda

Get PRO

May '26

+68

78 kanalda

Get PRO

Aprel '26

+101

83 kanalda

Get PRO

Mart '26

+178

102 kanalda

Get PRO

Fevral '26

+6 655

171 kanalda

Get PRO

Yanvar '26

+211

215 kanalda

Get PRO

Dekabr '25

+7 412

95 kanalda

Get PRO

Noyabr '25

+25 219

116 kanalda

Get PRO

Oktabr '25

+41 984

79 kanalda

Get PRO

Sentabr '25

+56 475

244 kanalda

Get PRO

Avgust '25

+79 039

85 kanalda

Get PRO

Iyul '25

+70 425

197 kanalda

Get PRO

Iyun '25

+13 287

153 kanalda

Get PRO

May '25

+39 092

94 kanalda

Get PRO

Aprel '25

+39 358

102 kanalda

Get PRO

Mart '25

+20 790

92 kanalda

Get PRO

Fevral '25

+6 503

81 kanalda

Get PRO

Yanvar '25

+8 675

295 kanalda

Get PRO

Dekabr '24

+3 575

144 kanalda

Get PRO

Noyabr '24

+3 287

216 kanalda

Get PRO

Oktabr '24

+4 115

93 kanalda

Get PRO

Sentabr '24

+4 404

233 kanalda

Get PRO

Avgust '24

+1 750

80 kanalda

Get PRO

Iyul '24

+2 866

67 kanalda

Get PRO

Iyun '24

+12 257

101 kanalda

Get PRO

May '24

+11 108

80 kanalda

Get PRO

Aprel '24

+1 695

76 kanalda

Get PRO

Mart '24

+2 971

70 kanalda

Get PRO

Fevral '24

+5 661

31 kanalda

Get PRO

Yanvar '24

+2 647

56 kanalda

Get PRO

Dekabr '23

+1 304

52 kanalda

Get PRO

Noyabr '23

+5 784

103 kanalda

Get PRO

Oktabr '23

+2 155

24 kanalda

Get PRO

Sentabr '23

+2 924

0 kanalda

Get PRO

Avgust '23

+2 277

1 kanalda

Get PRO

Iyul '23

+1 133

0 kanalda

Get PRO

Iyun '23

+1 313

0 kanalda

Get PRO

May '23

+3 157

0 kanalda

Get PRO

Aprel '23

+3 027

0 kanalda

Get PRO

Mart '23

+4 643

0 kanalda

Get PRO

Fevral '23

+1 040

0 kanalda

Get PRO

Yanvar '23

+861

0 kanalda

Get PRO

Dekabr '22

+757

0 kanalda

Get PRO

Noyabr '22

+1 414

0 kanalda

Get PRO

Oktabr '22

+583

0 kanalda

Get PRO

Sentabr '22

+623

0 kanalda

Get PRO

Avgust '22

+578

0 kanalda

Get PRO

Iyul '22

+738

0 kanalda

Get PRO

Iyun '22

+905

0 kanalda

Get PRO

May '22

+1 033

0 kanalda

Get PRO

Aprel '22

+640

0 kanalda

Get PRO

Mart '22

+936

0 kanalda

Get PRO

Fevral '22

+420

0 kanalda

Get PRO

Yanvar '22

+442

0 kanalda

Get PRO

Dekabr '21

+444

0 kanalda

Get PRO

Noyabr '21

+597

0 kanalda

Get PRO

Oktabr '21

+650

0 kanalda

Get PRO

Sentabr '21

+491

0 kanalda

Get PRO

Avgust '21

+489

0 kanalda

Get PRO

Iyul '21

+532

0 kanalda

Get PRO

Iyun '21

+512

0 kanalda

Get PRO

May '21

+518

0 kanalda

Get PRO

Aprel '21

+570

0 kanalda

Get PRO

Mart '21

+424

0 kanalda

Get PRO

Fevral '21

+405

0 kanalda

Get PRO

Yanvar '21

+761

0 kanalda

Get PRO

Dekabr '20

+18 472

0 kanalda

Sana	Obunachilarni jalb qilish	Esdaliklar	Kanallar
03 Avgust	0
02 Avgust	0
01 Avgust	+11

Kanal postlari

🌟 WASTE: запускаем полную Kimi K3 на MacBook Pro с 64 ГБ памяти SQLite AI собрала движок на 6000 строк C, который гоняет полновесную K3 без BLAS, CUDA и Python в рантайме. Kimi K3 после предварительной конвертации из safetensors в формат, который движок умеет читать, занимает 982 ГиБ (диск бы назвал это 1,05 ТБ). В оперативную память она не влезает даже приблизительно. WASTE держит в RAM только резидентную часть на 27,28 ГБ, а экспертов подтягивает с SSD ровно тогда, когда они понадобились. Скорость генерации выходит 0,49-0,54 токена в секунду. Веса при этом полные, без дистилляции и обрезки слоёв. 🟡Расчёт строится на устройстве MoE На каждый токен K3 включает около 4% собственных весов - 16 экспертов в каждом из 92 слоёв. Простаивающему весу незачем сидеть в памяти, ему достаточно успеть подгрузиться вовремя. Контейнер с моделью устроен так, что один эксперт стоит ровно одного чтения с диска - матрицы gate, up и down лежат вплотную, а сами эксперты хранятся в остаточном векторном квантовании (3 ступени кодбуков по 256 записей, 3 бита на вес), и матрица никогда не разворачивается целиком. 🟡Скорость диска На один токен движок вычитывает 17 ГБ. Внутренний NVMe в MacBook выдаёт 12,78 ГБ/с, и модель успевает читать. Внешний бокс по USB даёт 0,94 ГБ/с, и тот же токен считается 13 секунд. Вариант для очень терпеливых. 🟡Работа с памятью Раздувать кэш экспертов выше 46 ГБ бесполезно и вредно - на 52 ГБ скорость падает втрое, на 58 ГБ в 8 раз.

Причина в том, что движок остаётся внутри своего бюджета, а система уже нет - macOS вытесняет кэш на диск, и попадание в память оборачивается обращением к подкачке. Поэтому по умолчанию WASTE не забирает все доступные ресурсы, а берёт на один рабочий набор экспертов меньше, чем мог бы.

Полтокена в секунду - это 30 секунд на одно предложение, но модели вчетверо меньше до сих пор запускают на серверах с терабайтом DDR5, а здесь почти 3 триллиона параметров отвечают без сети. Если триллионы параметров не нужны, тот же движок крутит Kimi-Linear 48B из контейнера на 19 ГБ и выдаёт 10,7 токена в секунду - с этого проще начать знакомство.

Для K3 придётся освободить терабайт на диске и потратить около 5 часов на M5 Pro в три процесса, почти сутки - если гонять конвертацию чистым торчем.

Авторы, кстати, завели файл с опровергнутыми гипотезами и записали туда всё, что померили и выбросили. 📌Лицензирование: Apache 2.0 License. 🖥Github @ai_machinelearning_big_data #AI #ML #Inference #KimiK3 #WASTE #SQLiteAI

2	✔️ Apple будет монетизировать Apple Intelligence Компания планирует продавать расширенные квоты на запросы к Apple Intelligence и обновленной Siri через подписку iCloud+. По словам Тима Кука, пользователи смогут доплачивать за снятие базовых дневных ограничений. Текущие тарифы iCloud+ уже предлагают слегка увеличенные ИИ-лимиты. Для интенсивной работы с ИИ-функциями Apple добавит в линейку сервиса новые, более дорогие уровни подписки. Релиз обновленной Siri ожидается осенью в составе очередного обновления iOS. theverge.com ✔️ Google автоматизировала создание исследований без галлюцинаций в источниках Science One - экспериментальный фреймворк для автоматической генерации научных статей. Инструмент использует архитектуру Chain-of-Evidence, которая минимизирует галлюцинации. Алгоритм привязывает каждое утверждение в тексте к конкретному рабочему артефакту или результату выполнения кода. Для работы с литературой система игнорирует внутреннюю память языковой модели и обращается к научным API, выстраивая графы цитирования в реальном времени. Оценку качества сгенерированных текстов проводит автоматизированный ревьюер CoE Audit. Он проверяет подлинность источников, работоспособность кода и воспроизводимость метрик. В тестах 5 систем на базе Gemini 3.1 Pro написали 75 статей по 5 задачам. Все 337 цитат Science One оказались подлинными. Кроме того, 12 экспериментов выдали корректные результаты, а в 14 из 15 проверенных работ написанный код полностью совпал с заявленной методологией. research.google ✔️ MiniMax релизнул видеомодель H3 - модель генерации видео с поддержкой мультимодального ввода, которая генерирует ролики длиной до 15 секунд в разрешении 2K со стереозвуком по составным промптам. Модель одновременно обрабатывает текст, изображения, видео и аудио и умеет комбинировать референсы в одном запросе - извлечь движение камеры из загруженного ролика, внешность персонажа из фото, а звук - из аудиофайла. В один промпт можно передать до 12 референсов. Генерация через API стоит 13 центов за секунду видео в 2К и 9 центов за 768P. Открытый релиз на ModelScope запланирован на 3 августа. minimax.io ✔️ ByteDance выпустила Seedance 2.5 Новинка генерирует видео длиной до 30 секунд за один проход, что вдвое больше лимита предыдущей версии. Фрагменты можно объединять в ролики длительностью до нескольких минут. Модель поддерживает расширенный мультимодальный промптинг - в один запрос можно передать до 30 изображений, 10 видеоклипов и 10 аудиодорожек. Для точного контроля визуального ряда и темпа генерации используются таймкоды. В Китае Seedance 2.5 появилась на платформах Jiemeng AI и Doubao Professional, на глобальном рынке она доступна через сервис Dreamina экосистемы CapCut. bytedance.com ✔️ ElevenLabs добавила автоматическую озвучку по ролям Новая функция Character Casting парсит загруженный текст, извлекает персонажей и назначает им роли из библиотеки на 10 тысяч синтетических дикторов. При замене диктора алгоритм обновляет реплики для выбранного персонажа по всему документу. Инструмент умеет определять нестандартные имена и выдуманные термины. Достаточно задать произношение один раз, после чего правило применяется ко всему тексту. Готовый проект можно дополнить звуковыми эффектами, экспортировать (заявлена поддержка более 70 языков) или опубликовать в ElevenReader. По оценкам ElevenLabs, Character Casting снижает стоимость производства аудиокниги с $5000 до $200, а время создания - с трех месяцев до нескольких часов. Новая функция доступна в разделе Audiobooks. elevenlabs.io @ai_machinelearning_big_data #news #ai #ml	16 523
3	+1 🤯 OpenAI заявила о десяти прорывах в задачах, которые математики не могли решить десятилетиями Результаты получила внутренняя версия Astra - следующей крупной модели компании. Среди достижений: — построен первый явный пример не-софической группы (особого типа абстрактной алгебраической структуры, которую раньше удавалось описывать только косвенно); — опровергнута гипотеза жёсткости Конна (долгосрочное предположение в функциональном анализе о том, насколько строго определяются такие математические объекты); — доказана квантовая теорема о параллельном повторении для общих двухигровых систем (показывает, как быстро падают шансы на успех при многократном повторении квантовых игр); — доказана гипотеза Эрхарта об объёме (результат из геометрии, связанный с подсчётом точек в многомерных фигурах и их объёмами); — впервые с 1978 года улучшена общая верхняя оценка плотности упаковки сфер (то есть насколько плотно можно «уложить» шары в пространстве). По заявлению OpenAI, Astra самостоятельно нашла основные математические аргументы, а затем формализовала каждое доказательство в Lean. Вместе с машинно проверяемыми сертификатами опубликована рукопись на 249 страниц. Успешные запуски обошлись бы примерно в $2000 по тарифам Sol API. одели начинают предлагать новые доказательства для открытых задач - хотя теперь результаты должен внимательно проверить весь математический мир. Astra ещё не выпущена, и OpenAI не называет её GPT-6. openai.com/index/ten-advances-in-mathematics/	16 133
4	✔️ OpenAI заблокировала сеть аккаунтов ChatGPT скам-центров из Камбоджи Злоумышленники использовали языковую модель для автоматизации инвестиционного и дэйтинг-скама, а также имитации работы правоохранительных органов. ChatGPT создавал для них виртуальные личности, переводил переписки с жертвами в реальном времени и генерировал поддельные паспорта и юридические документы. Анализ логов показал, что инфраструктура применялась для вербовки людей в киберрабство. Модель массово писала объявления о найме операторов чата с обещанием бесплатного перелета и проживания (это стандартная тактика преступных синдикатов Юго-Восточной Азии). OpenAI передала собранные улики правоохранительным органам и ИБ-партнерам. По оценкам компании, жертвами сети стали сотни человек, финансовые потери отдельных пострадавших исчисляются тысячами долларов. @ai_machinelearning_big_data #news #ai #ml	21 923
5	✔️ Экс-сотрудник OpenAI основал стартап для создания качественных RL-данных Эндрю Хо, соавтор бенчмарка GeneBench-Pro покинул компанию ради запуска собственного проекта. Безымянный пока стартап займется генерацией специализированных датасетов для обучения LLM. По мнению Эндрю, современные языковые модели всё ещё ограничены и предвзяты - для освоения сложных практических задач им не хватает качественных данных, которые позволили бы моделям тренироваться без вмешательства человека. Решение Хо заключается в создании наборов данных, максимально приближенных к реальным научным исследованиям, но с заранее известными эталонными ответами. Это даст агентам возможность свободно искать алгоритмы решения, а системе - автоматически и безошибочно проверять их корректность. Эффективность такого подхода уже доказал GeneBench-Pro. В этом тесте по биологии модель GPT-5.6 Sol Pro смогла решить лишь 31,5% из 129 предложенных задач. На старте детище Хо сфокусируется на биологии, статистике и анализе реальных лабораторных снимков. Позже стартап планирует создавать обучающие выборки для химии, материаловедения, медицины и сложных офисных задач. Хо уверен, что нехватка верифицируемых данных - это главная проблема индустрии, на преодоление которой топовые лаборатории вскоре потратят более 100 миллиардов долларов. @ai_machinelearning_big_data #news #ai #ml	19 193
6	⚡️ Модели Anthropic случайно взломали 3 реальные компании во время тестов Инцидент произошел во время ИБ-учений формата CTF из-за сбоя в настройках на стороне компании-партнера Irregular, отвечавшей за проведение тестирования. Вместо закрытой изолированной среды, модели получили прямой доступ к публичному интернету. Оказавшись во внешней сети, Opus 4.7, Mythos 5 и одна внутренняя исследовательская сборка применили базовые хакерские техники, успешно проэксплуатировав слабые пароли и неаутентифицированные эндпоинты реальных компаний. Anthropic выявила эти случаи лишь после масштабного аудита 141 тысячи тестовых сессий. Проверку инициировали на фоне недавнего скандала с OpenAI, который при схожих обстоятельствах проник в инфраструктуру Hugging Face. После обнаружения утечки Anthropic экстренно остановила все кибериспытания и связалась с пострадавшими организациями, две из которых не зафиксировали у себя факт взлома. @ai_machinelearning_big_data #news #ai #ml	20 739
7	24 сентября пройдёт Yandex Scale 2026 — ежегодная флагманская технологическая конференция Yandex Cloud про облачные технологии, инфраструктуру и искусственный интеллект. В программе четыре офлайн-трека — AI, Hybrid Infrastructure & DevOps, Data, Security — с докладами, воркшопами, питчингом решений, демо-зонами, IT-квестом и мерчом. А ещё отдельный онлайн-трек DeepTech: с воркшопами, в которых можно принять участие, голосованием, влияющим на ход эфира и эксклюзивными гостями. Ещё одна фишка конференции — виртуальный стенд VibeCraft, где можно завайбкодить свой проект и забрать призы Плюс отдельная онлайн-студия с интерактивной программой где можно: 🔴 оценить юмор на Лиге IT-шуток; 🔴 задать вопросы СТО Yandex Cloud; 🔴 послушать известных научпоп-спикеров и задать им свои вопросы; Зрители голосуют и в реальном времени влияют на взаимодействие в студии. И это ещё не всё! Полезно будет CTO, CIO, CDO, CISO, CDTO, CPO, архитекторам, тимлидам, разработчикам, DevOps- и ML-инженерам, продакт-менеджерам, аналитикам, специалистам по информационной безопасности и руководителям клиентского опыта — то есть всем, кто и так уже читает этот канал. 🗓 Когда: 24 сентября. 📍 Где: онлайн и офлайн в Москве. Подать заявку уже можно на сайте Yandex Scale, участие бесплатное!	17 971
8	DeepSeek запустила официальный API модели V4-Flash и заметно улучшила её работу в агентных сценариях. По тестам компании, новая версия значительно опережает V4-Pro-Preview в задачах, связанных с кодом и автономными агентами. Что изменилось: - усилены возможности для долгих агентных задач; - добавлена нативная поддержка Responses API; - появились параллельные вызовы инструментов; - доступны уровни рассуждения low, high и max; - контекст увеличен до 1 млн токенов; - модель адаптирована для работы с Codex. V4-Flash можно подключить к Codex CLI, расширению для VS Code и другим совместимым инструментам через единый конфиг. ⚠️ Примечание 🔷 DeepSeek-V4-Flash-0731 сохранила ту же архитектуру и размер модели, что и предварительная версия. 🔷 Сегодняшнее обновление касается только API DeepSeek-V4-Flash. API DeepSeek-V4-Pro, а также модели в приложении и веб-версии пока остаются без изменений. Официальный релиз DeepSeek-V4-Pro состоится в ближайшее время. Документация: https://api-docs.deepseek.com/quick_start/agent_integrations/codex	23 593
9	✔️ ЕС выделит 10 млрд евро на создание семи ИИ-фабрик Еврокомиссия открыла тендер на строительство ИИ-кластеров с ожидаемым общим бюджетом 30 млрд евро. Из них 10 млрд евро напрямую предоставят фонды ЕС и бюджеты стран-участниц. Финансирование получат 7 дата-центров - в документах они фигурируют как "суперфабрики". Прием заявок продлится до 12 ноября, победителей объявят в июле 2027 года. По условиям тендера, подрядчики обязаны полностью ввести объекты в эксплуатацию в течение 18 месяцев после подписания контрактов. wsj.com ✔️ OpenAI запустила программу доступа к флагманским моделям для учёных Программа ChatGPT for Academic Researchers предполагает, что до 2027 года компания предоставит 100 тысячам учёных доступ к своим топовым моделям. Первые 10 тысяч исследователей получат приглашения этим летом. Участникам откроют доступ к GPT-5.6 Sol Pro, ChatGPT Work и Codex с расширенным контекстом, увеличенными лимитами и дополнительными кредитами для функции Deep Research. Платформа включает более 75 научных навыков и интегрирована с базами статей, геномными датасетами и вычислительными блокнотами. Участие отрыто только для профильным специалистам из одобренных OpenAI университетов. Кандидаты обязаны подтвердить академический статус и наличие научных проектов. Одобренный участник может добавить в рабочее пространство до четырех коллег из своего института. openai.com ✔️ Thinking Machines Lab представила модель Inkling-Small Стартап Миры Мурати опубликовал веса мультимодальной MoE-модели Inkling-Small на 276 млрд общих и 12 млрд активных параметров. Модель обрабатывает текст, аудио и изображения в окне контекста до 1 млн токенов. Благодаря дистилляции от флагманской Inkling и обучению с подкреплением, младшая версия превзошла оригинал в кодинге и логическом вывода. Она выбила 80% в бенчмарке SWE-bench Verified и 31,6% в Humanity’s Last Exam. Веса - на Hugging Face, инференс и файн-тюнинг доступны через платформу Tinker. С учетом стартовой скидки стоимость API составляет от $0,58 для контекста 64K до $1,16 для 256K токенов. thinkingmachines.ai ✔️ Google выпустила модель Embodied Reasoning 2 ER 2 обрабатывает непрерывные мультимодальные видеопотоки и работает как высокоуровневый планировщик. Архитектура разделяет логику и моторику - пока модель рассчитывает следующий шаг, физические действия выполняют VLA-модели. Модель анализирует видеокадры в реальном времени, оценивает статус текущего этапа и корректирует алгоритм на лету без перезапуска процесса. ER 2 также поддерживает мультиагентную работу - устройства разного типа могут обмениваться семантическим контекстом для совместного выполнения многошаговых задач в общем физическом пространстве. Модель доступна через Gemini API и на платформе Google AI Studio. В помощь начинающим опубликованы примеры того, как настроить модель и заставить её выполнять задачи в области физического ИИ. blog.google ✔️ Liquid AI выложила веса двунаправленных энкодеров под CPU Стартап опубликовал веса двунаправленных энкодеров LFM2.5-Encoder на 230M и 350M параметров. Модели базируются на архитектуре LFM2, оптимизированы для запуска на CPU и поддерживают контекст до 8К токенов. Основные сценарии применения - классификация, маршрутизация и токен-уровневые операции. По итогам 17 тестов, старшая версия на 350M заняла четвертое место из 14. По словам Liquid AI, при полной загрузке окна в 8192 токена модель 230M выполняет forward pass на CPU за 28 секунд - в 3,7 раза быстрее ModernBERT-base. Код и веса - на GitHub и Hugging Face. liquid.ai @ai_machinelearning_big_data #news #ai #ml	18 144
10	🖥 OpenAI одновременно снижает стоимость дешёвых моделей и ускоряет флагман. GPT-5.6 Sol Fast теперь работает до 2,5 раза быстрее, при этом стоит вдвое дороже обычного режима. В пересчёте на скорость это примерно на 25% выгоднее. Параллельно OpenAI снизила цены: - GPT-5.6 Luna — до $0,20 за вход и $1,20 за выход на миллион токенов; - GPT-5.6 Terra — до $2 и $12; - GPT-5.6 Sol — $5 и $30. Luna теперь в 25 раз дешевле Sol. Она подходит для массовых задач: классификации, обработки данных, поддержки и простых агентов. Sol Fast рассчитан на задачи, где важна минимальная задержка: интерактивные продукты, сложные агенты и работа в реальном времени. OpenAI давит сразу с двух сторон: предлагает дешёвый инференс для больших объёмов и ускоряет самые мощные модели. @ai_machinelearning_big_data #openai #chatgpt	21 168
11	📌 Нейрослоп добрался до крупного бизнеса Сервис проверки текстов GPTZero обнаружил выдуманные ссылки и ложные факты в 4-х отчетах ближневосточного подразделения PwC за 2024–2026 годы. GPTZero - один из самых быстрорастущих стартапов в сфере ИИ, создавший лидирующий в индустрии детектор ИИ-текста. Платформа обслуживает более 10 миллионов пользователей, включая преподавателей, авторов и специалистов по кибербезопасности. Костяк команды состоит из специалистов, пришедших из ведущих технологических компаний и лабораторий: Perplexity AI, Apple, Microsoft AI, Uber, Caltech и Стэнфордского университета. Самый проблемный документ, "Transforming Governance" с вероятностью 84% был полностью написан ИИ. В этом отчете компания продвигает свой продукт "Citizen Pulse", заявляя, что решение якобы уже используют правительства Дании, Саудовской Аравии, США и Австралии. Никаких доказательств, подтверждающих эти внедрения, не существует. GPTZero выявили закономерность - чем выше доля ИИ-генерации в документе, тем больше в нем несуществующих источников. Команда назвала этот признак "вайб-цитатами" - когда сноски проставляются хаотично, не содержат реальных авторов или валидных URL-адресов и совершенно не подтверждают утверждения в тексте. Представители PwC заявили, что серьезно относятся к точности данных и уже обновляют источники, но причину появления галлюцинаций в официальных документах не объяснили. Проблема оказалась характерной для "Большой консалтинговой четвёрки" - ранее сервис находил аналогичные фейки в отчетах KPMG, Deloitte и Ernst & Young. @ai_machinelearning_big_data #news #ai #ml	20 137
12	Что произошло в мировом ML за последние полгода? Если не успеваете следить за ICML и другими крупными конференциями, 13 августа Яндекс проведёт ML Global Recap H1 2026 — встречу, где эксперты разберут ключевые работы, тренды и идеи, которые уже начинают влиять на индустрию. В программе — четыре доклада от руководителей команд Яндекса. О развитии Tabular DL расскажет Артём Бабенко из Yandex Research, о трендах и вызовах в reasoning — Дмитрий Мокеев из Alice AI, о новых подходах к оценке качества моделей — Иван Дёгтев из Яндекс R&D —, а об оптимизации LLM-инференса — Андрей Бежин из Яндекс R&D. А еще участников ждут нетворк и обмен впечатлениями с теми, кто побывал на конференциях лично. 📍 Москва + онлайн 🗓 13 августа 🔗Регистрация — на сайте конференции Реклама ООО «Яндекс», ИНН 7736207543, erid: CQH36pWzJqMVErd51Wmdi672nSWCXUoVD3hQqe7LcXVEpC	19 950
13	✔️ В США запретили импорт китайских роботов-гуманоидов Федеральная комиссия по связи США запретила сертификацию новых китайских антропоморфных и четвероногих роботов. По заявлению регулятора, мера защитит вычислительную ИИ-инфраструктуру от уязвимостей в цепочках поставок, перехвата данных и удаленного вмешательства. Ограничения затрагивают и производителей оборудования для дата-центров, включая Sungrow и Huawei. В сегменте автономных систем под запрет попадает продукция Unitree - недавнего партнера Nvidia по интеграции чипов Blackwell в робототехнику. Правило распространяется на устройства, еще не прошедшие сертификацию FCC. Агентство также оставило за собой право отзывать выданные ранее разрешения. reuters.com ✔️ MCP перевели на stateless-архитектуру В обновлении протокола Agentic AI Foundation отказались от постоянных сессий и sticky-роутинга, что позволяет развертывать MCP-серверы за стандартными облачными балансировщиками и в Kubernetes-кластерах. При перезагрузке подов контекст агента теперь не теряется. В протокол добавили обязательную валидацию параметра issuer для защиты от атак типа OAuth mix-up. Также совместно с Okta реализована функция Enterprise Managed Authorization. Расширения MCP Apps (серверные интерфейсы) и MCP Tasks (асинхронные задачи) перешли в статус официальных. Для стабильности корпоративных инфраструктур мейнтейнеры зафиксировали 12-месячный период поддержки устаревающих функций для всех будущих изменений. aaif.io ✔️ Google выпустила модель генерации музыки Lyria 3.5 В релиз добавили функцию Selective Section Painting, которая позволяет переписывать отдельные фрагменты аудио без перегенерации композиции с нуля. Еще появился раздельный контроль ритма и длительность дорожек вокала, баса, ударных и других инструментов. По словам Google, в новой версии также улучшили синтез речи для вокальных партий, а длительность трека увеличили до 3-х минут. Google не раскрывает состав датасета для Lyria 3.5. Предыдущую версию тренировали на лицензионном контенте YouTube и легальных материалах партнеров. Доступ к модели открыт на платформе Google Flow Music. blog.google ✔️ OpenAI выложила в опенсорс утилиту Codex Security CLI Консольная утилита, доступная на Github под лицензией Apache 2.0, автоматически находит, проверяет и устраняет уязвимости в кодовой базе. Инструмент поддерживает массовое сканирование нескольких репозиториев, верификацию примененных патчей и прямую интеграцию в CI/CD. Технология дебютировала в марте 2026 года в формате превью для корпоративных подписчиков ChatGPT на тарифах Enterprise, Business и Edu. По данным OpenAI, за месяц использования система помогла закрыть свыше 3000 критических багов. Утилита в статусе беты, устанавливается через npm и требует для работы Node.js 22 и Python 3.10 или новее. OpenAI в сети Х ✔️ Pangram представила четвертую версию модели для распознавания сгенерированного текста Новинка отличает тексты, написанные ИИ с нуля от материалов с частичной машинной редактурой. Алгоритм распознает признаки генерации в 98,83% случаев даже после обработки текста сервисами для обхода детекции. По результатам внутренних тестов компании, модель определяет машинный контент с точностью 99,66%. Модель стала в 6 раз масштабнее предыдущей версии. Компания заявляет о снижении ложных срабатываний в 14 раз - авторские материалы ошибочно помечаются как генерации в 0,0041% случаев (1 ошибка на 24 тысячи документов). Количество пропусков ИИ-контента сократилось в 6 раз. Стоимость обращения к API составляет 5 центов за 100 слов. Во все тарифы добавили бесплатное сканирование изображений. Поддержка Pangram 3 прекратится 30 сентября 2026 года. pangram.com @ai_machinelearning_big_data #news #ai #ml	19 553
14	✔️ OpenAI представила новые модели распознавания речи GPT Transcribe предназначена для работы с аудиофайлами и обрабатывает их примерно в 34 раза быстрее реального времени. GPT Live Transcribe оптимизирована для потоковой расшифровки звука с минимальной задержкой. Оба решения доступны через API, умеют учитывать текстовый контекст и заданные ключевые слова, а также поддерживают мультиязычный ввод. По данным тестов Artificial Analysis на бенчмарке AA-WER, GPT Transcribe демонстрирует уровень ошибок в словах (WER) на отметке 3,3%. Это на 0,7 пп лучше результата ее предшественницы - GPT-4o Transcribe. Несмотря на улучшенные метрики, изделие OpenAI пока не дотягивает до лидеров. В рейтинге AA-WER первое место у Fun-Realtime-ASR-Preview от Alibaba Group с показателем 1,7% второе - у ElevenLabs Scribe v2 (2,2%), за ней следуют MAI-Transcribe-1.5 (2,4%), Mistral Voxtral Small (2,8%) и Gemini 3.1 Pro (2,8%). Вместе с релизом OpenAI снизила тарифы - минута обработки аудио обойдется в $0,0045, а для GPT Live Transcribe - $0.017. @ai_machinelearning_big_data #news #ai #ml	21 071
15	🧱 Sakana AI и NYU научили Transformer генерировать Minecraft-миры по отдельным блокам В Dream-Cubed каждый блок - камень, вода, песок или дерево - обрабатывается как отдельный токен. Для обучения собрали более 30 млрд блоков: свыше 1,8 млн процедурных чанков размером 32×32×32 и более 200 тысяч фрагментов авторских карт. Исследоватли собрали датасет из десятков миллиардов блоков: процедурно созданных ландшафтов и качественных пользовательских карт, полученных с разрешения авторов. На этих данных обучили семейство Transformer-моделей для генерации интерактивных 3D-миров с точностью до отдельного блока. Модели умеют: - достраивать мир вокруг заданной структуры; - заменять отдельные участки и биомы; - генерировать по расставленным пользователем блокам; - расширять карту через outpainting; - создавать миры практически неограниченного размера. Авторы протестировали дискретную и непрерывную диффузию. Сгенерированные миры сразу остаются редактируемыми и пригодными для игры. Опубликованы датасет, код обучения, инференс и готовые модели. Блог: https://pub.sakana.ai/dream-cubed Статья: https://arxiv.org/abs/2604.22847 Код: https://github.com/SakanaAI/DreamCubed #AI #Minecraft #GenerativeAI #Diffusion #3D #OpenSource @ai_machinelearning_big_data	22 108
16	⚡️ Агент OpenAI использовал инфраструктуру Modal Labs как плацдарм для взлома Hugging Face. Инцидент с агентом OpenAI оказался куда масштабнее, чем предполагалось изначально. Выяснилось, что перед резонансной атакой на Hugging Face экспериментальная нейросеть проникла в изолированную тестовую среду одного из клиентов облачного провайдера Modal Labs. По словам техдира компании Акшата Бубны, пользователь оставил открытым эндпоинт, что позволило агенту выполнить произвольный код и превратить уязвимую песочницу в отправную точку для дальнейшего распространения. При этом базовые механизмы безопасности и изоляции самой платформы Modal не пострадали. OpenAI отказалась комментировать новые подробности инцидента. @ai_machinelearning_big_data #news #ai #ml	20 328
17	Главный вопрос вокруг ИИ сегодня уже не «использовать или нет», а «как его интегрировать в процессы с максимальной пользой». При этом единых стандартов пока нет: каждая компания сама определяет, где ИИ действительно может приносить эффект. Яндекс анонсировал внутреннюю программу 75/75/75, которая должна сделать использование ИИ новым стандартом разработки. К концу 2026 года планируется, что регулярно применять ИИ при написании кода будут не менее 75% разработчиков, на уровне всей компании ИИ будет участвовать в подготовке не менее 75% изменений, а в каждом таком изменении — генерировать не менее 75% кода. При этом принятие важных решений и контроль качества остаются за разработчиками. Подход уже применяется в сервисах: команда Яндекс Еды с помощью ИИ сократила время разработки ИИ-хостес более чем в два раза, а в Яндекс Браузере с помощью ИИ за два дня вместо двух-трех недель было создано около 80% кода для новой архитектуры технологии в переводе видео. Помимо этого, компания создает собственных ИИ-агентов для внутренних процессов. Например, агент Стефания помогает сотрудникам с аналитикой и поиском информации во внутренней сети. Эти же принципы масштабируются и вовне через SourceCraft и Yandex AI Studio, которые дают возможность внедрять ИИ в процессы разработки и ускорять создание новых продуктов.	20 067
18	🔥 ChatGPT приближается к 1 млрд пользователей в неделю, но давление на OpenAI растёт По данным The Information: • цель достигнута на семь месяцев позже плана • у ChatGPT уже более 50 млн платных пользователей • enterprise приносит свыше 40% выручки • прогноз выручки на год - около $25 млрд • ожидаемый cash burn - примерно те же $25 млрд • Anthropic могла обогнать OpenAI по выручке благодаря корпоративным клиентам Миллиард пользователей - исторический масштаб. https://www.theinformation.com/articles/openais-chatgpt-nears-1-billion-weekly-active-users-seven-months-target	20 261
19	📌Mythos нашла математические слабости в криптографических алгоритмах Anthropic опубликовала отчёт подразделения Frontier Red Team. По его данным, Mythos улучшила атаку на постквантовую схему цифровой подписи HAWK и нашла новый способ атаковать упрощённую версию шифра AES. HAWK - кандидат в новый стандарт. В 2022 году американский институт стандартов NIST объявил конкурс на подписи, устойчивые к будущим квантовым компьютерам - HAWK дошёл до третьего раунда, и специалисты разбирали его 2 года. По утверждению Anthropic, Mythos за 60 часов обнаружила в математической решётке, на которой держится стойкость схемы, ранее незамеченную симметрию. Эффективная длина ключа сокращается вдвое - для варианта HAWK-256 оценка стоимости взлома падает с 2 в 64-й степени операций до 2 в 38-й. Атака остаётся экспоненциальной и на другие постквантовые кандидаты NIST не переносится, но чтобы вернуть прежний запас прочности, ключи HAWK пришлось бы удвоить, а тогда схема теряет свои главные преимущества. 🟡AES-128 Полная версия шифра делает 10 раундов преобразований, атака работает против урезанной, семираундовой (такие варианты криптографы изучают специально, чтобы оценивать надёжность целого шифра). Модель предложила метод, который назвала "мостом Мёбиуса" - он убирает один из перебираемых атакующим параметров и ускоряет лучшую известную атаку до 800 раз. 🟡Человек в тесты взлома почти не вмешивался В кейсе HAWK участвовал исследователь без специализации в решётчатой криптографии, и занимался он в основном организацией процесса. Атаку на AES модель нашла почти сама - сначала она от задачи отказывалась, написав, что "AES-128 r5/r6 трудная задача", и взялась за поиск только после нескольких подбадривающих сообщений. За 3 дня она выдала несколько сотен миллионов токенов, получив всего 3 подсказки. Каждая из двух работ обошлась примерно в 100 тысяч долларов оплаты API. В отчёте упомянуты и другие результаты - атаки на укороченные версии шифров LEA и Serpent-128, небольшие улучшения против Salsa20, Poseidon и SHA-1. Подробности компания обещает позже. Anthropic выложила статью и демонстрационный код атаки на HAWK, цепочку рассуждений Mythos в момент находки по AES и сообщила, что консультировалась с криптографами, передала находку авторам HAWK и синхронизировала раскрытие с публичной рассылкой NIST. Также, вместе с ETH Zurich, Тель-Авивским университетом и Университетом Хайфы Anthropic выпустила набор тестов CryptanalysisBench, чтобы криптоаналитические способности языковых моделей могли измерять и другие. @ai_machinelearning_big_data #AI #ML #Research #Cybersecurity #Mythos #Anthropic	19 007
20	🧠 Чем живёт ML-индустрия? Чтобы найти ответ на вопрос, разработчик из ML-инфраструктуры Яндекса Даша отправилась в Сеул на конференцию ICML — одну из главных мировых конференций по машинному обучению. На ней она вместе с коллегами представила свою статью об ускорении графовых нейронных сетей. В видео Даша рассказывает, о чём ее статья, как выглядят подобные ML-события и в чём ценность участия в них. ↘ Присоединяйтесь к команде Яндекса и решайте самые интересные задачи. Подписывайтесь 〰️ @yandex	18 574

Barcha postlarni ko‘rish