ar
Feedback
Анализ данных (Data analysis)

Анализ данных (Data analysis)

الذهاب إلى القناة على Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

إظهار المزيد

📈 نظرة تحليلية على قناة تيليجرام Анализ данных (Data analysis)

تُعد قناة Анализ данных (Data analysis) (@data_analysis_ml) في القطاع اللغوي الروسية لاعباً نشطاً. يضم المجتمع حالياً 50 188 مشتركاً، محتلاً المرتبة 2 674 في فئة التكنولوجيات والتطبيقات والمرتبة 12 568 في منطقة روسيا.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 50 188 مشتركاً.

بحسب آخر البيانات بتاريخ 11 يونيو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -1 975، وفي آخر 24 ساعة بمقدار -4، مع بقاء الوصول العام مرتفعاً.

  • حالة التحقق: غير موثّقة
  • معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 9.28‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 5.80‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
  • وصول المنشورات: يحصل كل منشور على متوسط 4 656 مشاهدة. وخلال اليوم الأول يجمع عادةً 2 912 مشاهدة.
  • التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 32.
  • الاهتمامات الموضوعية: يركز المحتوى على مواضيع رئيسية مثل llm, контекст, openai, архитектура, deepseek.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 12 يونيو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة التكنولوجيات والتطبيقات.

50 188
المشتركون
-424 ساعات
-227 أيام
-1 97530 أيام
أرشيف المشاركات
🖥 Nvidia представила RTX Spark 0 ARM-чип, который метит туда, где Apple M-серия доминирует. По памяти: RTX Spark поддерживае
+3
🖥 Nvidia представила RTX Spark 0 ARM-чип, который метит туда, где Apple M-серия доминирует. По памяти: RTX Spark поддерживает до 128 ГБ LPDDR5X (минимум 16 ГБ) с пропускной способностью 300 ГБ/с через NVLink C2C. Для локального запуска LLM и диффузионных моделей это принципиально важная цифра - большой объём единой памяти без разделения между CPU и GPU. Полный стек NVIDIA включает поддержку CUDA, TensorRT, NVFP4, DLSS, Ray Tracing, Reflex и G-SYNC. Всё, что нужно разработчику под CUDA, будет работать нативно без каких-либо дополнительных прослоек. Первые устройства на RTX Spark выйдут осенью 2026 года. Свои флагманы на новом чипе уже готовят Microsoft (Surface Laptop Ultra), Asus (ProArt P14, P16), Dell (XPS 16), MSI (Prestige N16 Flip AI), HP (OmniBook X14 Ultra 16), Lenovo (Yoga Pro 9i) и другие. Помимо ноутбуков, в планах у Nvidia - компактные десктопы: Acer, Asus, Dell, Gigabyte, HP, MSI и Lenovo анонсировали RTX Spark Desktop-устройства.

Lakehouse — новый подход к данным, который убивает DWH и Data Lake - Высокая вероятность, что массовый переход на Lakehouse начнётся в ближайшие 1-2 года — после того как первые игроки (Т-банк, Магнит, Ламода) уже доказали экономию и масштабируемость. Об этом в интервью «Коммерсанту» рассказал Леонид Савченков, руководитель продуктовой архитектуры платформы данных Yandex Cloud. - Классические DWH на объёмах от 100 ТБ начинают тормозить: единственный способ — докупать серверы целиком, потому что хранение и вычисления сцеплены. - Data Lake решал проблему объёма, но не давал нормального управления данными — отчёты строить было сложно. - Lakehouse разделяет хранение и вычисления: можно нарастить мощности под «Чёрную пятницу» и не платить за лишнее место весь год. - В отличие от Data Lake, здесь появляются строгие табличные форматы и управление данными как в СУБД. - Узкое место — нужны спецы по Trino и Spark. Чудес не бывает. - Для ИИ это идеально: вычисления можно выделить в отдельные мощности, не роняя основные отчёты. X5 уже построил бота по трендам молока в регионах. - Через пять лет, вероятно, появится новая концепция. Если данных мало — старый DWH всё ещё дешевле и проще. https://www.kommersant.ru/doc/8691430

MiniMax M3 выглядит как один из самых сильных открытых релизов этого года. Модель сразу бьёт в три направления, которые сейча
MiniMax M3 выглядит как один из самых сильных открытых релизов этого года. Модель сразу бьёт в три направления, которые сейчас важны для практического ИИ: кодинг, агентные сценарии и мультимодальность. То есть не просто чат-модель с длинным контекстом, а система, которую пытаются сделать пригодной для реальной работы с кодом, терминалом, браузером, изображениями, видео и computer use. Что заявляют по цифрам: - 59.0% на SWE-Bench Pro - 66.0% на Terminal Bench 2.1 - 34.8% на SWE-fficiency - 28.8% на KernelBench Hard - 74.2% на MCP Atlas - контекст до 1M токенов через MiniMax Sparse Attention - до 15x ускорение декодирования на длинном контексте - оптимизация CUDA FP8 GEMM kernel с нуля дала 9.4x ускорение на Hopper GPU - нативная работа с изображениями, видео и computer use API: http://platform.minimax.io Тарифы по токенам: https://platform.minimax.io/subscribe/token-plan MiniMax Code: http://code.minimax.io

Работа The AI Layoff Trap цепляет самой механикой ловушки вокруг ИИ-автоматизации. Представьте обычную компанию. Она заменяет
Работа The AI Layoff Trap цепляет самой механикой ловушки вокруг ИИ-автоматизации. Представьте обычную компанию. Она заменяет часть сотрудников ИИ, снижает расходы и получает преимущество. Конкуренты видят это и повторяют. Потом подключаются остальные. Бизнес действует рационально: режет издержки, защищает маржу, ускоряет процессы. Уволенные сотрудники были покупателями. Когда таких людей становится много, они тратят меньше. Спрос падает, продажи проседают, компании снова ищут, где урезать расходы. Самый быстрый путь - ещё больше автоматизации. Так появляется петля: компании заменяют людей ИИ, доходы падают, рынок покупает меньше, бизнес снова режет расходы. Для одной фирмы это выглядит разумно. Для системы в целом такой цикл может стать ловушкой. Обычно считают стоимость задачи, скорость, качество ответа, экономию на людях. Гораздо реже считают эффект второго порядка: что произойдёт, если такую же оптимизацию одновременно проведут тысячи компаний. Авторы работы показывают, что базовый доход, налоги на капитал, переобучение, доля работников в бизнесе и договорённости между компаниями в их модели проблему полностью не закрывают. Единственный механизм, который сработал, - налог на автоматизацию задач. Компания заранее учитывает ущерб спросу, который создаёт массовой заменой людей ИИ. С моделью можно спорить. Но постановка сильная: ИИ может ударить по экономике через обычную конкуренцию. Каждый игрок действует рационально, пока сумма этих решений постепенно ослабляет рынок, на котором все они зарабатывают. http://arxiv.org/pdf/2603.20617

В Сан-Франциско дом за $2.995 млн теперь можно купить акциями OpenAI или Anthropic Это реальный листинг в Duboce Triangle: пр
+1
В Сан-Франциско дом за $2.995 млн теперь можно купить акциями OpenAI или Anthropic Это реальный листинг в Duboce Triangle: продавец готов принять не только деньги, но и частные акции OpenAI или Anthropic. У сотрудников и ранних инвесторов может быть большое состояние на бумаге, но оно застряло в неликвидных акциях. До IPO, tender sale или вторичного рынка эти деньги нельзя просто вывести и принести на сделку по недвижимости. В итоге человек может формально быть миллионером, но при покупке дома всё равно упираться в классическую проблему: денег на счету нет, а капитал лежит в private equity. Интерес к объекту появился почти сразу после публикации такого условия. По её словам, на просмотрах часто встречаются сотрудники и инвесторы из AI-компаний, которые хотят покупать жильё, но не могут быстро превратить опционы и акции в ликвидность. Продавец, судя по описанию, сам верит в OpenAI и Anthropic, поэтому готов рассматривать их акции как часть расчёта. Для обычного рынка это рискованная конструкция, для Сан-Франциско 2026 года - почти логичное продолжение AI-экономики. zillow.com/homedetails/160-Noe-St-San-Francisco-CA-94114/461638923_zpid/

✔️ Бывшие исследователи DeepMind подняли $50 млн на лабораторию, где ИИ будет улучшать не только модель, а всю исследовательс
✔️ Бывшие исследователи DeepMind подняли $50 млн на лабораторию, где ИИ будет улучшать не только модель, а всю исследовательскую организацию Команда Inherent хочет строить AI-лабораторию вокруг идеи recursive self-improvement - но не в узком смысле «модель сама себя переписывает». Их ставка шире: ИИ должен помогать людям во всём исследовательском цикле: - находить перспективные вопросы - проектировать эксперименты - проверять гипотезы - анализировать результаты - улучшать сам процесс исследований Раунд на $50 млн возглавили Index и Radical. В инвесторах также венчурное подразделение NVIDIA, Dwarkesh Patel, Thomas Wolf, Max Jaderberg и другие заметные имена. У фаундеров сильный бэкграунд. Louis Kirsch связан с линией Шмидхубера по самоулучшающимся системам. Edward Hughes давно пишет про open-endedness как важный путь к сверхчеловеческому ИИ. Tantum Collins работал над AI policy в Белом доме при Байдене. Inherent хочет, чтобы ИИ жил внутри эксперимента рядом с человеком: не просто был инструментом для ответа, а становился полноценным исследовательским партнёром. Компанию сразу оформили как Public Benefit Corporation - то есть миссия заложена в структуру бизнеса с первого дня. https://x.com/Machinelearrn/status/2060704335772721350

Как он создал Linux без OPUS 4.8 ??
Как он создал Linux без OPUS 4.8 ??

🧩 Microsoft показала SkillOpt - способ обучать навыки агентов без дообучения модели Обычно agent skills пишут руками, генери
🧩 Microsoft показала SkillOpt - способ обучать навыки агентов без дообучения модели Обычно agent skills пишут руками, генерируют один раз через LLM или правят хаотично после неудачных запусков. Проблема в том, что такие правки легко делают навык хуже: текст звучит убедительно, но агент начинает чаще ошибаться. SkillOpt предлагает относиться к skill-файлу как к обучаемому артефакту. Модель не трогают. Меняется только небольшой документ с инструкциями, привычками и процедурой выполнения задачи. Как это работает: агент решает задачи, система смотрит на успешные и провальные траектории, затем отдельная optimizer-модель предлагает точечные правки в skill-документ. Правка принимается только если новый вариант даёт прирост на отдельной validation-выборке. В итоге получается не новый чекпоинт и не набор хрупких промптов, а компактный readable-файл, который можно проверить, перенести в другой agent loop и использовать без дополнительных вызовов optimizer-модели. По статье, SkillOpt тестировали на 6 бенчмарках, 7 моделях и 3 режимах работы: direct chat, Codex и Claude Code. Он оказался лучшим или разделил первое место во всех 52 проверенных случаях. На GPT-5.5 средняя точность выросла на 23.5 пункта в direct chat, на 24.8 в Codex и на 19.1 в Claude Code. arxiv.org/abs/2605.23904

Один человек в киберполе не воин... А когда на кону безопасность компании — тем более. Открытый диалог StopPhish 2026 собрал
+8
Один человек в киберполе не воин... А когда на кону безопасность компании — тем более. Открытый диалог StopPhish 2026 собрал экспертов по кибербезопасности. Площадкой встречи стал МосХаб.Сколково — традиционная точка сборки ИТ-сообщества. Вместе с теми, кто отвечает за устойчивость сотрудников к киберугрозам, говорили о главном: как превратить человеческий фактор в надёжный щит. Участники разобрали изменения в Приказе №117 — документе, который регламентирует требования к обучению персонала в области кибербезопасности, сравнили подходы в банках и госсекторе, поделились кейсами компаний, уже выстроивших осознанную культуру безопасности. Чтобы её развивать, нужен живой обмен опытом, честные разборы ошибок и сообщество, где CISO, HR-директора и руководители цифровой трансформации говорят на одном языке. Именно такую среду для эффективной коммуникации мы создаём в нашем деловом пространстве. Подписывайтесь: Telegram | МАКС | ВКонтакте

✔️ Step 3.7 Flash: новая ставка на агентную эффективность StepFun выпустили Step 3.7 Flash - открытую MoE-модель под Apache 2
✔️ Step 3.7 Flash: новая ставка на агентную эффективность StepFun выпустили Step 3.7 Flash - открытую MoE-модель под Apache 2.0, заточенную не просто под чат, а под агентные сценарии: кодинг, поиск, работу с инструментами, документами, интерфейсами и изображениями. По заявленным бенчмаркам модель выглядит серьёзно: - #1 на ClawEval-1.1 - 67.1 - #1 на SimpleVQA Search - 79.2 - #2 на SWE-PRO - 56.3 - 95.3 на V* Python Что внутри: - 198B параметров всего - около 11B активных параметров - до 400 токенов в секунду - контекст 256K - 3 уровня reasoning - открытые веса под Apache 2.0 Главный акцент - не «самая большая модель», а модель, которая быстро и стабильно работает внутри агента. Она должна понимать UI, графики, документы и изображения, после чего писать код, вызывать инструменты и продолжать задачу без постоянного развала tool calls. Отдельно заявлена совместимость с Claude Code, KiloCode, Hermes Agent, OpenClaw и протоколами вроде MCP. Локальный запуск тоже в фокусе: Mac Studio M4 Max, DGX Spark, AMD AI Max+ 395. GitHub: http://github.com/stepfun-ai/Step-3.7-Flash HuggingFace: http://huggingface.co/stepfun-ai/Step-3.7-Flash GGUF: http://huggingface.co/stepfun-ai/Step-3.7-Flash-GGUF ModelScope: http://modelscope.cn/models/stepfun-ai/Step-3.7-Flash API: http://platform.stepfun.ai Blog: http://static.stepfun.com/blog/step-3.7-flash/

Anthropic уже почти триллионная компания По данным из раунда, Anthropic привлекла $65 млрд и получила оценку $965 млрд post-m
Anthropic уже почти триллионная компания По данным из раунда, Anthropic привлекла $65 млрд и получила оценку $965 млрд post-money. Для сравнения: всего три месяца назад компания якобы поднимала $30 млрд при оценке $380 млрд. То есть за один квартал оценка выросла больше чем в 2.5 раза. Главный драйвер - Claude. Run-rate revenue, по этим данным, уже превысил $47 млрд. В раунде участвовали Altimeter Capital, Dragoneer, Greenoaks, Sequoia Capital, Capital Group, Coatue, D1 Capital Partners и другие крупные фонды. Отдельно интересно, что в сделку зашли Samsung, SK Hynix и Micron как стратегические инфраструктурные партнёры. Это важная деталь: гонка ИИ всё больше упирается не только в модели, но и в память, GPU, дата-центры и долгосрочные поставки железа. Часть раунда - $15 млрд - связана с прежними обязательствами гиперскейлеров, включая инвестиции Amazon на $5 млрд. На фоне этого OpenAI выглядит уже не единственным «монстром рынка»: в марте компания привлекала $122 млрд при оценке $852 млрд post-money. Сигнал простой: инвесторы больше не ставят только на одного победителя. Anthropic превращается во второго гиганта уровня OpenAI, а рынок фронтирных моделей окончательно становится игрой, где нужны не только лучшие нейросети, но и доступ к капиталу, чипам, облакам и инфраструктуре. https://x.com/Machinelearrn/status/2060085502234214902

\

Repost from Machinelearning
Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила Claude Opus 4.8. Три конкретных изменения по с
Anthropic только что выпустила Claude Opus 4.8. Anthropic только что выпустила Claude Opus 4.8. Три конкретных изменения по сравнению с 4.7: точнее судит о ситуации, честнее говорит о собственных ограничениях и дольше держит контекст при самостоятельной работе без подсказок. По бенчмаркам: agentic coding (SWE-Bench Pro) 69.2% против 64.3% у 4.7 и 58.6% у GPT-5.5. Computer use (OSWorld) 83.4%. Knowledge work (GDPval-AA) 1890 против 1753 у предыдущей версии. В терминальном кодинге GPT-5.5 пока впереди с 78.2% против 74.6%, но разрыв небольшой. Цена не изменилась. В релизе упоминается апдейт про "более честную оценку собственного прогресса" — это прямо отвечает на одну из главных болей при работе с агентами: модель уверенно сообщает, что задача выполнена, хотя на самом деле застряла. Посмотрим, насколько это реально изменилось на практике. claude.com/blog/introducing-dynamic-workflows-in-claude-code

Claude Sonnet 4.8, похоже, уже на подходе. - Высокая вероятность, что Sonnet 4.8 выйдет сегодня - после нескольких месяцев ож
Claude Sonnet 4.8, похоже, уже на подходе. - Высокая вероятность, что Sonnet 4.8 выйдет сегодня - после нескольких месяцев ожидания с момента, когда модель впервые засветилась в утечке исходников Claude Code. - Sonnet 4.6 уже в основном отошёл на второй план: большую часть реальных задач по коду и reasoning сейчас забрали Opus 4.7 и GPT-5.5. - Sonnet 4.8, судя по всему, позиционируют как новую рабочую лошадку - особенно для повседневного кодинга и агентных сценариев. - Утечки уже указывали на более сильный coding, заметно лучшее следование инструкциям, улучшенные vision-возможности и более чистые completion с первого прохода. - Текущие сигналы в основном указывают только на Sonnet 4.8. Шансов на запуск Opus 4.8 сегодня почти нет. - Возможно, сегодня ещё будет что-то со стороны Codex. https://x.com/Machinelearrn/status/2060035106371252254

✔️ Apple пересобрала Siri с нуля и всё равно пришла к чужим моделям Bloomberg пишет, что в iOS 27 Siri ждёт крупнейший редиза
+3
✔️ Apple пересобрала Siri с нуля и всё равно пришла к чужим моделям Bloomberg пишет, что в iOS 27 Siri ждёт крупнейший редизайн за всю историю. Два года задержек, новая архитектура, новый интерфейс, много обещаний. Новая Siri, по данным Bloomberg, будет работать на Google Gemini. А в интерфейсе появится выбор модели - можно будет переключиться на ChatGPT или Claude. То есть Apple долго пыталась сделать Siri заново, а в итоге пришла к максимально прагматичному решению: пусть пользователь сам выбирает, чей интеллект подключить. Что ещё готовят: - AI-поиск по вебу в стиле Perplexity - создание Shortcuts обычным языком - AI-редактирование фотографий Даже Apple больше не делает вид, что голосовой ассистент должен быть полностью своим. Побеждает не закрытая Siri, а интерфейс, который умеет подключать лучшие модели. https://www.bloomberg.com/news/features/2026-05-28/apple-ios-27-photos-screenshots-revamped-siri-pro-camera-app-new-ai-features

10 GitHub-репозиториев, которые заставят вас навсегда забыть о платном ПО Полностью бесплатно. 1.LocalSend / http://github.com/localsend/localsend Передача файлов между платформами. Передача файлов между Windows, Mac, Linux, Android, iOS — без регистрации и облака 2.yt-dlp / http://github.com/yt-dlp/yt-dlp Скачивание видео и аудио с любого сайта. YouTube, Bilibili, Twitter — всё покрыто, мощнее любого платного загрузчика 3.Stirling-PDF / http://github.com/Stirling-Tools/Stirling-PDF Свой универсальный инструмент для PDF. Объединение, разделение, сжатие, конвертация в Word, добавление водяных знаков, OCR — замена всему семейству Adobe 4.FreeTube / http://github.com/FreeTubeApp/FreeTube Десктопный плеер для YouTube. Без рекламы, без слежки, без аккаунта Google — что вы смотрите, знает только вы 5.Syncthing / http://github.com/syncthing/syncthing Альтернатива Baidu Netdisk и iCloud. Прямая синхронизация файлов между устройствами, сквозное шифрование, данные не проходят через серверы третьих лиц 6.Vaultwarden / http://github.com/dani-garcia/vaultwarden Свой менеджер паролей. Бесплатная замена 1Password и LastPass навсегда, данные хранятся только на вашем устройстве 7.Immich / http://github.com/immich-app/immich Свой Google Фото. Автоматическое резервное копирование фото с телефона, распознавание лиц, поиск по ИИ — больше не платите аренду за хранилище ежемесячно 8.AdGuard Home / http://github.com/AdguardTeam/AdGuardHome Блокировка рекламы по всей сети. Блокировка на уровне роутера — все устройства в доме, включая смарт-телевизоры, без рекламы 9.Jellyfin / http://github.com/jellyfin/jellyfin Свой Netflix. Свои фильмы, сериалы и музыка — транслируйте сколько угодно, без ежемесячных платежей платформам 10.Uptime Kuma / http://github.com/louislam/uptime-kuma Своя панель мониторинга. Следит за вашими сайтами и сервисами, мгновенно уведомляет о сбоях — замена платному мониторингу за $50 в месяц.

Устал инициализировать претрейны весами Qwen? Приходи к нам — мы честно учим с нуля! 😉 Ищем Senior/Senior+ AI Engineer и про
Устал инициализировать претрейны весами Qwen? Приходи к нам — мы честно учим с нуля! 😉 Ищем Senior/Senior+ AI Engineer и продактов в RnD-команду: как отдельных специалистов, так и целые команды, — которые готовы разрабатывать прорывные AI-решения. Познакомиться ближе с нашими направлениями и оставить отклик можно на сайте. А если хотите следить за тем, как команда RnD ML Сбера исследует и разрабатывает AI-технологии, — подписывайтесь на Telegram-канал команды. Там делятся исследованиями, экспериментами и инсайтами из мира AI, а также свежими вакансиями 🚀

OpenAI заплатит 250 миллионов на спасение тех, чьи работы заберёт ИИ Контролирующий некоммерческий орган OpenAI, у которого 2
OpenAI заплатит 250 миллионов на спасение тех, чьи работы заберёт ИИ Контролирующий некоммерческий орган OpenAI, у которого 26% доли в коммерческой части компании (при оценке OpenAI в 1 триллион это около 260 миллиардов), объявил о выделении 250 миллионов долларов на изучение и смягчение последствий от внедрения ИИ-систем, которые умеют заменять людей в оплачиваемых задачах. Документ называется «Economic Futures in the Age of AI», авторы Divya Siddarth и Wojciech Zaremba. По сути, OpenAI признаёт, что её же продукты бьют по рынку труда, и пытается заранее подложить соломку. Деньги пойдут по трём направлениям. Первое: независимые исследования и метрики реального экономического эффекта от ИИ. Никаких внутренних отчётов с красивыми графиками, обещают именно внешнюю экспертизу. Второе: поддержка работников и сообществ, которые уже сейчас попадают под удар автоматизации. Сюда входит переобучение, помощь при смене профессии и страховые механизмы. Третье: поиск долгосрочных моделей того, как делиться экономической выгодой от ИИ с обществом. То самое распределение богатства, про которое Альтман любит рассуждать в подкастах. Интересный момент: 250 миллионов для OpenAI Foundation это копейки на фоне её собственной капитализации. Фактически компания страхует свою репутацию и одновременно собирает данные о том, кого именно её модели вытесняют с рынка. Грантовые программы и партнёрства по этим трём направлениям, скорее всего, будут открыты внешним исследователям и НКО.

580 токенов в секунду на Qwen3.5 - новый рекорд для агентских задач на GPU NVIDIA. PyTorch Foundation опубликовали разбор опт
+4
580 токенов в секунду на Qwen3.5 - новый рекорд для агентских задач на GPU NVIDIA. PyTorch Foundation опубликовали разбор оптимизации Qwen3.5 в движке инференса TokenSpeed. Цифра скорости света - 580 tps на агентских ворклоадах. Под капотом: дизайн, реализация и тюнинг моделей в TokenSpeed, плюс FlashAttention-4 от Tri Dao. Над релизом работали инференс-команда Alibaba Qwen, TokenSpeed от Lightseek Foundation, NVIDIA и Mooncake. Кому интересно, как именно выжали такую пропускную способность - блог по ссылке.

Вайбкодер 2026
Вайбкодер 2026