ru
Feedback
Machinelearning

Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 296 342 подписчиков, занимая 329 место в категории Технологии и приложения и 1 272 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 296 342 подписчиков.

Согласно последним данным от 20 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 181, а за последние 24 часа — -161, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 8.10%. В первые 24 часа после публикации контент обычно набирает 5.73% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 24 014 просмотров. В течение первых суток публикация набирает 16 967 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 187.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Благодаря высокой частоте обновлений (последние данные получены 21 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

296 342
Подписчики
-16124 часа
-1 4287 дней
-6 18130 день
Архив постов
Хотите разбираться в Big Data так, как это делают специалисты Яндекса? Тогда присоединяйтесь к бесплатному интенсиву ШАДа Big
Хотите разбираться в Big Data так, как это делают специалисты Яндекса? Тогда присоединяйтесь к бесплатному интенсиву ШАДа Big DWH Week! Вас ждёт 8 онлайн-занятий, на которых вы познакомитесь с YTsaurus — платформой для распределённого хранения и обработки данных. Вы разберётесь в её архитектуре и масштабировании, а также научитесь настраивать систему под свои задачи. Интенсив открытый, поэтому зарегистрироваться может каждый. Однако интереснее всего программа будет тем, кто уже работает с данными: опытным бэкенд-разработчикам и разработчикам баз данных, инженерам и аналитикам данных, а также студентам технических направлений. Регистрируйтесь до 25 апреля и прокачивайтесь в Big Data вместе с экспертами Яндекса и ШАДа! Все подробности — по ссылке.

✔️ Учёные Яндекса, НИУ ВШЭ,MIT, ISTA и KAUST разработали новый метод сжатия LLM без использования данных Недавно был представ
+3
✔️ Учёные Яндекса, НИУ ВШЭ,MIT, ISTA и KAUST разработали новый метод сжатия LLM без использования данных Недавно был представлен HIGGS (Hadamard Incoherence with Gaussian MSE-optimal GridS) — data-free метод квантизации, который позволяет запускать большие языковые модели локально, за минуты, без GPU. 🔥 Особенности: 🟢Работает без обучающих данных (data-free) 🟢Квантизует даже модели масштаба DeepSeek R1 (671B) и Llama 4 Maverick (400B) 🟢Полностью open-source 📈 Результаты: 🟠Лучшее соотношение качество / размер среди всех data-free методов (NF4, HQQ и др.) 🟠Проверено на Llama 3, Qwen2.5 🟠Статья принята на NAACL 2025 Применение: ▶️Прототипирование без серверов и долгих калибровок ▶️Демократизация доступа к LLM ▶️Подходит для стартапов, исследователей, независимых лабораторий, образовательных и ограниченных сред 🛠 Установка: pip install flute-kernel 🌟 Пример:
python 
from transformers import AutoModelForCausalLM, AutoTokenizer, HiggsConfig

model = AutoModelForCausalLM.from_pretrained(
    "google/gemma-2-9b-it",
    quantization_config=HiggsConfig(bits=4),
    device_map="auto",
)
🟡Paper 🟡Hugging Face 🟡GitHub @ai_machinelearning_big_data #quantization #LLM #opensource #HIGGS #ai

✔️ Google Veo-2 стал доступен в AI Studio бесплатным пользователям Можно создавать 5, 6, 7 и 8 секундные видеоролики. Генерация 6-секундного заняла примерно 45 секунд. Примечание: доступ пока открыт появился не у всех (у меня появился на бесплатном акке), ждем анонса от Google https://aistudio.google.com/ @ai_machinelearning_big_data #video #veo2

✔️ Google представила новые геопространственные модели для анализа данных. Google анонсировала запуск тестовой программы новы
+3
✔️ Google представила новые геопространственные модели для анализа данных. Google анонсировала запуск тестовой программы новых геопространственных и Population Dynamics моделей. Эти инструменты объединяют генеративный ИИ (под капотом - Gemini), с данными спутниковых снимков и социальными индексами, чтобы ускорить анализ в сферах урбанистики, экологии и кризисного управления. Модели позволяют находить объекты по описанию («дороги с заторами»), сегментировать ландшафты и предсказывать динамику населения. Интеграция с Google Cloud и Earth Engine дает разработчикам возможность для создания собственных решений — от медиапланирования до мониторинга сельхозугодий. Первыми тестерами стали Airbus, Maxar и Planet Labs: они используют модели для анализа спутниковых данных в реальном времени. Сейчас доступ к моделям открыт через программу Trusted Tester, а детали Google обещает раскрыть в ближайшие месяцы. 🔗 research.google @ai_machinelearning_big_data #google #geospatialreasoning

🔥 Приглашаем принять участие в Летней школе машинного обучения от ведущих мировых ученых SMILES-2025. Главная тема SMILES-20
🔥 Приглашаем принять участие в Летней школе машинного обучения от ведущих мировых ученых SMILES-2025. Главная тема SMILES-2025, которая пройдёт в Харбинском технологическом институте (HIT) 14-27 июля, — генеративные методы в ИИ. В фокусе программы: большие языковые модели, мультиагентные системы, безопасный ИИ, генеративные подходы в компьютерном зрении. Подать заявку на участие могут студенты, аспиранты и молодые AI исследователи. Соорганизатор летней школы — HIT, генеральный партнер — Альфа-Банк, научный партнер — Институт AIRI. 👉 Участие бесплатное на основе конкурсного отбора. Подробности и подача заявки. Реклама. СКОЛКОВСКИЙ ИНСТИТУТ НАУКИ И ТЕХНОЛОГИЙ, СКОЛТЕХ. ИНН 5032998454.

✔️ Forbes опубликовал список 2025 AI 50. Forbes выпустил ежегодный рейтинг AI 50, составленный в сотрудничестве с Sequoia и M
✔️ Forbes опубликовал список 2025 AI 50. Forbes выпустил ежегодный рейтинг AI 50, составленный в сотрудничестве с Sequoia и Meritech Capital, который показал смещение акцента среди ИИ-стартапов с разработки моделей на создание практических приложений. Новички списка:, Anysphere (Cursor) и Speak (обучение английскому и испанскому с аудиторией 10 млн пользователей). Лидеры прежние: OpenAI и Anthropic. Впервые в список попали xAI и проект Миры Мурати Thinking Maсhine. В этом году было подано 1860 заявок, а суммарное финансирование участников составило 142,45 млрд. долл. forbes.com ✔️ Google и Samsung показали прототипы устройств Android XR. На TED2025 в Ванкувере глава подразделения Android X продемонстрировал прототип умных очков от Google. Устройство получило функции перевода в реальном времени, распознавание изображений и интеграцию с Gemini. Параллельно Samsung представила свой X-rеality шлем с акцентом на многозадачность. Оба проекта развиваются в рамках Android XR, но детали их релиза и даты выхода остаются неизвестными. 9to5google.com ✔️ QodoAI внедрила RAG в код-ревью инструмент Qodo Merge. QodoAI выпустила обновление для своего инструмента проверки кода Qodo Merge, интегрировав технологию RAG. Это позволит разработчикам анализировать код в контексте всей базы проекта, ускоряя ревью и упрощая коммуникацию по правкам. RAG даёт ИИ доступ к полной истории и зависимостям кода - теперь система может автоматически предлагать исправления, ссылаясь на ранее написанные модули. bito.ai ✔️ Adobe анонсировала ИИ-агентов для Photoshop, Acrobat и Premiere Pro. Adobe анонсировала разработку ИИ-агентов для Photoshop и Premiere Pro, которые упростят рутинные задачи в редакторах. Например, ИИ может автоматически убрать людей с фона или настроить глубину резкости — пользователю достаточно кликнуть по подсказке. Для Premiere Pro агенты помогут создавать черновые монтажи, корректировать цвет и звук, опираясь на функцию Media Intelligence, которая распознаёт объекты в видео. При этом ИИ не заменяет креативность, а ускоряет работу: система обучаема, а пользователи смогут давать команды на естественном языке. Презентация технологии для Photoshop состоится 24 апреля на мероприятии Max в Лондоне. blog.adobe.com ✔️ Спам-бот при помощи ChatGPT атаковал 80 000 сайтов. SentinelLabs обнаружили, что спамеры используют модели OpenAI для массовой рассылки сообщений, обходящих стандартные фильтры. Бот AkiraBot генерировал уникальный контент через API ChatGPT (модель gpt-4o-mini), подставляя в шаблон название целевого сайта. Это делало каждое сообщение «персонализированным», усложняя его блокировку. Вместо шаблонных фраз AkiraBot создавал описания услуг под конкретный ресурс, имитируя ручную работу. По данным логов, с сентября 2024 по январь 2025 года бот успешно отправил сообщения на 80 000 доменов, тогда как 11 000 попыток завершились ошибкой. OpenAI подтвердила, что подобное использование ChatGPT нарушает её политику, и поблагодарила экспертов за информацию. arstechnica.com @ai_machinelearning_big_data #news #ai #ml

Записка на двери: ушёл на One Day Offer для NLP-специалистов — буду поздно и, возможно, с оффером мечты! 19 апреля Сбер приглашает амбициозных спецов стать частью команды стратегии и развития Сбера, чтобы создавать инновации. Хочешь сказать: «Да, я тот самый автор GigaChat/Llama/Falcon/AI-помощника»? Велком на One Day Offer!

🖥 Вдогонку OpenAI выпустили BrowseComp — новый бенчмарк, предназначенный для оценки способности AI-агентов находить сложную
🖥 Вдогонку OpenAI выпустили BrowseComp — новый бенчмарк, предназначенный для оценки способности AI-агентов находить сложную и труднодоступную информацию в интернете. Этот набор данных включает 1 266 задач, требующих от моделей глубокого понимания контекста и эффективного поиска информации. ​ Особенности: ▪ В отличие от существующих бенчмарков, таких как SimpleQA, BrowseComp фокусируется на вопросах, ответы на которые трудно найти и которые требуют анализа множества источников. ​ Например, “Найдите мне статью из EMNLP 2018–2023, где первый автор учился в бакалавриате в Dartmouth, а четвёртый — в UPenn”  → Ответ: Frequency Effects on Syntactic Rule Learning in Transformers ▪ Структура вопросов: Каждый вопрос имеет однозначный, короткий ответ, что облегчает оценку результатов и снижает вероятность неоднозначности. ​ OpenAI ▪ Примеры вопросов: Вопросы охватывают различные темы и требуют от модели способности устанавливать связи между разрозненными фактами. ​ OpenAI 💡 По аналогии с тем, как CodeForces навыки программирования, BrowseComp показывает, насколько модель способна ориентироваться в "диких" условиях в вебе. https://openai.com/index/browsecomp/ @ai_machinelearning_big_data #openai #benchmark

Начиная с сегодняшнего дня, память в ChatGPT стала еще мощнее — теперь она может учитывать все твои прошлые чаты, чтобы давать ещё более персонализированные ответы. • Помнит твои интересы и стиль общения • Подстраивается под твои цели: учёба, код, тексты, советы • Работает незаметно, но помогает как будто «знает тебя давно» Это новый уровень взаимодействия с ИИ — теперь он не просто отвечает, а действительно помогает тебе как личный ассистент. P.S. Память можно настраивать и полностью отключать — всё под контролем 👌

🌟 Google Cloud запускает ИИ-решения и суперкомпьютеры для науки. Ученые все чаще переходят на облачные технологии, чтобы реш
🌟 Google Cloud запускает ИИ-решения и суперкомпьютеры для науки. Ученые все чаще переходят на облачные технологии, чтобы решать сложнейшие задачи — от прогнозирования погоды до симуляции квантовых систем. Google Cloud сделала новый шаг им навстречу, представив супервычислительные решения, ИИ-модели и сервисы, которые помогут делать открытия быстрее: 🟢Основой для многих проектов станут новые виртуальные машины H4D — самые мощные CPU-решения Google Cloud. Они построены на CPU AMD и используют сетевую технологию Titanium для ускорения передачи данных. 🟢Чтобы упростить работу с кластерами, Google обновил Cluster Toolkit и Cluster Director: теперь развертывание крупных систем стало проще, а управление — эффективнее. 🟢Новая версия AlphaFold 3 High-Throughput Solution доступна для некоммерческого использования и умеет обрабатывать тысячи последовательностей, автоматически масштабируя ресурсы. 🟢WeatherNext предлагает быстрые и точные прогнозы погоды через платформу Vertex AI Model Garden. Ученые смогут тестировать больше сценариев, а компании — лучше готовиться к стихийным событиям. Google также добавил в Agentspace двух ИИ-агентов. Первый, Deep Research, за минуты анализирует горы данных и генерирует детальные отчёты. Второй, Idea Generation, помогает учёным быстро придумывать гипотезы для экспериментов. Оба инструмента уже доступны в тестовом режиме. Не забыли и о хранении данных: новая управляемая файловая система Lustre, созданная с DDN, справится с нагрузками даже самых требовательных проектов. А для тех, кто только начинает, Google Cloud предлагает гранты, обучение и доступ к сообществу Advanced Computing Community. Эти обновления — не просто апдейты. Они меняют правила игры, объединяя вычислительную мощь, ИИ и удобство облака. 🔜 Читать подробный анонс @ai_machinelearning_big_data #google

🌟 Kimi-VL: VLM с MoE, ризонингом и контекстом 128K. Moonshot AI опубликовала веса Kimi-VL — открытой VLM, которая объединяет
+3
🌟 Kimi-VL: VLM с MoE, ризонингом и контекстом 128K. Moonshot AI опубликовала веса Kimi-VL — открытой VLM, которая объединяет обработку текста, изображений и видео. Благодаря архитектуре MoE модель активирует всего 2.8 млрд. параметров в языковом декодере, обеспечивая скорость, сопоставимую с компактными аналогами, и результативность флагманских решений. Главное преимущество Kimi-VL — способность анализировать длинные контексты до 128 тыс. токенов, что делает её идеальной для работы с объемными документами, длинными видео или сложными мультимедийными задачами. Основу модели составляет визуальный энкодер MoonViT, оптимизированный для нативной обработки изображений любого разрешения без необходимости разбивать их на части. Это позволяет точно распознавать текст, графики или UI-интерфейсы даже в высокодетализированных скриншотах. Например, на бенчмарке InfoVQA модель показывает точность 83.2%, обходя даже GPT-4o. В задачах OCR Kimi-VL достигает 86.7% на OCRBench, что ставит её в ряд лучших в индустрии. Разработчики также представили Kimi-VL-Thinking — версию с расширенными возможностями CoT. Благодаря использованным RL и длительному CoT-тюнингу она демонстрирует впечатляющие результаты в математических и академических задачах: на MathVista точность составила 71.3%, а на MMMU — до 61.7%, что лучше, чем у Gemma-3-12B-IT. В тестах Kimi-VL превосходит конкурентов в работе с агентами: на OSWorld её результат 8.22% выше, чем у GPT-4o (5.03%), а на WindowsAgentArena — 10.4%. Для длинных видео модель набирает 64.5% на LongVideoBench, подтверждая способность анализировать часовые записи без потери ключевых деталей. Модели доступны на Hugging Face в двух вариантах: 🟢Kimi-VL-A3B-Instruct для стандартных задач; 🟠Kimi-VL-Thinking для сложных рассуждений. ▶️ Инференс через Transformers занимает несколько строк кода — достаточно загрузить изображение, задать запрос и получить подробный ответ. 📌Лицензирование: MIT License. 🟡Набор моделей 🟡Техотчет 🖥GitHub @ai_machinelearning_big_data #AI #ML #VLM #KimiAI #MoonShotAI

📌 SAE Match: новый метод в области интерпретируемости ИИ Предыдущие разработки в области интерпретируемости не позволяли пон
📌 SAE Match: новый метод в области интерпретируемости ИИ Предыдущие разработки в области интерпретируемости не позволяли понять, как большие языковые модели обрабатывают информацию на каждом этапе вычислений и как эволюционируют концепции от слоя к слою. Для решения этой проблемы ученые из T-Bank AI Research разработали метод, который позволяет выявить моменты, когда ИИ начинает предсказывать нежелательные или ошибочные ответы, и оперативно их исправить. Это, наверное, первый шаг на пути к более прозрачным, точным и понятным алгоритмам — особенно важно при внедрении ИИ в критически важные сферы, такие как медицина, финансы и безопасность. При этом дополнительные данные и переобучение модели не потребуются. В будущем метод может применяться в разработке гибридных структур ИИ в качестве фундамента для дальнейшего развития интерпретируемых моделей. Результаты работы будут представлены на одной из главных конференций в области машинного обучения и искусственного интеллекта уровня А* — международной конференции по обучению представлениям (ICRL), которая в этом году пройдет в Сингапуре с 24 по 28 апреля. 🔗Новость @ai_machinelearning_big_data #AI #ML #LLM #news

✔️ OpenAI запускает программу разработки специализированных тестов. OpenAI объявила о старте программы Pioneers Program, кото
✔️ OpenAI запускает программу разработки специализированных тестов. OpenAI объявила о старте программы Pioneers Program, которая займётся созданием «доменно-специфичных» бенчмарков для оценки ИИ-моделей. Как отметили в компании, текущие тесты часто не отражают реальных задач — например, фокусируются на решении сложных математических проблем, а не на практическом применении. В ближайшие месяцы OpenAI планирует сотрудничать со стартапами, которые помогут создать «эталоны качества» для своих сфер. Участники программы также получат доступ к методам тонкой настройки моделей через RL — это повысит эффективность ИИ в узких задачах. openai.com ✔️ Anthropic запускает подписку Claude Max за $200 в месяц. Anthropic добавила новый тарифный план Max для Claude. Подписка доступна в 2 вариантах: за $100 в месяц с лимитом в 5 раз выше базового и за $200 — с 20-кратным увеличением. Пользователи получат приоритетный доступ к свежим моделям, включая Claude 3.7 Sonnet. Параллельно компания развивает нишевые решения, например, Claude для образования, и пытается покрыть растущие затраты на разработку ИИ. Очевидно, гонка за монетизацию «тяжёлых» ИИ-моделей набирает обороты. techcrunch.com ✔️ WordPress.com запустил свой ИИ-конструктор сайтов. WordPress.com представил бета-версию ИИ-конструктора, который за минуты создаёт сайты с текстом, изображениями и макетом на основе запросов в чате. Пользователь описывает идею — например, «лендинг для ретро-магазина игр» — а ИИ генерирует контент, подбирает цвета и структуру. Готовый сайт можно дорабатывать вручную или через чат, но только для новых проектов — миграция существующих пока невозможна. Для интернет-магазинов или сложных интеграций инструмент пока не подходит — разработчики обещают добавить это позже. Чтобы начать, нужен аккаунт WordPress.com: бесплатный пробный период доступен без карты, но для публикации сайта придётся подключить хостинг от $18/месяц. wordpress.com ✔️ Genomic Tokenizer упрощает анализ ДНК. В мире геномных исследований появился инструмент, который меняет подход к обработке последовательностей ДНК. Genomic Tokenizer — токенизатор, созданный для анализа генетических данных с учётом биологических принципов. Вместо разбивки на отдельные нуклеотиды он работает с кодонами — трехбуквенными последовательностями, которыми кодируют аминокислоты. Такой подход близок к центральной догме молекулярной биологии и учитывает старт-стоп сигналы, а также синонимичные кодоны. Интеграция Genomic Tokenizer в экосистему HuggingFace Transformer позволяет обрабатывать даже сдвиги рамок считывания из-за мутаций. Например, при добавлении или удалении нуклеотидов токенизатор сохраняет биологический смысл вариаций, не теряя важных деталей. Все возможные кодоны включены в его словарь, а синонимичные получают одинаковые ID — это ускоряет анализ и снижает нагрузку на модели. biorxiv.org ✔️ Samsung представит домашнего робота Ballie с Gemini этим летом. Samsung объявила о старте продаж робота Ballie в США и Южной Корее уже этим летом. В партнёрстве с Google Cloud устройство получит интеграцию с Gemini, которая дополнит собственные разработки Samsung. Ballie умеет обрабатывать голосовые команды, аудио и визуальные данные благодаря мультимодальным алгоритмам. Робот не только управляет умным домом, но и даёт советы по здоровью или стилю. Цену Ballie Samsung пока не называет, ссылаясь на неопределённость из-за новых таможенных тарифов. Робота впервые показали ещё в 2020-м, а текущая версия с проектором дебютировала на CES 2024. engadget.com @ai_machinelearning_big_data #news #ai #ml

🖥 Google не шутку разошлись сегодня! Они выкатили Firebase Studio - новую облачную агенсткую среду разработки, в которой есть весь инструментарий для быстрого создания полнофункциональных приложений с искусственным интеллектом, и все это в одном месте. Поддержка можете создавать приложения на естественном языке, тестить их и развертывать в одном месте 🔥 По сути, это бесплатная альтернатива Cursor, Bolt или v0, прямо в браузере. Начните создавать прямо сейчас → https://goo.gle/4cvcUzY @ai_machinelearning_big_data #GoogleCloudNext #FirebaseStudio

🌟 UNO — новый подход к генерации изображений по нескольким референсам от Bytedance UNO — новая мощная subject-to-image модель, которая умеет генерировать изображения по одному или нескольким референсам, сохраняя стиль, черты и контекст между ними. 🔁 Главная особенность модели максимальная согласованность при генерации по нескольким референсам или персонажам. Хотя генерация изображений по конкретному референсу - не новая задача и уже выпущено не мало моделей, у неё остаются две ключевые проблемы: 1️⃣ Масштабируемость данных — перейти от датасетов с одним объектом к мульти-субъектным очень сложно 2️⃣ Ограниченность на одного персонажа — большинство моделей работают только с одним объектом, и «ломаются» при попытке сгенерировать несколько Модель решает одну из ключевых проблем генерации — разрыв в стилистике и контексте между изображениями. 🔁 In-context diffusion + UNO-архитектура: Используется встроенное понимание контекста и универсальное позиционное кодирование (URPE) для точной синхронизации между субъектами. 🎯 Одна модель для всего: UNO объединяет генерацию по одному или нескольким htathtycfvb в единой системе. – Для одного субъекта: референс = 512px по длинной стороне – Для нескольких — 320px – Работает даже с нестандартными разрешениями: 512, 568, 704 и выше 🔥 Высокая согласованность: Модель отлично справляется с генерацией персонажей и объектов, сохраняя ключевые особенности сцены — без разрыва между кадрами. ✔️ Проект выложен в open-source: – Код под Apache 2.0 – Модели под CC BY-NC 4.0 – Поддерживается только некоммерческое использование 🟡 GitHub: https://github.com/bytedance/UNO 🟡Demo: https://huggingface.co/spaces/bytedance-research/UNO-FLUX 🟡 Paper: https://arxiv.org/abs/2504.02160 🟡HF: https://huggingface.co/bytedance-research/UNO #ByteDance #opensource

🖥 Google анонсировала Ironwood TPU — специализированный чип, созданный для ускоренного инференса ИИ-моделей. 10× прирост про
+3
🖥 Google анонсировала Ironwood TPU — специализированный чип, созданный для ускоренного инференса ИИ-моделей. 10× прирост производительности по сравнению с предыдущим поколением. 🔧 Что важно знать: ⚡️ Ironwood TPU = высокая плотность + эффективность: на 67% больше FLOPS/ватт, чем v5p. 4 614 TFLOPS на чип (FP8) и 192 ГБ HBM. Производительность чипов растёт, а энергоэффективность выходит на новый уровень. 🌐 Интеграция с Google Cloud: Ironwood TPUs уже работают в дата-центрах с жидкостным охлаждением, интегрированы в Vertex AI и масштабируются по запросу. 📈 Под капотом — высокоскоростная сеть с пропускной способностью 3.5 Тбит/с, обеспечивающая быструю связность для масштабных моделей. ⚡️ Впервые: поддержка vLLM на TPU Теперь можно без боли запускать PyTorch + GPU-оптимизированные модели прямо на TPU — просто, эффективно и дешево. @ai_machinelearning_big_data #google #TPU

Уровень развития искусственного интеллекта в бизнесе растет: ожидается, что к 2026 году уже более 80% компаний будут использо
Уровень развития искусственного интеллекта в бизнесе растет: ожидается, что к 2026 году уже более 80% компаний будут использовать API, генеративные модели и AI-приложения. Несмотря на это, скорости внедрения AI по-прежнему заметно ограничены. Всему виной нехватка квалифицированных специалистов и отсутствие понимания, как встроить технологии в структуру бизнеса так, чтобы получить реальные преимущества. ⚡️ СберУниверситет создал программу «Бизнес с AI: от теории к практике» для владельцев и менеджеров продуктов, а также технических специалистов продуктов. По итогам программы вы: 🎉 Разработаете проект внедрения AI‑продукта или сервиса в свой бизнес; 🎉 Приобретете навыки планирования, реализации и оценки проектов с использованием AI; 🎉 Узнаете все о процессах разработки и внедрения AI‑продукта, формировании команды и бюджетировании. 🔝 Преподаватели — эксперты-практики Сбера и других ведущих компаний. Старт: 17 мая Если вы хотите оптимизировать процессы и повысить экономическую эффективность своей компании с помощью AI ➡️ переходите на сайт и оставьте заявку.

🌟 Deep Cogito представила серию языковых моделей с открытым исходным кодом. Deep Cogito выпустила семейство языковых моделей
+1
🌟 Deep Cogito представила серию языковых моделей с открытым исходным кодом. Deep Cogito выпустила семейство языковых моделей размером 3B, 8B, 14B, 32B и 70B параметров, которые уже доступны для загрузки. По заявлению разработчиков, их модели превосходят аналогичные открытые решения от LLaMA, DeepSeek и Qwen в большинстве стандартных бенчмарков. Например, 70B-версия обходит новую 109B MoE-модель Llama 4, несмотря на меньший размер. Все модели обучены с помощью метода Iterated Distillation and Amplification (IDA) — стратегии, которая сочетает итеративное самоулучшение и «сжатие» интеллекта для преодоления ограничений, накладываемых человеческим контролем. Суть IDA проста: сначала модель «усиливает» свои способности, тратя больше вычислительных ресурсов на поиск решений через CoT, а затем «дистиллирует» эти улучшения в свои параметры. Такой цикл повторяется, создавая петлю обратной связи — каждая итерация делает модель умнее, а её мышление эффективнее. По словам команды, этот подход не только масштабируем, но и быстрее, чем RLHF. Семейство поддерживает 2 режима работы: стандартный (прямой ответ) и «рефлексивный», где система сначала обдумывает запрос, как это реализовано в Claude 3.7. Они оптимизированы для программирования, вызова функций и агентских сценариев, но без акцента на CoT — разработчики считают, что короткие шаги эффективнее в реальных задачах. Уже в ближайшие месяцы ожидаются версии на 109B, 400B и 671B параметров и вариации с MoE-архитектурой. Модели доступны на Hugging Face, Ollama и через API Fireworks AI/Together AI. @ai_machinelearning_big_data

✔️ Amazon Nova Sonic: голосовая модель с точностью выше, чем у GPT-4o. Amazon запустил Nova Sonic — голосовую модель, которая
✔️ Amazon Nova Sonic: голосовая модель с точностью выше, чем у GPT-4o. Amazon запустил Nova Sonic — голосовую модель, которая уже работает в обновлённом ассистенте Alexa+. Модель на 80% дешевле GPT-4o от OpenAI, при этом точнее распознаёт речь: уровень ошибок — 4,2%, что на 46,7% лучше GPT-4o-transcribe. Модель доступна через платформу, Bedrock с помощью нового двунаправленного потокового API. По словам вице-президента Amazon Рохита Прасада, модель отлично справляется с маршрутизацией пользовательских запросов к различным API, что позволяет ей получать информацию в режиме реального времени, анализировать собственные данные или выполнять действия во внешних приложениях. aboutamazon.com ✔️ Anthropic расширяет присутствие в Европе. Anthropic объявила о планах по расширению своей деятельности в Европе, создав более 100 новых рабочих мест. Компания назначила Гийома Принсена, бывшего руководителя Stripe и генерального директора Mooncard, главой подразделения в Европе, на Ближнем Востоке и в Африке (EMEA). Вакансии будут открыты в Дублине и Лондоне по направлениям: продажи, проектирование, исследования и бизнес-операции. tech.eu ✔️ Shopify будет проверять перед наймом новых сотрудников, не сможет ли ИИ выполнять эту работу. Тоби Лютке, глава Shopify, заявил сотрудникам: перед запросом новых кадров или ресурсов команды должны обосновать, почему задачу нельзя решить с помощью ИИ. В меморандуме, опубликованном в X, Лютке призвал переосмыслить рабочие процессы через призму автономных ИИ-агентов: «Это открывает интересные возможности для оптимизации». По его словам, активное использование ИИ стало «базовым требованием» для всех в компании. Эффективная работа с алгоритмами — навык, который сотрудники обязаны развивать, экспериментируя и анализируя результаты. Вопросы об интеграции ИИ теперь включат в систему оценки эффективности. cnbc.com ✔️ IBM анонсировала мейнфрейм z17 на процессорах Telum II. IBM официально представила новое поколение мейнфреймов z17, оснащённых процессорами Telum II. Восьмиядерные чипы с частотой 5.5 ГГц получили виртуальный кэш L3 на 360 МБ и L4 на 2.88 ГБ, а также новый блок обработки данных для ускорения ИИ-задач. По заявлениям IBM, система справляется с 24 трлн операций в секунду и на 50% быстрее предшественника z16, выпущенного три года назад. z17 оптимизирован под задачи искусственного интеллекта: обновленные I/O-модули и кэширование должны сократить задержки в сложных вычислениях. Мейнфрейм поддерживает z/OS, а из Linux-дистрибутивов — RHEL, Ubuntu и SUSE. Ожидается, что z17 поступят в продажу летом. ibm.com ✔️ Вышел DeepCoder 14B Preview — новая кодовая модель, лидирующая в своём классе (14B) и конкурирующая с o3-mini и o1 (на low-настройках). Создан на базе — DeepSeek R1 Distill 14B + RL на 24k задач, что сильно прокачало навыки кодинга и неожиданно улучшило математику. Главное: опубликованы веса, код и датасет. Можно запускать локально! Github ✔️ AlphaXiv выпустили бесплатного агента Deep Research В инструмент добавили Deep Research — ИИ, который за минуту делает обзор по любой научной теме: - находит ключевые статьи - показывает тренды - кратко объясняет каждую работу Можно вести диалог, уточнять детали и копать глубже. И всё это — бесплатно. alphaxiv.org ✔️ Deep Research теперь работает в Gemini 2.5 Pro Google прокачали Deep Research в: - Поиске и синтезе информации - Генерации глубоких и наглядных отчётов - Аналитическом мышлении и рассуждении Пользователи Gemini Advanced уже могут использовать новый Deep Research в браузере, на Android и iOS Попробовать @ai_machinelearning_big_data #news #ai #ml

You can't read the label from inside the jar — нельзя прочитать этикетку изнутри банки. Также, как порой нельзя решить сложны
You can't read the label from inside the jar — нельзя прочитать этикетку изнутри банки. Также, как порой нельзя решить сложные рабочие ситуации, не увидев их со стороны. Чтобы показать вам работу руководителя с новой перспективы, Стратоплан проведет бесплатную серию воркшопов «Основы управления». 5 дней, 5 ключевых аспектов работы руководителя, 5 спикеров Каждая из тем – это двухчасовой deep dive с конкретными ситуациями и кейсами, на актуальные для менеджеров темы: – первые шаги после назначения; ожидания и задачи – найм и как это делать правильно – как создать команду – как ставить и контролировать задачи – лидерство Когда? С 14 по 18 апреля, с 17:00 до 19:00 (GMT+3) Бесплатная регистрация В числе спикеров: Виталий Шароватов, Ярослав Астафьев, Дмитрий Болдырев и тренеры Стратоплана На выходе (даем зуб) у вас будут конкретные 5 инструментов по каждой из тем и пища для размышлений WARNING! Мозг растянутый знаниями в прежнее состояние не возвращается :)