Machinelearning

Kanalga Telegram’da o‘tish

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya1 261 Texnologiyalar & Aralashmalar324...

📈 Telegram kanali Machinelearning analitikasi

Machinelearning (@ai_machinelearning_big_data) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 297 383 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 324-o'rinni va Rossiya mintaqasida 1 261-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 297 383 obunachiga ega bo‘ldi.

14 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -6 744 ga, so‘nggi 24 soatda esa -170 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 8.03% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.69% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 23 912 marta ko‘riladi; birinchi sutkada odatda 16 939 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 186 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent openai, claude, api, gemini, контекст kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 15 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

297 383

Obunachilar

-17024 soatlar

-1 4767 kunlar

-6 74430 kunlar

23 912

Post ko'rishlar

~ 16 93924 soatlar

~ 18 95348 soatlar

8.03%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Postlar arxiv

297 364

✔️ DeepSeek планирует создать собственного кодинг-агента Китайская компания приступила к разработке инструмента, который будет конкурировать с Claude Code от Anthropic, Codex от OpenAI и редактором Cursor. Об этом сообщил в объявлении о найме сотрудник компании Дели Чэн в соцсети X. Согласно вакансиям, в Пекине формируется новая команда под названием Harness, которая займётся разработкой продукта с рабочим названием DeepSeek Code. DeepSeek ищет менеджера продукта и R&D инженера. От обоих кандидатов требуется опыт работы с Claude Code, Cursor, Codex или GitHub Copilot. Менеджер продукта возьмёт на себя дорожную карту, анализ обратной связи и развитие сообщества пользователей. В числе обязательных компетенций: понимание агентных циклов, протокола MCP, многоагентных систем и инженерии контекста, а также практический опыт вайб-кодинга. @ai_machinelearning_big_data #news #ai #ml

297 364

Почему в ML смена прикладной области не означает смену профессии Когда ML-инженер приходит в новый проект, он может переживать, что потеряет накопленную экспертизу из-за другого контекста задач. Однако опыт выпускницы ШАДа Даримы Мылзеновой показывает, что этот страх не оправдан: она успела поработать в медицине, нефтянке, сфере синтеза речи и финтехе, сохранив единый рабочий инструментарий. Выбрали главное из ее недавнего интервью для 8бит. 🟡У задач из разных проектов одинаковые методы решения В ML меняется только физический смысл данных, поэтому наработанный инструментарий можно последовательно переносить в разные сферы, в которых заинтересован инженер. 🟡Байесовская гибкость как рабочая установка В начале карьеры Дариме казалось, что модели почти всемогущие. Потом пришло осознание, что все зависит от объема и разнообразия данных. Затем появились LLM — и то, что вчера было невозможным, вдруг заработало. Поэтому Дарима руководствуется принципом «байесовской гибкости»: у нее есть априорное представление о границах ML, а новые наблюдения его корректируют. 🟡Главный урок от работы в стартапе — не технический Стартап становится отличной проверкой сил: задачи здесь меняются быстро, и нужно уметь мгновенно включаться в незнакомый контекст. В такие моменты выручает подход, сформированный Даримой в ШАДе, — «все можно понять, если сесть и разобраться». Однако без устойчивой бизнес-модели проекта работать тяжело даже профессионалу. Неопределенность быстро ведет к выгоранию, поэтому Дарима сделала выбор в пользу корпоративной среды. 📌 Полное интервью @ai_machinelearning_big_data #ML #Interview #ШАД #Career

297 364

✔️ OpenAI и Google DeepMind объединили C2PA и SynthID для маркировки ИИ-контента Компании совместно внедрили технологию водяных знаков SynthID в изображения, создаваемые через ChatGPT, Codex и корпоративные API. Решение дополняет криптографические подписи стандарта C2PA, которые теряются при конвертации форматов или сохранении скриншотов. SynthID встраивает невидимые маркеры на уровне пикселей и метка сохраняется после обработки и сжатия графики. Для проверки контента OpenAI запустила превью веб-инструмента. Система анализирует загруженные файлы на наличие метаданных C2PA и скрытых маркеров SynthID, определяя генеративное происхождение изображения. openai.com ✔️ Anthropic научила Claude обращаться к виртуальной "совести" Anthropic добавила механизм проверки этических ограничений в процессе генерации ответа Claude. Обновление разработано после консультаций с философами и теологами для доработки базовой конституции модели и снижения склонности к сикофантии. Инструмент реализован как внешняя функция - модель вызывает ее во время формирования ответа, чтобы получить напоминание о заданных ограничениях. На внутренних тестах Claude начал самостоятельно обращаться к инструменту перед выполнением потенциально опасных команд, фиксируя конфликт интересов. Интеграция дополнительного шага в цикл вывода снизила количество некорректных действий LLM. anthropic.com ✔️ Stability AI выпустила семейство аудиомоделей Stable Audio 3.0 Третье поколение моделей для генерации аудио построено на базе архитектуры с семантико-акустическим автоэнкодером и состоит из 4 вариаций. Small SFX, Small и Medium) опубликованы на Hugging Face. Флагманская Large (2,7 млрд параметров) доступна только через API и по корпоративной лицензии. Модель Medium (1,4 млрд параметров) генерирует трек длиной более 6 минут за 1,31 секунды на GPU H200. Версии Small (459 млн параметров) оптимизированы для локального запуска на смартфонах и ПК. Помимо генерации доступны инпэйнт отдельных фрагментов, бесшовное продление треков и файн-тюнинг с помощью LoRA. Модели обучались на лицензионных данных, коммерческое использование создаваемого аудио легально в рамках лицензии. stability.ai ✔️ Alibaba добавила анализ видео в систему синхронного перевода Qwen3.5-LiveTranslate Китайский техногигант представил мультимодальную модель синхронного перевода Qwen3.5-LiveTranslate на базе архитектуры Qwen3.5-Omni. Система понимает текст на 60 языках и генерирует речь на 29. Модель учитывает визуальный контекст видеоряда в реальном времени для разрешения семантических неоднозначностей в речи. Встроено клонирование голоса: нейросеть генерирует перевод с сохранением тембра и интонации оригинального спикера. Для обработки аудио с сильным акцентом или фоновым шумом добавлен механизм ключевых слов, который позволяет передавать в поток перевода жестко заданные специфические термины, имена и названия брендов. Демоверсия доступна на платформе Qwen Omni. Релиз API в облаке Alibaba Cloud ожидается в ближайшее время. qwen.ai ✔️ Китай неожиданно запретил ввоз видеокарт NVIDIA RTX 5090 D v2 Таможня КНР прекратила выдачу разрешений на импорт видеокарт NVIDIA RTX 5090 D v2. Легальные поставки и продажи устройств остановлены. NVIDIA разработала эту модель специально для китайского рынка, чтобы вписаться в экспортные ограничения США. Ради соответствия требованиям компания урезала VRAM графического ускорителя с 32 до 24 ГБ. Поскольку карта создавалась исключительно для Китая, официальный сбыт закрыт. Ожидается, что уже произведенные партии попадут на черный рынок или будут модифицированы местными ИИ-компаниями под свои задачи. Самым мощным решением NVIDIA, доступным китайским пользователям, остается RTX 5080, а локальные чипы пока уступают флагманам американской компании в производительности. hkepc.com @ai_machinelearning_big_data #news #ai #ml

297 364

ИИ от OpenAI опроверг гипотезу Эрдёша, которой почти 80 лет OpenAI показала редкий для ИИ результат: внутренняя модель самостоятельно нашла контрпример к известной задаче из дискретной геометрии, которую Пал Эрдёш сформулировал ещё в 1946 году. Суть задачи простая: есть n точек на плоскости. Нужно понять, сколько пар точек могут находиться ровно на расстоянии 1 друг от друга. Долгое время считалось, что почти оптимальный ответ дают конструкции, похожие на квадратную решётку. Модель OpenAI показала, что это неверно. Она построила бесконечное семейство конфигураций, где таких пар получается заметно больше, чем ожидалось. То есть была опровергнута не мелкая техническая деталь, а известная гипотеза, вокруг которой десятилетиями строились оценки. Модель связала задачу о точках на плоскости с алгебраической теорией чисел. В доказательстве используются решётки Минковского (способ превратить числа из алгебраической теории чисел в точки в обычном евклидовом пространстве), элементы нормы один и pro-3 башни числовых полей. Это инструменты из другой части математики, и именно их перенос в геометрию дал результат. Нога Алон из Принстона отметил, что ответ оказался неожиданным, а применённые методы выглядят элегантно и нетривиально. При этом доказательство не даёт нового «чисто геометрического» метода, на который многие надеялись. Гипотеза опровергнута, но сама структура задачи стала ещё интереснее. Задачу сформулировал ИИ, решение сгенерировала внутренняя модель OpenAI, первичная проверка тоже прошла через автоматический ИИ-пайплайн. После этого люди проверили детали, улучшили изложение и довели работу до публикации. Модель сама нашла неочевидную связь между разными областями математики и получила результат по открытой задаче высокого уровня. Оригинал: https://openai.com/index/model-disproves-discrete-geometry-conjecture/ @ai_machinelearning_big_data

297 364

«На моей нейросети всё компилировалось». @ai_machinelearning_big_data

297 364

🌟 Nous Research придумала метод предобучения LLM с заявленным ускорением в 2–3 раза Исследовательская группа опубликовала описание метода Token Superposition Training, который, по утверждению авторов, ускоряет предобучение больших языковых моделей в 2–3 раза по реальному времени при неизменном объёме вычислений. 🟡Суть метода авторы описывают так На первые 20–40% обучения модель обрабатывает не отдельные токены, а батчи из нескольких идущих подряд токенов, их векторные представления усредняются на входе, а на выходе применяется модифицированная функция потерь. Никакого отбора по смыслу, частоте или содержанию нет - деление чисто механическое, по позиции в тексте. Внутри бвтча порядок токенов отбрасывается. Модель не учится предсказывать, какой токен стоит на какой конкретной позиции в ближайшем будущем, - только то, какие токены вообще там встречаются.

Размер батча - один из двух ключевых параметров метода. Оптимальное значение растёт вместе с размером модели: для 270 млн параметров оно лежало в диапазоне от 3 до 8 токенов, а для 10 млрд равнялось 16

Оставшуюся часть обучения модель переводят на обычный режим предсказания следующего токена. По словам Nous Research, готовая модель на инференсе ничем не отличается от обученной стандартным способом - архитектура, оптимизатор, токенизатор или набор данных не изменяются. Метод протестили на моделях 4-х размеров: 270 млн, 600 млн и 3 млрд параметров, а также на 10 миллиардной MoE. В самом крупном эксперименте модель с TST достигла более низкого значения лосса, чем сопоставимая по вычислениям базовая модель, примерно за 40% времени и показала лучшие результаты на тестах HellaSwag, ARC и MMLU. 🟡Ограничения TST расходует обучающие данные быстрее обычного, поскольку модель переваривает больше текста. Если обучающих данных мало, метод становится контрпродуктивным. 🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Pertrain #TST #NousResearch

297 364

🌟 На ЦИПР Digital-2026 в номинации «Зелёная цифра» победил проект по поиску борщевика с помощью ИИ и спутниковых снимков. Решение разработал Яндекс — сервис использует computer vision-модель, обученную на датасете из 10 тысяч снимков. Нейросеть автоматически размечает очаги заражения и делает это примерно в 50 раз быстрее ручного поиска. С технической точки зрения кейс интересен тем, что ИИ здесь используется для практической обработки спутниковых снимков и анализа геоданных. Сервис уже помог обнаружить крупные очаги заражения в 18 регионах России и сейчас мониторит территории Тверской и Ярославской областей общей площадью около 100 тыс. км². Вообще, хороший пример того, что ИИ – это не только чат-боты, генерация изображений и code assistants. Компьютерное зрение и спутниковые данные становятся рабочим инструментом для экологии, мониторинга территорий и управления природными рисками. @ai_machinelearning_big_data #news #ai #ml

297 364

✔️ Агенты Claude получили поддержку локальных песочниц и MCP-туннелей Anthropic добавила песочницы и MCP-туннели в платформу Claude Managed Agents. Корпоративные клиенты получили возможность выполнять код агентов внутри собственной инфраструктуры. Локальные песочницы нужны для обработки конфиденциальных файлов в закрытом контуре. Поддерживается интеграция сCloudflare, Daytona, Modal и Vercel. MCP-туннели обеспечивают подключение агентов к внутренним базам данных и приватным API. Соединение со сквозным шифрованием устанавливается только на выход - открывать порты или менять правила брандмауэра не требуется. Полностью on-premise развертывание не поддерживается. Оркестрация, управление контекстом и обработка ошибок остаются на серверах Anthropic. Локальные песочницы доступны в стадии открытой беты, MCP-туннели предоставляются по запросу. claude.com ✔️ Prime Intellect открыла код General-Agent General-Agent - синтетическая среда для генерации тренировочных данных ИИ-агентов без участия разметчиков. Решение заменяет датасеты на динамическую генерацию с автоматической семантической валидацией. В основе системы лежит соревновательный подход между двумя моделями. "Синтезатор" конструирует задания с базами данных и функциями проверки, а "решатель" пытается их выполнить. Эволюция задач проходит пять уровней сложности. Простые сценарии обрастают дополнительными условиями, перекрестными связями и инструкциями. Платформа сохраняет задачи, которые алгоритм решает с заданным порогом вероятности. Самые сложные кейсы используются для генерации следующего раунда. Дообучение 30-миллиардной модели на собранных в General-Agent траекториях повысило точность вызова инструментов в бенчмарке BFCL с 18,9% до 52,3%. primeintellect.ai ✔️ Mythos научилась связывать мелкие баги в эксплойты в тестах Cloudflare Mythos Preview проанализировала более 50 репозиториев Cloudflare. Основной результат - модель научилась связывать мелкие разрозненные баги в рабочие эксплойты. CISO Cloudflare рассказал, что предыдущие поколения алгоритмов выявляли единичные ошибки, но не могли собрать их в вектор атаки. Mythos снизила долю ложных срабатываний и генерирует шаги для воспроизведения уязвимостей с минимальным участием инженеров. Для поиска Cloudflare развернула архитектуру Project Glasswing из 50 параллельных агентов. Система использовала состязательный подход: один агент генерировал вектор атаки, второй его опровергал. cloudflare.com ✔️ Mistral купил стартап Emmi для выхода на рынок физических симуляций Французский разработчик ИИ приобрел австрийский стартап Emmi AI, который создает ИИ-модели для симуляции физических процессов. Сумма сделки не раскрывается. В 2025 году Emmi AI привлек €15 млн инвестиций. Модели Emmi просчитывают аэродинамику, теплообмен и сопротивление материалов. CEO Mistral заявил, что интеграция технологий нацелена на аэрокосмическую отрасль, автомобилестроение и производство полупроводников. Сделка расширяет промышленное направление Mistral. Компания уже предоставляет решения для ASML, Stellantis и Veolia: алгоритмы выявляют дефекты на сборочных линиях и управляют роботизированными манипуляторами. emmi.ai ✔️ Сооснователь Anthropic выступит на презентации первой энциклики Ватикана об ИИ 25 мая Ватикан представит энциклику об ИИ "Magnifica Humanitas". В презентации примет участие сооснователь Anthropic и исследователь интерпретируемости моделей Крис Ола. Документ затрагивает защиту человеческого достоинства, влияние алгоритмов на труд и осуждает применение ИИ в военных конфликтах. Привлечение Олы связывает теологическую повестку с технической проблемой ИИ-безопасности. Выход документа приурочен к годовщине исторической энциклики о правах рабочих эпохи Промышленной революции. Таким образом Ватикан приравнивает развитие ИИ к аналогичному по масштабам социальному сдвигу, требующему этических ограничений. reuters.com @ai_machinelearning_big_data #news #ai #ml

297 364

Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash Похоже, Google снова пытается перехватить повестку в ИИ. Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами. Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы: - добавить эффекты в видео со смартфона - сделать картину из грубого наброска - собрать образовательный подкаст по фото - работать с кодом, текстом, визуалом и видео в одном контексте Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня. Второй релиз - Gemini 3.5 Flash. Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно. По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей. Если коротко: - Gemini Omni - модель для всего: текст, код, картинки, видео, миры - Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами - Google явно двигается не в сторону «чатбота», а в сторону моделей, которые реально что-то делают Интересно, насколько хорошо он будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах. Релиз https://x.com/GoogleDeepMind/status/2056786446636212467 Попробовать: https://gemini.google.com/app

297 364

Repost from Анализ данных (Data analysis)

Андрей Карпаты перешёл в Anthropic Один из самых известных людей в индустрии - сооснователь OpenAI, бывший директор по ИИ в Tesla, автор легендарных лекций по нейросетям - официально объявил о переходе в Anthropic. В твите он написал, что ближайшие несколько лет на фронтире LLM будут особенно формирующими, и он рад вернуться к R&D в команде Anthropic. Образовательные проекты, включая Eureka Labs, обещает не бросать и вернуться к ним позже. Карпаты последние пару лет фактически был «свободным агентом» - выпускал собственные туториалы, строил Eureka Labs, считался одной из самых независимых фигур в ИИ. Его выбор в пользу Anthropic, а не OpenAI, xAI или Google, многое говорит о том, где сейчас концентрируется самая интересная исследовательская работа. С учётом недавнего policy paper Anthropic про 2028 год и фронтирные модели - у компании явно идёт серьёзная фаза найма под большие задачи. https://x.com/karpathy/status/2056753169888334312 @data_analysis_ml

297 364

Бывший CEO Google Эрик Шмидт выступил на выпускной церемонии Университета Аризоны с речью про ИИ. Когда он сказал:

Вам не обязательно интересоваться ИИ. Какую бы карьеру вы ни выбрали, ИИ всё равно будет ее частью.

И зал раздался свистом. Студенты воспринимают это так:

Вам придётся конкурировать с машинами за вашу первую работу.

Но с другой стороны, они находятся в лучшей позиции, чем предшественники и могут использовать мощные ИИ-инструменты уже на самом старте своей карьеры.

297 364

✔️ Black Forest Labs запустила MCP-сервер Сервер доступен по адресу mcp.bfl.ai и позволяет создавать и редактировать изображения в чат-клиентах, поддерживающих этот протокол. Заявлена совместимость с Claude, Cursor, Codex, Windsurf и другими MCP-клиентами. MCP-сервер предоставляет несколько инструментов: генерацию до 8 изображений параллельно, создание вариаций на основе предыдущего результата, просмотр истории запросов и проверку остатка средств на счёте. Нужную модель клиент выбирает автоматически в зависимости от запроса. Доступно несколько моделей линейки FLUX.2: от быстрой Klein до топовой Мax. По умолчанию используется Flux2 Pro. Оплата, согласно документации, производится напрямую BFL: счёт выставляется той организации, которая была выбрана при авторизации. Актуальные тарифы - на странице bfl.ai/pricing. @ai_machinelearning_big_data #news #ai #ml

297 364

Orion soft запускает Сезон ИИ-инфры

Чтобы ИИ приносил конкретные результаты, важно понимать ограничения своей ИТ-инфраструктуры. Спецпроект российского разработчика ПО поможет пройти практический путь к ИИ: от первичной оценки готовности инфраструктуры — до конкретных решений и рекомендаций экспертов, которые внедряют ИИ в продакшн.

Вы можете выбрать любую из следующих активностей или все: Чек-лист готовности инфраструктуры к ИИ • определите свой уровень инфраструктуры • получите подробные рекомендации по каждому из этапов Серия вебинаров • как стартовать ИИ без типовых ошибок • где считать экономику • архитектура production-ИИ • реальная стоимость «своей платформы» Персональный аудит • разбор вашей инфраструктуры с экспертами Orion soft • рекомендации под конкретные AI/ML-сценарии • практические шаги внедрения Подробнее #ai #ml

297 364

🌟 Alice AI ART получила обновление с фокусом на генерацию русского текста Яндекс выпустил новую версию своей визуально-генеративной модели - точность воспроизведения кириллического текста при использовании приемов промптинга выросла в 3 раза относительно предыдущей версии.

Диффузионные модели плохо справляются с текстом, в процессе генерации буквы для них ничем не отличаются от любой другой текстуры, нет встроенного представления о символах как о дискретных единицах со стабильной формой. С кириллицей ситуация усугубляется дисбалансом обучающих данных: в открытых датасетах её доля минимальна, а доступные примеры с русским текстом в большинстве низкого качества - их прямое добавление в претрейн просаживает эстетику и общее качество генерации.

🟡 Технические изменения 🟠 Собственный датасет пар «изображение - текст» с разметкой глифов: 30 млн примеров в претрейн и около 100 тыс. в файнтюн, отобранных по качеству и визуальной эстетике. Ключевой фокус - на разнообразии символов и токенов, без этого модель хорошо писала бы только частотные буквы. 🟠 Переход с UNet на Diffusion Transformer - трансформерная архитектура лучше работает с пространственными связями между удалёнными участками картинки, что критично для длинных надписей. 🟠 Замена текстового энкодера на LLM для более точного понимания семантики и контекста запроса. 🟠 Обучение на русскоязычных промптах вместо схемы с переводом с английского. 🟡 Результаты внутренних замеров 🟢 Кириллический текст - фразы 7–9 слов корректно генерируются в большинстве случаев (предыдущая версия с ними практически не справлялась) 🟢 Общее качество — доля генераций без визуальных искажений выросла на треть 🟢 Локальная айдентика - 85% корректных генераций, на уровне топовых индустриальных решений

По доле успешных генераций кириллического текста Alice AI ART показывает лучшие результаты среди российских моделей. Команда также рекомендует приёмы промптинга для получения заявленного роста качества генерации — заключать текст в кавычки, сложные слова писать заглавными, длинные фразы разбивать на части с явным указанием расположения.

https://admin.kod.ru/alisa-ai-russkiy-tekst-na-kartinkah-prompty/ @ai_machinelearning_big_data #news #ai #ml

297 364

Repost from C++ Academy

🖥 Создатель C++ разнёс вайбкодинг: “сеньоры не хотят разгребать этот мусор” Бьёрн Страуструп, легендарный создатель C++, в новом двухчасовом интервью резко прошёлся по вайбкодингу. Главная претензия простая: сгенерированный код пока слишком часто выглядит красиво только на демке. В реальном проекте он приносит баги, раздувает кодовую базу, плодит уязвимости и плохо поддаётся нормальной проверке. Особенно больно это бьёт по опытным разработчикам. Им потом приходится не “магически ускоряться с ИИ”, а читать, чинить и переписывать слоп, который кто-то нагенерировал за пять минут. Похожая история уже достала и Линуса Торвальдса. Его буквально завалили кривыми AI-отчётами по ядру Linux: вроде бы люди “помогают”, а на практике создают шум, который мешает настоящей разработке. Сеньоры не боятся ИИ. Они просто не хотят провести остаток карьеры, разгребая чужой промптованный мусор. https://www.youtube.com/watch?v=U46fJ2bJ-co @cpluspluc

297 364

Repost from C++ Academy

🖥 Создатель C++ разнёс вайбкодинг: “сеньоры не хотят разгребать этот мусор” Бьёрн Страуструп, легендарный создатель C++, в новом двухчасовом интервью резко прошёлся по вайбкодингу. Главная претензия простая: сгенерированный код пока слишком часто выглядит красиво только на демке. В реальном проекте он приносит баги, раздувает кодовую базу, плодит уязвимости и плохо поддаётся нормальной проверке. Особенно больно это бьёт по опытным разработчикам. Им потом приходится не “магически ускоряться с ИИ”, а читать, чинить и переписывать слоп, который кто-то нагенерировал за пять минут. Похожая история уже достала и Линуса Торвальдса. Его буквально завалили кривыми AI-отчётами по ядру Linux: вроде бы люди “помогают”, а на практике создают шум, который мешает настоящей разработке. И вот тут неприятный вывод для рынка: ИИ не отменяет инженерное мышление. Он просто делает слабого разработчика быстрее. А если человек не понимает архитектуру, безопасность, тесты и границы задачи, то вайбкодинг превращается не в ускорение, а в генератор технического долга. Сеньоры не боятся ИИ. Они просто не хотят провести остаток карьеры, разгребая чужой промптованный мусор. https://www.youtube.com/watch?v=U46fJ2bJ-co @cpluspluc

297 364

📌 Сколько стоит построить ИИ-ЦОД мощностью 1 ГВт? Epoch AI опубликовала модельную оценку полной стоимости владения типовым дата-центром для искусственного интеллекта мощностью один гигаватт. По расчётам, такой объект потребует около $38 млрд первоначальных капитальных вложений и $900 млн операционных расходов в год.

Если капитальные затраты распределить на срок службы оборудования, совокупная стоимость владения составляет примерно $8,5 млрд в год.

Около 60% этой суммы (порядка $5 млрд) приходится на серверы. Расходы на их фоне невелики: даже электроэнергия, крупнейшая операционная статья, по оценке обойдется в $600 млн в год. Авторы оговариваются, что это упрощённая финмодель, а не оценка конкретного объекта. Расчёт описывает гипотетический ЦОД крупного американского оператора облачной инфраструктуры на оборудовании NVIDIA GB200 NVL72.

Реальные издержки могут заметно отличаться в зависимости от выбора серверов, проектирования, расположения, схемы финансирования и стратегии энергоснабжения.

Главная неопределённость расчётов связана со сроком службы IT-оборудования. Базовый сценарий исходит из 5 лет для серверов и сетевой инфраструктуры и 14 лет для здания. При сроке в 3 года годовая стоимость владения возрастает примерно до $12–13 млрд, при 7 - снижается до $7 млрд.

Оценка опирается на статистику государственного энергорегулятора США, показатели энергоэффективности Lawrence Berkeley Lab, стоимость серверов по выкладкам SemiAnalysis, строительные индексы Turner & Townsend и ряд других источников. Модель предполагает полное питание от энергосети и не учитывает собственную генерацию, налоговые льготы оценены приблизительно.

Обновлённый расчёт даёт стоимость владения $8,5 млн на мегаватт в год против прежних $10,8 млн. Снижение авторы объясняют переходом на новое оборудование и пересмотром части исходных данных. @ai_machinelearning_big_data #news #ai #ml

297 364

Приглашаем на GenAI MeetUp — hh.ru х Lamoda Tech Если вы LLM-инженер или ML-специалист, работаете с генеративным AI, приходите обсудить разработку агентов, применение моделей и оценку их качества. 🧬 В программе разбор кейсов, интерактивы с призами, нетворкинг и угощения. Спикеры и доклады: ▪️ Коля Безносов, Руководитель направления AI Lab, hh.ru Рекрутер, который не спит: как мы автоматизировали первичный контакт с соискателями с помощью ИИ ▪️Данил Дмитриев, Senior Data Scientist, Lamoda Tech Контролируемый агент поддержки: как мы превратили обратную связь из прода в роадмап ▪️Женя Орлов, Руководитель команды разработки AI Lab, hh.ru Нейроразбор резюме: практический опыт и нюансы создания LLM-судей ▪️Дима Курганский, Teamlead MLOps, Lamoda Tech Как мы строим GenAI-платформу в Lamoda: от MVP к production-решениям 🗓 28 мая, сбор 18:30, начало 19:00 🔗 Очно и онлайн 📍 Офис hh.ru 🔥 ЗАРЕГИСТРИРОВАТЬСЯ Количество очных мест ограничено. Реклама. ООО "ЛАМОДА ТЕХ". ИНН 7734461512. erid: 2W5zFHW2tg9

297 364

✔️ OpenAI и Dell стали партнерами Компании будут совместно адаптировать Codex для работы в гибридных и on-premise инфраструктурах. Модели OpenAI интегрируют напрямую с платформами Dell AI Data Platform и Dell AI Factory. Решение позволяет корпоративным клиентам развертывать ИИ в локальном контуре с базами данных, закрытыми репозиториями и внутренней документацией без необходимости передачи конфиденциальной информации на сторонние серверы. Целевой сценарий интеграции - разработка автономных ИИ-агентов. Локальный запуск даст агентам прямой доступ к корпоративному контексту для автоматизации бизнес-процессов, работы с системами учета и генерации отчетов. openai.com ✔️ Илон Маск проиграл суд против Сэма Альтмана и OpenAI Суд присяжных в Калифорнии отклонил иск Илона Маска к OpenAI, Сэму Альтману, Грегу Брокману и Microsoft. Причиной стало истечение сроков давности. Маск обвинял бывших коллег в мошенничестве и отказе от изначальной некоммерческой миссии. По его версии, руководство незаконно перевело OpenAI в статус коммерческого предприятия, использовав его стартовые пожертвования в размере $38 млн. Защита OpenAI настаивала, что процесс инициирован для замедления конкурента на фоне развития проекта Маска xAI. Юристы компании заявили, что истец изначально осознавал необходимость привлечения капитала и партнерств уровня Microsoft для масштабирования архитектуры и закупки вычислительных мощностей. businessinsider.com ✔️ Anthropic покупает стартап Stainless Anthropic приобрела стартап Stainless, автоматизирующий генерацию SDK. Цель сделки - упростить разработку коннекторов и серверов MCP для интеграции Claude с корпоративным инструментарием. Компании сотрудничают с 2022 года: инфраструктура Stainless применялась для сборки официальных SDK API Claude. Платформа стартапа конвертирует спецификации API в готовые библиотеки и CLI-утилиты для TypeScript, Python, Go, Java и Kotlin. Технологии стартапа позволят сторонним разработчикам автоматизировать создание MCP-серверов для подключения ИИ-моделей к внутренним базам данных и запуска автономных агентов. Команда Stainless перейдет в Anthropic. anthropic.com ✔️ GitHub выпустил десктопное приложение Copilot Решение работает отдельно от IDE и переводит взаимодействие с ИИ из диалогового окна в параллельные рабочие процессы. В интерфейсе можно запускать несколько агентов одновременно. Для каждой задачи Copilot автоматически разворачивает изолированные Git-worktrees и ветки. Разработчик может поручить одному агенту фоновое исправление CI, а другому написание фичи, не прерывая работу в локальном репозитории. Для работы с PR добавлен механизм Agent Merge. Агенты самостоятельно обрабатывают комментарии после код-ревью, исправляют упавшие тесты и сливают ветки при выполнении заданных условий. Также приложение получило поддержку стандарта MCP. Десктопный Copilot доступен по списку ожидания. На тарифах Business и Enterprise новинка доступна после корпоративной авторизации. github.com ✔️ Из FAIR ушёл ключевой сотрудник по видеогенерации Исследователь подразделения FAIR Эндрю Браун перешел в стартап AMI Labs для разработки моделей мира - систем, обучающихся законам физики и причинно-следственным связям реального мира. У Цукерберга Браун провел 3 года. Он занимался моделями генерации видео, выступил соавтором архитектуры Emu Video и контрибьютором комплекса Movie Gen. Фаундеры AMI Labs - суперзвезды ИИ-сцены Ян Лекун и Се Сайнин (самый цитируемый учёный в области генеративного ИИ и CV, соавтор архитектуры Diffusion Transformers). Andrew Brown в сети Х @ai_machinelearning_big_data #news #ai #ml

297 364

⚡️ Cursor выпустил Composer 2.5 - свою самую мощную модель. Главное: - умнее в рассуждениях и работе с кодом - заметно выносливее на длинных задачах: рефакторинги, миграции, многочасовые агентские прогоны больше не разваливаются на полпути - строже следует сложным инструкциям - держит рамки, ограничения и стиль проекта Бонус: всю неделю включённые лимиты модели удвоены - самое время обкатать на своих задачах. https://cursor.com/blog/composer-2-5