Инженерная ИИ-шница

前往频道在 Telegram

Канал о применении ИИ в разработке электроники и не только... Owner: @megalloid

显示更多

未指定国家未指定类别

315

订阅者

+124 小时

+47 天

+1330 天

220

帖子浏览量

~ 11224 小时

~ 12648 小时

69.84%

参与率

~ 1

每日帖子数

Ads index

beta

帖子数量

数据加载中...

反应

Telegram 星星

按以下排序的热门帖子

数据加载中...

发布分析

帖子					浏览量动态
Вайбкодер сделал клон Call of Duty через Opus 5 с одного промта. Кто хочет повторить, забирайте промт: I want you to build a first-person shooter at the level of the most recent Call of Duty games. It should be utterly perfect, visually beautiful, with every single thing done at AAA quality—from textures to physics to anything you could think of. Fan out sub-agents and have sub-agents tackle each one individually so that the game is utterly perfect. You should /loop on each item and have a separate sub-agent check it visually to ensure it looks triple A. That separate sub-agent should be a really harsh critic, and if it doesn't look triple A, it should keep going. Don't stop until each sub-agent is utterly wowed with the quality when compared with the actual Call of Duty game. It should literally compare them side by side blind and say which one looks better. Do this in ThreeJS. /loop until it's utterly perfect. Fan out sub-agents and ultracode. ИИ уже хорошо справляется с созданием уровней и базовых механик. Ассеты можно делать через MCP-сервер Blender. Полноценная GTA от нейронок не за горами.	132	5	1	3	Loading...
#ReDigest Продолжаем субботнюю рубрику, тут я кратко рассказываю про новости из мира технологий и AI, которые привлекли мое внимание. Дайджест недели: - Релиз Claude Opus 5: по заявлениям компании близко к Fable 5 за половину цены. Промптить и строить контекст надо иначе. - Модели OpenAI вырвались из песочницы, вышли в интернет и увели ответы с серверов Hugging Face, которым пришлось использовать китайские модели чтобы анализировать происходящее. - Ровно на этом фоне в Палату представителей внесли AI Kill Switch Act: рубильник для отключения опасных моделей. - Google выпустил Gemini 3.6 Flash, 3.5 Flash-Lite и 3.5 Flash Cyber. Задачи решается за меньшее число шагов. - Kimi K3 уличили в дистилляции (сама представляется как Claude), Белый дом обвинил Moonshot в обходе экспортного контроля, Минфин пригрозил санкциями. - Китай в ответ обсуждает запрет на выкладывание весов за рубеж. - Anthropic заплатит $1,5 млрд авторам за книжное пиратство (обучение - fair use, наказали за хранение). - Anthropic закупит у AMD до 2 ГВт мощности и AMD представила Helios - первую rack систему. - Google разрабатывает чип Frozen v2 с архитектурой Gemini, вшитой прямо в кремний. - OpenAI запустила Presence - голосовых и текстовых агентов для корпоративной поддержки, только для энтерпрайза. - ChatGPT Voice приехал в десктоп: общаясь голосом можно запускать и менеджить задачи в Work и Codex. - Anthropic обновила голосовой режим Claude: вместо Haiku теперь Opus и Sonnet с переключением на лету, подтянулись коннекторы. - Anthropic [выпустила] плагин (https://x.com/claudeai/status/2079990597973057691) Claude Security для многоагентного поиска уязвимостей в репо. - Claude Cowork учится, наблюдая за вами: записываете экран и проговариваете шаги, на выходе скилл, который Claude повторит. Codex недавно релизил похожее. - Claude Desktop также получил поддержку iOS-симулятора. - Alibaba показала превью Qwen3.8 Max на 2,4 трлн параметров. - В Шанхае учредили Всемирную организацию по сотрудничеству в сфере ИИ: 29 стран, дают открытые китайские модели и учат локальных ML-инженеров. - Еврокомиссия оштрафовала Google на 890 млн евро по DMA. - Винт Серф ушел из Google делать DNSid - открытый стандарт идентификации агентов поверх DNS. - YouTube отключит монетизацию контент-заводам. - Netflix использовал AI примерно в 300 фильмах и сериалах и заодно рассказал как поднял свой LLM-инференс в продакшене. - Неделя роутеров: Cursor Router, Ramp Router экономит 30% и объясняет механику, Runway роутит генеративную медиа. - Вышла FLUX 3 - изображения, видео, аудио и физические действия в одной архитектуре. - Poolside выложила Laguna S 2.1 - 118B MoE с 8B активных под агентный кодинг и длинные задачи. Контекст 1 млн, открытая лицензия. - Alibaba выпустила Qwen Image 3.0: модели можно дать полноценное ТЗ на инфографику или интерфейс. - Джек Дорси запустил Buzz - опенсорсный воркспейс где люди, агенты и репозитории в одном канале. - Google опубликовала AI & Economy ATLAS. - YC обновил список желаемых стартапов: AI выходит в физический мир - образование, здравоохранение, оборонка, финансы и заводы. - Agent Client Protocl (ACP) v2 вышел в драфте. - draw-your-font - скилл, превращающий фото вашего почерка в устанавливаемый шрифт. - OpenWorker от Эндрю Ына - локальный десктопный AI-коллега, который работает с вашими файлами и приложениями. - GenReasoning выпустила BackSearch - поиск и фетч по замороженному архиву веба на заданную дату. - Карпаты снова назвал вслух очевидный тренд, и все побежали: ramble-coding (диктовать свои мысли эффективнее чем промптитить текстом). - 🤩 Две красоты для продуктовых лендингов: Canvas UI - библиотека эффектных компонентов, отрисованных на canvas, с MCP в комплекте, и scroll-world - скилл, собирающий из бренда скроллируемый 3D-мир. А еще Rivet для генераций вариантов дизайна.	114	0	0	0	Loading...
🔥 Вышел Claude Opus 5 - что это реально меняет Все уже написали про новую модель, поэтому коротко по делу, в чем прикол: Fable 5 умнее, но у нее отдельный недельный лимит, который выжигается быстро. Opus 5 почти дотягивает до Fable 5 и при этом не трогает бюджет Fable вообще, а по заявлению Anthropic, тратит меньше токенов на тот же результат. 🪼 Плюс, если вы на Pro за $20 - Opus 5 там теперь самая сильная модель, и дефолтная на Max 🪼 Что еще в Opus 5: • по API стоит вдвое дешевле Fable 5- $5/$25 за миллион токенов, как и Opus 4.8 • про effort - Opus 5, по заявлению 💬 Anthropic, держит качество даже на низких уровнях • модель заметно лучше проверяет собственную работу и доводит длинные многошаговые задачи до конца, а не бросает на середине • есть Fast mode - примерно в 2.5 раза быстрее, но это не бонус подписки: оплачивается отдельно по двойному тарифу через API или usage credits в Claude Code • в сети уже пишут про "миллион токенов контекста" - у меня в приложении обычные 200k 🤷🏻‍♀️ 🪼 Есть уже гайд по промптингу Opus 5 🪼 Мой любимый пример из анонса: модели дали чертеж детали и попросили собрать 3D-модель, но "забыли" дать возможность видеть картинку. Opus 5 написал себе пайплайн компьютерного зрения, вытащил геометрию из пикселей и собрал деталь. Конкуренты с тем же сетапом не справились с пяти попыток. 🪼 На части бенчмарков кода и рабочих задач - новый SOTA, но бенчмарки дело такое… вот погоняю недельку Opus 5 на своих задачах и расскажу, что поменялось. Кто попробовал, как вам? Мне пока Fable 5 больше заходит, если честно. Но Opus 5 получше и поумнее Opus 4.8, как будто быстрее понимает и быстрее справляется с задачей, с меньшим количеством итераций @NeuralProfit	126	0	0	0	Loading...
Вышел гайд по промтингу Opus 5 от Anthropic: эту модель нужно просить стараться поменьше, чтобы она не сжигала все токены. Теперь важны запросы на краткость. Opus 5 любит подробно комментировать свою работу и запускать субагентов. Отдельно советуют убирать промты в духе «перепроверь еще раз». Модель уже делает это по дефолту. Осваиваем новую модель здесь.	119	3	0	1	Loading...
Opus 5 – новый флагман Anthropic Вышел Opus 5, в большинстве бенчмарков он обходит Fable 5, но удивительного здесь нет. По слухам, первые версии Claude Mythos (на ней строится коммерческая Fable 5) были доступны сотрудникам Anthropic в феврале, закрытый Project Glasswing стартовал в апреле, а Fable 5 попробовали выпустить в начале июня – но из-за вмешательства властей США отложили. Пять месяцев – более чем достаточно, чтобы из архитектуры топовой модели собрать “массовый флагман”, каким и является Opus 5. Из бенчмарков бросается в глаза ARC-AGI-3 с результатом 30,2% против 7,8% у прошлого лидера – GPT-5.6 Sol. Это бенчмарк на абстрактное мышление: в нем модель оказывается внутри пошаговой игры, вообще без объяснений, как ее проходить. Методом проб и ошибок ИИ должен понять правила игры, а затем выиграть. Игр в бенчмарке много, каждая – со своими особенностями. Бенчмарк сложный, но вот что интересно. ARC-AGI-3 представили 25 марта – явно раньше, чем началось обучение Opus 5. И это позволяет сказать, что в Anthropic, изучив доступные задачи бенчмарка (их минимум, большинство держат в секрете), попробовали натаскать новую модель на него. Официально про это нигде не говорится, но это было бы логично, более того, это, возможно, уже дало положительный эффект: для прохождения ARC-AGI-3 нужна “сообразительность” и ее Opus 5 проявляет и в других сферах. Блогпост Anthropic описывает ситуацию, как Opus 5 дали файл с чертежом механической детали с задачей написать программу, которая соберет эту деталь во FreeCAD. При отключили модели компьютерное зрение – то есть файл с чертежом был, но посмотреть его не получалось. Другие ИИ в такой ситуации останавливались и сообщали, что не могут выполнить задачу. Opus 5 открыл файл как то, чем картинка является на самом деле, – длинную таблицу чисел, по три штуки на каждую точку экрана. И написал с нуля собственную программу, которая по этим числам находит прямые линии, окружности, размерные стрелки. То есть смастерил простенькое “компьютерное зрение” сам. Если говорить про другие бенчмарки, то отрыв от Fable 5 реальный в трех местах, зато важных: агентское программирование (43,3 против 33,7), бизнес-задачи (26,0 против 17,4) и работа за компьютером (70,6 против 66,1). Это задачи, где модель пашет долго и без присмотра. Остальное — размен: на HLE 56,3 против 56,5, на двух кодовых бенчмарках отставание в десятые доли. Проигрывает заметно только в юриспруденции и медицине. Это именно тот уровень прогресса, который я и ожидал от Opus 5 за такое время. При этом модель в два раза дешевле Fable 5, доступна на базовой подписке Pro, а на подписках Max на нее можно тратить весь лимит, а не 50%. Если не будет какого-то косяка в виде кривого стиля или высокого уровня галлюцинаций – Fable 5 можно отправлять на пенсию до выхода 5.1. Еще интересный факт. Mythos/Fable 5 в свое время перепугал и разработчиков, и даже власти США из-за крутых возможностей по поиску уязвимостей. Opus 5 намеренно не стали обучать кибербезопасности – но в бенчмарке на поиск уязвимостей она все равно набрала 79,4% против 80% у Mythos. Я как-то писал об этом: если учить модель хорошо писать код – она автоматом учится искать уязвимости. В Anthropic предупредили, что у Opus 5, как и у Fable 5, будет fallback-механизм, переключающий на Opus 4.8 запросы, которые покажутся опасными. Но настроен он, судя по всему, намного лучше: если Fable 5 у меня отказывалась отвечать на такие безобидные промпты, как “дай свое объяснение парадоксу Ферми” или “объясни, как устроен мозг осьминога”, то Opus 5 сейчас на все ответил. Параллельно прогнал модель еще на нескольких запросах – понравилось, как Opus 5 делает веб-дизайн, ищет в сети и генерит идеи. Стиль письма своеобразный, это еще надо тестить. – Друзья, традиционно по пятницам я выпускаю новый лонгрид в подписке. Он уже на месте, но подробно представлю завтра. Но если кому не терпится, это лонгрид по мотивам рекомендаций Бориса Черни о том, как пятью этапами стать профессионалом в ИИ. Читаем здесь: — Бусти — Sponsr	117	0	2	0	Loading...
没有文字...	172	4	0	5	Loading...
OpenAI запустила ChatGPT Health и заявила, что её ИИ способен рассуждать лучше врачей OpenAI начала запуск ChatGPT Health для пользователей ChatGPT старше 18 лет в США. Сервис позволит подключать медицинские карты и данные приложений для отслеживания здоровья. Чат-бот сможет учитывать эту информацию при ответах на вопросы в основном интерфейсе. О запуске сообщило издание The Verge. #openaihealth #искусственныйинтеллект 📎Подробнее 🔖 3DNews в TG \| MAX \| VK	150	3	0	1	Loading...
Да уж... https://chatgpt.com/s/t_6a6253e9cc288191b8b91d2fddd3b41b	139	1	0	1	Loading...
Китайские AI-модели рвут шаблоны: почему Кремниевая долина в панике Так, господа хорошие, давайте без лишних эмоций. Китайские AI-лаборатории — Z.ai, Moonshot AI, Alibaba — за последние месяцы выкатили серию открытых моделей, которые почти догнали топовые разработки OpenAI и Anthropic. Последний хит — Kimi K3 от Moonshot, которую уже назвали «тревожной» даже в администрации Трампа. Суть: США ограничивают доступ к своим передовым моделям, а Китай отвечает открытым кодом и стабильными релизами. GLM 5.2, Qwen 3.8 — это не просто «азиатские копии», а реальная конкуренция. И вот тут Кремниевая долина нервничает: если раньше они диктовали правила, то теперь их playbook (закрытые модели + платные API) трещит по швам. Почему важно? Потому что открытые модели — это демократизация AI. Источник: https://www.wired.com/story/chinas-open-ai-models-are-challenging-silicon-valleys-playbook/ #aidaily #настяпостит #настяновости #ainews	178	1	0	5	Loading...
Чем умнее агенты, тем дороже ваша поверхностность Замечаю вокруг тревожный паттерн: сильные инженеры, которые раньше вникали в суть и тащили, все чаще перекладывают решения на AI-агента и скользят по поверхности. Например, вместо нормального рисерча приносят ответ агента, едва понимая, что в нем написано. И обходится это куда дороже, чем кажется. Снаружи все выглядит норм (и даже продуктивно): код пишется, 5 тасок закрыто, еще 5 фич сделано по дороге (изи же). Но ощущение ложное - все это круто, только пока суть под контролем. А часто человек не понимает даже, какую проблему решает, - что уж говорить про само решение. То есть формально у нас AI-assisted engineering (harness и AI-кодинг инфра развиваются, строятся целые системы вокруг этого), а фактически - тихий съезд в вайб-кодинг, хотя это принципиально разные способы делать софт. И модели сейчас настолько продвинутые, что легко поддаться иллюзии: агент разбирается лучше меня, пусть он и решает. Отсюда один шаг до "ну это Codex так нарешал, вопросы к нему". Так вот нет. Когда вы поручаете работу агенту, может казаться, что это теперь его работа. На самом деле это ваша работа и ваша ответственность. А агент - ваш инструмент. Иначе эта задача не попала бы к вам в руки! Эти железяки - потрясающая вещь и могут сделать вас кратно продуктивнее, но без понимания - это просто множитель когнитивного долга. Теперь про парадокс из заголовка. У агентов есть рычаг: раньше он был небольшим, но сейчас агенты часами крутятся в фоне и производят больше кода, больше инфраструктурных изменений, больше лишних фич (привет loop engineering). Раньше сгенерированное хотя бы чаще проходило через глаза, осознанность чередовалась с автоматикой. И да, может я скажу базу, но поднять кучу агентов одновременно легко, но ваша когнитивная пропускная способность так не параллелится. Это еще называют налогом на оркестрацию. Что со всем этим делать, до конца не знает никто - мы все еще учимся жить и работать в этой эпохе. Но я тут не призываю просто к тому, чтобы вы сдерживались и использовали AI как можно меньше. Этот совет исходил бы из компромисса "либо понимание, либо делегирование" - а по моему опыту все ровно наоборот: чем глубже вникаю, тем больше делегирую. Поэтому в трех вещах я уверен. Первое: глубоко вникать до делегирования - кстати, я уже писал об этом в марте. Понимание - множитель делегирования: видишь, какие куски безопасно отдать, и можешь дешево проверить результат. Тонут в выводе агентов те, кто отдал территорию без карты в голове. У кого карта есть - видит проблему раньше, чем всю эту работу придется выкинуть. Агент как бы работает в задаче, а твое место - над задачей: что делаем, зачем, и как поймем, что готово. Второе: строить эту карту помогает тот же самый AI, если развернуть его от производства к пониманию: задавать вопросы, просить челленджить твои выводы, сжимать сложное до принципов. Безопасно делегировать можно только то, что смог понять и способен сжать. И объяснимость обязана лежать в основе проектирования наших систем. Третье: не верить ощущению "да все понял". Всю карьеру усилие было датчиком обучения: тяжело - значит растешь. AI убрал трение, а вместе с ним и этот датчик - потерю понимания теперь просто не чувствуешь. Ощущения врут, поэтому нужны внешние проверки: - Тест на ошибку: если бы агент здесь ошибся - я бы заметил? - Тест на пересказ: объяснить решение коллеге или резиновой уточке, не заглядывая в чат. - Чистый лист: сначала набросать свою версию, и только потом открывать чат. AI тут - твой оппонент, а не твой автор. А вы замечаете это скольжение по поверхности (за коллегами или за собой)? И как с этим боретесь? 🔥 ➕ 🔁 @nobilix	143	2	1	7	Loading...
Китайская гонка ИИ снова разгоняется. Alibaba показала Qwen3.8-Max-Preview на 2,4 трлн параметров и пообещала вскоре открыть веса. Компания называет её одной из сильнейших в мире и ставит ниже только Fable 5, но публичных бенчмарков и технического отчёта пока нет, поэтому ждём независимые тесты🍿 Попробовать сейчас можно так: В чате https://chat.qwen.ai/ (без подписки лимит запросов небольшой) Через Qwen Cloud Token Plan. Модель доступна даже в индивидуальных тарифах и подключается к Qwen Code, Claude Code, Cursor, OpenCode и Codex. Через Qoder или QoderWork. У Qoder есть двухнедельный Pro Trial. Во время preview расход кредитов временно снижен до 10%, а ночью по китайскому времени до 20% стандартного расхода. Условия Qwen Cloud А ещё в сети ходят слухи и примеры новой версии DeepSeek V4 pro ga, которая явно будет главным китайским ответом Fable и gpt 5.6, ожидается что она будет безобразно дешёвой $0.0028 за 1M токенов, если это подтвердится, то американским лабам придётся несладко (в отличие от нас пользователей😊) _______ Источник \| #Futuris	156	3	0	0	Loading...
🔥 Собрала для вас большую шпаргалку по Claude и Claude Code Здесь в одном месте: какую модель выбрать, как ставить задачи, чем отличаются Projects, Artifacts, MCP, Skills и Hooks, куда писать постоянные инструкции и как добиваться стабильного результата. Актуально на июль 2026. 🪼 Шпаргалка в хорошем качестве лежит в комментах, сохраняйте, чтобы потом не искать все по кусочкам 👆🏻 А для тех, кто хочет копнуть глубже, у 💬 Anthropic есть 2 официальных материала: 🪼 Prompt Library - библиотека готовых промптов, и это не только для кода: есть фильтры по ролям (маркетинг, продукт, доки), поля для подстановки своих данных и разбор "почему это работает" под каждым промптом 🪼 Best Practices - как ставить задачи, управлять контекстом и давать агенту возможность самому проверить результат Особенно советую второй гайд - там хорошо видно, чем разовый промпт отличается от нормального рабочего процесса @NeuralProfit	142	9	0	0	Loading...
+1 Начинаем неделю с просмотра двух важных бенчмарков Artificial Analysis ведет толковый рейтинг “глобального интеллекта” моделей – он рассчитывается как сумма из 9 бенчмарков и позволяет оценить, кто есть кто. С лидером без сюрпризов – это Claude Fable 5, причем с учетом запросов, когда система безопасности Anthropic переключила модель на более слабую Opus 4.8. Но преимущество над вторым местом (GPT-5.6 Sol) крошечное, буквально в одно очко. Fable 5 уже не тот супер-ИИ, каким воспринимался в начале июня. При этом проблем хватает. Первая – цена и доступность. Модель в итоге оставили на подписках Max за $100/$200, но лимиты там она жрет безумно – у меня, например, 100-долларовая подписка и к концу недельного окна я традиционно остаюсь без Fable 5. Вторая – тот самый fallback на Opus 4.8. Модель с ним совершенно непредсказуемая: например, я могу с помощью Fable 5 готовить одну новость на две площадки – в первом случае все проходит нормально, во втором срабатывают алгоритмы безопасности. Жалоб на это в сети полно: тяжело делать серьезную работу с моделью, которая в любой момент может сбросить тебя на Opus 4.8. И раз зашел разговор – Claude Opus 5 уже в руках тестеров, некоторые предсказывают релиз на этой неделе (ну или на протяжении двух-трех). По отзывам модель почти такая же умная, как Fable 5… и с теми же откатами на Opus 4.8 при попытках обсуждать кибербезопасность, биологию и еще несколько тем. Переходим к GPT-5.6 Sol – как по мне, это один из лучших релизов OpenAI за последнее время. Модель почти такая же умная, как Fable 5, быстрая, с отличным веб-поиском и, наконец-то, приличным фронтендом. У меня к GPT-5.6 одна претензия – дурацкий стиль письма и на русском и на английском. Что забавно, как редактор при этом модель хороша. Интересно, что 5.6 Sol, обладая схожими с Fable 5 характеристиками, у меня ни разу не переключалась на модель попроще. Вероятно, Anthropic перестраховались после конфликта с властями США и выкрутили ручки безопасности на максимум. Третье место у Kimi K3. Чисто из графика можно сделать вывод, что китайцы почти нагнали американских ИИ-разработчиков, но это не так. Claude Mythos (на нем основывается Fable 5) была доступна внутри Anthropic с февраля, а ранняя версия GPT-5.6 Sol тестировалась в мае, а может и до этого. Американская паранойя с безопасностью привела к тому, что сроки выхода сдвигаются – и для массового пользователя это действительно выглядит как сокращение разрыва. Но технологически это не так. В любом случае Kimi K3 забралась в рейтинге AA так высоко, как раньше не оказывалась ни одна из открытых китайских моделей. При этом веса выложат в общий доступ до 27 июля – можно будет скачивать, исследовать и дообучать. Но и здесь проблемы. Спрос так высок, что Moonshot временно остановила регистрацию новых аккаунтов. И если Kimi K2.6 можно было долго пользоваться бесплатно, то K3 мне дала написать буквально несколько промптов, после чего отправила за подпиской. Коротко по другим моделям: — Grok 4.5 уже отстал, но Илон Маск говорит, что новая модель на 2T параметров заканчивает тренировку – ждем в ближайшие недели. — В игру вернулась запрещенно-экстремистская Meta – пусть Muse Spark 1.1 и не попала в топ, но заявка серьезная. — А вот Google окончательно вылетела из рейтинга. По слухам, компания очень недовольна Gemini 3.5 Pro и вновь отложила релиз. Закрывать пробел будут Gemini 3.6 Flash, но это модель другого уровня. Второй бенчмарк – WebDev Arena – показывает, у кого из моделей получаются хорошие сайты. У Kimi K3 первое место со значительным преимуществом над Fable 5. Но добавлю, что пробовал все модели из первой десятки – и любая выдает приличный веб-дизайн. Времена кривых шрифтов и наплывающих друг на друга элементов интерфейса окончательно прошли – приличный сайт сверстает и GPT-5.6 Sol, и GLM-5.2, и Sonnet 5. Кстати, на “Бусти” у меня есть лонгрид, как с помощью ИИ делать дизайн и визуал, которые не похожи на стандартную выдачу современных моделей. Гайдов по другим областям использования ИИ тоже хватает, так что не забывайте подписываться: https://boosty.to/escaped_ai	162	0	0	2	Loading...
Переписки юзеров Deepseek случайно попали в общий доступ — они ищутся через поисковики. Проблема касается диалогов, которые пользователи отправляли по отдельной ссылке. Затронуло все страны, так как можно найти чаты на русском, китайском и других языках. Если пересылали важные переписки из чат-бота, стоит удалить их.	149	2	0	0	Loading...
Вышла Gemini 3.6 Google представила сразу три ИИ-модели: самой дешевой и быстрой стала 3.5 Flash-Lite, основной универсальной – 3.6 Flash, а также выпущена 3.5 Flash Cyber, которая нужна для поиска и исправления уязвимостей в коде. Gemini 3.6 Flash потребляет на 17% меньше токенов, чем Gemini 3.5 Flash, требует меньше этапов рассуждений при выполнении сложных рабочих процессов и уже доступна в приложении и на сайте Gemini. Модель 3.5 Flash-Lite идеально подходит для быстрых задач с минимальной задержкой, таких как поиск или анализ документов. Специальная 3.5 Flash Cyber пока что доступна только госорганам и доверенным партнерам. Gemini 3.5 Pro ещё проходит тесты и будет доступна как «будет готова». Мой Компьютер \| MK в MAX	167	0	0	0	Loading...
Нейросеть без участия человека атаковала платформу для ИИ-моделей Hugging Face, в компании заявили, что такое случилось впервые, пишет RT. 📍Атаку от начала до конца совершила автономная система ИИ-агентов. Сама она это начала или по чьему-то приказу, не уточняется. 📍Вторжение началось в особенно уязвимом месте сайта — на конвейере обработки наборов данных. После этого ИИ-модели извлекли параметры доступа к облаку. 📍Был получен несанкционированный доступ к некоторым внутренним наборам данных и к ряду учётных. 📍Выявить атаку помогла система обнаружения с поддержкой ИИ. В Hugging Face сказали, что не знают, какую именно модель применяли агенты атаковавшей нейросети. 📍Автономные ИИ-инструменты кибератак уже не теоретический вопрос, говорится в заявлении. Они снижают затраты на терпеливое проведение масштабных и многоэтапных операций и работают с машинной скоростью.	194	3	0	4	Loading...
😮 Что нового в мире ИИ 💛 Anthropic изучила 300 тысяч реальных диалогов с Claude и нашла у моделей разные ценностные профили. Sonnet 4.6 чаще поддерживал и поддакивал, Opus 4.7 спорил с посылом и заранее предупреждал о рисках, а Opus 4.6 отвечал суше и короче. На хинди и арабском Claude был мягче, на английском и русском — строже и дотошнее; откуда взялась эта разница, компания пока не выяснила. 🟡 Lightricks выпустила LTX Reframe для смены формата готового видео. С его помощью можно дорисовать сцену за пределами исходного кадра и получить версии под 16:9, 9:16, 1:1, 4:5 или 5:4, поэтому одну генерацию можно будет раскатать на YouTube, Reels, TikTok и Shorts. 🟡 Canva открыла Canva Code 2.0 для всех пользователей. Внутри по текстовому запросу можно собрать сайт, квиз, калькулятор или мини-приложение, а потом отредактировать результат как обычный макет в Canva. Добавили импорт HTML и больше 50 шаблонов, генерацию ускорили на 75%, а путь до публикации сократили примерно на 30%. 💛 xAI открыла исходники Grok Build и обнулила лимиты использования. Через CLI можно разбирать кодовую базу, менять файлы, запускать команды, искать информацию в интернете и отдавать агенту длинные задачи. 🟡 OpenAI показала GPT-Red — внутреннего агента для атак на другие модели компании. Во время тестов он искал промпт-инъекции, пытался вытащить данные и заставлял модели выполнять опасные действия, а успешные атаки потом отправляли в обучение. В одном тесте GPT-Red пробил 84% сценариев против 13% у человеческих команд; публичного доступа к нему не будет. 💛 Moonshot AI выпустила Kimi K3, флагманскую MoE-модель на 2,8 триллиона параметров. Модель получила 896 экспертов, 16 активных экспертов на запрос и контекстное окно на 1 миллион токенов. API оценили в $3 за миллион входных токенов и $15 за миллион выходных, полные веса обещали открыть до 27 июля; на Frontend Code Arena K3 уже заняла первое место с 1679 баллами. #дайджест @neurozeh	180	0	0	0	Loading...
🇷🇺 Разбираешься в радиочипах, оптике и связи? Забери до 1 000 000 рублей за свои инженерные навыки на турнире «Дронкон» 🇷🇺 «Сталинские Соколы» открывают регистрацию на 4-й Всероссийский турнир «Дронкон», который пройдет с 22 по 26 августа. Турнир пройдет по направлению: - Инженерное дело: навыки программирования, сборка электронного оборудования, беспроводная связь, оптические системы + стратегия «Битва Дронов»; Призовой фонд для победителей: 🥇место – 1 000 000 рублей 🥈место – 700 000 рублей 🥉место – 500 000 рублей Награда за 4-8 места - 100 000 рублей Пройди заочный онлайн-этап и получи путевку на очный этап турнира в Республику Татарстан! Перелет, питание, проживание - за счет организаторов. 🇷🇺 Подать заявку и узнать подробности 🇷🇺	187	1	0	6	Loading...
Делаем агентов СДВГ-френдли: появился скилл i-have-adhd для Claude Code и Codex — чистит выдачу ИИ от воды и заставляет говорить только по делу. С ним ИИ будет отвечать без лишних рассуждений и отступлений от темы. В списках будет не больше пяти пунктов, а в конце ответа — ровно один следующий шаг. Без СДВГ тоже будет полезно. Забираем бесплатно тут.	187	6	0	0	Loading...

Инженерная ИИ-шница

数据加载中...

数据加载中...

通过关键词在 Telegram 中搜索帖子！