Осцилляции WaveCut
Ir al canal en Telegram
Mostrar más
El país no está especificadoLa categoría no está especificada
934
Suscriptores
Sin datos24 horas
-17 días
+2730 días
Archivo de publicaciones
TL;DR: Пострижем баранов и вернем в план, когда шерсть перестанет расти.
Будет смешно и интересно, если GPT 5.6 Sol откроют для всех до 7 июля.
Помимо того, что ее будет невозможно использовать для кодинга, в пресс-релизе отмечается, что Fable 5 будет доступна в рамках подписок по 7 июля, и не более чем на половину недельного юзедж лимита. После этой даты Fable будет эксклюзивно Pay To Go за отдельно оплачиваемые токены.
Завтра модель Claude Fable 5 вновь станет доступна по всему миру. После серии конструктивных переговоров с правительством США мы вновь запускаем модель с новым набором классификаторов, которые позволят выявлять и блокировать больше задач, связанных с кибербезопасностью. В ближайшей перспективе выполнение некоторых рутинных задач, таких как программирование и отладка, будет перенесено на модель Opus 4.8. В течение ближайших недель мы продолжим дорабатывать эти классификаторы, чтобы сократить количество ложных срабатываний и лучше различать случаи реального злоупотребления от законных запросов. Мы также приступили к разработке согласованной концепции — совместно с Amazon, Microsoft, Google и другими партнёрами Glasswing — для оценки серьезности случаев «джейлбрейка» ИИ и определения того, как разработчики ИИ должны на них реагировать. Мы приглашаем других партнёров из отрасли и поставщиков моделей присоединиться к нам в этой работе. Наконец, мы расширяем сотрудничество с правительством США в области тестирования моделей и мер безопасности. Это будет включать доступ к моделям и мерам безопасности на этапе до выпуска для оценки, обмен информацией о взломах и злоупотреблениях, а также выделение специальных ресурсов для совместных исследований. Благодарим наших пользователей за терпение, а также наших партнеров из правительства, отрасли и научного сообщества, которые работали вместе с нами, чтобы Fable 5 снова стал доступен.Пресс релиз Оригинальный твит
Минутка домашней конспирологии.
Этой весной случилась забавная ситуация, когда в API Anthropic случайно засветилась модель Claude Sonnet 5 и тут же исчезла.
А буквально через несколько дней анонсировали выход Claude Opus 4.7.
На основании этого случая возникла такая конспирологическая теория, что новые модели Anthropic стали настолько лучше, что компания решила сделать skip level и продавать Sonnet по цене Opus.
Якобы,
Opus превратился в Mythos,
Sonnet превратился в Opus.
И вот я смотрю на графики этого релиза и вижу одну такую очень режущую мне глаз деталь.
А именно: перформанс этой модели сильно размазан по доске и на низких уровнях мышления бывает даже хуже, чем у предыдущей версии - Sonnet 4.6. При этом в целом модель значительно лучше предшественника на большинстве задач.
А не продают ли нам новую Haiku под именем Sonnet 5?
Впрочем, что мы можем с этим поделать, кроме как поворчать. 🫠
У нас случился вторник релизов!
Claude Sonnet 5 — новая рабочая лошадка Anthropic для разработчиков, по способностям где-то лучше, где-то хуже предыдущей версии, в зависимости от уровня мышления.
Nano Banana 2 Lite — самая быстрая и дешёвая модель Gemini для генерации картинок (codename: Gemini 3.1 Flash-Lite Image). По цене становится чуток ниже первой Nano Banana и вдвое дешевле Nano Banana 2, качество при этом приличное. С русским текстом справляется, но даже по демкам видно, что попроще.
Gemini Omni (Preview) — омни-модель Google, генерящая что угодно из чего угодно. Хорошо редактирует готовые видео и чуть слабее в генерации с нуля.
brain — память для AI-агентов
Что делает: запоминает что агент узнал про людей и компании из переписки, а потом отвечает на "что мы вообще про этого клиента знаем", "что изменилось с прошлой недели", "у нас по нему две версии — какая правильная?".
Чем отличается от того что уже есть (Mem0, Zep и прочие):
— Помнит когда что было правдой. Большинство систем кидают текст в вектор-базу и забывают что у фактов есть время. У brain "Алиса была на gold-тарифе до марта, потом ушла на platinum" — это две правильно связанные записи, а не каша где оба факта валяются вперемешку.
— Знает что менялось. Спросил "что мы узнали за неделю" — получил список: новые факты, отменённые, заменённые. Не "вот вектор-поиск по последним записям", а реальный diff с before/after.
— Замечает противоречия. Если из одного источника пришло "клиент активен", а из другого "ушёл" — не выбирает молча, а помечает обе записи как спорные и даёт агенту или человеку разрулить.
— Можно реально забыть. Пришёл GDPR-запрос — стираем человека со всеми его фактами, оставляем только хеш-метку для аудита. У большинства "забыть" значит "найди вектор и удали" — а ссылки на него висят.
Подключается через MCP к чему угодно: Claude Desktop, Cursor, Aider, Goose, Continue, n8n — обвязку писать не надо.
AGPL-3.0, можно поднять у себя или использовать как сервис.
https://github.com/inite-ai/inite-brain-service
Repost from Технологии | Нейросети | Боты
🐸 ByteDance показала Seedance 2.5
Компания анонсировала новую версию видеогенератора вместе с обновлением Seedance 2.0.
Что добавили:
— Генерацию видео до 30 секунд за раз;
— До 50 референсов — изображения, ролики, аудио и другие материалы;
— Вывод в 3K и 4K;
— Редактирование монтажа через текстовые промпты.
Официальный релиз обещают уже в начале июля.
• Источник
@aiaiai
Есть несколько методов компрессии весов LLM, и все для одной цели: ужать модель в памяти GPU и на диске с минимальной потерей качества. Бесплатный сыр, как нам известно из закона сохранения энергии, бывает только в мышеловке, так что без компромиссов не обходится.
Основной подход сейчас это набор методик Post-Training Quantization: у длинного дробного числа веса обрубают хвост, чтобы он занимал меньше места. Компенсируют это хаками, например ищут общий множитель, который декодирует группу весов обратно в оригинал, и сами веса бьют на группы так, чтобы этот множитель точнее восстанавливал исходное по всей группе. Есть гораздо более сложные варианты PTQ, но не мне о них рассказывать.
Чемпион локального квантования это *llama.cpp* и GGUF. Этот формат и рантайм стал известен благодаря тому, что заводит инференс буквально на любом чайнике, от Raspberry Pi до серверных стоек Nvidia.
Но не PTQ единым.
REAP, его представила Cerebras в прошлом году, и вот суть: берём калибровочный датасет, по нему определяем наименее полезных экспертов и просто их выкидываем из весов. Из методологии ясно, что метод работает только с MoE. Модель пересобирается без лишних экспертов, и всё вроде прекрасно.
На практике REAP-чекпойнты частенько выходят серьезно лоботомированными. Вместе с низкорелевантными экспертами уходит часть знаний, что логично, и часто заметно: модель тупеет на всём, кроме калиброванных кейсов, и порой просто ломается. Обидно, потому что метод хороший, обещает заметный выигрыш для локального инференса и не конфликтует с любыми методами квантования.
В начале этого года Samsung предложили очевидное, но своевременное лекарство от лоботомии. Называется REAM: то же самое, что REAP, только мерджинг вместо прунинга. Наименее важных экспертов сливают в одного усреднённого эксперта, в котором остаются знания от всех, кого при REAP бы выкинули. Метод почему-то ещё не разошёлся широко, но по моим вайб-чекам модели на REAM заметно лучше, чем REAP-версии.
Я решил попробовать сам и собрал свою REAM-модель на базе Qwen3.6-35B-A3B. Вышло примерно 24 миллиарда параметров. Обтачивал на агентской калибровке и русскоязычном корпусе, плюс сделал все варианты GGUF-квантов, чтобы запускать локально с полным контекстом на всём спектре консюмерских видеокарт.
Самый большой квант, 8-битный, весит чуть больше 24 ГБ и подойдёт владельцам 5090. Следующий вниз, 6-битный mixed precision, занимает уже 19,5 ГБ, влезет в 4090 и 3090 с запасом под контекст. Дальше вся линейка вплоть до однобитного лежит в репозитории. Мой вайб-чек кванты проходят: пишут код, пишут на русском, не тупеют. Наверняка получится очень неплохая рабочая лошадка для условного локального Hermes Agent.
Скачать модель и кванты можно по ссылкам ниже, буду благодарен за лайки на HF, чтобы поднять видимость.
Модель
GGUF-кванты
REAP, Cerebras
REAM, Samsung
Midjourney Medical
Midjourney, та самая компания с генерацией картинок, показала первое железо: полнотелый ультразвуковой сканер под именем "Ultrasonic CT". Человек ложится в неглубокий бассейн золотого света, за минуту проезжает сквозь кольцо датчиков и получает трёхмерную карту тела "почти в сто раз быстрее, чем МРТ", без рентгена и без магнитов, только ультразвук через воду. Устройство уже есть, прототип Gen-1.
До Midjourney Хольц руководил Leap Motion, так что это знакомый ему домен. Генерация изображений без единого инвестора приносила, по оценкам, под полмиллиарда долларов в год и давала полный контроль, на эти деньги он и построил машину, которую планировал создать с самого начала. _Выходит, люди, генерящие кошкодевочек, оплатили медицинский сканер_.
Платформа погружает человека в воду со скоростью пять сантиметров в секунду сквозь кольцевой массив из тысяч ультразвуковых элементов; каждый работает и динамиком, и микрофоном, посылая импульсы и слушая эхо миллионы раз в секунду. По тому, как форма волн меняется на границах тканей, кластер примерно на два петафлопса восстанавливает срезы тела. Пока это прототип, одно сканирование длится около 20 минут, прошли его примерно дюжина человек, обещанная минута остаётся целью.
Первую точку Midjourney открывает в спа. Флагманский Midjourney Spa примерно на 2300 м² заработает у Юнион-сквер в Сан-Франциско к концу 2027 года: гидромассажные ванны, сауны, холодные купели и около десяти сканеров в комнатах золотого света, а сам скан подаётся как побочный эффект приятного дня. Миллиард сканов в месяц к 2031 году собирается в гигантскую базу снимков тел во времени, и она может оказаться ценнее самого спа. Политику приватности такой библиотеки Midjourney обещает раскрыть ближе к запуску.
Пожелаем ребятам удачи. Ультразвуковая томография без радиации и магнитов, если её удастся сделать дешёвой и быстрой, потенциально может перевернуть медицину. Смущает слишком шелковая рекламная кампания и разрыв между прототипом и целью. Слишком много обещано на старте, который пока выдаёт только карты жира и мышц.
Анонс
Сайт
Галерея сканов
Чек GLM 5.2
У меня в загашнике лежит промпт для vibe-check'a, который мне в начале года написал мой товарищ.
Я его (промпт) с тех пор использую для вайбчекинга новых моделей на их способность написать one-shot более-менее симпатичную игру по слоджной ппецификации.
И этот же промпт я использовал с анонсированной вчера моделью GLM 5.2, но в отличие от других тестов, я решил не останавливаться и попробовать Прощупать границы возможного с этой моделью.
И, вооружившись официальным харнессом Z-Code, я начал проверять, насколько хорошо и уверенно модель держит контекст на длинных дистанциях.
И за два вечера я примерно четыре раза дошел до уровня триггера автосжатия контекста, то есть это было больше, чем 700 тысяч токенов в рамках одного чата, и модель не развалилась.
Выполняла все просьбы, помнила проект и, в принципе, добивалась результата. Иногда приходилось задачу более подробнее разжевывать, чем флагманам, но в целом получилось очень годно.
Итого, за два вечера и большое количество промптов получилось собрать вот такой вот маленький прототип игрушки, в котором я опробовал кучу идей, и GLM с ними справился.
Все в игре сделано моделью, не использовались внешние ассеты. Музыка авторская, от модели.
Поиграть можно тут, Enjoy.
"I'm sorry Dario, but your Mythos is in another castle." CRT, distorted, abberations, retro console gaming platformer 4:3
за авторством VIP-персоны 👑 WaveCut
Плотва любит донаты 💙Евросоюз объявил симметричный ответ на ограничения доступа к Claude Fable:
Теперь доступ к Mistral будет осуществляться строго по паспорту, с 9:00 до 16:00, кроме обеденного перерыва с 13:00 до 14:00.
Для жителей Испании доступ дополнительно закрывается на фиесту с 14:00 до 17:00.
Журналисты спрашивают:
— А если срочно?
— Тогда можно подать форму AI-27B/6 о внеочередном промпте. Рассмотрение занимает до 30 рабочих дней.
Шутка, от которой и смешно и грустно.
Repost from Denis Sexy IT 🤖
Помните DOS игру 1993 года "Поле Чудес"?
В общем, у нее утеряны исходники, о чем рассказал автор игры Вадим Башуров как-то на хабре
Попросил Fable перегнать эту игру в Typescript из бинаря (скомпилированного кода) – и спустя пару часов он вернулся ко мне с переписанными исходниками где вытащены даже спрайты:
https://github.com/DenisSergeevitch/pole-chudes-2
А тут можно поиграть в вебе:
https://shir-man.com/pole-chudes-exe/
Я говорю, Fable/Mythos это лазер, но в мире ПО, просто делает работу – главное чтобы денег хватило, этот проект стоит примерно 100$ в пересчете на API-косты ☕️
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
