Осцилляции WaveCut

رفتن به کانال در Telegram

نمایش بیشتر

کشور مشخص نشده استدسته بندی مشخص نشده است

953

مشترکین

+124 ساعت

+47 روز

+1930 روز

641

نمایش های پست

~ 31224 ساعت

~ 36348 ساعت

67.26%

نرخ مشارکت

~ 1

پست های در روز

Ads index

beta

در حال بارگیری داده...

کانال‌های مشابه

هیچ داده‌ای

مشکلی وجود دارد؟ لطفاً صفحه را تازه کنید یا با مدیر پشتیبانی ما تماس بگیرید.

ابر برچسب‌ها

هیچ داده‌ای

مشکلی وجود دارد؟ لطفاً صفحه را تازه کنید یا با مدیر پشتیبانی ما تماس بگیرید.

اشارات ورودی و خروجی

---

جذب مشترکین

ژوئیه '26

+33

در 4 کانال‌ها

ژوئن '26

+40

در 3 کانال‌ها

Get PRO

مه '26

+108

در 9 کانال‌ها

Get PRO

آوریل '26

+677

در 4 کانال‌ها

Get PRO

مارس '260

در 7 کانال‌ها

Get PRO

فوریه '26

در 38 کانال‌ها

Get PRO

ژانویه '260

در 0 کانال‌ها

Get PRO

دسامبر '25

+25

در 0 کانال‌ها

Get PRO

نوامبر '250

در 0 کانال‌ها

Get PRO

اکتبر '250

در 1 کانال‌ها

Get PRO

سپتامبر '25

+127

در 0 کانال‌ها

تاریخ	رشد مشترکین	اشارات	کانال‌ها
25 ژوئیه	0
24 ژوئیه	+1
23 ژوئیه	+2
22 ژوئیه	+1
21 ژوئیه	0
20 ژوئیه	+1
19 ژوئیه	+2
18 ژوئیه	0
17 ژوئیه	+1
16 ژوئیه	+7
15 ژوئیه	0
14 ژوئیه	+3
13 ژوئیه	0
12 ژوئیه	+5
11 ژوئیه	0
10 ژوئیه	+1
09 ژوئیه	0
08 ژوئیه	+2
07 ژوئیه	+2
06 ژوئیه	0
05 ژوئیه	0
04 ژوئیه	+2
03 ژوئیه	0
02 ژوئیه	0
01 ژوئیه	+3

پست‌های کانال

2	بدون متن...	702
3	4️⃣0️⃣🥳	667
4	پیام ویدیو	623
5	بدون متن...	654
6	بدون متن...	811
7	Извините меня за это непопулярное мнение, но, мне кажется, что это эталонный пример того, как абсолютно бездарно и впустую просрать кучу ресурсов и времени ради абсолютно бесполезной херни. Tongyi Lab сделали Wan-Dancer — модель с танцульками для Тиктоков.	490
8	2 июля 2026 года на arXiv появилась работа OrbitQuant: Data-Agnostic Quantization for Image and Video Diffusion Transformers. Я не настоящий machine learning специалист, поэтому вдаваться в детали математики не буду. По моему скромному разумению, это очередной подход из недавней волны работ по квантованию с помощью метода ротации весов, которую мы видели после хайпа о DeepMind TurboQuant. Суть этого метода в том, что помимо уменьшения битности, группы весов ротируются ортогонально до такой конфигурации, в которой квантование дает наименьшую ошибку округления. В этом конкретном случае нормализованные данные переводятся в повёрнутую базу и квантуются фиксированным Lloyd–Max codebook. Выгода метода в том, что один метод подходит для всего подряд и не нужна предварительная калибровка. Папира привлекла моё внимание хорошими результатами на низких битностях. Всё так хорошо складывается. В чём же может быть подвох? Авторы не выложили код. 🎉 И я подумал: почему бы не попытаться реализовать папиру самостоятельно? У меня нет такого опыта, но я периодически читаю о таких историях успеха. Сказано — сделано. Целями я выбрал соответствие методологии оригинальной работы и практический ориентир в виде SDNQ от Disty0 из экосистемы SD.Next (vladmandic). SDNQ — взрослый фреймворк: много форматов, динамическое/статическое квантование, SVD, quantized matmul, training и quantized optimizers. Моя реализация менее крутая, но мне нужен базовый минимум: экономное и производительное квантование transformer-based моделей для изображений и видео. С наскока на GPT-5.5 у меня этого не получилось. Два дня мы писали CUDA кенелы: они кое-как работали, но до производительной реализации было далеко. Потом OpenAI подкинули подарочек в виде GPT-5.6. Примерно за шесть часов она переделала CUDA-путь так, что мы практически догнали SDNQ в его самом экономном варианте (static UINT4). Но этого мне показалось мало. Я подключил Anthropic Fable 5, который дополировал ещё один набор экспериментов. В итоге на одном FLUX.2 [klein] 9B, одной RTX PRO 6000 и одинаковой генерации 1024×1024 OrbitQuant W4A4 показал: • 10,839 GB весов против 12,181 GB у SDNQ: на 11% меньше; • 14,17 GB peak VRAM против 15,42 GB: на 1,25 GB меньше; • загрузку 1,95 с против 3,02 с; • hot median 1,164 с против 1,273 с: на 8,6% быстрее. Даже на 3,2% быстрее исходного BF16. Сравнивались полные пайплайны; в обоих квантах сжаты трансформер и текстовый энкодер. SDNQ использует static UINT4 weights с BF16 activations, OrbitQuant — W4A4. Я очень доволен результатом и в ближайшее время переведу набор моделей, который используется в Плотве, на свою реализацию этой папиры. Кроме кернелов, получилось реализовать нормальный стриминг весов для онлайн-квантования без загрузки полной BF16-модели в память, компактные safetensors-артефакты, Transformers/Diffusers и PyTorch API, CPU offload и всякое еще. Рецепты: W4A4, W3A3, W2A4, W2A3 и W4A6; поддерживаются 2-, 3-, 4-, 6- и 8-битные weights и activations. На Hugging Face я загрузил FLUX.1-schnell, Z-Image-Turbo и Wan 2.1 из выбранного набора paper, а ещё трансформер от FLUX.2 [klein] 4B и полностью квантованный FLUX.2 [klein] 9B, где сжаты и трансформер и текстовый энкодер. (Да, LLM этим методом тоже можно квантовать) Для желающих посмотреть глазами сделал матрицу из десяти сложных промптов, которая показывает детализированные изображения, сложную композицию, мелкую типографику и мультиязычность на оригинальной, SDNQ и OrbitQuant моделях. Есть и ComfyUI-нода, но честно, я не знаю, насколько она рабочая. CUDA, Metal/MPS и CPU kernels реализованы и проверены. Лимитейшен: готовые бинари для всех сочетаний PyTorch, CUDA, ОС и архитектуры пока не публикуются. Самый быстрый native kernel нужно билдить на целевой машине. Vulkan экспериментально проверен на одном AMD Cezanne/RADV под Linux. ROCm и Intel XPU имеют экспериментальные реализации, нНо у меня нет доступа к ускорителям AMD и Intel, поэтому я не могу сказать, что они стабильны. Это WIP. Если у вас есть AMD ROCm или Intel GPU, буду рад помощи с аппаратной проверкой кернелов. GitHub	550
9	+1 К - конкуренция! Объявляются несколько дней бонусного прожига токенов.	469
10	+3 Meta выкатила Muse Spark 1.1 — сlosed-source, API-only реинкарнация LLaMA, reasoning-модель, заточенная под агентные воркфлоу, кодинг и computer-use. Модель уже в паблик-превью через Meta Model API и в режиме Thinking внутри Meta AI. Позиционируется как прямой конкурент frontier-агентам, задешево. Главные фичи: - Контекст 1M токенов с селф-менеджментом: Модель умеет сама компактить контекст и делать ретрив нужных данных из начала долгой таски. (Не знаю, как это работает, но, видимо, у меты есть какой-то вариант стейтфул чатов, а-ля Responses API) - Нативная агентность: Нормальный zero-shot по MCP-серверам, батчинг UI-действий и встроенная поддержка мультиагентности (главный агент + сабагенты). - Связка Vision + Code: Фокус на сложных багфиксах и крупных кодовых базах. Может написать веб-UI, сама его отскриншотить, найти визуальные баги, сматчить их с нужным файлом и выкатить фикс. - Perception & Action: Заточена на действия в браузере. Пример: скармливаешь видео товара с телефона — агент сам выдирает лучшие кадры, понимает суть и заполняет листинг на маркетплейсе. - Security 💩: Повышенная устойчивость к prompt injection, джейлбрейкам и снижение «поддакивания» (sycophancy). 💰 Прайсинг (API): Input: ~$1.25 / 1M токенов Output: ~$4.25 / 1M токенов Получается, что-то на уровне Grok 4.5, но еще дешевле! Пресс-релиз	894
11	+9 Meta запустила Muse Image — первую image-gen модель от Meta Superintelligence Labs, которая теперь стоит за визуалкой в Meta AI. Это не просто ещё одна генеративка: модель заточена под реальное использование внутри экосистемы Meta, чтобы быстро выдавать картинки для сторис, постов, чатов и даже рекламы, без мучительного подбора промптов. Muse Image уже крутится в Meta AI, а под капотом многих новых фич в Instagram и WhatsApp — это именно она. Главный прикол — в связке с Muse Spark и "reasoning before rendering". Модель сначала разбирает смысл промпта, планирует композицию, может подмешивать несколько референсов, тянуть свежий контекст из веба и только потом рисует. Отсюда вещи, которые у многих конкурентов до сих пор боль: в Muse Image текст в картинке рендерится читабельно, инфографика и приглашения выглядят как готовый макет, а не как месиво из 2022. Плюс она умеет аккуратно склеивать несколько фото (селфи + фон, питомец + картина, комната + 3D-редизайн) без ощущения коллажа из трёх разных моделей. Как обычно — тесная интеграция с экосистемой Meta на всех уровнях, но мне это не особо интересно, например. Никакого опенсорса, конечно же, в духе обновленной политики Meta.	708
12	MiMo-V2.5 — еще один пример того, что "цена токена" почти ничего не говорит о реальной себестоимости инференса. Из статьи видно, что Xiaomi выжимает из железа и архитектуры кратные выигрыши: гибридный Sliding Window Attention режет KVCache и вычисления примерно до 1/7 от full attention, MoE снижает per-token compute, агрессивная работа с кэшем (L1/L2/L3, GCache, affinity-routing) дает 90%+ hit-rate, а сетевые и NUMA-оптимизации просто убирают "воздух" из пайплайна. А еще там — MTP, bucketing по длинам, мультимодальный энкодер с кросс-батчингом и GPU-препроцессингом. Мой тейк: мы не знаем реальной внутренней цены инференса у провайдеров. Считать экономию и экономику инференс провайдеров по официальному прайсу — это бессмысленный пересчет попугаев. Модель может работать в 2–5 раз дешевле за счет инженерии и архитектуры, но внешняя "цена токена" этого не отражает. Делать из этих попугаев выводы в духе "этот провайдер точно субсидирует, а тот нет" — методологическая ошибка. Вы ничего не знаете, но делаете далеко идущие выводы из маркетинговой цены. MiMo-V2.5, как и кейсы DeepSeek, показывает важную вещь: если серьезно заниматься архитектурой (Hybrid SWA, MoE, длинный контекст) и всей цепочкой инференса — от KVCache-двухпула и SWA-осознанного префетча до length bucketing, EP-/PP-конфигураций и мультимодального кэша, — можно радикально удешевить инференс по сравнению с тем, что нам продают сейчас. При этом конечный API-прайс — это уцена с учетом многократной маржи и хедрума. Отсюда вывод. Споры про "настоящую" цену токена и про то, кто кого скрыто субсидирует, опираясь только на публичные тарифы, вредны. Они создают ложную уверенность, что вы понимаете экономику чужого стека. Используйте критическое мышление и не доверяйте статьям так называемых экспертов. MiMo blog	529
13	+3 Проблема "doom loops" у reasoning‑моделей: при сложных задачах (математика, код) модель застревает в повторении одного и того же фрагмента текста ("Wait, let me reconsider…" и т.п.) до конца контекстного окна. Это связано с переобученными «удобными» токенами вроде "the", "So", "Alternatively", усиливающим эффектом контекста (каждый повтор ещё больше повышает вероятность повторяющихся токенов) и почти жадной выборкой при низких температурах. Liquid предлагает метод Antidoom на базе Final Token Preference Optimization (FTPO). Они автоматически собирают примеры лупов на специальной смеси промптов, детектируют участок, который повторяется хотя бы 4 раза, и целятся ровно в первый токен первого повтора. Для этой позиции берут топ‑k альтернативы модели, фильтруют шум, формируют пары «rejected токен» (виновник лупа) и несколько «chosen токенов» (разумные альтернативы) и обучают модель только на этом последнем токене в последовательности, с аккуратной регуляризацией в логит‑пространстве, чтобы не испортить остальное распределение. Обучение через LoRA с довольно высокими рангами (128–256), на всех attention/MLP‑проекциях и ‎⁠lm_head⁠, с маленьким learning rate и жёстким ранним остановом по метрике chosen_win, чтобы не "пересушить" модель и не создать новые лупы. На раннем чекпоинте LFM2.5‑2.6B доля лупящихся ответов упала с 10.2% до 1.4%, на Qwen3.5‑4B — с 22.9% до 1%. При этом метрики на задачах растут именно за счёт того, что модель перестаёт сама себя ломать повторами и доходит до правильных ответов, которые уже умела выдавать. Интересный побочный результат: после подавления лупов становится видно, что высокие температуры (около 1.0) реально портят качество, а оптимум для таких моделей — около жадной выборки. Также авторы отмечают, что полезны несколько раундов Antidoom: первый раунд убирает "главных виновников", после чего всплывают новые, менее частые триггеры лупов, которые можно добить следующей итерацией FTPO. Весь пайплайн (генерация, детекция, тренер FTPO) выложен в репозиторий Antidoom. Пост Репо	725
14	بدون متن...	1
15	Пу-пу-пу: Китай хочет закрыть свои лучшие ИИ-модели от внешнего мира 😬 Reuters пишет, что власти Пекина обсуждают ограничения на экспорт своих самых продвинутых моделей — в том числе тех, которые еще даже не вышли. На встрече по этому вопросу были все главные китайские ИИ-компании: Alibaba, ByteDance и Z.ai. Что будет с опенсорсными моделями, на которых держатся 80% американских ИИ-стартапов (и не только) — неизвестно. Кажется, ИИ-война набирает обороты 😨 @xor_journal	431
16	В последнее время по чатам и Твиттеру гуляет тема, что китайские посредники нашли дешёвый доступ к флагманам и продают Opus и Claude Code за 1–10% официальной цены, а окупают это субсидиями и продажей ваших промптов. Это все — развод. Дешёвого доступа у них нет. Вам продают дешёвый ширпотреб под этикеткой флагмана, а разницу кладут себе в карман. На сегодня нету возможности купить Opus дешевле, чем рыночная цена (если только вы не Cursor из 2024 года и имеете индивидуальные условия контракта). Соответственно, дешёвого Opus'а по скидкам для малоимущих просто не существует. Когда вы только получаете доступ на несколько первых запросов или некоторое время вам отвечает настоящая дорогая модель, чтобы пройти ваш smoke-тест, а дальше в бэкенд тихо подставляют копеечную опенсорсную модель или что-то с опенроутера. Иногда там есть семантический роутер. Простые запросы уходят на дешёвый канал, контрольные иногда прогоняют через настоящий Opus. Спрашивать "какая ты модель" наивно: релей модифицирует системный промпт в духе "отвечай, что ты Claude Opus", и она честно играет роль. Появились даже отдельные верификаторы вроде Veridrop. Академический аудит теневых API (arXiv, Real Money Fake Models) на части эндпойнтов нашёл до 45% проваленных проверок подлинности и просадку качества почти вдвое. Многие люди недооценивают количество информации, проходящей через агентский харнесс. То, что мы видим в чате, это сильно сокращенная версия того, что ходит в API. Туда полетит весь контекст, необходимый для работы агента, включая ваши исходники и персональные данные, память агента, и он не будет сильно разбираться, попали туда ваши .env ключи или нет. А если попали, считайте, утекли, потому что прокси есть прокси, это MITM. Если вы любите рисковать, ротировать ключи и вообще не хватает острых ощущений по жизни, то, пожалуйста, берите такие выгодные предложения и пользуйтесь. Но моя откровенная рекомендация — не ведитесь на бесплатный сыр. Можно заплатить гораздо больше в итоге. Аудит теневых API	1 022
17	Стартап Biotic собрал SpudCell (или попросту Крошка-Картошка, хехе) — искусственную клетку из готовых, заранее известных деталей: жировой пузырёк-мембрана, геном на ~90 тысяч пар оснований из нескольких плазмид, плюс очищенный набор для синтеза белка из кишечной палочки (рибосомы, ферменты, тРНК). Эта клетка ест, растёт, копирует свою ДНК, делится и в опыте вытесняет более слабый вариант себя. Ест она через слияние с мелкими пузырьками-кормушками, которые заносят внутрь липиды, рибосомы и мелкие молекулы. ДНК копирует полимераза Phi29. Делится с костылями — в долгих опытах клетку продавливают через мембранный фильтр, хотя зашитое в геном деление тоже показали. Отбор в каком-то виде тоже есть: вариант с сильным промотором α-гемолизина лучше питался, быстрее рос и выдавливал слабого. Прикол в том, что клетку собрали снизу вверх из понятных частей с известным составом. Обычно минимальные клетки делают наоборот: берут живую бактерию и вырезают лишнее, и там остаются гены с непонятной функцией. Отдельные куски — синтез белка в пузырьке, рост мембраны, копирование ДНК — показывали и раньше. Челленджем была сборка всего в один рабочий цикл, и вот её победили. Джек Шостак, нобелевский лауреат, говорит, что другой такой системы, зашедшей так далеко, он не знает. Нельзя сказать, что это живой организм. Рибосомы клетка сама не делает, их подкармливают снаружи, обмена веществ нет, энергию сама не производит. После пяти поколений полный набор ключевых плазмид оставался у трети потомков. Мутацию для отбора вносят руками, так что настоящей эволюции тут нет. Все детали взяты из существующей биологии, и к вопросу о зарождении жизни это отношения не имеет. Плюс это препринт без рецензии, а подачу критикуют: сначала пресса под эмбарго, оценка пирами не проводилась. Также смущает тот факт, что, называя проект открытым, авторы в препринте раскрывают, что уже подали патентную заявку. Без лабораторной подкормки эта клетка нежизнеспособна, так что биориск близок к нулю. Вопросы появятся, если такие системы станут автономными. Дальше из этого может вырасти стандартная клетка-платформа для биопроизводства: лекарства, материалы, необычная химия. Вывод: Сотворение жизни пока не достигли, но впервые собрали рабочий черновик клеточного цикла из понятного конструктора. Это важное достижение, потому что именно сборку долго не могли осилить. Имеет огромный потенциал для будущей фармы и биотеха. Пресс-релиз	515
18	The state of tech jobs market 2026	513
19	TL;DR: Пострижем баранов и вернем в план, когда шерсть перестанет расти. Будет смешно и интересно, если GPT 5.6 Sol откроют для всех до 7 июля.	542
20	Влог о разработке прототипа сканера Midjourney	612

مشاهده همه پست‌ها