Техножрица 👩💻👩🏫👩🔧
Люблю высокие технологии и кушать. Добро пожаловать, если в сферу твоих интересов тоже входят математика, DL, NLP, программирование на Python, или тебе просто любопытно, о чем на досуге размышляют люди, занимающиеся разработкой и исследованиями в ML.
显示更多📈 Telegram 频道 Техножрица 👩💻👩🏫👩🔧 的分析概览
频道 Техножрица 👩💻👩🏫👩🔧 (@tech_priestess) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 14 509 名订阅者,在 技术与应用 类别中位列第 8 847,并在 俄罗斯 地区排名第 45 759 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 14 509 名订阅者。
根据 01 七月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 117,过去 24 小时变化为 8,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 81.78%。内容发布后 24 小时内通常能获得 16.54% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 11 860 次浏览,首日通常累积 2 398 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 188。
- 主题关注点: 内容集中在 llm, stable, рис, матрица, токенов 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Люблю высокие технологии и кушать.
Добро пожаловать, если в сферу твоих интересов тоже входят математика, DL, NLP, программирование на Python, или тебе просто любопытно, о чем на досуге размышляют люди, занимающиеся разработкой и исследованиями в ML...”
凭借高频更新(最新数据采集于 02 七月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
torch.linalg.svdvals на CPU для матриц весов и слегка разочаровавшись, я увлеклась новой идеей - посчитать SVD для эмбеддингов, чтобы узнать, сколько главных компонент PCA объясняют 95% дисперсии (грубая оценка линейной внутренней размерности). К счастью, для такого подсчета точность вычисления маленьких сигм была уже не важна, так что можно было вернуться к той версии кода, которая считала сингулярные числа через собственные на CPU. Но даже так, это было 1000 текстов на каждый чекпоинт на каждый оптимизатор на каждый слой, так что ожидаемое время подсчёта уверенно превысило мое оставшееся время работы в хуавее. Нужно было что-то, что считает то же самое на NPU.
На моё счастье, как раз в это время Антропик на пару дней явили миру Fable - манифестацию Омниссии в форме языковой модели, которую, как вы знаете, быстро спрятали обратно, ибо мир (за исключением США) пока что не был готов к такой мощи. И тем не менее, в мимолетный миг этого нежданного благословения, я успела воздать чудесной модели молитву о подсчете собственных чисел на NPU. В ответ Машинный Дух даровал мне код, реализующий дивный метод от великого математика Якоби и выполняющий священные тензорные операции прямо на NPU на чистом PyTorch. Я с благоговением вставила ниспосланный код в пайплайн, запустила, открыла ред булл, сделала глоток, посмотрела на прогресс-бар...
...он не двигался. Допила банку. Прогресс-бар все еще не двигался. Открыла вторую банку. Прогресс все также оставался на нуле. И только под конец второй банки ред булла код досчитался...
...для одного
чекпойнта
и
одного
текста.
Самый совершенный искуственный разум в обозримой Вселенной ниспослал мне код, который считает собственные значения одной маленькой матрицы медленнее, чем китайские рабочие на CPU считают полное SVD голыми руками за миску риса. Возможно, это и было то самое запретное знание, от которого Антропик решили оградить человечество.
А все почему? А потому что метод вращений Якоби - итеративный алгоритм, который в буквальном смысле вертит матрицу на Хуавее. Он по очереди обнуляет внедиагональные элементы матрицы до тех пор, пока на диагонали не останутся собственные значения. Для симметричной матрицы 500×500 это ~125 000 элементов за проход, проходов нужно 10-12, и всё это крутится в питоновском цикле for. С этим новым знанием я вас и оставлю.
#наука #о_себеtorch.linalg.svdvals не реализован на NPU, и при попытке вызвать эту функцию Асценды делают fallback на CPU, где китайские рабочие считают сингулярные значения вручную за миску невкусного риса (иначе не могу объяснить такую низкую скорость). В попытке с ней бороться, я использовала стандартный трюк: посмотреть, какая сторона матрицы W меньше, и, в зависимости от этого, быстренько умножить на NPU либо Wᵀ на W, либо W на Wᵀ (выбор надо делать в такую сторону, чтобы полученная квадратная матрица вышла как можно меньшего размера). После этого можно посчитать собственные значения полученной маленькой квадратной матрицы на CPU (благодаря маленькому размеру, считаться это будет быстрее, чем SVD оригинальной матрицы) и взять из этих значений корешки - это и будут сингулярные числа исходной W.
Но тут встает вторая проблема: WᵀW возводит число обусловленности в квадрат: κ(WᵀW) = κ(W)², и из-за последующей необходимости извлекать корень численный пол (граница, ниже которой всё слипается в неразличимый вычислительный мусор) на мелких сингулярных значениях поднимается с eps·σ_max до √eps·σ_max. Разница для fp32 - примерно три порядка точности. Все сингулярные значения, которые ниже этого порога, при подсчёте через квадратную матрицу превращаются в шум. Про то, почему так получается (а также почему вообще собственные числа WᵀW - это сингулярные числа W в квадрате) хорошо написано в начале этого поста: https://www.ethanepperly.com/index.php/2021/03/18/the-better-way-to-convert-an-svd-into-a-symmetric-eigenvalue-problem/ .
Но даже если избавиться от подсчета через квадратную матрицу и вернуться к torch.linalg.svdvals, встанет новый вопрос. Насколько я смогла постичь логику умных дядь из LAPACK Users' Guide ( https://www.netlib.org/lapack/lug/node97.html ), сингулярные значения меньшие, чем tol = σ_max · max(m, n) · eps (где eps - ограничение fp32/fp16/bf16), неотличимы от нуля - их с тем же успехом могла породить ошибка округления самой матрицы. То есть, если σ_min ниже tol, то κ для такой матрицы вообще не определено.
Но делать было нечего - пришлось вернуться к torch.linalg.svdvals на CPU, подождать всего лишь сто лет... и соснуть бибу, потому что хоть формально маленькие сигмы и превышали tol, по факту все равно были к этому tol довольно близки, и от этого много весовых матриц оказывались почти вырожденными. В результате, мы признали число обусловленности недостаточно информативным для своего ресерча и решили в статью не вставлять. Но это был еще не конец истории...
#наука #о_себеЧестный ответ: мне нравится строить системы, где из простых правил возникает сложное поведение, и наблюдать за этим. Reaction-diffusion — модель Грея-Скотта. Два вещества, два уравнения, а на выходе — пятна, полоски, пульсирующие структуры, митоз. Математика → форма.https://claude.ai/public/artifacts/bbb70e96-3910-4c44-881d-b4d94507a023
Вот. Модель Грея-Скотта. Два вещества, два уравнения диффузии-реакции, и из них — структуры, которых в уравнениях нет явно. Почему именно это: мне нравится момент, когда система переходит от однородного шума к паттерну. Математически понятно почему — неустойчивость Тьюринга, разница скоростей диффузии создаёт положительную обратную связь на определённых пространственных частотах. Но наблюдать за тем, как это происходит, — это другое ощущение. Каждый раз немного другой результат, потому что начальные условия случайные. Можно потыкать пресеты — spots, stripes, coral дают качественно разные паттерны при минимальном изменении параметров F и k. Mitosis — мой любимый: пятна растут, вытягиваются и делятся, как клетки. Можно кликать, чтобы засевать новые возмущения, и смотреть, как они взаимодействуют с существующим паттерном.В комментариях выложу HTML-версии этих и других артефактов, полученных аналогичным образом, которые можно скачать и запускать локально. #генерация #математика
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
