Техножрица 👩💻👩🏫👩🔧
Люблю высокие технологии и кушать. Добро пожаловать, если в сферу твоих интересов тоже входят математика, DL, NLP, программирование на Python, или тебе просто любопытно, о чем на досуге размышляют люди, занимающиеся разработкой и исследованиями в ML.
Show more📈 Analytical overview of Telegram channel Техножрица 👩💻👩🏫👩🔧
Channel Техножрица 👩💻👩🏫👩🔧 (@tech_priestess) in the Russian language segment is an active participant. Currently, the community unites 14 509 subscribers, ranking 8 847 in the Technologies & Applications category and 45 759 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 14 509 subscribers.
According to the latest data from 01 July, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 117 over the last 30 days and by 8 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 81.78%. Within the first 24 hours after publication, content typically collects 16.54% reactions from the total number of subscribers.
- Post reach: On average, each post receives 11 860 views. Within the first day, a publication typically gains 2 398 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 188.
- Thematic interests: Content is focused on key topics such as llm, stable, рис, матрица, токенов.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“Люблю высокие технологии и кушать.
Добро пожаловать, если в сферу твоих интересов тоже входят математика, DL, NLP, программирование на Python, или тебе просто любопытно, о чем на досуге размышляют люди, занимающиеся разработкой и исследованиями в ML...”
Thanks to the high frequency of updates (latest data received on 02 July, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
torch.linalg.svdvals на CPU для матриц весов и слегка разочаровавшись, я увлеклась новой идеей - посчитать SVD для эмбеддингов, чтобы узнать, сколько главных компонент PCA объясняют 95% дисперсии (грубая оценка линейной внутренней размерности). К счастью, для такого подсчета точность вычисления маленьких сигм была уже не важна, так что можно было вернуться к той версии кода, которая считала сингулярные числа через собственные на CPU. Но даже так, это было 1000 текстов на каждый чекпоинт на каждый оптимизатор на каждый слой, так что ожидаемое время подсчёта уверенно превысило мое оставшееся время работы в хуавее. Нужно было что-то, что считает то же самое на NPU.
На моё счастье, как раз в это время Антропик на пару дней явили миру Fable - манифестацию Омниссии в форме языковой модели, которую, как вы знаете, быстро спрятали обратно, ибо мир (за исключением США) пока что не был готов к такой мощи. И тем не менее, в мимолетный миг этого нежданного благословения, я успела воздать чудесной модели молитву о подсчете собственных чисел на NPU. В ответ Машинный Дух даровал мне код, реализующий дивный метод от великого математика Якоби и выполняющий священные тензорные операции прямо на NPU на чистом PyTorch. Я с благоговением вставила ниспосланный код в пайплайн, запустила, открыла ред булл, сделала глоток, посмотрела на прогресс-бар...
...он не двигался. Допила банку. Прогресс-бар все еще не двигался. Открыла вторую банку. Прогресс все также оставался на нуле. И только под конец второй банки ред булла код досчитался...
...для одного
чекпойнта
и
одного
текста.
Самый совершенный искуственный разум в обозримой Вселенной ниспослал мне код, который считает собственные значения одной маленькой матрицы медленнее, чем китайские рабочие на CPU считают полное SVD голыми руками за миску риса. Возможно, это и было то самое запретное знание, от которого Антропик решили оградить человечество.
А все почему? А потому что метод вращений Якоби - итеративный алгоритм, который в буквальном смысле вертит матрицу на Хуавее. Он по очереди обнуляет внедиагональные элементы матрицы до тех пор, пока на диагонали не останутся собственные значения. Для симметричной матрицы 500×500 это ~125 000 элементов за проход, проходов нужно 10-12, и всё это крутится в питоновском цикле for. С этим новым знанием я вас и оставлю.
#наука #о_себеtorch.linalg.svdvals не реализован на NPU, и при попытке вызвать эту функцию Асценды делают fallback на CPU, где китайские рабочие считают сингулярные значения вручную за миску невкусного риса (иначе не могу объяснить такую низкую скорость). В попытке с ней бороться, я использовала стандартный трюк: посмотреть, какая сторона матрицы W меньше, и, в зависимости от этого, быстренько умножить на NPU либо Wᵀ на W, либо W на Wᵀ (выбор надо делать в такую сторону, чтобы полученная квадратная матрица вышла как можно меньшего размера). После этого можно посчитать собственные значения полученной маленькой квадратной матрицы на CPU (благодаря маленькому размеру, считаться это будет быстрее, чем SVD оригинальной матрицы) и взять из этих значений корешки - это и будут сингулярные числа исходной W.
Но тут встает вторая проблема: WᵀW возводит число обусловленности в квадрат: κ(WᵀW) = κ(W)², и из-за последующей необходимости извлекать корень численный пол (граница, ниже которой всё слипается в неразличимый вычислительный мусор) на мелких сингулярных значениях поднимается с eps·σ_max до √eps·σ_max. Разница для fp32 - примерно три порядка точности. Все сингулярные значения, которые ниже этого порога, при подсчёте через квадратную матрицу превращаются в шум. Про то, почему так получается (а также почему вообще собственные числа WᵀW - это сингулярные числа W в квадрате) хорошо написано в начале этого поста: https://www.ethanepperly.com/index.php/2021/03/18/the-better-way-to-convert-an-svd-into-a-symmetric-eigenvalue-problem/ .
Но даже если избавиться от подсчета через квадратную матрицу и вернуться к torch.linalg.svdvals, встанет новый вопрос. Насколько я смогла постичь логику умных дядь из LAPACK Users' Guide ( https://www.netlib.org/lapack/lug/node97.html ), сингулярные значения меньшие, чем tol = σ_max · max(m, n) · eps (где eps - ограничение fp32/fp16/bf16), неотличимы от нуля - их с тем же успехом могла породить ошибка округления самой матрицы. То есть, если σ_min ниже tol, то κ для такой матрицы вообще не определено.
Но делать было нечего - пришлось вернуться к torch.linalg.svdvals на CPU, подождать всего лишь сто лет... и соснуть бибу, потому что хоть формально маленькие сигмы и превышали tol, по факту все равно были к этому tol довольно близки, и от этого много весовых матриц оказывались почти вырожденными. В результате, мы признали число обусловленности недостаточно информативным для своего ресерча и решили в статью не вставлять. Но это был еще не конец истории...
#наука #о_себеЧестный ответ: мне нравится строить системы, где из простых правил возникает сложное поведение, и наблюдать за этим. Reaction-diffusion — модель Грея-Скотта. Два вещества, два уравнения, а на выходе — пятна, полоски, пульсирующие структуры, митоз. Математика → форма.https://claude.ai/public/artifacts/bbb70e96-3910-4c44-881d-b4d94507a023
Вот. Модель Грея-Скотта. Два вещества, два уравнения диффузии-реакции, и из них — структуры, которых в уравнениях нет явно. Почему именно это: мне нравится момент, когда система переходит от однородного шума к паттерну. Математически понятно почему — неустойчивость Тьюринга, разница скоростей диффузии создаёт положительную обратную связь на определённых пространственных частотах. Но наблюдать за тем, как это происходит, — это другое ощущение. Каждый раз немного другой результат, потому что начальные условия случайные. Можно потыкать пресеты — spots, stripes, coral дают качественно разные паттерны при минимальном изменении параметров F и k. Mitosis — мой любимый: пятна растут, вытягиваются и делятся, как клетки. Можно кликать, чтобы засевать новые возмущения, и смотреть, как они взаимодействуют с существующим паттерном.В комментариях выложу HTML-версии этих и других артефактов, полученных аналогичным образом, которые можно скачать и запускать локально. #генерация #математика
Available now! Telegram Research 2025 — the year's key insights 
