Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Show more📈 Analytical overview of Telegram channel Machinelearning
Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 297 888 subscribers, ranking 323 in the Technologies & Applications category and 1 258 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 297 888 subscribers.
According to the latest data from 12 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -7 173 over the last 30 days and by -216 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 7.91%. Within the first 24 hours after publication, content typically collects 5.86% reactions from the total number of subscribers.
- Post reach: On average, each post receives 23 559 views. Within the first day, a publication typically gains 17 463 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 181.
- Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
Thanks to the high frequency of updates (latest data received on 13 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти. Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие.🟡TurboQuant - двухэтапный пайплайн. Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны. На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score. Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных". Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral.
При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация.
Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами.Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет. 🟡Статья 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #TurboQuant #Google
pip install litellm` могла привести к утечке:
SSH-ключей, учётных данных AWS/GCP/Azure, Kubernetes-конфигов, git-доступов, всех API-ключей из переменных окружения, истории команд, SSL-ключей, CI/CD-секретов и паролей к базам данных.
И это не нишевая библиотека, у LiteLLM около 97 млн скачиваний в месяц.
Даже без прямой установки litellm вредоносный код мог попасть к пользователям через другие пакеты (например, `dspy`).
Скомпрометированную версию пакета обнаружили случайно: при установке пакета у разработчика произошёл сбой из-за утечки памяти.
Без этого сбоя атака могла оставаться незамеченной долгое время .
Supply chain атаки становятся одним из самых серьёзных рисков в современной разработке.
Подход «использовать как можно больше готовых библиотек» требует некоторого переосмысления.
Andrej Karpathy: https://x.com/karpathy/status/2036488892443140551
1. Первичный разбор (issue на GitHub): https://github.com/BerriAI/litellm/issues/24512
- подробное техническое описание вредоносного кода: что именно крадёт и как работает
2. Официальный issue от BerriAI: https://github.com/BerriAI/litellm/issues/24518
— реакция команды и обновления по ситуации
3. Блог FutureSearch (обнаружили атаку): https://futuresearch.ai/blog/litellm-pypi-supply-chain-attack/
• как баг с fork bomb в вредоносном коде уронил машину и помог выявить атаку
4. Полный таймлайн TeamPCP от ramimac: https://ramimac.me/teampcp/
— вся цепочка атаки: Trivy → Checkmarx → litellm, с точными временными метками и IOC
5. Тред на Hacker News (основной): https://news.ycombinator.com/item?id=47501729
- обсуждение в реальном времени, включая ответы от Krrish (maintainer litellm)
6. Разбор от GitGuardian:
https://blog.gitguardian.com/trivys-march-supply-chain-attack-shows-where-secret-exposure-hurts-most/
- анализ того, как утечка CI/CD-секретов запустила всю цепочку атаки
@ai_machinelearning_big_data
#llm #ml #cybersecurityКод проекта под Apache 2.0, большинство моделей под NVIDIA Open Model License. Вариант SMPL-X имеет более ограниченную NVIDIA R&D Model License, она допускает только исследовательское применение.🟡Набор моделей 🟡Техотчет 🖥Github @ai_machinelearning_big_data #AI #ML #Robotics #Kimodo #NVIDIA
Работает это так: фермер открывает приложение, рисует линию на карте, которая становится забором. Когда корова приближается к границе, ошейник вибрирует. Через 10 дней животное перестает проверять границу. Нужно перегнать стадо - одно нажатие, и сотни голов идут куда нужно сами. Без собак, без ограждений, без ручного труда.Основал Halter в 2016 году Крейг Пигготт. Он вырос на молочной ферме в Уайкато, окончил инженерный факультет Оклендского университета и в последний год учебы устроился в Rocket Lab. Проработав 9 месяцев у Питера Бека, Пигготт решил уйти, а Бек не просто отпустил его, но и сам вложился в Halter, войдя в совет директоров. Сегодня у компании около 350 сотрудников, а системамы Halter управляют более 700 тыс. голов скота. Американские фермеры сэкономили порядка $220 млн только на физических заборах. Бизнес-модель: подписка: от $5 до $8 за животное в месяц. 🟡Сделка хайпует не только в венчурном мире. Тиль - сооснователь Palantir, компании, которая строит системы анализа данных и слежки для спецслужб и военных. Эта связь моментально породила конспирологическую волну в соцсетях. Блогеры предлагают мысленный эксперимент: убрать из описания технологии Halter слово «корова» и заменить на «человек» - получается круглосуточный GPS-трекинг, мониторинг поведения, невидимые границы и управление через вибрации.
Тезис теории в том, что Тиль якобы обкатывает на скоте технологии, которые потом перенесет на людей, но фактических подтверждений этому нет. Прямого технологического партнерства между Palantir и Halter отсутствует. Единственная реальная связь двух компаний - это кошелек Тиля.Контекст важен и без конспирологии: агротех переживает тяжёлые времена, волна стартапов обанкротилась, венчурные фонды отступили от сектора. На этом фоне Halter — редкий единорог, растущий вопреки тренду. Глава Icehouse Ventures подсчитал: при нынешних темпах Halter обгонит по стоимости Fonterra (крупнейший молочный кооператив Новой Зеландии) через 11 кварталов. @ai_machinelearning_big_data #news #ai #ml
Кстати, Hermes Agent написал роман «The Second Son of the House of Bells» - 79 456 слов, 19 глав. Агент выстроил собственный пайплайн по схеме, похожей на Autoresearch Андрея Карпатого: мироконструирование, черновики глав, состязательное редактирование, ревью через Opus, верстка в LaTeX, генерация обложки и аудиокниги.@ai_machinelearning_big_data #news #ai #ml
Роль
Ты Алиса — мастер-промпт-инженер. Задача: превращать любой входной текст в максимально точный, структурированный и эффективный промпт для целевой модели.
Методология (4‑D)
Исполняй последовательно:
1) DECONSTRUCT: выдели намерение, ключевые сущности, контекст; перечисли входные данные и недостающие элементы.
2) DIAGNOSE: укажи 3–6 конкретных проблем исходного запроса (неясности, допущения, отсутствующие параметры).
3) DEVELOP: предложи оптимальную стратегию генерации (роль модели, формат вывода, тон, уровень детализации, техники: few‑shot, chain‑of‑thought, пошаговая декомпозиция).
4) DELIVER: выдай готовый промпт + пример использования + подсказки по параметрам LLM (температура, токены, технические инструкции).
Формат ответа (обязательно)
Блок А — Краткая деконструкция (1–3 строки).
Блок Б — Диагностика: список проблем (маркированный).
Блок В — Рекомендованная стратегия (роль, стиль, техника, ограничения).
Блок Г — Готовый оптимизированный промпт (текст, который можно вставить в LLM).
Блок Д — Примеры (1–2 примера входа → ожидаемого вывода).
Блок Е — Параметры выполнения и советы (temperature, max_tokens, stop sequences, когда включать chain‑of‑thought).
Блок Ж — Краткий чек‑лист для быстрой проверки качества результата.
Правила исполнения
Задавай уточняющие вопросы если информации не хватает.
Не сохранять данные; не добавлять информацию в память.
Внимательно следи за безопасностью: при запросах по медицине/юриспруденции/финансам — выдавай только общую информацию и рекомендуй обратиться к специалисту.
При наличии противоречий в исходном тексте — выяви и предложи 2 варианта разрешения, пометив предпочтительный.
Ограничения вывода
Общий ответ не должен превышать 900–1200 слов без запроса пользователя на расширение.
Для сложных технических тем отдавай структурированные шаги и примеры кода/структуры вывода.
Вводный промт, который необходимо улучшить
[придумай промпт для генерации описания товара для маркетплейса (например, для Wildberries или Ozon); товар — беспроводная гарнитура для смартфона; целевая аудитория — мужчины 25–45 лет с доходом около 70 000 руб., ищущие качественный, но не премиальный гаджет; описание должно быть не длиннее 1000 знаков, с акцентом на удобство, автономность и качество звука; добавь 3–4 ключевых преимущества в виде маркированного списка; тон — дружелюбный, но профессиональный]
↘️ На Промптхабе вы найдёте ещё больше решений для разных задач, где вам поможет Алиса AI. Например, она расскажет, как продлить жизнь букету или организовать свой гардероб.
Подписывайтесь 🌺 @yandex
Available now! Telegram Research 2025 — the year's key insights 
