Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Показати більше📈 Аналітичний огляд Telegram-каналу Machinelearning
Канал Machinelearning (@ai_machinelearning_big_data) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 297 888 підписників, посідаючи 323 місце в категорії Технології та додатки та 1 258 місце у регіоні Росія.
📊 Показники аудиторії та динаміка
З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 297 888 підписників.
За останніми даними від 12 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -7 173, а за останні 24 години на -216, загальне охоплення залишається високим.
- Статус верифікації: Не верифікований
- Рівень залученості (ER): Середній показник залученості аудиторії становить 7.91%. Протягом перших 24 годин після публікації контент зазвичай збирає 5.86% реакцій від загальної кількості підписників.
- Охоплення публікацій: В середньому кожен допис отримує 23 559 переглядів. Протягом першої доби публікація в середньому набирає 17 463 переглядів.
- Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 181.
- Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як openai, claude, api, gemini, контекст.
📝 Опис та контентна політика
Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
Завдяки високій частоті оновлень (останні дані отримано 13 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.
Примечательно: когда интервьюер спрашивал, что за желанием продуктивности стоит на самом деле, многие раскрывались. Оказывалось, что дело не в работе как таковой, а в том, чтобы успевать к детям, проводить время с родителями или просто жить свою жизнь.Примерно 81% участников сказали, что ИИ уже в какой-то мере оправдал их ожидания. Чаще всего называли ускорение рабочих процессов (32%), когнитивное партнерство (17%) и обучение (10%). Отдельно выделяется категория доступности: люди с нарушениями обучаемости, слуха, речи описывают ИИ как явление, которой у них раньше не было. 🟡Страхи конкретнее надежд Главное беспокойство - ненадежность и галлюцинации (27%), следом идут угрозы занятости (22%) и потеря автономии (22%). Важный паттерн: опасения, связанные с рынком труда, сильнее всего коррелируют с общим негативным отношением к ИИ. Исследование зафиксировало 5 устойчивых противоречий, которые люди переживают одновременно, не выбирая одну из сторон: 🟢обучение - когнитивная деградация; 🟢качество решений - ненадежность; 🟢эмоциональная поддержка - зависимость; 🟢экономия времени - ускорение темпа жизни; 🟢экономические возможности - вытеснение с рынка труда. У пользователей, ценящих ИИ за эмоциональную поддержку, втрое выше страхя зависимости от него. 🟡Региональный разрыв В Африке, Латинской Америке и Южной Азии смотрят на ИИ заметно оптимистичнее, чем пользователи из Северной Америки и Западной Европы. В развивающихся регионах ИИ воспринимается прежде всего как инструмент возможностей: для предпринимательства, образования, обхода инфраструктурных ограничений. В богатых странах фокус смещается на управление сложностью уже насыщенной жизни и регуляторные вопросы. Anthropic обещает вернуться с новыми опросами позже планирует продолжить исследование: следующая волна интервью будет про влияние Claude на благополучие людей в долгосрочной перспективе. @ai_machinelearning_big_data #news #ai #ml
Роль
Ты Алиса — мастер-промпт-инженер. Задача: превращать любой входной текст в максимально точный, структурированный и эффективный промпт для целевой модели.
Методология (4‑D)
Исполняй последовательно:
1) DECONSTRUCT: выдели намерение, ключевые сущности, контекст; перечисли входные данные и недостающие элементы.
2) DIAGNOSE: укажи 3–6 конкретных проблем исходного запроса (неясности, допущения, отсутствующие параметры).
3) DEVELOP: предложи оптимальную стратегию генерации (роль модели, формат вывода, тон, уровень детализации, техники: few‑shot, chain‑of‑thought, пошаговая декомпозиция).
4) DELIVER: выдай готовый промпт + пример использования + подсказки по параметрам LLM (температура, токены, технические инструкции).
Формат ответа (обязательно)
Блок А — Краткая деконструкция (1–3 строки).
Блок Б — Диагностика: список проблем (маркированный).
Блок В — Рекомендованная стратегия (роль, стиль, техника, ограничения).
Блок Г — Готовый оптимизированный промпт (текст, который можно вставить в LLM).
Блок Д — Примеры (1–2 примера входа → ожидаемого вывода).
Блок Е — Параметры выполнения и советы (temperature, max_tokens, stop sequences, когда включать chain‑of‑thought).
Блок Ж — Краткий чек‑лист для быстрой проверки качества результата.
Правила исполнения
Задавай уточняющие вопросы если информации не хватает.
Не сохранять данные; не добавлять информацию в память.
Внимательно следи за безопасностью: при запросах по медицине/юриспруденции/финансам — выдавай только общую информацию и рекомендуй обратиться к специалисту.
При наличии противоречий в исходном тексте — выяви и предложи 2 варианта разрешения, пометив предпочтительный.
Ограничения вывода
Общий ответ не должен превышать 900–1200 слов без запроса пользователя на расширение.
Для сложных технических тем отдавай структурированные шаги и примеры кода/структуры вывода.
Вводный промт, который необходимо улучшить
[придумай промпт для генерации описания товара для маркетплейса (например, для Wildberries или Ozon); товар — беспроводная гарнитура для смартфона; целевая аудитория — мужчины 25–45 лет с доходом около 70 000 руб., ищущие качественный, но не премиальный гаджет; описание должно быть не длиннее 1000 знаков, с акцентом на удобство, автономность и качество звука; добавь 3–4 ключевых преимущества в виде маркированного списка; тон — дружелюбный, но профессиональный]
↘️ На Промптхабе вы найдёте ещё больше решений для разных задач, где вам поможет Алиса AI. Например, она расскажет, как продлить жизнь букету или организовать свой гардероб.
Подписывайтесь 🌺 @yandexSSM в базе - это обыкновенное дифференциальное уравнение, которое нужно перевести в дискретную рекуррентную формулу. Mamba1 и Mamba2 использовали комбинацию двух методов (ZOH и Эйлера), подобранную эмпирически.В Mamba3 реализовали экспоненциально-трапецеидальный метод: вместо одной точки для аппроксимации интеграла берутся обе границы интервала с обучаемым коэффициентом смешивания. В результате рекуррентная формула неявно применяет свёртку к входу скрытого состояния, что делает динамику выразительнее без дополнительных компонентов. 🟡 Комплекснозначная SSM.
Ранние модели семейства S4 работали с комплексными числами, но Mamba1 от них отказалась. Из-за этого модель не справляется даже с простейшими задачами отслеживания состояний (например, определением четности последовательности).Решение нашли во вращении в двумерном пространстве: вместо комплексных вычислений авторы разложили переход на масштабирование и поворот, а затем применили фишку из RoPE - встроили вращения в матрицы через кумулятивную сумму углов. Переписывать ядра для поддержки комплексной арифметики не пришлось. Модель решает задачи на чётность и другие бенчмарки, недоступные предыдущим версиям. 🟡 Переход от SISO к MIMO.
В стандартной SSM каждый хэд содержит набор независимых систем (один вход - один выход). При декодировании арифметическая интенсивность составляет около 2,5 операций на байт при пороге вычислительной загруженности на H100 в районе 300.Mamba3 расширяет матрицы, превращая внешние произведения в матричные умножения. Арифметическая интенсивность растет пропорционально. При этом размер скрытого состояния не увеличивается, а значит, латентность декодирования почти не меняется. Обучение, конечно, дорожает, но это сознательный компромисс. Еще из архитектуры убрали короткую каузальную свёртку, присутствовавшую с первой Mamba - новая рекуррентная формула и смещения выполняют ту же функцию. Добавили нормализацию BCNorm по аналогии с QKNorm в трансформерах, перешли на чередование SSM- и MLP-слоев. Ядра написаны на Triton (prefill SISO), TileLang (prefill MIMO) и CuTe DSL (decode). 🟡Тесты Mamba-3 SISO при 1,5B параметров показывает лучшую суммарную латентность prefill + decode на всех длинах последовательностей по сравнению с Mamba2, Gated DeltaNet и Llama-3.2-1B под vLLM на одном H100. MIMO-вариант сопоставим по скорости с Mamba2, но заметно точнее. При анализе Парето-фронта Mamba-3 показывает тот же уровень качества при вдвое меньшем состоянии. @ai_machinelearning_big_data #AI #ML #LLM #Mamba3 #TogetherAI
На встрече обсудят: 💙 как рост ИИ трансформируют рынок труда 💙 4 трека для развития: ML, CV, NLP и Data Engineering 💙 какие задачи усложняются и где усиливается конкуренция И расскажут, как за 2 года освоить фундаментальную базу, собрать портфолио из проектов и получить диплом магистра без отрыва от работы.Подключайтесь онлайн 1 апреля в 19:00 мск. 🏃♀️ Записаться на ДОД
Модели на 8B и 70B параметров (например, Llama 3.1, Llama 3.3, DeepSeek-R1) можно файн-тюнить на одной RTX 4090 или 5090, а не на кластере, но есть и поддержка multi-GPU.В режиме инференса Studio умеет: tool calling, выполнение кода прямо в чате, работу с изображениями, аудио, PDF и DOCX. Из коробки - веб-поиск и автонастройка параметров инференса. Экспорт результатов - одной кнопкой в GGUF, vLLM или Ollama. Studio сама мерджит LoRA-адаптеры с базовой моделью. Работает на Windows, Linux и macOS (на Mac пока только инференс, поддержка MLX-обучения анонсирована), есть Docker. AMD-пользователи могут обучать через Unsloth Core, поддержка в Studio обещана позже. 📌Лицензирование: AGPL-3.0. 🟡Документация 🖥Github @ai_machinelearning_big_data #AI #ML #LLM #Framework #Train #UnslothStudio
На демонстрации модель прошла цикл онлайн-покупки автономно: нашла отзывы на Xiaohongshu, сравнила продавцов на JD.com, поторговалась с поддержкой, оформила заказ. Второе демо: получила одно текстовое задание, сняла 15-секундный ролик из 4 сцен, синтезировала звук, исправила ошибку рендеринга шрифта, загрузила на TikTok и опубликовала.🟡MiMo-V2-TTS Модель обучена на сотнях миллионов часов аудио, и допилена через многомерный RL. Синтезирует речь с управлением эмоциями на уровне отдельных предложений, поёт с сохранением высоты и ритма, воспроизводит китайские диалекты: сычуаньский, хэнаньский, кантонский, тайваньский. Поддержка других языков не заявлена. Форматные маркеры в тексте: пунктуацию, частицы и выделение сама переводит в просодику без дополнительной разметки. Доступ на ограниченный период - бесплатно. Сроки предложения не указаны.
Кстати, команду MiMo возглавляет Ло Фули, один из ключевых авторов DeepSeek R1.Все модели релиза доступны через API на platform.xiaomimimo.com и в MiMo Studio. @ai_machinelearning_big_data #news #ai #ml
reasoning_effort. Если поставить none будет быстрый чат-режим, как в Small 3.2, а с ключом high модель начнет разворачивать цепочку рассуждений, сопоставимую с Magistral. Переключение в рантайме, без смены модели.
🟡Тесты
Small 4 с включенным reasoning обходит GPT-OSS 120B на LiveCodeBench и генерирует при этом на 20% меньше токенов.
На AA LCR набирает 0.72 при длине ответа 1.6K символов. Для сравнения, модели Qwen для тех же результатов нужно от 5.8K до 6.1K.
Для self-hosted деплоя минимальный стенд - 4× NVIDIA HGX H100, 2× HGX H200 или 1× DGX B200.Попробовать бесплатно можно на build.nvidia.com, через Mistral API или AI Studio. 📌 Лицензирование: Apache 2.0 License. 🟡Статья 🟡Набор моделей @ai_machinelearning_big_data #AI #ML #LLM #MistralSmall4 #MistralAI
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
