Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
Mostrar más📈 Análisis del canal de Telegram Machinelearning
El canal Machinelearning (@ai_machinelearning_big_data) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 297 790 suscriptores, ocupando la posición 323 en la categoría Tecnologías y Aplicaciones y el puesto 1 258 en la región Rusia.
📊 Métricas de audiencia y dinámica
Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 297 790 suscriptores.
Según los últimos datos del 12 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -7 173, y en las últimas 24 horas de -216, conservando un alto alcance.
- Estado de verificación: No verificado
- Tasa de interacción (ER): El promedio de interacción de la audiencia es 7.91%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 5.86% de reacciones respecto al total de suscriptores.
- Alcance de las publicaciones: Cada publicación recibe en promedio 23 559 visualizaciones. En el primer día suele acumular 17 463 visualizaciones.
- Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 181.
- Intereses temáticos: El contenido se centra en temas clave como openai, claude, api, gemini, контекст.
📝 Descripción y política de contenido
El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 13 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.
Иными словами - модели не умеют надежно создавать то знание, которым умеют пользоваться.🟡Еще один интересный момент - это объем Skills. Оптимальный вариант: 2–3 модуля, прирост +18,6%. При 4 и более - всего +5,9%. Подробная документация вообще дает отрицательный эффект: –2,9%, с ней агент буквально тонет в контексте. Показательна и стоимость решения задач: Haiku 4.5 со Skills обходит Opus 4.5 без Skills — меньшая и более дешевая модель с готовыми Skills бьет старшую модель без них. Gemini 3 Flash при этом показал лучший абсолютный результат среди всех конфигураций - 48,7% со Skills при цене $0,57 за одну задачу против $1,06 у Gemini 3 Pro. 🟡Страница проекта 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #Benchmark #Skills
1. При создании PR включать auto-merge. 2. Постить ссылку на PR во внутренний канал Slack. Если Claude совершает ошибку, команда тегает его в PR (командой /add claude), чтобы он исправил код и обновил правила в CLAUDE.md для предотвращения рецидивов.🟡Агенты, Plan Mode и мультиагентность Эволюция идет от простого выполнения команд к сложному планированию и роям агентов. Plan Mode: Режим, где модель сначала расписывает шаги, а потом выполняет. Промпт для Plan Mode технически прост: к запросу добавляется фраза "Пожалуйста, не пиши код, а сначала спланируй". Функция "Plugins" была написана роем агентов за выходные без участия человека: инженеры дали спецификацию и доступ к Asana. Главный агент спавнил субагентов, раздавал задачи из доски, а те писали код. Стратегия "Mama Claude": основной инстанс Claude Code рекурсивно вызывает субагентов (другие инстансы Claude Code) для решения подзадач. 🟡Инсайты о найме и типах инженеров Биомодальное распределение эффективных сотрудников:
Гипер-специалисты: кандидаты с глубоким знанием devtools, runtime, оптимизаций. Гипер-дженералисты: люди, совмещающие роли Product, Infra, Design.Product Engineer исчезает как термин, все становятся "Builders". В Anthropic код пишут все: дизайнеры, финансисты и менеджеры. @ai_machinelearning_big_data
Это 3B модель. В сложных задачах она очевидно хуже или где-то рядом с одноклассниками, чудес ждать не стоит. Несмотря на заявленное разнообразие, английский язык занимает львиную долю датасета во всех кластерах. При сильном сжатии (ниже Q4) качество начинает заметно страдать, особенно на редких языках.📌Лицензирование: CC-BY-NC-4.0 License. 🟡Блогпост 🟡Набор моделей 🟡Техотчет 🟡Demo @ai_machinelearning_big_data #AI #ML #SLM #TinyAya #Cohere
В поездке человек не строит рейтинг маршрутов - он выбирает один, а все остальные варианты для него в этот момент перестают существовать. Поэтому мы перешли от классического «ранжирования» к задаче «выбора», используя функцию потерь на основе Softmax с one‑hot‑таргетом.🟡Что на практике Долгое время порядок формировался простой сортировкой по ETA - удобные и предсказуемые маршруты не всегда были на первом месте и иногда вовсе выпадали из топ-3. - Синий маршрут - результат старого ранжирования (ETA-first); - Красный - новое ML‑ранжирование, он чуть медленнее по времени, но с него реже сходят. Модель начала чаще поднимать такие варианты наверх, обходя сложные участки или центр города. В итоге первым оказывается не самый быстрый путь, а тот, который на практике понятнее и чаще проезжаем. При этом пользователю предлагаются и другие варианты и выбор всегда остается за ним. Такой подход позволяет учитывать реальные сценарии движения и легко масштабируется: модель может учитывать новые факторы - от персонализации до адаптации под локальные дорожные особенности. Технические детали и логику работы модели команда разложила на Хабре. @ai_machinelearning_big_data #news #ai #ml
В релизе 2 версии 14B модели, с предикшеном на 16 и 64 токена и макс. разрешением 1Мpx. Остается вопрос: насколько бинарный токенизатор + diffusion head добавляет латентности на каждом шаге, даже если самих шагов стало меньше из-за патчинга. 30x по скорости - это сравнение не с диффузионными моделями, которые уже умеют генерировать за 4–8 шагов. 14B - это не про "взял и запустил". Есть конечно версии на ImageNet с разрешением 256х256 для воспроизведения эксперимента, но не за этим мы сюда пришли.📌Лицензирование: Apache 2.0 License. 🟡Страница проекта 🟡Arxiv 🟡Модель 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI #ML #AR #T2I #BitDance
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
