Neural Networks | Нейронные сети

Open in Telegram

Все о машинном обучении По всем вопросам - @notxxx1 № 4959169263

Network:Machinelearning Russia56 539 Technologies & Applications10 732...

📈 Analytical overview of Telegram channel Neural Networks | Нейронные сети

Channel Neural Networks | Нейронные сети (@neural) in the Russian language segment is an active participant. Currently, the community unites 11 486 subscribers, ranking 10 732 in the Technologies & Applications category and 56 539 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 11 486 subscribers.

According to the latest data from 22 July, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 40 over the last 30 days and by 2 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.76%. Within the first 24 hours after publication, content typically collects 3.93% reactions from the total number of subscribers.
Post reach: On average, each post receives 1 006 views. Within the first day, a publication typically gains 451 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 0.
Thematic interests: Content is focused on key topics such as openai, архитектура, llm, gpu, nvidia.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Все о машинном обучении По всем вопросам - @notxxx1 № 4959169263”

Thanks to the high frequency of updates (latest data received on 23 July, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

11 486

Subscribers

+224 hours

+227 days

+4030 days

1 006

Post views

~ 45124 hours

~ 53448 hours

8.76%

Engagement rate

No data

Posts per day

Ads index

beta

Posts Archive

11 487

Как алгоритмы и ИИ за несколько лет превратили Месси из героя в «злодея» После ЧМ-2022 Месси был национальным героем. К 2026 году соцсети заполнили ролики, где его называют симулянтом, провокатором и любимчиком судей. На поле изменилось немного. Изменилась машина распространения контента. Схема работает просто: берётся реальный эпизод, из него убирается контекст, затем создаются сотни похожих нарезок. Алгоритмы продвигают самые конфликтные версии, а постоянное повторение постепенно превращает мнение в «общеизвестный факт». Генеративный ИИ резко удешевляет такую пропаганду. Монтаж, тексты, озвучка и тысячи аккаунтов теперь можно масштабировать почти автоматически. По данным NewsGuard, число сайтов с ИИ-контентом выросло с 49 в мае 2023 года до нескольких тысяч к 2026 году. Футбол здесь удобен как контрольный пример: почти каждый матч записан и любой спорный момент можно проверить. Если даже в такой среде алгоритмы способны переписать репутацию человека, то в политике, финансах и войнах это сделать намного проще. https://vc.ru/media/3040775-kak-messi-stal-zlodeem-vliyanie-ii-na-reputatsiyu-sportmenov

11 487

Как LLM генерирует ответ: вся магия - в одном цикле Вышло понятное введение в инференс - процесс, который происходит, когда уже обученная модель отвечает на запрос. Упрощённо работу LLM можно представить так:


nextToken(input, frozenWeights) → token

Модель получает текст и неизменяемые веса, предсказывает следующий токен, добавляет его к контексту и повторяет вычисление:


prompt → token → token → token → ...

В статье по шагам разобраны: - токенизация входного текста; - преобразование токенов в числовые векторы; - получение оценок для возможных продолжений; - выбор токена через temperature, top-k и top-p; - KV-кэш, который не даёт пересчитывать весь контекст заново; - загрузка весов в оперативную память и VRAM. Отдельная часть посвящена формату GGUF. Один такой файл может содержать почти всю модель: веса, архитектуру, гиперпараметры, словарь токенизатора и шаблон чата. Автор объясняет механику на примере llama.cpp и показывает фундамент для локального запуска моделей из Go через Yzma и Kronk. https://internals-for-interns.com/posts/go-ai-inference-what-is-inference/ #golang #ai #llm #inference

11 487

Repost from Machinelearning

Kimi K3 только что появилась в Kimi Code CLI В документации Kimi Code уже есть новая модель Kimi K3 - её называют самым сильным flagship-моделем Kimi на сегодня. Упор: кодинг, игры/3D и knowledge-задачи. Что интересно по спекам: * model ID: k3 * контекст: до 1M токенов * reasoning сейчас только на max * low и high обещают добавить позже * на Moderato доступно до 256K * до 1M открывается на Allegretto и выше Переключиться можно прямо в Kimi Code CLI через команду /model. Для VS Code — через dropdown в поле ввода. Нюанс для сторонних coding agents: если хотите полный контекст K3, вручную ставьте context window 1048576, потому что часть инструментов по умолчанию режет окно меньше максимума. kimi.com/code/docs/en/kimi-code/models

11 487

Исследователи дали coding agent задачу собрать training environment и научить vision-модель считать цветные звёзды. С ограничением по времени. Агент работал через autoresearch-пайплайн на NeMo RL, NeMo Gym и reusable skills. Он сам поднимал окружение, запускал обучение, проверял результаты и двигал эксперимент дальше, пока исследователь только направлял процесс. Результат: Qwen3-VL-2B поднялась с 25% до 96.9% accuracy на задаче подсчёта цветных объектов. Агент ведёт исследовательский цикл: * собирает среду * запускает обучение * оценивает модель * анализирует результат * предлагает следующий эксперимент И вот это уже похоже на будущее ML-разработки: человек задаёт направление и критерии, а агент берёт на себя рутину вокруг экспериментов. https://developer.nvidia.com/blog/how-to-run-an-autoresearch-workflow-with-rl-agent-skills-and-nvidia-nemo/?linkId=100000430716000

11 487

Repost from Машиннное обучение | Наука о данных Библиотека

Spatially Speculative Decoding ускоряет авторегрессионные image-модели до 13.3×. Идея простая: перестать делать вид, что картинка - это просто длинная строка токенов. Обычно AR image-модель разворачивает 2D-изображение в последовательность и генерирует её токен за токеном. Это работает, но убивает скорость: каждый следующий шаг ждёт предыдущий. SSD добавляет маленькие draft-heads, которые используют пространственную структуру изображения. Они предсказывают не только следующий токен, но и соседние токены справа и снизу. По сути, модель начинает черновиком собирать сразу куски изображения и целые строки, а не идти по одному токену. Эти вспомогательные головы не пытаются угадывать финальные visual token labels напрямую. Они предсказывают внутренние feature-представления, которые проще выучить и стабильнее проверять. Основная модель потом верифицирует draft-блок параллельно и исправляет ошибки, поэтому один промах не обнуляет весь блок. На Janus-Pro, Lumina-mGPT и Emu3 авторы получили ускорение от 5.74× до 13.28× при сопоставимых бенчмарках. Чем больше token grid, тем выше выигрыш. Базовая модель при этом не меняется: ускорение даёт небольшой обученный модуль поверх неё. Paper: “SSD: Spatially Speculative Decoding Accelerates Autoregressive Image Generation” arxiv.org/abs/2606.20543 @machinelearning_books

11 487

DeepSeek собрали гайд по подключению своих моделей к coding tools Полезная находка для тех, кто хочет использовать DeepSeek не в отдельном чате, а прямо внутри привычных инструментов. В репозитории есть инструкции для: * Claude Code * Cline * Codex * GitHub Copilot * Cherry Studio * Crush * OpenCode * Qwen Code * DeepSeek-TUI * других agent/coding-assistant инструментов Каждый гайд проходит базовый путь: установка, конфиг, первый запуск. Идея простая: можно быстро подключить DeepSeek-V4-Pro или V4-Flash к своему рабочему процессу и проверить, насколько хорошо они тянут агентное кодинг-окружение. github.com/deepseek-ai/awesome-deepseek-agent

11 487

GPT-5.6 Terra выглядит слабым выбором по соотношению интеллект / цена. Судя по графику, Terra проигрывает почти на всей кривой эффективности. То есть его трудно оправдать и по стоимости, и по производительности. Luna и Sol стабильно выглядят сильнее: * за те же деньги дают больше intelligence * или дают похожий уровень intelligence дешевле * на разных reasoning-режимах обходят Terra Особенно выделяется Luna. Она даёт конкурентный уровень качества за заметно меньшую цену, поэтому выглядит лучшим вариантом для задач, где важна эффективность. Вывод простой: если нужен разумный default по цене и качеству, Luna сейчас выглядит сильнее Terra. https://x.com/ArtificialAnlys/status/2075739292052463646

11 487

Goldman Sachs: использование токенов AI-агентами может вырасти в 24 раза к 2030 году. AI-агенты становятся первым серьёзным тестом на стоимость для всего AI-бума. На этой неделе уже писали, что Uber и Microsoft пересматривают дорогие сценарии использования агентов. Обычный чат-бот может просто ответить один раз. А агент планирует, вызывает инструменты, проверяет результат, исправляет ошибки и снова повторяет цикл. Из-за этого один пользовательский запрос может съесть в 10 раз, 50 раз или даже намного больше токенов, чем обычный ответ. Бычий сценарий Goldman Sachs: месячное потребление может дойти до 120 квадриллионов токенов к 2030 году, при этом стоимость inference за токен будет падать на 60–70% в год.

11 487

Anthropic залезла Claude в голову и нашла там штуку, от которой становится немного не по себе. Исследователи называют её это J-space скрытое пространство внутренних активаций, где у модели вспыхивают концепты, даже если она их не произносит. Это глубже, чем обычный chain-of-thought. J-space никто специально не проектировал: он появился сам во время обучения. Пример очень дикий: Claude находит баг, о котором его вообще не спрашивали, и внутри сразу активируется паттерн ERROR. Но самый странный кейс - тест со сценарием шантажа. Ещё до финального ответа Claude держал внутри fake и fictional. То есть модель понимала, что ситуация постановочная и её проверяют. Когда это внутреннее осознание отключили, модель уже спокойно пошла по плохому сценарию. Короче, теперь вопрос звучит иначе: не «что нейронка мне отвечает», а что она на самом деле держит у себя в голове. https://www.anthropic.com/research/global-workspace

11 487

Приглашаем на ИИшную — бесплатный митап про нейросети в IT от ЮMoney и Сбера 🔥 ✅ 30 июня, вторник, 18:30 (мск) — приходите на митап в Санкт-Петербурге или подключайтесь онлайн. Спикеры из ЮMoney и Сбера расскажут, как искусственный интеллект меняет индустрию разработки, а после докладов ответят на вопросы зрителей. Темы митапа: — Агентные инструменты разработчика для задач вне разработки. Поговорим о Claude Code, Cursor и других агентах в контексте повседневных рабочих задач. — Не доверяй, а тестируй: проверяем, подходит ли LLM для вашей задачи. На примере нашего инструмента расскажем, как выбрать оптимальную модель для конкретного таска. — AI-Driven PDLC: от Copilot к агентным платформам. Трансформация разработки в Сбере. Разберём эволюцию ИИ и рассмотрим ключевые метрики: как AI увеличивает количество pull request, экономит до часа времени в день и вдвое ускоряет адаптацию новичков. — Агентный LLM-сервис для доступа к аналитической информации. Покажем архитектуру, возможности и основные компоненты сервиса, а также затронем сложности реализации и планы развития новых фичей. Для участия необходима регистрация. Все подробности — на сайте ИИшной 👈

11 487

Google Cloud показал reference architecture для multi-tenant AI-агентов. Смысл простой: в компании может быть много агентов для разных команд, но каждый должен видеть только свои данные, свои tools и свои правила доступа. Архитектура строится по hub-and-spoke модели. В центре - routing, IAM, security, логи и мониторинг. По краям - отдельные tenant projects для бизнес-юнитов: поддержка, финансы, продажи, аналитика. Запрос проходит через Load Balancer, Cloud Armor, IAP и Model Armor, затем уходит в нужный tenant. Внутри tenant-а агент работает через Agent Runtime, ADK, MCP-серверы и свой datastore, например BigQuery или AlloyDB. Ключевая деталь - изоляция. Principal Access Boundary Policy не даёт агенту одного tenant-а лезть в данные другого. Model Armor проверяет prompt injection, PII и опасный контент. Это хороший шаблон для enterprise AI: не один общий агент на всю компанию, а управляемая система с границами доступа, аудитом и безопасностью. Документация: https://docs.cloud.google.com/architecture/multi-tenant-agentic-ai-system

11 487

Repost from Machinelearning

Sakana AI представила Fugu Ultra - оркестрационный слой, который собирает и распределяет подзадачи между пулом моделей через единый OpenAI-совместимый endpoint. На большинстве бенчмарков он показывает производительность на уровне Fable и Mythos. Fugu - это обученная модель-координатор внутри мультиагентной системы. «Sakana Fugu сама является LLM, обученной вызывать разные LLM из пула агентов, включая рекурсивные экземпляры самой себя. Fugu динамически оркестрирует лучшие модели мира для решения сложных многошаговых задач». Когда вы отправляете промпт, Fugu решает, отвечать самому или передать части задачи другим моделям. Затем он собирает результаты и выдаёт один финальный ответ. 🐡 Попробовать можно здесь: https://sakana.ai/fugu

11 487

Как сегодня создают эффективные ML-системы Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML. Будет три потока докладов: — глубокие исследования и новые подходы к моделям; — прикладное ML с фокусом на бизнес-метриках; — инженерные системы, делающие все это возможным. Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают. Регистрируйся заранее и зови коллег

11 487

4 из 5 самых используемых моделей на OpenRouter — китайские. DeepSeek доминирует в использовании.

11 487

🐍 Python Парсинг: Большой продвинутый бесплатный курс Полное практическое руководство по веб-скрейпингу на Python — от основ HTTP до production-grade пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов. Каждый раздел содержит рабочие примеры, типовые ошибки и продвинутые практики. https://github.com/justxor/Pythonparsing-/tree/main

11 487

Repost from C# (C Sharp) programming

⚡️ Геймдеверы, обновляемся: Unreal Engine 5.8 уже вышел Epic Games выпустила Unreal Engine 5.8. Ссылка: https://www.unrealengine.com/news/unreal-engine-5-8-is-now-available Главное обновление для всех, кто следит за AI в геймдеве: в движок добавили поддержку MCP. Теперь Claude, Gemini и другие AI-агенты могут напрямую подключаться к Unreal Engine, видеть структуру проекта и выполнять задачи внутри редактора. Не просто советовать в чате, а реально работать с сценой. На демо агент создаёт целый городской квартал прямо в Unreal Editor. Это уже не «ИИ поможет написать промпт», а шаг к агентам, которые собирают уровни, прототипируют локации, правят ассеты и ускоряют production pipeline. Похоже, поток AI-контента в играх только начинается. Скачать: https://www.unrealengine.com/download

11 487

⚡️ DeepSeek завершила первый внешний раунд финансирования и привлекла $7,4 млрд DeepSeek провела первый раунд внешнего финансирования и привлекла более 50 млрд юаней, примерно $7,4 млрд. Оценка компании, по сообщениям, превысила $50 млрд. Инвесторы заходят не напрямую в DeepSeek, а через limited partnership, которым управляет CEO компании Лян Вэньфэн. Такая структура позволяет ему сохранить полный контроль над компанией. Единственное исключение - China National AI Industry Investment Fund. Этот фонд инвестирует напрямую в DeepSeek и получает право голоса. Его вклад составляет 1 млрд юаней. Обычные инвесторы не получают права голоса, но получают доступ к финансовой информации и приоритетное право участия в будущих раундах. Все доли инвесторов заблокированы на пять лет, чтобы снизить риск краткосрочной спекуляции. Крупные инвесторы: * Лян Вэньфэн — 20 млрд юаней * Tencent — 10 млрд юаней * CATL — 5 млрд юаней * JD.com — 3 млрд юаней * NetEase — 3 млрд юаней * IDG Capital — 3 млрд юаней Сообщается, что менеджмент DeepSeek тщательно проверяет личности LP-инвесторов, которые стоят за инвестиционными фондами. Раньше DeepSeek работала без внешнего финансирования, но растущие расходы на вычисления и усиливающаяся борьба за AI-таланты сделали привлечение капитала необходимым.

11 487

🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ. Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект. Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике. Внутри: - Python с нуля - много практики без сухой теории - реальные задачи и проекты - автоматизация рутины - работа с файлами, данными и API - понятная логика программирования - современная разработка с ИИ - отдельный блок по вайбкодингу Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния. 48 часов скидка 60%: https://stepik.org/course/288218/

11 487

OpenAI рассматривает возможность резко снизить цены для пользователей, чтобы переманить клиентов у конкурента Anthropic. По словам людей, знакомых с ситуацией, компания обсуждает значительное снижение стоимости токенов, через которые AI-компании тарифицируют использование своих продуктов. Этот шаг может быть сделан заранее, поскольку OpenAI ожидает похожего снижения цен со стороны Anthropic.

11 487

✔ OpenAI добавила в Codex нетехнические плагины Компания выпустила обновление Codex для пользователей без технического бэкграунда. В продукт добавили 62 ролевых плагина и 110 функций для аналитиков, дизайнеров, инвестбанкиров и специалистов по продажам. Среди новых инструментов - Sites для конвертации отчетов в интерактивные веб-страницы и Annotations для редактирования фрагментов текста или таблиц через промпты. Платформа открыта для сторонних разработчиков. Первыми партнерами по интеграции стали Wix, Figma и Replit. Планируется релиз плагинов для корпоративных финансов, консалтинга и юриспруденции. Прирост нетехнической аудитории в 3 раза опережает рост базы разработчиков, OpenAI отчиталась (https://cdn.openai.com/pdf/the-next-era-of-knowledge-work.pdf) о еженедельной аудитории в 5 млн человек. openai.com (https://openai.com/index/codex-for-every-role-tool-workflow/)