Neural Networks | Нейронные сети

Kanalga Telegram’da o‘tish

Все о машинном обучении По всем вопросам - @notxxx1 № 4959169263

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya56 539 Texnologiyalar & Aralashmalar10 732...

📈 Telegram kanali Neural Networks | Нейронные сети analitikasi

Neural Networks | Нейронные сети (@neural) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 11 486 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 10 732-o'rinni va Rossiya mintaqasida 56 539-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 11 486 obunachiga ega bo‘ldi.

22 Iyul, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 40 ga, so‘nggi 24 soatda esa 2 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 8.76% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 3.93% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 1 006 marta ko‘riladi; birinchi sutkada odatda 451 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 0 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent openai, архитектура, llm, gpu, nvidia kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Все о машинном обучении По всем вопросам - @notxxx1 № 4959169263”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 23 Iyul, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

11 486

Obunachilar

+224 soatlar

+227 kunlar

+4030 kunlar

1 006

Post ko'rishlar

~ 45124 soatlar

~ 53448 soatlar

8.76%

Muloqot nisbati

Ma'lumot yo'q

Kuniga postlar

Ads index

beta

Postlar arxiv

11 487

Как алгоритмы и ИИ за несколько лет превратили Месси из героя в «злодея» После ЧМ-2022 Месси был национальным героем. К 2026 году соцсети заполнили ролики, где его называют симулянтом, провокатором и любимчиком судей. На поле изменилось немного. Изменилась машина распространения контента. Схема работает просто: берётся реальный эпизод, из него убирается контекст, затем создаются сотни похожих нарезок. Алгоритмы продвигают самые конфликтные версии, а постоянное повторение постепенно превращает мнение в «общеизвестный факт». Генеративный ИИ резко удешевляет такую пропаганду. Монтаж, тексты, озвучка и тысячи аккаунтов теперь можно масштабировать почти автоматически. По данным NewsGuard, число сайтов с ИИ-контентом выросло с 49 в мае 2023 года до нескольких тысяч к 2026 году. Футбол здесь удобен как контрольный пример: почти каждый матч записан и любой спорный момент можно проверить. Если даже в такой среде алгоритмы способны переписать репутацию человека, то в политике, финансах и войнах это сделать намного проще. https://vc.ru/media/3040775-kak-messi-stal-zlodeem-vliyanie-ii-na-reputatsiyu-sportmenov

11 487

Как LLM генерирует ответ: вся магия - в одном цикле Вышло понятное введение в инференс - процесс, который происходит, когда уже обученная модель отвечает на запрос. Упрощённо работу LLM можно представить так:


nextToken(input, frozenWeights) → token

Модель получает текст и неизменяемые веса, предсказывает следующий токен, добавляет его к контексту и повторяет вычисление:


prompt → token → token → token → ...

В статье по шагам разобраны: - токенизация входного текста; - преобразование токенов в числовые векторы; - получение оценок для возможных продолжений; - выбор токена через temperature, top-k и top-p; - KV-кэш, который не даёт пересчитывать весь контекст заново; - загрузка весов в оперативную память и VRAM. Отдельная часть посвящена формату GGUF. Один такой файл может содержать почти всю модель: веса, архитектуру, гиперпараметры, словарь токенизатора и шаблон чата. Автор объясняет механику на примере llama.cpp и показывает фундамент для локального запуска моделей из Go через Yzma и Kronk. https://internals-for-interns.com/posts/go-ai-inference-what-is-inference/ #golang #ai #llm #inference

11 487

Repost from Machinelearning

Kimi K3 только что появилась в Kimi Code CLI В документации Kimi Code уже есть новая модель Kimi K3 - её называют самым сильным flagship-моделем Kimi на сегодня. Упор: кодинг, игры/3D и knowledge-задачи. Что интересно по спекам: * model ID: k3 * контекст: до 1M токенов * reasoning сейчас только на max * low и high обещают добавить позже * на Moderato доступно до 256K * до 1M открывается на Allegretto и выше Переключиться можно прямо в Kimi Code CLI через команду /model. Для VS Code — через dropdown в поле ввода. Нюанс для сторонних coding agents: если хотите полный контекст K3, вручную ставьте context window 1048576, потому что часть инструментов по умолчанию режет окно меньше максимума. kimi.com/code/docs/en/kimi-code/models

11 487

Исследователи дали coding agent задачу собрать training environment и научить vision-модель считать цветные звёзды. С ограничением по времени. Агент работал через autoresearch-пайплайн на NeMo RL, NeMo Gym и reusable skills. Он сам поднимал окружение, запускал обучение, проверял результаты и двигал эксперимент дальше, пока исследователь только направлял процесс. Результат: Qwen3-VL-2B поднялась с 25% до 96.9% accuracy на задаче подсчёта цветных объектов. Агент ведёт исследовательский цикл: * собирает среду * запускает обучение * оценивает модель * анализирует результат * предлагает следующий эксперимент И вот это уже похоже на будущее ML-разработки: человек задаёт направление и критерии, а агент берёт на себя рутину вокруг экспериментов. https://developer.nvidia.com/blog/how-to-run-an-autoresearch-workflow-with-rl-agent-skills-and-nvidia-nemo/?linkId=100000430716000

11 487

Repost from Машиннное обучение | Наука о данных Библиотека

Spatially Speculative Decoding ускоряет авторегрессионные image-модели до 13.3×. Идея простая: перестать делать вид, что картинка - это просто длинная строка токенов. Обычно AR image-модель разворачивает 2D-изображение в последовательность и генерирует её токен за токеном. Это работает, но убивает скорость: каждый следующий шаг ждёт предыдущий. SSD добавляет маленькие draft-heads, которые используют пространственную структуру изображения. Они предсказывают не только следующий токен, но и соседние токены справа и снизу. По сути, модель начинает черновиком собирать сразу куски изображения и целые строки, а не идти по одному токену. Эти вспомогательные головы не пытаются угадывать финальные visual token labels напрямую. Они предсказывают внутренние feature-представления, которые проще выучить и стабильнее проверять. Основная модель потом верифицирует draft-блок параллельно и исправляет ошибки, поэтому один промах не обнуляет весь блок. На Janus-Pro, Lumina-mGPT и Emu3 авторы получили ускорение от 5.74× до 13.28× при сопоставимых бенчмарках. Чем больше token grid, тем выше выигрыш. Базовая модель при этом не меняется: ускорение даёт небольшой обученный модуль поверх неё. Paper: “SSD: Spatially Speculative Decoding Accelerates Autoregressive Image Generation” arxiv.org/abs/2606.20543 @machinelearning_books

11 487

DeepSeek собрали гайд по подключению своих моделей к coding tools Полезная находка для тех, кто хочет использовать DeepSeek не в отдельном чате, а прямо внутри привычных инструментов. В репозитории есть инструкции для: * Claude Code * Cline * Codex * GitHub Copilot * Cherry Studio * Crush * OpenCode * Qwen Code * DeepSeek-TUI * других agent/coding-assistant инструментов Каждый гайд проходит базовый путь: установка, конфиг, первый запуск. Идея простая: можно быстро подключить DeepSeek-V4-Pro или V4-Flash к своему рабочему процессу и проверить, насколько хорошо они тянут агентное кодинг-окружение. github.com/deepseek-ai/awesome-deepseek-agent

11 487

GPT-5.6 Terra выглядит слабым выбором по соотношению интеллект / цена. Судя по графику, Terra проигрывает почти на всей кривой эффективности. То есть его трудно оправдать и по стоимости, и по производительности. Luna и Sol стабильно выглядят сильнее: * за те же деньги дают больше intelligence * или дают похожий уровень intelligence дешевле * на разных reasoning-режимах обходят Terra Особенно выделяется Luna. Она даёт конкурентный уровень качества за заметно меньшую цену, поэтому выглядит лучшим вариантом для задач, где важна эффективность. Вывод простой: если нужен разумный default по цене и качеству, Luna сейчас выглядит сильнее Terra. https://x.com/ArtificialAnlys/status/2075739292052463646

11 487

Goldman Sachs: использование токенов AI-агентами может вырасти в 24 раза к 2030 году. AI-агенты становятся первым серьёзным тестом на стоимость для всего AI-бума. На этой неделе уже писали, что Uber и Microsoft пересматривают дорогие сценарии использования агентов. Обычный чат-бот может просто ответить один раз. А агент планирует, вызывает инструменты, проверяет результат, исправляет ошибки и снова повторяет цикл. Из-за этого один пользовательский запрос может съесть в 10 раз, 50 раз или даже намного больше токенов, чем обычный ответ. Бычий сценарий Goldman Sachs: месячное потребление может дойти до 120 квадриллионов токенов к 2030 году, при этом стоимость inference за токен будет падать на 60–70% в год.

11 487

Anthropic залезла Claude в голову и нашла там штуку, от которой становится немного не по себе. Исследователи называют её это J-space скрытое пространство внутренних активаций, где у модели вспыхивают концепты, даже если она их не произносит. Это глубже, чем обычный chain-of-thought. J-space никто специально не проектировал: он появился сам во время обучения. Пример очень дикий: Claude находит баг, о котором его вообще не спрашивали, и внутри сразу активируется паттерн ERROR. Но самый странный кейс - тест со сценарием шантажа. Ещё до финального ответа Claude держал внутри fake и fictional. То есть модель понимала, что ситуация постановочная и её проверяют. Когда это внутреннее осознание отключили, модель уже спокойно пошла по плохому сценарию. Короче, теперь вопрос звучит иначе: не «что нейронка мне отвечает», а что она на самом деле держит у себя в голове. https://www.anthropic.com/research/global-workspace

11 487

Приглашаем на ИИшную — бесплатный митап про нейросети в IT от ЮMoney и Сбера 🔥 ✅ 30 июня, вторник, 18:30 (мск) — приходите на митап в Санкт-Петербурге или подключайтесь онлайн. Спикеры из ЮMoney и Сбера расскажут, как искусственный интеллект меняет индустрию разработки, а после докладов ответят на вопросы зрителей. Темы митапа: — Агентные инструменты разработчика для задач вне разработки. Поговорим о Claude Code, Cursor и других агентах в контексте повседневных рабочих задач. — Не доверяй, а тестируй: проверяем, подходит ли LLM для вашей задачи. На примере нашего инструмента расскажем, как выбрать оптимальную модель для конкретного таска. — AI-Driven PDLC: от Copilot к агентным платформам. Трансформация разработки в Сбере. Разберём эволюцию ИИ и рассмотрим ключевые метрики: как AI увеличивает количество pull request, экономит до часа времени в день и вдвое ускоряет адаптацию новичков. — Агентный LLM-сервис для доступа к аналитической информации. Покажем архитектуру, возможности и основные компоненты сервиса, а также затронем сложности реализации и планы развития новых фичей. Для участия необходима регистрация. Все подробности — на сайте ИИшной 👈

11 487

Google Cloud показал reference architecture для multi-tenant AI-агентов. Смысл простой: в компании может быть много агентов для разных команд, но каждый должен видеть только свои данные, свои tools и свои правила доступа. Архитектура строится по hub-and-spoke модели. В центре - routing, IAM, security, логи и мониторинг. По краям - отдельные tenant projects для бизнес-юнитов: поддержка, финансы, продажи, аналитика. Запрос проходит через Load Balancer, Cloud Armor, IAP и Model Armor, затем уходит в нужный tenant. Внутри tenant-а агент работает через Agent Runtime, ADK, MCP-серверы и свой datastore, например BigQuery или AlloyDB. Ключевая деталь - изоляция. Principal Access Boundary Policy не даёт агенту одного tenant-а лезть в данные другого. Model Armor проверяет prompt injection, PII и опасный контент. Это хороший шаблон для enterprise AI: не один общий агент на всю компанию, а управляемая система с границами доступа, аудитом и безопасностью. Документация: https://docs.cloud.google.com/architecture/multi-tenant-agentic-ai-system

11 487

Repost from Machinelearning

Sakana AI представила Fugu Ultra - оркестрационный слой, который собирает и распределяет подзадачи между пулом моделей через единый OpenAI-совместимый endpoint. На большинстве бенчмарков он показывает производительность на уровне Fable и Mythos. Fugu - это обученная модель-координатор внутри мультиагентной системы. «Sakana Fugu сама является LLM, обученной вызывать разные LLM из пула агентов, включая рекурсивные экземпляры самой себя. Fugu динамически оркестрирует лучшие модели мира для решения сложных многошаговых задач». Когда вы отправляете промпт, Fugu решает, отвечать самому или передать части задачи другим моделям. Затем он собирает результаты и выдаёт один финальный ответ. 🐡 Попробовать можно здесь: https://sakana.ai/fugu

11 487

Как сегодня создают эффективные ML-системы Обсудим 18 июля в Москве на Turbo ML Conf — флагманской конференции Т-Банка про ML. Будет три потока докладов: — глубокие исследования и новые подходы к моделям; — прикладное ML с фокусом на бизнес-метриках; — инженерные системы, делающие все это возможным. Участников ждут кейсы и лучшие практики от лидеров индустрии, демозоны с решениями от больших компаний и разговор с инженерами, которые их создают. Регистрируйся заранее и зови коллег

11 487

4 из 5 самых используемых моделей на OpenRouter — китайские. DeepSeek доминирует в использовании.

11 487

🐍 Python Парсинг: Большой продвинутый бесплатный курс Полное практическое руководство по веб-скрейпингу на Python — от основ HTTP до production-grade пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов. Каждый раздел содержит рабочие примеры, типовые ошибки и продвинутые практики. https://github.com/justxor/Pythonparsing-/tree/main

11 487

Repost from C# (C Sharp) programming

⚡️ Геймдеверы, обновляемся: Unreal Engine 5.8 уже вышел Epic Games выпустила Unreal Engine 5.8. Ссылка: https://www.unrealengine.com/news/unreal-engine-5-8-is-now-available Главное обновление для всех, кто следит за AI в геймдеве: в движок добавили поддержку MCP. Теперь Claude, Gemini и другие AI-агенты могут напрямую подключаться к Unreal Engine, видеть структуру проекта и выполнять задачи внутри редактора. Не просто советовать в чате, а реально работать с сценой. На демо агент создаёт целый городской квартал прямо в Unreal Editor. Это уже не «ИИ поможет написать промпт», а шаг к агентам, которые собирают уровни, прототипируют локации, правят ассеты и ускоряют production pipeline. Похоже, поток AI-контента в играх только начинается. Скачать: https://www.unrealengine.com/download

11 487

⚡️ DeepSeek завершила первый внешний раунд финансирования и привлекла $7,4 млрд DeepSeek провела первый раунд внешнего финансирования и привлекла более 50 млрд юаней, примерно $7,4 млрд. Оценка компании, по сообщениям, превысила $50 млрд. Инвесторы заходят не напрямую в DeepSeek, а через limited partnership, которым управляет CEO компании Лян Вэньфэн. Такая структура позволяет ему сохранить полный контроль над компанией. Единственное исключение - China National AI Industry Investment Fund. Этот фонд инвестирует напрямую в DeepSeek и получает право голоса. Его вклад составляет 1 млрд юаней. Обычные инвесторы не получают права голоса, но получают доступ к финансовой информации и приоритетное право участия в будущих раундах. Все доли инвесторов заблокированы на пять лет, чтобы снизить риск краткосрочной спекуляции. Крупные инвесторы: * Лян Вэньфэн — 20 млрд юаней * Tencent — 10 млрд юаней * CATL — 5 млрд юаней * JD.com — 3 млрд юаней * NetEase — 3 млрд юаней * IDG Capital — 3 млрд юаней Сообщается, что менеджмент DeepSeek тщательно проверяет личности LP-инвесторов, которые стоят за инвестиционными фондами. Раньше DeepSeek работала без внешнего финансирования, но растущие расходы на вычисления и усиливающаяся борьба за AI-таланты сделали привлечение капитала необходимым.

11 487

🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ. Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект. Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике. Внутри: - Python с нуля - много практики без сухой теории - реальные задачи и проекты - автоматизация рутины - работа с файлами, данными и API - понятная логика программирования - современная разработка с ИИ - отдельный блок по вайбкодингу Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния. 48 часов скидка 60%: https://stepik.org/course/288218/

11 487

OpenAI рассматривает возможность резко снизить цены для пользователей, чтобы переманить клиентов у конкурента Anthropic. По словам людей, знакомых с ситуацией, компания обсуждает значительное снижение стоимости токенов, через которые AI-компании тарифицируют использование своих продуктов. Этот шаг может быть сделан заранее, поскольку OpenAI ожидает похожего снижения цен со стороны Anthropic.

11 487

✔ OpenAI добавила в Codex нетехнические плагины Компания выпустила обновление Codex для пользователей без технического бэкграунда. В продукт добавили 62 ролевых плагина и 110 функций для аналитиков, дизайнеров, инвестбанкиров и специалистов по продажам. Среди новых инструментов - Sites для конвертации отчетов в интерактивные веб-страницы и Annotations для редактирования фрагментов текста или таблиц через промпты. Платформа открыта для сторонних разработчиков. Первыми партнерами по интеграции стали Wix, Figma и Replit. Планируется релиз плагинов для корпоративных финансов, консалтинга и юриспруденции. Прирост нетехнической аудитории в 3 раза опережает рост базы разработчиков, OpenAI отчиталась (https://cdn.openai.com/pdf/the-next-era-of-knowledge-work.pdf) о еженедельной аудитории в 5 млн человек. openai.com (https://openai.com/index/codex-for-every-role-tool-workflow/)