Анализ данных (Data analysis)
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
Show more📈 Analytical overview of Telegram channel Анализ данных (Data analysis)
Channel Анализ данных (Data analysis) (@data_analysis_ml) in the Russian language segment is an active participant. Currently, the community unites 50 212 subscribers, ranking 2 684 in the Technologies & Applications category and 12 591 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 50 212 subscribers.
According to the latest data from 03 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -1 925 over the last 30 days and by -13 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 9.56%. Within the first 24 hours after publication, content typically collects 6.45% reactions from the total number of subscribers.
- Post reach: On average, each post receives 4 799 views. Within the first day, a publication typically gains 3 239 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 30.
- Thematic interests: Content is focused on key topics such as llm, контекст, openai, архитектура, deepseek.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
Thanks to the high frequency of updates (latest data received on 04 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
Data loading in progress...
| Date | Subscriber Growth | Mentions | Channels | |
| 04 June | +21 | |||
| 03 June | +8 | |||
| 02 June | +17 | |||
| 01 June | +14 |
| 2 | 🔥 Вышка за 2,5 года в универе IThub
Самые востребованные направления в ИТ и креативе:
🔸 ИТ инновации и управление бизнесом
🔸 Интеллектуальный анализ данных
🔸 Продуктовый менеджмент
🔸 Технологическое предпринимательство
🔸 Информационная безопасность
🔸 Арт директор
Преподаватели — топы из индустрии. Те, кто сам делает то, чему учит.
Диплом бакалавра всего за 2,5 года для выпускников колледжей и второе высшее — для выпускников вузов.
Уже во время учебы ты наработаешь мощное портфолио с реальными кейсами и пройдешь стажировки в ведущих компаниях.
А еще здесь можно учиться в гибридном формате: пары онлайн по вечерам, а очные сессии по выходным. Можно не ставить карьеру на паузу
21 июня — День открытых дверей IThub. Приходи и задай все вопросы лично. Регистрация здесь.
Подать заявку на обучение можно на сайте.
#реклама
О рекламодателе | 1 964 |
| 3 | NVIDIA выкатила Nemotron 3 Ultra - открытую frontier-модель для агентов, которые работают долго, а не просто отвечают на один промпт и забывают контекст.
Ставка здесь не на красивые бенчмарки общего рассуждения, а на длинные агентные цепочки: планирование, вызов инструментов, работа с кодом, исследование документов и enterprise-сценарии, где задача тянется через десятки шагов.
Именно там обычно ломается экономика агентов. Каждый шаг - новый инференс. Чем длиннее траектория, тем выше задержка и итоговая стоимость. В демо это почти не видно, а в проде быстро превращается в главный счёт.
Поэтому самые интересные цифры у Nemotron 3 Ultra связаны с эффективностью:
- до 5x быстрее инференс
- до 30% дешевле на агентных задачах
- фокус на длинных рабочих сессиях
- открытая модель для команд, которым важен контроль над весами
Для продакшен-агентов это бьёт в больное место. Важен не только красивый ответ на одном запросе, а цена завершённой задачи: сколько стоила вся цепочка, сколько времени заняла и сколько раз агенту пришлось дергать модель.
Открытость тоже важна. Команды с собственной инфраструктурой получают больше контроля: можно дообучать под домен, гонять модель внутри периметра и не держать критичный агентный пайплайн полностью на чужом API.
Но радоваться цифрам стоит аккуратно. «До 5x» и «до 30%» почти всегда означают лучший сценарий на удобном профиле нагрузки. Реальный прирост зависит от ваших трасс, инструментов, длины контекста и количества шагов.
Проверять такую модель нужно не по latency одного запроса, а по cost-per-completed-task: сколько стоит агенту реально закрыть задачу от начала до конца.
https://blogs.nvidia.com/blog/nvidia-gtc-taipei-computex-2026-news/ | 1 852 |
| 4 | Как сделать ранжирование с нуля 💫
В Авито совсем недавно появился новый продукт — Подработка. Здесь исполнители ищут удобную работу на пару часов с быстрыми выплатами, а заказчики — толковых работников. В отличие от классической задачи что-то продать тут мы решали проблему мэтчинга: важно, чтобы и исполнителю, и заказчику понравилось работать друг с другом.
Задача большая и интересная, поэтому мы сняли новый выпуск «Диванной аналитики» с Владиславом Урихом, архитектором системы алгоритмов мэтчинга для GIG-платформы.
Вот что он рассказал:
➡️ Как начинали строить мэтчинг и почему вначале не использовали ML.
➡️ Почему первый ML-подход не сработал и какую альтернативу придумали.
➡️ Какие инсайты и уроки вынесли, чтобы построить эффективную алгоритмическую систему.
Видео о том, как разрабатывали новые подходы к мэтчингу, смотрите где удобно:
📱 YouTube
📱 VK Видео | 1 953 |
| 5 | ✔️ DeepSeek привлекает около $7,4 млрд инвестиций
Китайская компания проводит первый в своей истории раунд привлечения внешнего капитала около 50 млрд юаней ($7,4 млрд).
По данным агентства Reuters, после вложений компанию оценят в 350–400 млрд юаней ($52–59 млрд).
Крупнейшими внешними инвесторами могут стать интернет-холдинг Tencent и производитель аккумуляторов CATL: первый рассматривает вложение 10 млрд юаней, второй - 5 млрд.
Основатель DeepSeek Liang Wenfeng, по словам источников, внесёт 20 млрд юаней собственных средств (это самый крупный частный взнос в раунде).
Переговоры также ведутся с государственным фондом поддержки ИИ КНР, а также с NetEase и JD.com. Общее число инвесторов, как ожидается, не превысит десяти. Среди возможных участников называют гонконгские IDG Capital и Monolith Management.
На фоне западных сделок раунд выглядит скромно: Anthropic в прошлом месяце привлёк $65 млрд, OpenAI в марте - $122 млрд.
О планах выхода на биржу DeepSeek пока не заявлял.
@ai_machinelearning_big_data
#news #ai #ml | 1 349 |
| 6 | ИИ-ассистенты уже умеют писать код, предлагать исправления и ускорять разработку.
Но в реальных проектах вайб-кодинг заканчивается нестабильным результатом, неожиданными ошибками и хаосом в промптах.
На открытом уроке:
• Почему хаотичные промпты дают нестабильный результат и перестают работать в реальной разработке;
• Ошибки, возникающие при использовании ИИ-ассистента в рабочих задачах;
• Как перейти от «вайб-кодинга» к системному подходу при работе с ИИ в разработке;
• Как применять готовые шаблоны и практики, чтобы получать предсказуемый и полезный результат;
• Как эти подходы работают на практике — в формате живой демонстрации на реальном open-source проекте.
После занятия вы поймёте, как выстраивать управляемую работу с ИИ, как переносить рабочие подходы в свои проекты.
🗓 Открытый урок пройдёт 16 июня в 20:00 МСК в преддверии старта курса «ИИ для разработчиков».
Регистрация: https://tglink.io/75fcbcb0984f60?erid=2W5zFGqSCUH
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. | 2 276 |
| 7 | У агентов снова нашли слабое место: память может портиться прямо во время «самоулучшения».
В новой работе Useful Memories Become Faulty When Continuously Updated by LLMs исследователи из University of Illinois, Tsinghua University и других лабораторий проверили, что происходит, когда агент постоянно переписывает свой опыт в аккуратные заметки.
Идея выглядит логично: агент решил задачу, сжал опыт в короткий урок, сохранил его в память и в следующий раз должен работать лучше. Но на практике такие пересказы постепенно ломают исходный смысл.
LLM часто превращает конкретный успешный эпизод в слишком общий совет. Потом эти советы группируются, обновляются, переписываются и начинают смешивать разные типы задач. В итоге память выглядит красиво, но работает хуже, чем сырые попытки с реальным контекстом.
Авторы тестировали это на веб-шопинге, симулированных средах, работе с приложениями и ARC-подобных задачах. Самый жёсткий результат: GPT-5.4 решала 100% небольшого набора ARC-AGI без памяти, но после построения памяти из правильных решений качество падало примерно до 54%.
Что ломалось:
- разные задачи склеивались в одну группу
- частные правила становились «универсальными»
- важные детали терялись при пересказе
- память переобучалась на узкие примеры
- новые обновления затирали полезные старые факты
Для агентных систем это неприятная проблема. Долгая память сама по себе не делает агента умнее. Если каждое действие автоматически превращать в саммари, агент может звучать увереннее, но действовать хуже.
Более рабочая схема - хранить сырые эпизоды как доказательства: реальные попытки, ошибки, решения и контекст. А обобщения делать осторожно, не превращая память в бесконечно переписываемый конспект.
Paper: https://arxiv.org/abs/2605.12978 | 2 579 |
| 8 | Там, где не должно быть сбоев, нужны вы
Т-Банк запускает наем сотрудников в новые дата-центры в Серпухове и Доброграде.
Компания ищет инженеров и ИТ-специалистов, которые готовы обеспечить стабильную работу инфраструктуры и развивать современные ЦОД по последним стандартам.
А еще предлагает:
— работу в современных офисах;
— ДМС со стоматологией, спортзал, консультации психологов, юристов и финансовых специалистов;
— компенсацию питания и спорта;
— специальные тарифы на продукты банка и скидки от партнеров;
— возможность переезда.
Вакансии подойдут и опытным, и начинающим специалистам.
Откликнуться можно прямо сейчас | 2 667 |
| 9 | ⚡️ OpenAI раздаёт ChatGPT Pro на 6 месяцев владельцам open-source проектов.
В рамках программы Codex for Open Source можно получить:
• 6 месяцев ChatGPT Pro
• доступ к Codex и GPT-5.5 Pro
• API-кредиты
• Codex Security
Заявка простая: нужно отправить ссылку на свой репозиторий и коротко объяснить, зачем проект важен и как Codex поможет его улучшить.
Больше шансов у тех, у кого есть:
• активный GitHub-профиль
• несколько публичных репозиториев
• звёзды на проектах
• нормальная история коммитов
Если у вас есть живой open-source проект, это один из самых простых способов получить ChatGPT Pro на полгода бесплатно.
https://openai.com/ru-RU/form/codex-for-oss/
@data_analysis_ml | 7 600 |
| 10 | Кремниевая долина в шоке: Сандерс хочет забрать половину AI-капитала
Берни Сандерс (главный социал-демократ американской политики) готовит законопроект American A.I. Sovereign Wealth Fund Act. Идея звучит максимально жёстко для Кремниевой долины: крупнейшие AI-компании должны передать 50% акций в пользу общества через разовый налог не на прибыль, а именно на stock.
По замыслу Сандерса, эти доли попадут в суверенный фонд. Дальше доходы от роста AI-индустрии должны идти не только основателям, фондам и ранним инвесторам, а обычным гражданам США: через выплаты, медицину, образование и жильё.
Аргумент у него простой и политически очень заряженный. Генеративный ИИ обучался на книгах, коде, статьях, музыке, изображениях, видео и идеях миллионов людей. Значит, если новые триллионы создаются на базе «коллективного знания человечества», то и часть богатства должна возвращаться обществу.
Для AI-компаний это, конечно, выглядит как кошмарный сценарий. Не штраф, не новый налог на прибыль, не регулирование API, а фактическое размывание собственности в пользу государства и граждан.
Что предлагает Сандерс:
- 50% ownership stake для общества в крупнейших AI-компаниях США
- разовый налог акциями, а не деньгами
- создание американского AI sovereign wealth fund
- участие государства в управлении через голосующие акции
- распределение будущих доходов между гражданами
Полный текст закона он обещает раскрыть позже, поэтому пока это скорее политическая рамка, чем готовый юридический механизм. Но сама постановка вопроса уже важна.
Политики начали смотреть на ИИ модели не как на обычный софт, а как на новую нефтяную скважину. Только вместо нефти - данные, код, культура, научные тексты и человеческое внимание. | 4 101 |
| 11 | Недавно вышло интервью с выпускником ШАДа Степаном Платинским. Он сейчас работает в международном поиске Яндекса и параллельно занимается экстремальной статистикой.
В прошлом году Степан ездил на стажировку в Саудовскую Аравию — в университет KAUST — как приглашённый исследователь. И вот какие советы он даёт тем, кто хочет развиваться в ML и науке.
1. Начинайте исследования как можно раньше. Степан жалеет, что вплотную занялся наукой только на старших курсах. Совет: ищите экспертов, участвуйте в их проектах, публикуйтесь. Это даёт опыт, связи и строчку в резюме, которая открывает двери в PhD за границей.
2. Идеальный английский не нужен. Гораздо важнее иметь реальные результаты. На зарубежные стажировки берут тех, у кого за плечами есть наработки и исследования, а не тех, кто красиво говорит.
3. Главный навык для ML — любознательность. «Заставить себя невозможно, важно искренне хотеть разбираться».
Ну и база — фундаментальное образование, сочетающее теорию и практику. | 3 434 |
| 12 | США хотят смотреть самые мощные AI-модели до релиза
Трамп подписал executive order, который вводит добровольную проверку frontier-моделей перед выпуском. Речь не про все новые LLM подряд, а про системы, которые могут перейти порог по продвинутым киберспособностям.
Если модель уже умеет находить уязвимости, автоматизировать кибероперации или подсвечивать слабые места в критической инфраструктуре, государство хочет получить короткое окно до публичного релиза. Не чтобы «разрешить или запретить» модель, а чтобы защитники успели подготовить патчи, процедуры и ограничения.
По новой рамке AI-лаборатории смогут добровольно давать федеральным агентствам доступ к таким моделям максимум на 30 дней до релиза для других доверенных партнёров. К оценке должны подключаться NSA, CISA, NIST и другие структуры, а сам порог для covered frontier model будет определяться через закрытый benchmarking-процесс.
covered frontier model - это не любая новая модель, не очередной апдейт чат-бота и не open-source релиз на Hugging Face. Это модель, которая по правительственным критериям показывает продвинутые возможности именно в кибердомене.
Отдельно в EO прописано, что документ не создаёт обязательное лицензирование, preclearance или разрешительный режим для разработки, публикации и распространения AI-моделей, включая frontier-модели. То есть формально это не «гослицензия на LLM», а попытка встроить ранний кибер-аудит в релизный цикл самых опасных систем.
Пока это добровольная опция.
http://whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security/ | 3 448 |
| 13 | ⚡️ Microsoft выпустил MAI-Transcribe-1.5 - модель транскрибации речи, которая обрабатывает аудио в 276 раз быстрее реального времени.
Для сравнения: второй по скорости точный конкурент из топ-10 работает вдвое медленнее.
При этом по качеству - 2.4% WER по бенчмарку Artificial Analysis, третье место в общем зачёте. Впереди только Alibaba Fun-Realtime-ASR-preview (1.7%) и ElevenLabs Scribe v2 (2.2%).
keyword biasing для редких слов - имён собственных, медицинских терминов и поддержка 43 языков включая арабский, японский, китайский.
Скорость такого уровня при точности из топ-3.
https://microsoft.ai/news/introducingmai-code-1-flash/ | 3 660 |
| 14 | Alphabet больше не ведёт себя как классическая софтверная машина с бесконечной маржей
Компания собирается привлечь до $80 млрд через выпуск акций и гибридных инструментов, чтобы залить эти деньги в ИИ-инфраструктуру. Berkshire Hathaway отдельно заходит на $10 млрд, и это делает историю намного интереснее обычного «техгиганту понадобился кеш».
Спрос на ИИ есть. Продукты есть. Модели есть. Проблема в том, где взять достаточно compute, энергии, дата-центров, сетей и чипов, чтобы этот спрос обслужить.
Alphabet не просто завтра выкидывает на рынок $80 млрд обычных акций. Структура сложнее:
- $30 млрд через underwritten offerings
- часть через mandatory convertible preferred
- $10 млрд частным размещением для Berkshire Hathaway
- $40 млрд через ATM-программу
- около $30 млрд из ATM связано с налоговой механикой по employee equity
ИИ-инфраструктура стала настолько дорогой, что даже Alphabet выгоднее комбинировать разные источники финансирования.
Если Berkshire заходит в такой раунд, рынок получает сигнал: AI capex можно рассматривать не только как безумные траты на GPU, а как строительство будущей платной магистрали.
s206.q4cdn.com/479360582/files/doc_news/2026/Jun/01/attachments/2026-June-Alphabet-Equity-Capital-Raise-Press-Release-PDF.pdf | 3 812 |
| 15 | PewDiePie внезапно стал амбассадором локального ИИ
За первый день проект собрал почти 20 000 звёзд.
Человек, который больше десяти лет был лицом YouTube-летсплеев и развлекательного контента, теперь собирает железо под LLM, дообучает модели и выкатывает open-source инструменты для локальных агентов.
Сначала он показал домашнюю машину примерно за $20 000, собранную под запуск ИИ-моделей без облачных сервисов. Аргумент у него простой: не отправлять личные данные в чужие API, не зависеть от подписок и держать весь стек у себя.
Потом он начал экспериментировать с дообучением моделей и заявлял, что его вариант на отдельном бенчмарке обгоняет даже топовые закрытые решения.
Теперь появился Odysseus - open-source оболочка для self-hosted AI-среды.
Это уже не просто «запусти модель через терминал». Идея ближе к локальному ChatGPT для своих задач:
- удобный интерфейс
- память
- работа с инструментами
- хранение данных у себя
- поддержка агентов
- подключение моделей через Ollama, llama.cpp и vLLM
- гибкая настройка доступов
Видео: https://youtu.be/rAzT5lcezPs
GitHub: github.com/pewdiepie-archdaemon/odysseus | 4 542 |
| 16 | Keye 2.0 от Kuaishou - интересный шаг для мультимодальных моделей: DeepSeek Sparse Attention впервые нормально утащили в задачу длинного видео.
Главная фишка - 256K контекста. Модель может разбирать часовые видео без типичного развала внимания, когда в начале ролика одно, в середине другое, а к концу модель уже теряет причинно-следственные связи.
Что важно:
- 30B MoE-модель с 3B активных параметров
- поддержка длинных видео и сложной временной логики
- prefill cost ниже примерно на 50%
- результат 74.10 на LongVideoBench
- на VideoMME V2 качество растёт при увеличении входа с 64 до 512 кадров: 35.34% → 42.44%
- есть фокус на timestamps, причинные цепочки, туториалы, игровые видео и длинные влоги
изменился контекст и почему это важно.
Веса уже открыты:
https://modelscope.ai/models/Kwai-Keye/Keye-VL-2.0-30B-A3B | 3 911 |
| 17 | 🖥 Nvidia представила RTX Spark 0 ARM-чип, который метит туда, где Apple M-серия доминирует.
По памяти: RTX Spark поддерживает до 128 ГБ LPDDR5X (минимум 16 ГБ) с пропускной способностью 300 ГБ/с через NVLink C2C. Для локального запуска LLM и диффузионных моделей это принципиально важная цифра - большой объём единой памяти без разделения между CPU и GPU.
Полный стек NVIDIA включает поддержку CUDA, TensorRT, NVFP4, DLSS, Ray Tracing, Reflex и G-SYNC. Всё, что нужно разработчику под CUDA, будет работать нативно без каких-либо дополнительных прослоек.
Первые устройства на RTX Spark выйдут осенью 2026 года. Свои флагманы на новом чипе уже готовят Microsoft (Surface Laptop Ultra), Asus (ProArt P14, P16), Dell (XPS 16), MSI (Prestige N16 Flip AI), HP (OmniBook X14 Ultra 16), Lenovo (Yoga Pro 9i) и другие. Помимо ноутбуков, в планах у Nvidia - компактные десктопы: Acer, Asus, Dell, Gigabyte, HP, MSI и Lenovo анонсировали RTX Spark Desktop-устройства. | 5 955 |
| 18 | Lakehouse — новый подход к данным, который убивает DWH и Data Lake
- Высокая вероятность, что массовый переход на Lakehouse начнётся в ближайшие 1-2 года — после того как первые игроки (Т-банк, Магнит, Ламода) уже доказали экономию и масштабируемость. Об этом в интервью «Коммерсанту» рассказал Леонид Савченков, руководитель продуктовой архитектуры платформы данных Yandex Cloud.
- Классические DWH на объёмах от 100 ТБ начинают тормозить: единственный способ — докупать серверы целиком, потому что хранение и вычисления сцеплены.
- Data Lake решал проблему объёма, но не давал нормального управления данными — отчёты строить было сложно.
- Lakehouse разделяет хранение и вычисления: можно нарастить мощности под «Чёрную пятницу» и не платить за лишнее место весь год.
- В отличие от Data Lake, здесь появляются строгие табличные форматы и управление данными как в СУБД.
- Узкое место — нужны спецы по Trino и Spark. Чудес не бывает.
- Для ИИ это идеально: вычисления можно выделить в отдельные мощности, не роняя основные отчёты. X5 уже построил бота по трендам молока в регионах.
- Через пять лет, вероятно, появится новая концепция. Если данных мало — старый DWH всё ещё дешевле и проще.
https://www.kommersant.ru/doc/8691430 | 4 037 |
| 19 | MiniMax M3 выглядит как один из самых сильных открытых релизов этого года.
Модель сразу бьёт в три направления, которые сейчас важны для практического ИИ: кодинг, агентные сценарии и мультимодальность. То есть не просто чат-модель с длинным контекстом, а система, которую пытаются сделать пригодной для реальной работы с кодом, терминалом, браузером, изображениями, видео и computer use.
Что заявляют по цифрам:
- 59.0% на SWE-Bench Pro
- 66.0% на Terminal Bench 2.1
- 34.8% на SWE-fficiency
- 28.8% на KernelBench Hard
- 74.2% на MCP Atlas
- контекст до 1M токенов через MiniMax Sparse Attention
- до 15x ускорение декодирования на длинном контексте
- оптимизация CUDA FP8 GEMM kernel с нуля дала 9.4x ускорение на Hopper GPU
- нативная работа с изображениями, видео и computer use
API: http://platform.minimax.io
Тарифы по токенам: https://platform.minimax.io/subscribe/token-plan
MiniMax Code: http://code.minimax.io | 3 825 |
| 20 | Работа The AI Layoff Trap цепляет самой механикой ловушки вокруг ИИ-автоматизации.
Представьте обычную компанию. Она заменяет часть сотрудников ИИ, снижает расходы и получает преимущество. Конкуренты видят это и повторяют. Потом подключаются остальные. Бизнес действует рационально: режет издержки, защищает маржу, ускоряет процессы.
Уволенные сотрудники были покупателями. Когда таких людей становится много, они тратят меньше. Спрос падает, продажи проседают, компании снова ищут, где урезать расходы. Самый быстрый путь - ещё больше автоматизации.
Так появляется петля: компании заменяют людей ИИ, доходы падают, рынок покупает меньше, бизнес снова режет расходы. Для одной фирмы это выглядит разумно. Для системы в целом такой цикл может стать ловушкой.
Обычно считают стоимость задачи, скорость, качество ответа, экономию на людях. Гораздо реже считают эффект второго порядка: что произойдёт, если такую же оптимизацию одновременно проведут тысячи компаний.
Авторы работы показывают, что базовый доход, налоги на капитал, переобучение, доля работников в бизнесе и договорённости между компаниями в их модели проблему полностью не закрывают. Единственный механизм, который сработал, - налог на автоматизацию задач. Компания заранее учитывает ущерб спросу, который создаёт массовой заменой людей ИИ.
С моделью можно спорить. Но постановка сильная: ИИ может ударить по экономике через обычную конкуренцию. Каждый игрок действует рационально, пока сумма этих решений постепенно ослабляет рынок, на котором все они зарабатывают.
http://arxiv.org/pdf/2603.20617 | 3 894 |
Available now! Telegram Research 2025 — the year's key insights 
