Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya12 565 Texnologiyalar & Aralashmalar2 677...

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 165 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 677-o'rinni va Rossiya mintaqasida 12 565-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 165 obunachiga ega bo‘ldi.

14 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -30 ga, so‘nggi 24 soatda esa 4 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 8.79% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 6.04% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 4 408 marta ko‘riladi; birinchi sutkada odatda 3 027 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 30 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 15 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 165

Obunachilar

+424 soatlar

-527 kunlar

-3030 kunlar

4 408

Post ko'rishlar

~ 3 02724 soatlar

~ 3 53448 soatlar

8.79%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Postlar arxiv

50 178

🧠 Теперь можно вычислять LLM, которые «накрутили» баллы на бенчмарказ по математике, но не умеют больше ничего. В свежем исследовании *“Does Math Reasoning Improve General LLM Capabilities?”* показано, что модели, обученные на математике с помощью SFT, часто не улучшаются вне математики — а иногда даже деградируют. 📊 Что выяснили: • SFT на математике → ухудшение на нематематических задачах • RL на математике → перенос улучшений в другие домены • SFT вызывает сильное смещение представлений и токен-дистрибуций • RL наоборот — сохраняет топологию модели и двигает только логические оси 🧪 Авторами разработан новый инструмент — Transferability Index: Это простое соотношение между улучшением на математике и изменением на сбалансированном наборе задач. Помогает понять: ✔️ где модель реально умнее ❌ а где — просто бенчмарк‑максинг 📌 Вывод: RL-постобучение лучше предотвращает «забвение» и делает LLM более универсальными. SFT — может казаться эффективным, но часто ухудшает общие способности модели. 📌 Подробнее

50 178

Microsoft уволит 9 000 сотрудников — это примерно 4% от общего числа работников компании. Очевидно, что ИИ действительно делает людей ненужными. И это уже не просто громкие заявления. @data_analysis_ml

50 178

🧠 II-Medical-8B-1706 — open-source LLM для медицинских задач! ▪️ Превзошла MedGemma 27B от Google при 70% меньшем количестве параметров ▪️ Квантизированные веса GGUF — модель запускается даже на <8 ГБ ОЗУ Model card: https://huggingface.co/Intelligent-Internet/II-Medical-8B-1706 GGUF quantization: https://huggingface.co/Intelligent-Internet/II-Medical-8B-1706-GGUF

50 178

Интелион Облако запускает розыгрыш 🎉 Главный приз – 3 сервера с А10 или А5000. Также разыгрываются приятные скидки. Запусти нейросеть, рендер, LLM или сложные вычисления на топовом GPU за 1 рубль! Как принять участие: 1. Зарегистрироваться на Intelion.cloud 2. Заполнить форму розыгрыша 3. Подписаться на ТГ канал Итоги подведем 5 июля в прямом эфире в канале Artificial Intelion. Не забудь поделиться с другом!

50 178

🧠 WM-Abench — бенчмарк для оценки памяти у мультимодальных LLM Новый open-source бенчмарк от Maitrix Research оценивает, как мультимодальные модели (текст + изображение) запоминают и используют визуальную информацию. 📌 Что проверяется: – Могут ли LLM “удерживать в голове” объекты, числа и расположение – Насколько глубоко модель понимает визуальный контекст – Способна ли она логически оперировать на основе того, что “видела” 📈 Поддерживаются: GPT‑4o, Gemini, Claude, LLaVA и другие 🔍 Задания: от простых “где лежит мяч?” до сложных визуальных рассуждений Исследователи из Maitrix оценили 15 SOTA мультимодальных моделей (включая o3 и Gemini 2.5 Pro) по 23 когнитивным измерениям: от базового восприятия до предсказания будущих состояний. Ключевые выводы: 🔹 Модели хорошо справляются с распознаванием, но проваливаются в 3D-пространственном мышлении, динамике движения и причинно-следственной симуляции. 🔹 VLM склонны “путать” физику: даже изменение цвета объекта сбивает модель на задачах восприятия. 🔹 В сложных задачах предсказания следующего состояния — даже лучшие модели отстают от человека на 34.3%. 🔹 Точность восприятия ≠ понимание: даже “увидев” всё правильно, модели не умеют достроить последствия и взаимодействия объектов. Отличный инструмент, чтобы понять на что реально способна ваша мультимодальная модель, а не только на красивые демо. 🔗 https://wm-abench.maitrix.org #LLM #AI #multimodal #benchmark

50 178

🧠 Хочешь понять, на чём основана модель Gemma 3n от Google? Вот ключевые научные работы, стоящие за её архитектурой и обучением: 🔹 AltUp — улучшение аппроксимации внимания https://arxiv.org/abs/2301.13310 🔹 LAuReL — расширение языковых моделей за счёт многоязычного претрейнинга https://arxiv.org/abs/2411.07501 🔹 MatFormer — матричная факторизация для масштабируемых LLM https://arxiv.org/abs/2310.07707 🔹 Activation Sparsity — обучение моделей с разреженной активацией https://arxiv.org/abs/2506.06644 🔹 Universal Speech Model — единая модель для понимания и генерации речи https://arxiv.org/abs/2303.01037 📘 Блог Google с обзором архитектуры и практическим гайдом по Gemma 3n: https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/

50 178

📡 Как студенты российских IT-вузов занимаются разработкой баз данных. На Хабре вышла статья про YDB — распределённую СУБД с открытым исходным кодом. Она применяется для построения высоконагруженных систем и может исполнять федеративные запросы к внешним источникам данных. Что внутри: 🧩 как реализовать SQL-запрос к внешней NoSQL-базе 📦 как упаковать Redis и MongoDB в реляционную модель ⚙️ проектируем абстракцию, которая может спрятать *любой* внешний источник данных Новые функции YDB пилят студенты Яндекс Образования, а ревью прходоят у разработчиков бигтеха. Результат: федеративные запросы в YDB теперь могут быть адресованы к PostgreSQL, ClickHouse, MongoDB, Redis и многим другим источникам – польза для всего open-source сообщества. 📌 Статья полезна для тех, кто интересуется: — Разработкой СУБД — Консолидацией гетерогенных данных

50 178

miniDiffusion — упрощённая реализация Stable Diffusion 3.5 на PyTorch 🔹 Этот репозиторий — минималистичный, но рабочий аналог Stable Diffusion: всего ~2800 строк кода, без лишних зависимостей. 📦 Что внутри: • Архитектура DiT (Diffusion Transformer) • Кодировщики: T5 (текст) и CLIP • VAE для генерации изображений • Attention, Noise Scheduler и FID-оценка качества 🧪 Зачем это нужно: • Понять, как работает диффузионная генерация • Экспериментировать с архитектурой • Обучать и тестировать свои модели ▶️ Быстрый старт:


git clone https://github.com/yousef-rafat/miniDiffusion
pip install -r requirements.txt
python3 encoders/get_checkpoints.py

📌 Github

50 178

🧠 Как успевать следить за всеми новостями искусственного интеллекта? И чтобы не тратить на это кучу времени?! Мы нашли ребят, которые делают это за вас. 📌 Рекомендуем подписаться на канал @svodka_ai — Искусственный интеллект. Каждый день их AI-журналисты мониторят десятки каналов про ИИ, а затем выдают утренний компактный дайджест: 📰 5–8 главных новостей без оффтопа и инфошума 🔗 Линк на источник под каждым пунктом — сразу в закладки или "прочитать позже" ⏱️ Формат "прочёл за три минуты — знаешь всё основное" 🧩 Все релизы, новости ИИ-компаний, секреты о тулах – в одном месте 💡 Экономия: ~90 % времени против ручного серфинга по каналам. Если ИИ — ваш хлеб (или хотя бы джем к утреннему кофе), подпишитесь на @svodka_ai и начинайте день, уже зная главное. Профит прост: меньше скролла — больше инсайтов без инфошума. 👉 Подписывайтесь и пусть ИИ готовит для вас сводки самого главного erid: 2W5zFHoXe24

50 178

Apple выложила Sage Mixtral 8x7B fine-tune с лицензией Apache 💡 Это не просто ещё одна доработка LLM — модель использует State-Action Chains (SAC), чтобы встроить в диалоговую генерацию латентные переменные для эмоций и стратегий общения. Что это даёт: - SAC vs обычный fine-tune: модель получает грубое управление через state/action токены → диалоги становятся эмоционально насыщеннее, без потери на метриках - Итеративная доработка: self-play + tree search позволяют оптимизировать диалоги по цепочкам действий, превзойдя базовые модели по оценкам LLM-судей 🔗 https://huggingface.co/apple/sage-ft-mixtral-8x7b #apple #opensource

50 178

🍏 Apple рассматривает замену Siri на Claude или ChatGPT Apple активно изучает возможность использования моделей Claude 3 Opus от Anthropic и GPT-4 Turbo от OpenAI для новой версии Siri, отказавшись от собственных LLM. Компания провела тестирование обеих моделей на закрытой облачной инфраструктуре, чтобы сравнить качество генерации, безопасность и способность к сложным диалогам. Причины перехода: — Собственная разработка LLM для Siri задерживается до 2026 года из-за проблем с качеством — Необходимость ускорить вывод на рынок более интеллектуального голосового ассистента — Усиленная конкуренция с Google Assistant и Microsoft Copilot Что уже сделано: — Тестирование Claude 3 Opus и GPT-4 Turbo на Private Cloud Compute Apple — Смена руководства AI-подразделения: Майк Рокуэлл занял место Джона Джаннандреа — Отмена запуска “LLM Siri” на WWDC 2025 из-за неготовности модели 📌 Подробнее @data_analysis_ml

50 178

Repost from Machinelearning

✔️ Alibaba Group представила обновленный Qwen-TTS для английского и китайского языков. Qwen обновила свой синтезатор речи Qwen-TTS, его обучали на миллионах часов аудиозаписей. Новая версия адаптирует интонацию, ритм и эмоции под контекст текста и приближает звучание к человеческому. Добавили 3 китайских диалекта и поддержку 7 двуязычных голосов (Cherry, Ethan, Jada и др.). Тесты в SeedTTS-Eval показали высокую точность (WER 1.209) и естественность (SIM 1.967). Модель доступна только через API. В будущем обещают новые языки и стили речи. qwenlm.github.io ✔️ Исследование: как ИИ-поисковики меняют правила видимости веб-контента. Совместное исследование ERGO Innovation Lab и ECODYNAMICS показало, что ИИ-системы не просто выдают популярные ссылки, они анализируют структуру, читаемость и ясность контента. Это ставит под сомнение традиционные методы SEO в для традиционных сайтов. Аналитики изучили 33 тыс. запросов и 600 сайтов из области услуг страхования. Результат: LLM оценивают не только ключевые слова, но и логичность подачи информации, удобство навигации и глубину раскрытия темы. Специалисты советуют пересмотреть стратегии: упростить тексты, структурировать данные и адаптировать контент под агентные системы. Чем раньше компании пересмотрят свои SEO-стратегии, тем выше вероятность оставаться на виду, когда алгоритмы станут сложнее. Полную версию отчета можно почитать по ссылке. ergo.com ✔️ OpenAI и компания Марка Цукерберга борются за кадры. Конкуренция за лучших специалистов в сфере ИИ достигла критической точки. После того как компания Цукерберга переманила 4 ключевых сотрудников OpenAI для работы над «суперинтеллектом», глава исследований Марк Чэн призвал команду Сэма Альтмана оставаться верной компании, пообещав пересмотреть зарплаты и улучшить условия. По данным источников, Цукерберг предлагает бонусы до $100 млн и лично контактирует с потенциальными кандидатами. Внутри OpenAI сотрудники жалуются на перегрузки, многие работают по 80 часов в неделю. В ответ на агрессивный хэдхантинг, Open AI объявила о «перезагрузке» на неделю, при этом напомнив, что из главная цель - развитие ИИ, а не соревнование с конкурентами. wired.com ✔️ Microsoft создала ИИ-систему для диагностики, превосходящую врачей. Microsoft разработала ИИ-инструмент MAI-DxO, который в 4 раза эффективнее опытных врачей в решении сложных диагностических задач. Система использует «оркестратор», создавая сеть из 5 ИИ-агентов, выполняющих роли от генератора гипотез до выбора тестов, которые взаимодействуют и «спорят» для принятия решений. Тестирование на 304 сложных клинических случаях из NEJM показало точность 85,5% при использовании OpenAI o3 — против 20% у людей без доступа к справочникам или коллегам. Технология может быть интегрирована в Copilot и Bing, которые суммарно обрабатывают около 50 млн. медицинских запросов ежедневно. ft.com ✔️ Роботы-гуманоиды впервые сыграли в футбол без участия людей. В минувшую субботу, в Пекине прошел первый в Китае турнир по футболу полностью автономных роботов-гуманоидов. Команда университета Циньхуа победила в финале, обыграв соперников из сельскохозяйственного университета со счетом 5:3. Обе команды использовали одинаковое оборудование от Booster Robotics, но разрабатывали собственные алгоритмы для управления зрением, балансом и движениями. Матч стал испытанием для технологий: роботы падали, теряли равновесие, а иногда их приходилось уносить на носилках - все это помогает тестировать системы управления и безопасности перед массовым внедрением. Организаторы назвали матч "трейлером" предстоящих Всемирных игр роботов в августе, где будут представлены 11 видов спорта. bloomberg.com @ai_machinelearning_big_data #news #ai #ml

50 178

🧠 Хочешь сделать свой ИИ-стартап? Начни с базы! Microsoft запустила бесплатный курс по MCP — это про то, как подключать нейросети к реальным приложениям: сайтам, чатам, бэкендам и не только. 📚 Что внутри: • 11 модулей с теорией и практикой • Примеры кода на разных языках • Всё можно пройти на русском Идеально, если хочешь научиться использовать ИИ не на уровне «поиграться», а реально внедрять. 👉 Курс бесплатный — забираем здесь

50 178

📘 Machine Learning Q and AI — новая книга от мастодонта ML Себастьяна Рашки теперь в открытом доступе! 👨‍🔬 Автор — core‑разработчик Scikit‑learn, преподаватель, автор культовых пособий по машинному обучению. Что внутри: • 30 глав по нейросетям, компьютерному зрению, LLM, оценке и деплою моделей • Чёткая структура: теория → примеры → упражнения • Много практики, схем, визуализаций и Python‑кода Это не просто справочник, а полный курс по Deep Learning, от основ до продвинутых тем. 📖 Читать онлайн @data_analysis_ml

50 178

🖥 Когда с первого взгляда ясно — статья огонь. Иллюстрация различий между: unsupervised learning, supervised fine-tuning и RLHF из тех репорта ERNIE. @data_analysis_ml #ERNIE #Baidu

50 178

Многие аналитики годами остаются на одном уровне, хотя могли бы расти быстрее. Проблема часто не в недостатке знаний, а в отсутствии системного понимания профессии. Без четкого представления о том, какие навыки действительно важны и как они сочетаются между собой, развитие становится хаотичным и неэффективным. 3 июля в 19:00 (мск) Анастасия Зеленова, team lead аналитики в Raiffeisen CIB, проведет вебинар, где разберет устройство профессии аналитика данных и расскажет какие инструменты и навыки нужны для работы. Систематизируйте свои знания на бесплатном онлайн-вебинаре: https://clc.to/erid_2W5zFH7Rc9e Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFH7Rc9e

50 178

🔥 Дженсен Хуанг (CEO NVIDIA): «Я желаю вам боли и страданий» Жёсткое, но честное заявление от главы одной из самых влиятельных технологических компаний мира: > «Говорят: выбирай карьеру по страсти. И обычно люди связывают страсть с удовольствием. Это не ошибка… но это не всё. Потому что создать что-то великое — непросто. А когда делаешь что-то сложное, тебе не всегда приятно.» 🧠 Хуанг признаётся: он не любит каждый день своей работы и не всегда счастлив, но *каждую секунду любит свою компанию*. > «Многие думают, что лучшая работа — та, где ты всегда счастлив. Я так не считаю. > Нужно страдать. Нужно бороться. Нужно преодолевать. > Только так можно по-настоящему ценить то, что ты сделал. > Нет ничего великого в легком.» 🎯 И добавляет: > «Я желаю вам величия. А значит — желаю вам боли и страданий.» Это не мотивация в розовых тонах. Это правда тех, кто строит настоящее. Успех — не про постоянный комфорт, а про постоянное преодоление. 💬 А вы согласны с таким взглядом на дело жизни? @data_analysis_ml

50 178

Самый надёжный способ стать аналитиком, которого берут в Авито, Яндекс и Альфу. В этом канале мы много рассказываем об обучении аналитике. Хотим рассказать еще про одну хорошую школу. Как заметили курс: стали часто встречаться ребята из Changellenge >> Education. По хардам ок, презентуют как взрослые. Разобрался, что они выпускаются из годовой программы переподготовки «Аналитик PRO». Чем они сильнее большинства курсов и симуляторов: — Школа специализируется только на аналитике, обучает студентов с 2018 года. — Учитесь на живых бизнес-кейсах от компаний-партнеров: оптимизируете запасы ретейл-сети, считаете юнит-экономику маркетплейса, строите модель оттока банка. — Софт-скиллы встроены: проекты защищаете в мини-командах, тренируясь говорить с продукт-диром на его языке, а не «RMSE снизил — пора на прод». — После курса навсегда остаётесь в сообществе 1 000+ аналитиков: обмен джоб-офферами, экспертизой и ревью резюме нон-стоп. В программе: — гибкий график обучения на 12 месяцев — Excel → SQL → Python → BI + финмодели — 4 законченных кейса (Авито, РЖД, Т-банк, МТС) — диплом гос.образца о профессиональной переподготовке Длинный путь? Да. Но именно такие ребята проходят скрининги с первой попытки. До 30 июня на курс “Аналитик PRO” действует скидка более 70 000 рублей — а по моему промокоду ПРОМОКОД вы получите индивидуальную карьерную консультацию в подарок. Записывайтесь на курс и не сомневайтесь, станьте востребованным на рынке специалистом! Реклама. ООО "Высшая школа аналитики и стратегии" ИНН 7716917009

50 178

🚨 Цукерберг переманил ещё 4 исследователей из OpenAI По сообщениям, Meta усилила свою AI-команду, наняв сразу четырёх топовых специалистов из OpenAI: • Shengjia Zhao • Jiahui Yu • Shuchao Bi • Hongyu Ren Все четверо работали над ключевыми направлениями reasoning, мультимодальности и архитектурой LLM. 💬 Zuck be like: *“If you can’t beat them — just buy their team.”* Meta продолжает агрессивную AI-экспансию после неудачного старта Llama 4 и явно собирается реваншироваться. 📌 Подробности #openai #ai #llm #zuckerberg #research #technews