Анализ данных (Data analysis)
前往频道在 Telegram
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
显示更多📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览
频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 50 150 名订阅者,在 技术与应用 类别中位列第 2 678,并在 俄罗斯 地区排名第 12 571 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 50 150 名订阅者。
根据 12 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -35,过去 24 小时变化为 -30,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 9.06%。内容发布后 24 小时内通常能获得 5.57% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 4 547 次浏览,首日通常累积 2 794 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 30。
- 主题关注点: 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
凭借高频更新(最新数据采集于 13 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
50 150
订阅者
-3024 小时
-537 天
-3530 天
帖子存档
DeepAnalyze: первый агентный LLM для полностью автономной Data Science 🤖📊
Забудьте о ручной обработке данных — DeepAnalyze-8B сам проходит весь путь:
от сырых файлов до аналитического отчёта уровня эксперта.
Поддерживает:
🛠 Подготовку данных, анализ, моделирование, визуализацию и генерацию инсайтов
🔍 Открытые исследовательские задачи и автоматическое составление research-репортов
И всё это — без жёстких workflow’ов, с обучением по принципу «от простого к сложному», как настоящий дата-сайентист.
При этом модель всего 8B параметров, но уже обгоняет агентов на проприетарных LLM.
✅ Открытый код
✅ Открытые веса
✅ Открытые данные обучения
Идеальный инструмент для автоматизации рутинных и сложных data-задач.
🔗 https://ruc-deepanalyze.github.io
Стажировка для будущих аналитиков
Т-Банк открыл набор на оплачиваемую стажировку для тех, кто хочет разобраться, как устроен бигтех изнутри. Здесь не дают учебных заданий — с первого дня будете искать закономерности, проверять гипотезы и помогать команде принимать продуктовые решения.
Наставники помогут освоить новые инструменты, а команда — разобраться в сложных кейсах. Стажеры получают поддержку, обратную связь и возможность развиваться в удобном темпе.
Формат гибкий: от 20 до 40 часов в неделю, удаленно или в офисе. Есть пять направлений: продуктовая, риск-, инвестиционная аналитика, технологии и AI-продукты.
Станьте аналитиком — приходите качать скиллы в Т-Банк.
Заявки принимаются до 13 ноября
+3
LoRA-модель от autoweeb, которая превращает обычные фотографии в аниме-стиль ☺️
Основана на Qwen-Image-Edit-2509.
Работает просто: загружаете фото, пишете что-то вроде «transform into anime» - и получаете аниме-версию исходного снимка. Настроек минимум, результат отличный.
Ссылка: https://huggingface.co/autoweeb/Qwen-Image-Edit-2509-Photo-to-Anime
@data_analysis_ml
⚡️ GPT-5 на Sudoku-Bench
Команда Sudoku-Bench обновила результаты тестов. Напомню, когда бенчмарк вышел в мае 2025, ни одна LLM вообще не могла решить обычную судоку 9×9.
Теперь ситуация изменилась: GPT-5 стал новым лидером и решает 33% задач - в два раза умнее ближайшего конкурента. Это первая модель, которой удалось пройти и вариант классической 9×9.
Но главная часть бенчмарка остаётся нерешённой: 67% более сложных головоломок по-прежнему оказываются слишком сложными. Причина в том, что современные модели плохо справляются с тем, что нужно для настоящей судоку: понимать новые правила, держать в голове глобальную структуру, строить длинные логические цепочки и находить "точку входа", которую опытные люди сразу замечают.
Дополнительные эксперименты - GRPO-тюнинг Qwen2.5-7B и Thought Cloning на примерах из Cracking the Cryptic - дали небольшой прогресс, но не решили ключевые проблемы: пространственное мышление и творческий подход всё ещё оказываются для моделей сложными.
Итог: прогресс заметный, но до уровня человеческого логического и пространственного мышления моделям ещё далеко.
Подробнее:
https://pub.sakana.ai/sudoku-gpt5/
AI-видео в китайском *Douyin выходят на совершенно другой уровень
В ленте вырубится ролик, где «китайская мама» устраивает разнос ксеноморфу - и выглядит это как мини-фильм. Кажется, что вот сейчас всё закончится, но сцена продолжает разгоняться и становится ещё абсурднее и эффектнее.
*Douyin - это китайская версия TikTok.
+8
Bloomberry опубликовала интересный разбор того, как ИИ влияет на рынок труда в 2025 году. Коротко — вот главное.
- Общее число вакансий в 2025 упало примерно на 8 % по сравнению с 2024 — это базовый фон изменений.
- Сильнее всего просели профессии, основанные на креативном исполнении:
3D-художники −33 %, фотографы −28 %, писатели −28 %.
Задачи, которые ИИ научился делать хорошо и быстро, работодатели стали искать реже.
- Наоборот, растёт спрос на стратегические, технические и руководящие роли.
Например, ML-инженеры показывают рост ≈ +40 %.
Именно там сейчас концентрируется развитие и инвестиции.
Bloomberry выделила набор графиков, которые лучше всего показывают, куда смещается рынок и какие профессии будут определять новую структуру занятости.
https://bloomberry.com/blog/i-analyzed-180m-jobs-to-see-what-jobs-ai-is-actually-replacing-today/
❔ Почему крупные компании так уверенно держат пользователей?
Секрет в рекомендательных системах — технологиях, которые анализируют поведение и дают персонализированные предложения.
Это ядро современных цифровых сервисов: от банков до e-commerce. Владение такими инструментами открывает путь к топовым проектам и высоким зарплатам.
👍Курс «Рекомендательные системы» в OTUS создан для специалистов с опытом в ML, которые хотят прокачать навыки и внедрять реальные решения: от малого бизнеса до крупных корпораций.
Вас ждут живые лекции от практиков, работа с продвинутыми датасетами и проектирование систем под конкретные задачи.
Плавный старт продлится до 16.11.2025 — оставьте заявку и получите скидку: https://tglink.io/e55abca47c7f?erid=2W5zFGvxNk8
🎁 Промокод на скидку 15% : RS_15 до 11.11.2025
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
🖥 Полный гайд: защита от SQL-инъекций для разработчиков
SQL-инъекции остаются одной из самых частых и опасных уязвимостей в веб-приложениях. Ошибка в одном запросе — и злоумышленник получает доступ к базе данных, паролям и пользовательским данным.
В этом материале — полный практический разбор:
как именно происходят SQL-инъекции, какие ошибки разработчиков к ним приводят, как их распознать в коде и главное — как защититься.
Разберём реальные примеры на Python, PHP и Go, посмотрим, как атакующий «взламывает» запрос, и научимся писать безопасный код с параметризованными запросами и ORM.
Это не теория, а руководство, которое поможет понять уязвимость изнутри и навсегда закрыть её в своих проектах.
👉 Читать гайд
+2
🤖 Google представила Nested Learning — новую парадигму ИИ, которая учится как человек и не забывает прошлые знания
Google предлагает новый подход: Nested Learning - *вложенное обучение*, при котором новая информация интегрируется в уже существующую структуру знаний, а не замещает её.
Как это работает?
Каждое новое обучение добавляется внутрь уже выученного, как слой внутри слоя.
Это позволяет модели:
- сохранять предыдущие навыки
- адаптироваться к новым задачам
- отличать, в каком контексте она работает
Что это даёт?
1. Постоянное обучение без потерь
Модель может учиться бесконечно, не забывая старое. Новые знания не затирают прежние.
2. Контекстное понимание
ИИ понимает, *в каком режиме* он работает — это делает поведение гибче и разумнее.
3. Ближе к человеческому мышлению
Nested Learning приближает нейросети к человеческому типу обучения: поэтапному, постепенному и адаптивному.
📌 Подробнее: https://research.google/blog/introducing-nested-learning-a-new-ml-paradigm-for-continual-learning
@ai_machinelearning_big_data
#google
Repost from Machinelearning
⚡️ OpenAI выпустила GPT-5-Codex-Mini.
GPT-5-Codex-Mini - более доступная версия флагманского Codex, она в 4 раза эффективней по затратам по сравнению с полной версией GPT-5-Codex при небольшом компромиссе в производительности.
Разница в возможностях минимальна: на SWE-bench Verified версия Mini набрала 71.3%, в то время как старшая GPT-5-Codex - 74.5%. OpenAI рекомендует переключаться на Mini для решения более простых задач или для экономии ресурсов при приближении к лимитам. Старший Codex будет автоматически предлагать переход на Mini, когда пользователь достигнет 90% своего лимита.
Модель уже доступна в CLI и расширении для IDE, а в скором времени появится и поддержка через API.
@ai_machinelearning_big_data
#news #ai #ml
NVIDIA делает историю.
Ещё десять лет назад мало кто верил, что эта компания станет самой дорогой в мире. Но в эпоху ИИ NVIDIA стала тем самым «продавцом лопат» - их чипы оказались фундаментом для тренировки и работы больших моделей. Без их GPU сегодня не существует современного ИИ.
Дженсен Хуан прекрасно осознал исторический момент. Когда стало ясно, что именно NVIDIA будет ускорителем ИИ-революции, он не замешкался:
• мгновенно заключил стратегические партнёрства
• расширил R&D и продуктовую линейку
• резко увеличил мощности производства через TSMC
Конкуренты пытались догнать, но дистанция только выросла. Даже AMD, которая тоже выигрывает от ИИ-бума, находится далеко позади по экосистеме, софту и масштабу.
NVIDIA войдёт в историю как компания, изменившая технологическую эпоху.
И Дженсен Хуан - как лидер, который увидел момент и сделал всё правильно, превращая потенциал в новую индустриальную реальность.
💥 DS-STAR - новый state-of-the-art агент от Google, который сам решает комплексные задачи Data Science: от анализа и преобразования данных до работы с разными типами датасетов.
Он автоматизирует полный цикл работы и показывает топовые результаты на сложных бенчмарках.
🟠 Подробнее: https://research.google/blog/ds-star-a-state-of-the-art-versatile-data-science-agent
Microsoft запускает MAI Superintelligence Team — ставка на медицину
Microsoft создает новую команду MAI Superintelligence Team, начав с задач медицинской диагностики. Мустафа Сулейман заявляет, что у них есть «прямая траектория» к медицинскому суперинтеллекту за 2–3 года.
Цели команды: решать конкретные задачи — раннее выявление болезней, разработка батарей и материалов, проектирование молекул. Компания обещает массовые инвестиции в это направление.
Толчком стал недавний результат системы MAI-DxO — их оркестратор диагностики показал качество анализа сложных клинических случаев выше, чем у групп врачей. Сторонники считают это возможным шагом к сверхчеловеческому клиническому рассуждению — если удержать надежность, калибровку и прозрачность на масштабе.
Источник: reuters.com/technology/microsoft-launches-superintelligence-team-targeting-medical-diagnosis-start-2025-11-06/
🧠 Perplexity выпустила свой первый исследовательский paper - и он про то, как заставить сверхкрупные модели работать на десятках AWS-GPU одновременно.
Обычно это невозможно: сеть AWS (EFA) не поддерживает GPUDirect Async, поэтому GPU на разных машинах не могут обмениваться данными достаточно быстро.
Инженеры нашли обходной путь: они построили новый софт, который передаёт координацию CPU, позволяя GPU всё равно синхронизироваться почти напрямую.
Это делает эффективным инференс моделей на *1 триллион параметров* на обычных AWS-кластерах, а не только на специализированных суперкомпьютерах.
Они подготовили expert-parallel ядра для быстрого MoE-инференса на AWS EFA:
1T MoE работает практически без деградации, а многонодовый режим сопоставим или быстрее однонодового на 671B DeepSeek V3 при средних батчах — и открывает путь к сервингу Kimi K2.
Проблема: EFA не поддерживает GPUDirect Async, а стандартный NVSHMEM-proxy даёт маршрутизацию MoE c задержками выше 1 мс.
Решение: ядра упаковывают токены в единичные RDMA-записи прямо с GPU, а специальный CPU-поток запускает передачу и перекрывает её с вычислениями GEMM.
Итог — EFA внезапно становится рабочим вариантом для массивного MoE-инференса.
Это крепкая инженерия и адекватный баланс точности и памяти для команд, которым нужна переносимость между облаками.
https://research.perplexity.ai/articles/enabling-trillion-parameter-models-on-aws-efa
🍏 Apple готовит сделку на 1 млрд долларов в год с Google, чтобы встроить 1.2-триллионную модель Gemini в новое поколение Siri.
Обновленная Siri под кодовым именем Linwood выйдет следующей весной. Gemini будет отвечать за функции суммаризации и планирования, а собственные модели Apple сохранят ограниченные роли.
Параллельно Apple в ускоренном режиме разрабатывает свою модель на 1 триллион параметров, чтобы уже в следующем году заменить технологию Google, если догонит по качеству.
https://www.bloomberg.com/news/articles/2025-11-05/apple-plans-to-use-1-2-trillion-parameter-google-gemini-model-to-power-new-siri
⚡ Microsoft показала, как облако может выжать максимум из ИИ-железа
Azure ND GB300 v6 - новые VM на NVIDIA Blackwell пробили барьер: 1 100 000 токенов в секунду при работе с Llama-2-70B.
Что сделали:
— использовали новые Blackwell-GPU с большей памятью
— оптимизировали под TensorRT-LLM и FP4
— объединили 18 машин в один кластер
— выжали рекордный throughput без качества-в-ноль
2025 - год, когда облако и железо реально начинают тянуть модели на миллион+ токенов/с.
AI-инфраструктура становится конкурентным преимуществом.
https://techcommunity.microsoft.com/blog/azurehighperformancecomputingblog/breaking-the-million-token-barrier-the-technical-achievement-of-azure-nd-gb300-v/4466080
Google DeepMind представили IMO-Bench - набор тестов, который проверяет математические способности ИИ на уровне Международной математической олимпиады (IMO).
Что внутри:
• IMO-AnswerBench - 400 задач с короткими ответами
• IMO-ProofBench - 60 задач, где нужно написать доказательство
• IMO-GradingBench - 1000 готовых доказательств для автоматической проверки
Главная идея проста: перестать измерять только правильные ответы и начать оценивать глубину рассуждений, умение строить логические цепочки и строгие доказательства, как у олимпийских математиков.
Результаты:
Модель Gemini Deep Think показала:
• 80.0% на AnswerBench
• 65.7% на ProofBench
Это уровень золотой медали IMO - и заметно выше, чем у GPT-5 и Grok-4.
https://x.com/lmthang/status/1985760224612057092
Repost from Machinelearning
✔️ Google разместит ИИ-вычисления на околоземной орбите.
Google анонсировала проект Suncatcher, который будет строить ML-инфраструктуру в космическом пространстве. Концепция состоит из развертывания группировок спутников, оснащенных TPU и связанных оптическими каналами. Идея проекта в том, что на правильной орбите солнечная панель может быть до 8 раз продуктивнее, чем на Земле, а значит космос - это лучшее место для масштабирования вычислений.
Для реализации еще предстоит решить как поддерживать высокоскоростную межспутниковую связь, которая требует полета аппаратов в очень плотном строю (километр или менее). К началу 2027 года планируют запуск двух прототипов спутников для проверки работы оборудования на орбите.
research.google
✔️ Microsoft Azure преодолела барьер инференса в 1 млн. т/с.
Новый рекорд производительности был получен на виртуальных машинах Azure ND GB300 v6, запущенных на стоечной системе NVIDIA GB300 NVL72. В ходе тестов была достигнута совокупная скорость инференса модели Llama 2 70B в 1.1 млн токенов в секунду. Это на 27% больше предыдущего рекорда, установленного на GB200.
Новая конфигурация дала почти пятикратный прирост пропускной способности на один GPU по сравнению с поколением H100. Ключевыми факторами стали возможности архитектуры Blackwell, использование FP4 и оптимизация библиотеки NVIDIA TensorRT-LLM. Результаты были подтверждены независимой аналитической компанией Signal 65. Логи запуска тестового инстанса можно посмотреть на Github.
techcommunity.microsoft.com
✔️ ArXiv ужесточает модерацию CS-статей.
Платформа вводит новые, более строгие правила для раздела Computer Science. Причиной стал резкий рост числа обзорных и концептуальных статей низкого качества, многие из которых созданы с помощью нейросетей.
Теперь работы будут приниматься к публикации только после того, как их одобрят в рецензируемом научном журнале или на конференции. Авторам потребуется предоставить соответствующее подтверждение при загрузке работы, в противном случае статья будет отклонена. Новая политика не затрагивает обычные исследовательские статьи, однако в будущем может быть распространена и на другие научные области, если там возникнет схожая проблема.
blog.arxiv.org
✔️ AgiBot запустила роботов, обучающихся с подкреплением в реальном мире.
AgiBot в партнерстве с Longcheer Technology развернула систему обучения с подкреплением в реальном мире (RW-RL) на пилотной производственной линии. Это первый подтвержденный случай промышленного применения технологии, которая позволяет роботам обучаться непосредственно в процессе работы, а не следовать жестким инструкциям.
С RW-RL роботы AgiBot осваивают новые навыки за минуты, автономно адаптируясь к изменениям в деталях или производственных допусках. Система поддерживает стабильность промышленного уровня и не требует сложной аппаратной модификации при смене продукта. После успешного пилотного проекта компании планируют расширить применение RW-RL на сборку потребительской электроники и автомобильных компонентов.
gizmochina.com
✔️ Remote Labor Index: топовые ИИ-модели проваливают 97% реальных фриланс-задач.
Scale AI и Center for AI Safety опубликовали результаты бенчмарка Remote Labor Index, который оценивает способность ИИ выполнять реальную работу фрилансеров. В рамках теста исследователи взяли 240 завершенных проектов с биржи Upwork и поставили идентичные задачи 6 топовым ИИ-системам.
Результаты показали, что даже лучшие модели справились с заданиями на человеческом уровне лишь в 2.5% случаев. Почти 97% работ были признаны неудовлетворительными из-за низкого качества, неполных данных или поврежденных файлов. ИИ справился только с узкими задачами: создание логотипов или сведение аудио.
Тест наглядно подсветил огромный разрыв между показателями ИИ на синтетических бенчмарках и его реальной готовностью к автоматизации сложных проектов.
scale.com
@ai_machinelearning_big_data
#news #ai #ml
🧠 IBM объясняет, как математика симметрий помогает создавать новые квантовые алгоритмы
Математика групп — это про симметрии: как объекты можно менять местами, вращать или переставлять, и что при этом остаётся неизменным.
IBM показывает, что те же самые идеи лежат в основе квантовых вычислений — и помогают искать задачи, где квантовые алгоритмы могут быть быстрее классических.
Ключевые идеи:
- Симметрии в природе описываются теорией групп
- Квантовые системы тоже подчиняются симметриям
- Если правильно описать задачу через симметрии, можно найти квантовый алгоритм с ускорением
- IBM работает с более сложными (не-абелевыми) симметриями — это следующий уровень, сложнее и мощнее
Зачем это всё
Мы ещё не нашли много «убойных» квантовых алгоритмов.
Подход через симметрии — это способ открывать новые, а не только улучшать старые.
Если коротко:
Математика симметрий может стать картой для поиска новых квантовых алгоритмов.
Подробнее: https://www.ibm.com/quantum/blog/group-theory
Видео: https://www.youtube.com/watch?v=eSy-pwkLiIQ
#quantum #math #grouptheory #IBMQuantum #algorithms
6 ноября в 15:00 (МСК) — вебинар «Загрузка в 1С любых данных без программирования. Инжектор 1С» от Денвик и партнёра Инфостарт.
💬 Спикер — Степан Пыстин, технический директор и BI-внедренец. Он покажет, как работает инструмент Инжектор 1С — визуальный коннектор для загрузки данных из внешних БД в 1С без кода. Подробнее про функции: bi.denvic.ru/products/inzhektor-1s-instrument-zagruzki-dannykh-v-1s
На вебинаре обсудят методы загрузки данных, сценарии миграции и интеграции без программирования, визуальный конструктор и автодозагрузку данных.
🔧 Полезно архитекторам и разработчикам 1С, архитекторам данных и менеджерам проектов, где используется 1С.
➡️ Регистрация открыта: https://webinar-denvic.ru/?utm_source=tg_post_denvik3
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
