Анализ данных (Data analysis)

رفتن به کانال در Telegram

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

نمایش بیشتر

شبکه:Machinelearning روسيا12 571 فناوری و برنامه‌ها2 678...

📈 تحلیل کانال تلگرام Анализ данных (Data analysis)

کانال Анализ данных (Data analysis) (@data_analysis_ml) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 50 150 مشترک است و جایگاه 2 678 را در دسته فناوری و برنامه‌ها و رتبه 12 571 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 50 150 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 12 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -35 و در ۲۴ ساعت گذشته برابر -30 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 9.06% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 5.57% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 4 547 بازدید دریافت می‌کند. در اولین روز معمولاً 2 794 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 30 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند llm, контекст, openai, архитектура, deepseek تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 13 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

50 150

مشترکین

-3024 ساعت

-537 روز

-3530 روز

4 547

نمایش های پست

~ 2 79424 ساعت

~ 3 27748 ساعت

9.06%

نرخ مشارکت

~ 5

پست های در روز

Ads index

beta

آرشیو پست ها

50 151

DeepAnalyze: первый агентный LLM для полностью автономной Data Science 🤖📊 Забудьте о ручной обработке данных — DeepAnalyze-8B сам проходит весь путь: от сырых файлов до аналитического отчёта уровня эксперта. Поддерживает: 🛠 Подготовку данных, анализ, моделирование, визуализацию и генерацию инсайтов 🔍 Открытые исследовательские задачи и автоматическое составление research-репортов И всё это — без жёстких workflow’ов, с обучением по принципу «от простого к сложному», как настоящий дата-сайентист. При этом модель всего 8B параметров, но уже обгоняет агентов на проприетарных LLM. ✅ Открытый код ✅ Открытые веса ✅ Открытые данные обучения Идеальный инструмент для автоматизации рутинных и сложных data-задач. 🔗 https://ruc-deepanalyze.github.io

50 151

Стажировка для будущих аналитиков Т-Банк открыл набор на оплачиваемую стажировку для тех, кто хочет разобраться, как устроен бигтех изнутри. Здесь не дают учебных заданий — с первого дня будете искать закономерности, проверять гипотезы и помогать команде принимать продуктовые решения. Наставники помогут освоить новые инструменты, а команда — разобраться в сложных кейсах. Стажеры получают поддержку, обратную связь и возможность развиваться в удобном темпе. Формат гибкий: от 20 до 40 часов в неделю, удаленно или в офисе. Есть пять направлений: продуктовая, риск-, инвестиционная аналитика, технологии и AI-продукты. Станьте аналитиком — приходите качать скиллы в Т-Банк. Заявки принимаются до 13 ноября

50 151

LoRA-модель от autoweeb, которая превращает обычные фотографии в аниме-стиль ☺️ Основана на Qwen-Image-Edit-2509. Работает просто: загружаете фото, пишете что-то вроде «transform into anime» - и получаете аниме-версию исходного снимка. Настроек минимум, результат отличный. Ссылка: https://huggingface.co/autoweeb/Qwen-Image-Edit-2509-Photo-to-Anime @data_analysis_ml

50 151

⚡️ GPT-5 на Sudoku-Bench Команда Sudoku-Bench обновила результаты тестов. Напомню, когда бенчмарк вышел в мае 2025, ни одна LLM вообще не могла решить обычную судоку 9×9. Теперь ситуация изменилась: GPT-5 стал новым лидером и решает 33% задач - в два раза умнее ближайшего конкурента. Это первая модель, которой удалось пройти и вариант классической 9×9. Но главная часть бенчмарка остаётся нерешённой: 67% более сложных головоломок по-прежнему оказываются слишком сложными. Причина в том, что современные модели плохо справляются с тем, что нужно для настоящей судоку: понимать новые правила, держать в голове глобальную структуру, строить длинные логические цепочки и находить "точку входа", которую опытные люди сразу замечают. Дополнительные эксперименты - GRPO-тюнинг Qwen2.5-7B и Thought Cloning на примерах из Cracking the Cryptic - дали небольшой прогресс, но не решили ключевые проблемы: пространственное мышление и творческий подход всё ещё оказываются для моделей сложными. Итог: прогресс заметный, но до уровня человеческого логического и пространственного мышления моделям ещё далеко. Подробнее: https://pub.sakana.ai/sudoku-gpt5/

50 151

AI-видео в китайском *Douyin выходят на совершенно другой уровень В ленте вырубится ролик, где «китайская мама» устраивает разнос ксеноморфу - и выглядит это как мини-фильм. Кажется, что вот сейчас всё закончится, но сцена продолжает разгоняться и становится ещё абсурднее и эффектнее. *Douyin - это китайская версия TikTok.

50 151

Bloomberry опубликовала интересный разбор того, как ИИ влияет на рынок труда в 2025 году. Коротко — вот главное. - Общее число вакансий в 2025 упало примерно на 8 % по сравнению с 2024 — это базовый фон изменений. - Сильнее всего просели профессии, основанные на креативном исполнении: 3D-художники −33 %, фотографы −28 %, писатели −28 %. Задачи, которые ИИ научился делать хорошо и быстро, работодатели стали искать реже. - Наоборот, растёт спрос на стратегические, технические и руководящие роли. Например, ML-инженеры показывают рост ≈ +40 %. Именно там сейчас концентрируется развитие и инвестиции. Bloomberry выделила набор графиков, которые лучше всего показывают, куда смещается рынок и какие профессии будут определять новую структуру занятости. https://bloomberry.com/blog/i-analyzed-180m-jobs-to-see-what-jobs-ai-is-actually-replacing-today/

50 151

❔ Почему крупные компании так уверенно держат пользователей? Секрет в рекомендательных системах — технологиях, которые анализируют поведение и дают персонализированные предложения. Это ядро современных цифровых сервисов: от банков до e-commerce. Владение такими инструментами открывает путь к топовым проектам и высоким зарплатам. 👍Курс «Рекомендательные системы» в OTUS создан для специалистов с опытом в ML, которые хотят прокачать навыки и внедрять реальные решения: от малого бизнеса до крупных корпораций. Вас ждут живые лекции от практиков, работа с продвинутыми датасетами и проектирование систем под конкретные задачи. Плавный старт продлится до 16.11.2025 — оставьте заявку и получите скидку: https://tglink.io/e55abca47c7f?erid=2W5zFGvxNk8 🎁 Промокод на скидку 15% : RS_15 до 11.11.2025 Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

50 151

🖥 Полный гайд: защита от SQL-инъекций для разработчиков SQL-инъекции остаются одной из самых частых и опасных уязвимостей в веб-приложениях. Ошибка в одном запросе — и злоумышленник получает доступ к базе данных, паролям и пользовательским данным. В этом материале — полный практический разбор: как именно происходят SQL-инъекции, какие ошибки разработчиков к ним приводят, как их распознать в коде и главное — как защититься. Разберём реальные примеры на Python, PHP и Go, посмотрим, как атакующий «взламывает» запрос, и научимся писать безопасный код с параметризованными запросами и ORM. Это не теория, а руководство, которое поможет понять уязвимость изнутри и навсегда закрыть её в своих проектах. 👉 Читать гайд

50 151

🤖 Google представила Nested Learning — новую парадигму ИИ, которая учится как человек и не забывает прошлые знания Google предлагает новый подход: Nested Learning - *вложенное обучение*, при котором новая информация интегрируется в уже существующую структуру знаний, а не замещает её. Как это работает? Каждое новое обучение добавляется внутрь уже выученного, как слой внутри слоя. Это позволяет модели: - сохранять предыдущие навыки - адаптироваться к новым задачам - отличать, в каком контексте она работает Что это даёт? 1. Постоянное обучение без потерь Модель может учиться бесконечно, не забывая старое. Новые знания не затирают прежние. 2. Контекстное понимание ИИ понимает, *в каком режиме* он работает — это делает поведение гибче и разумнее. 3. Ближе к человеческому мышлению Nested Learning приближает нейросети к человеческому типу обучения: поэтапному, постепенному и адаптивному. 📌 Подробнее: https://research.google/blog/introducing-nested-learning-a-new-ml-paradigm-for-continual-learning @ai_machinelearning_big_data #google

50 151

Repost from Machinelearning

⚡️ OpenAI выпустила GPT-5-Codex-Mini. GPT-5-Codex-Mini - более доступная версия флагманского Codex, она в 4 раза эффективней по затратам по сравнению с полной версией GPT-5-Codex при небольшом компромиссе в производительности. Разница в возможностях минимальна: на SWE-bench Verified версия Mini набрала 71.3%, в то время как старшая GPT-5-Codex - 74.5%. OpenAI рекомендует переключаться на Mini для решения более простых задач или для экономии ресурсов при приближении к лимитам. Старший Codex будет автоматически предлагать переход на Mini, когда пользователь достигнет 90% своего лимита. Модель уже доступна в CLI и расширении для IDE, а в скором времени появится и поддержка через API. @ai_machinelearning_big_data #news #ai #ml

50 151

NVIDIA делает историю. Ещё десять лет назад мало кто верил, что эта компания станет самой дорогой в мире. Но в эпоху ИИ NVIDIA стала тем самым «продавцом лопат» - их чипы оказались фундаментом для тренировки и работы больших моделей. Без их GPU сегодня не существует современного ИИ. Дженсен Хуан прекрасно осознал исторический момент. Когда стало ясно, что именно NVIDIA будет ускорителем ИИ-революции, он не замешкался: • мгновенно заключил стратегические партнёрства • расширил R&D и продуктовую линейку • резко увеличил мощности производства через TSMC Конкуренты пытались догнать, но дистанция только выросла. Даже AMD, которая тоже выигрывает от ИИ-бума, находится далеко позади по экосистеме, софту и масштабу. NVIDIA войдёт в историю как компания, изменившая технологическую эпоху. И Дженсен Хуан - как лидер, который увидел момент и сделал всё правильно, превращая потенциал в новую индустриальную реальность.

50 151

💥 DS-STAR - новый state-of-the-art агент от Google, который сам решает комплексные задачи Data Science: от анализа и преобразования данных до работы с разными типами датасетов. Он автоматизирует полный цикл работы и показывает топовые результаты на сложных бенчмарках. 🟠 Подробнее: https://research.google/blog/ds-star-a-state-of-the-art-versatile-data-science-agent

50 151

Microsoft запускает MAI Superintelligence Team — ставка на медицину Microsoft создает новую команду MAI Superintelligence Team, начав с задач медицинской диагностики. Мустафа Сулейман заявляет, что у них есть «прямая траектория» к медицинскому суперинтеллекту за 2–3 года. Цели команды: решать конкретные задачи — раннее выявление болезней, разработка батарей и материалов, проектирование молекул. Компания обещает массовые инвестиции в это направление. Толчком стал недавний результат системы MAI-DxO — их оркестратор диагностики показал качество анализа сложных клинических случаев выше, чем у групп врачей. Сторонники считают это возможным шагом к сверхчеловеческому клиническому рассуждению — если удержать надежность, калибровку и прозрачность на масштабе. Источник: reuters.com/technology/microsoft-launches-superintelligence-team-targeting-medical-diagnosis-start-2025-11-06/

50 151

🧠 Perplexity выпустила свой первый исследовательский paper - и он про то, как заставить сверхкрупные модели работать на десятках AWS-GPU одновременно. Обычно это невозможно: сеть AWS (EFA) не поддерживает GPUDirect Async, поэтому GPU на разных машинах не могут обмениваться данными достаточно быстро. Инженеры нашли обходной путь: они построили новый софт, который передаёт координацию CPU, позволяя GPU всё равно синхронизироваться почти напрямую. Это делает эффективным инференс моделей на *1 триллион параметров* на обычных AWS-кластерах, а не только на специализированных суперкомпьютерах. Они подготовили expert-parallel ядра для быстрого MoE-инференса на AWS EFA: 1T MoE работает практически без деградации, а многонодовый режим сопоставим или быстрее однонодового на 671B DeepSeek V3 при средних батчах — и открывает путь к сервингу Kimi K2. Проблема: EFA не поддерживает GPUDirect Async, а стандартный NVSHMEM-proxy даёт маршрутизацию MoE c задержками выше 1 мс. Решение: ядра упаковывают токены в единичные RDMA-записи прямо с GPU, а специальный CPU-поток запускает передачу и перекрывает её с вычислениями GEMM. Итог — EFA внезапно становится рабочим вариантом для массивного MoE-инференса. Это крепкая инженерия и адекватный баланс точности и памяти для команд, которым нужна переносимость между облаками. https://research.perplexity.ai/articles/enabling-trillion-parameter-models-on-aws-efa

50 151

🍏 Apple готовит сделку на 1 млрд долларов в год с Google, чтобы встроить 1.2-триллионную модель Gemini в новое поколение Siri. Обновленная Siri под кодовым именем Linwood выйдет следующей весной. Gemini будет отвечать за функции суммаризации и планирования, а собственные модели Apple сохранят ограниченные роли. Параллельно Apple в ускоренном режиме разрабатывает свою модель на 1 триллион параметров, чтобы уже в следующем году заменить технологию Google, если догонит по качеству. https://www.bloomberg.com/news/articles/2025-11-05/apple-plans-to-use-1-2-trillion-parameter-google-gemini-model-to-power-new-siri

50 151

⚡ Microsoft показала, как облако может выжать максимум из ИИ-железа Azure ND GB300 v6 - новые VM на NVIDIA Blackwell пробили барьер: 1 100 000 токенов в секунду при работе с Llama-2-70B. Что сделали: — использовали новые Blackwell-GPU с большей памятью — оптимизировали под TensorRT-LLM и FP4 — объединили 18 машин в один кластер — выжали рекордный throughput без качества-в-ноль 2025 - год, когда облако и железо реально начинают тянуть модели на миллион+ токенов/с. AI-инфраструктура становится конкурентным преимуществом. https://techcommunity.microsoft.com/blog/azurehighperformancecomputingblog/breaking-the-million-token-barrier-the-technical-achievement-of-azure-nd-gb300-v/4466080

50 151

Google DeepMind представили IMO-Bench - набор тестов, который проверяет математические способности ИИ на уровне Международной математической олимпиады (IMO). Что внутри: • IMO-AnswerBench - 400 задач с короткими ответами • IMO-ProofBench - 60 задач, где нужно написать доказательство • IMO-GradingBench - 1000 готовых доказательств для автоматической проверки Главная идея проста: перестать измерять только правильные ответы и начать оценивать глубину рассуждений, умение строить логические цепочки и строгие доказательства, как у олимпийских математиков. Результаты: Модель Gemini Deep Think показала: • 80.0% на AnswerBench • 65.7% на ProofBench Это уровень золотой медали IMO - и заметно выше, чем у GPT-5 и Grok-4. https://x.com/lmthang/status/1985760224612057092

50 151

Repost from Machinelearning

✔️ Google разместит ИИ-вычисления на околоземной орбите. Google анонсировала проект Suncatcher, который будет строить ML-инфраструктуру в космическом пространстве. Концепция состоит из развертывания группировок спутников, оснащенных TPU и связанных оптическими каналами. Идея проекта в том, что на правильной орбите солнечная панель может быть до 8 раз продуктивнее, чем на Земле, а значит космос - это лучшее место для масштабирования вычислений. Для реализации еще предстоит решить как поддерживать высокоскоростную межспутниковую связь, которая требует полета аппаратов в очень плотном строю (километр или менее). К началу 2027 года планируют запуск двух прототипов спутников для проверки работы оборудования на орбите. research.google ✔️ Microsoft Azure преодолела барьер инференса в 1 млн. т/с. Новый рекорд производительности был получен на виртуальных машинах Azure ND GB300 v6, запущенных на стоечной системе NVIDIA GB300 NVL72. В ходе тестов была достигнута совокупная скорость инференса модели Llama 2 70B в 1.1 млн токенов в секунду. Это на 27% больше предыдущего рекорда, установленного на GB200. Новая конфигурация дала почти пятикратный прирост пропускной способности на один GPU по сравнению с поколением H100. Ключевыми факторами стали возможности архитектуры Blackwell, использование FP4 и оптимизация библиотеки NVIDIA TensorRT-LLM. Результаты были подтверждены независимой аналитической компанией Signal 65. Логи запуска тестового инстанса можно посмотреть на Github. techcommunity.microsoft.com ✔️ ArXiv ужесточает модерацию CS-статей. Платформа вводит новые, более строгие правила для раздела Computer Science. Причиной стал резкий рост числа обзорных и концептуальных статей низкого качества, многие из которых созданы с помощью нейросетей. Теперь работы будут приниматься к публикации только после того, как их одобрят в рецензируемом научном журнале или на конференции. Авторам потребуется предоставить соответствующее подтверждение при загрузке работы, в противном случае статья будет отклонена. Новая политика не затрагивает обычные исследовательские статьи, однако в будущем может быть распространена и на другие научные области, если там возникнет схожая проблема. blog.arxiv.org ✔️ AgiBot запустила роботов, обучающихся с подкреплением в реальном мире. AgiBot в партнерстве с Longcheer Technology развернула систему обучения с подкреплением в реальном мире (RW-RL) на пилотной производственной линии. Это первый подтвержденный случай промышленного применения технологии, которая позволяет роботам обучаться непосредственно в процессе работы, а не следовать жестким инструкциям. С RW-RL роботы AgiBot осваивают новые навыки за минуты, автономно адаптируясь к изменениям в деталях или производственных допусках. Система поддерживает стабильность промышленного уровня и не требует сложной аппаратной модификации при смене продукта. После успешного пилотного проекта компании планируют расширить применение RW-RL на сборку потребительской электроники и автомобильных компонентов. gizmochina.com ✔️ Remote Labor Index: топовые ИИ-модели проваливают 97% реальных фриланс-задач. Scale AI и Center for AI Safety опубликовали результаты бенчмарка Remote Labor Index, который оценивает способность ИИ выполнять реальную работу фрилансеров. В рамках теста исследователи взяли 240 завершенных проектов с биржи Upwork и поставили идентичные задачи 6 топовым ИИ-системам. Результаты показали, что даже лучшие модели справились с заданиями на человеческом уровне лишь в 2.5% случаев. Почти 97% работ были признаны неудовлетворительными из-за низкого качества, неполных данных или поврежденных файлов. ИИ справился только с узкими задачами: создание логотипов или сведение аудио. Тест наглядно подсветил огромный разрыв между показателями ИИ на синтетических бенчмарках и его реальной готовностью к автоматизации сложных проектов. scale.com @ai_machinelearning_big_data #news #ai #ml

50 151

🧠 IBM объясняет, как математика симметрий помогает создавать новые квантовые алгоритмы Математика групп — это про симметрии: как объекты можно менять местами, вращать или переставлять, и что при этом остаётся неизменным. IBM показывает, что те же самые идеи лежат в основе квантовых вычислений — и помогают искать задачи, где квантовые алгоритмы могут быть быстрее классических. Ключевые идеи: - Симметрии в природе описываются теорией групп - Квантовые системы тоже подчиняются симметриям - Если правильно описать задачу через симметрии, можно найти квантовый алгоритм с ускорением - IBM работает с более сложными (не-абелевыми) симметриями — это следующий уровень, сложнее и мощнее Зачем это всё Мы ещё не нашли много «убойных» квантовых алгоритмов. Подход через симметрии — это способ открывать новые, а не только улучшать старые. Если коротко: Математика симметрий может стать картой для поиска новых квантовых алгоритмов. Подробнее: https://www.ibm.com/quantum/blog/group-theory Видео: https://www.youtube.com/watch?v=eSy-pwkLiIQ #quantum #math #grouptheory #IBMQuantum #algorithms

50 151

6 ноября в 15:00 (МСК) — вебинар «Загрузка в 1С любых данных без программирования. Инжектор 1С» от Денвик и партнёра Инфостарт. 💬 Спикер — Степан Пыстин, технический директор и BI-внедренец. Он покажет, как работает инструмент Инжектор 1С — визуальный коннектор для загрузки данных из внешних БД в 1С без кода. Подробнее про функции: bi.denvic.ru/products/inzhektor-1s-instrument-zagruzki-dannykh-v-1s На вебинаре обсудят методы загрузки данных, сценарии миграции и интеграции без программирования, визуальный конструктор и автодозагрузку данных. 🔧 Полезно архитекторам и разработчикам 1С, архитекторам данных и менеджерам проектов, где используется 1С. ➡️ Регистрация открыта: https://webinar-denvic.ru/?utm_source=tg_post_denvik3