Анализ данных (Data analysis)
前往频道在 Telegram
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
显示更多📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览
频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 50 165 名订阅者,在 技术与应用 类别中位列第 2 677,并在 俄罗斯 地区排名第 12 565 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 50 165 名订阅者。
根据 14 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -30,过去 24 小时变化为 4,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 8.79%。内容发布后 24 小时内通常能获得 6.04% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 4 408 次浏览,首日通常累积 3 027 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 30。
- 主题关注点: 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
凭借高频更新(最新数据采集于 15 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
50 165
订阅者
+424 小时
-527 天
-3030 天
帖子存档
Бесплатный курс по PostgreSQL от практиков рынка
Присоединяйтесь к бесплатному курсу по основам PostgreSQL от Selectel и Эльбрус Буткемп. Он будет полезен Junior- и Middle-специалистам: администраторам баз данных, разработчикам, DevOps-инженерам и аналитикам.
Вы научитесь:
🔹создавать и связывать таблицы,
🔹выполнять базовые операции с данными,
🔹работать с РСУБД.
Бонусы: вы можете получить сертификат о прохождении курса, а также промокоды для практики на мощностях Selectel.
Начните обучение уже сегодня.
Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqwqVE9D
MWS Cloud запустила платформу хранения больших данных для обучения ИИ.
⚡️MWS Data Lakehouse - это целая экосистема, способная переваривать любые типы данных — структурированные, неструктурированные и векторные. А это значит, что теперь вся ваша информация — от отчетов о продажах и заказах до логистики — могут находится в одном месте.
Безопасность - на высшем уровне. В платформу встроены инструменты централизации контроля доступа, аудита и шифрования, динамического маскирования чувствительных данных.
При этом она легко интегрируется с Greenplum и Postgres, что позволяет бизнесу сохранить свои исторические активы, сократить цикл реализации проекта по миграции, а также снизить затраты и риски, связанные с переходом на новое решение.
Результаты говорят сами за себя:
• данные обрабатываются в 23 раза быстрее;
• хранилище используется на 40% экономичнее;
• персонал работает эффективнее в 2,5 раза;
• время расчетов аналитически витрин сокращается в 2 раза.
Поверх платформы можно запустить инструменты для обучения и инференса ML и больших языковых моделей. Компания может развернуть как свои сервисы для работы с ИИ, так и использовать готовые MLOps-инструменты MWS.
🔍 Lucy (1.7B) — легковесная агентная модель веб-поиска на базе Qwen3, обученная только через RL, без привычного SFT.
📱 Заточена под мобильные устройства и CPU-only:
• Агентный поиск через Serper (Google API) + Crawl4AI
• Специальные векторные задачи направляют рассуждение
• Обгоняет DeepSeek-v3 на SimpleQA (MCP-бенчмарк)
• Работает с vLLM, llama.cpp, Jan, LMStudio
• Есть в формате gguf — для локального запуска на CPU
• Режим генерации: temp 0.7 / top-p 0.9 / top-k 20
https://huggingface.co/collections/Menlo/lucy-6879d21ab9c82dd410b231ca
Генеративный ИИ для предприятий сегмента Enterprise: как выбрать пилотный проект с максимальной отдачей?
Крупные компании уже запускают первые проекты на основе генеративного искусственного интеллекта. Но как определить, какие решения принесут реальную пользу при ограниченных бюджетах и сжатых сроках реализации?
31 июля в 11:00 мск приходите на первый совместный вебинар Yandex Cloud и «Инфосистемы Джет», чтобы:
– узнать как выбрать перспективные ИИ-проекты для вашего бизнеса,
– увидеть демонстрацию рабочих GPT-решений по интеллектуальному поиску, технической поддержке, кибербезопасности и анализу отзывов,
– поучаствовать в разработке GPT-решения.
Все посетители вебинара смогу сделать свои проекты частью JET & YandexGPT Lab — новой российской платформы по разработке и тестированию GPT-решений для бизнеса.
Спикеры:
🔸Наиль Енаев, руководитель направления GPT «Инфосистемы Джет»
🔸Антон Чикин, начальник отдела ML «Инфосистемы Джет»
🔸Тарас Юзефович, менеджер по работе с партнерами ML&AI Yandex Cloud
Для кого:
▫️Руководители по ИТ и ИБ в крупных компаниях
▫️Ответственные за внедрение генеративного ИИ и больших языковых моделей
▫️Директора по данным, цифровизации и цифровой трансформации
➡️ Успейте зарегистрироваться на вебинар!
💸 Марк Цукерберг предложил *Марку Чену перейти к нему — и, по слухам, миллиардер предложил 1 миллиард долларов.
Когда речь заходит о гонке за ИИ‑талантами, ставки становятся буквально космическими 💸
Марк Чен (Mark Chen) — ведущий исследователь OpenAI, занимающий пост Chief Research Officer / Senior VP of Research.
🧪 Octelium — новая open-source платформа для запуска и оценки LLM-агентов в реалистичных сценариях.
🔍 Что делает:
• Запускает LLM-агентов в симулированных задачах: от браузинга до программирования
• Оценивает их поведение, принятие решений и эффективность
• Работает локально, без облака
• Поддерживает мультимодельность и кастомные задачи
• Подходит для RL, alignment, eval-пайплайнов
📦 Отличный инструмент для исследований, тестов и продвинутых экспериментов с LLM.
🔗 github.com/octelium/octelium
🧪 Octelium — новая open-source платформа для запуска и оценки LLM-агентов в реалистичных сценариях.
🔍 Что делает:
• Запускает LLM-агентов в симулированных задачах: от браузинга до программирования
• Оценивает их поведение, принятие решений и эффективность
• Работает локально, без облака
• Поддерживает мультимодельность и кастомные задачи
• Подходит для RL, alignment, eval-пайплайнов
📦 Отличный инструмент для исследований, тестов и продвинутых экспериментов с LLM.
🔗 github.com/octelium/octelium
ML-инженеры и Data Scientists + One Day Offer = попадание в команду HR-платформы Сбера! 💚
26 июля вы сможете пройти экспресс-отбор в команду банка, которая делает поиск кандидатов проще и быстрее. Вот для каких задач вы будете искать и разрабатывать AI-решения:
✔️ ранжирование резюме или вакансий
✔️ рекомендации образовательного контента
✔️ распознавание документов
✔️ автоматизация рутинных процессов
✔️ прогнозирование оттока и внутренних перемещений
Регистрация на One Day Offer по ссылке!
🚨 Похоже у нас тут… первая утечка GPT‑5?
В репозитории
biology-benchmarks-inspect появился подозрительный новый идентификатор:
`gpt‑5‑reasoning‑alpha` 👀
🧠 Главное:
> 20 часов назад коммит заменил модель o3 на новую — gpt‑5‑reasoning‑alpha
Если репозиторий действительно внутренний (а он на это похож), то GPT‑5 уже где-то рядом.
🤖 Это могут быть предварительные тесты, бенчмарки или подготовка к релизу.
@data_analysis_ml🎆 Harbor — локальный стек для работы с LLM в один клик. Этот инструмент упрощает запуск локальных языковых моделей и связанных сервисов — от веб-интерфейсов до RAG и голосового взаимодействия. Всё работает в Docker и настраивается парой команд.
Harbor автоматически интегрирует компонентов, например, SearXNG сразу подключается к Open WebUI для поиска по вебу, а ComfyUI — для генерации изображений. Подходит тем, кто хочет быстро развернуть локальную среду для экспериментов с ИИ.
🤖 GitHub
@data_analysis_ml
⚡ VoltAgent — TypeScript-фреймворк для создания автономных AI-агентов. Этот open-source проект предлагает готовую инфраструктуру для разработки сложных агентов на базе LLM, избавляя от необходимости писать всё с нуля. С его помощью можно создавать как простых чат-ботов, так и многоагентные системы с координацией через Supervisor и сложной workflow-логикой.
Фреймворк поддерживает популярные языковые модели, интеграцию с внешними API через Model Context Protocol и даже голосовые интерфейсы через @voltagent/voice. Для отладки есть VoltOps — платформа с визуализацией работы агентов.
🤖 GitHub
@data_analysis_ml
🚗 python-can — универсальная библиотека для работы с CAN-шиной из Python. Этот проект предоставляет удобные абстракции для взаимодействия с различными CAN-адаптерами и поддерживает как классический CAN, так и CAN FD.
Библиотека обладает кроссплатформенностью и поддерживает множество бэкендов, включая SocketCAN, Kvaser, PCAN и другие. Полезно для автомобильной диагностики, робототехники и промышленной автоматизации.
🤖 GitHub
🎨 Откуда у диффузионок креативность?
Команда AI VK Hub разбирает свежую статью с ICML 2025:
Достаточно двух свойств свёрточных сетей — локальности и инвариантности к сдвигам, чтобы генерировать осмысленные и разнообразные изображения, даже без нейросети.
Аналитический процесс с этими ограничениями почти не уступает ResNet и U-Net по качеству — и отлично объясняет поведение диффузионных моделей.
📊 ManusAI теперь умеет визуализировать данные красиво и без боли
Загружаете сырые данные → описываете, что хотите увидеть → выбираете тип графика → Manus сам всё строит.
Мы вот так выяснили, что среди трёх видов пингвинов — Адели, Антарктических и Генту — самые пухлые и длинноластые оказались именно генту. 🐧
Подходит идеально для:
— дашбордов и презентаций
— отчётов для коллег и инвесторов
— исследовательского анализа без кода
🎨 Приятный интерфейс, поддержка CSV, markdown-выгрузка и PDF. И всё это — бесплатно.
Попробовать: https://manus.ai
@data_analysis_ml
#manus
⚙️ Rig — современная Rust-библиотека для работы с LLM, предлагающая унифицированный интерфейс для разных провайдеров ИИ. Проект выделяется акцентом на модульность и эргономику, позволяя интегрировать языковые модели в приложения с минимальным бойлерплейтом.
Инструмент уже используют в продакшене такие проекты, как Dria Compute Node и Linera Protocol. Библиотека поддерживает не только чат-модели вроде GPT-4, но и векторные базы данных, включая MongoDB и LanceDB.
🤖 GitHub
@data_analysis_ml
Рискните зарегистрироваться на One Day Offer и получите работу в команду блока «Риски» ⚡️
25 июля Сбер приглашает дата-инженеров и аналитиков данных пройти ускоренный отбор и открыть доступ к реально интересным задачам в 120+ витринах и 25+ петабайтах данных.
Встречаемся онлайн 25 июля в 10:30 — ссылка на регистрацию здесь!
🛠️ Вышел Public Roadmap для Gemini CLI — команды хотят создать мощного, open-source Coding Agent, ориентированного на сообщество.
Проект развивается сразу по 4 ключевым направлениям:
1. Extensible
CLI должен быть легко расширяемым под любые среды и сценарии: кастомные slash-команды, удалённые протоколы, запуск
.gemini.md файлов с пользовательскими тулзами.
2. Everywhere
Агент можно запускать как фоновый процесс в разных окружениях: локально, в контейнерах, GitHub Actions, облаке. Поддерживается делегирование задач субагентам.
3. Intelligent
Фокус на качестве моделей и инструментов. Цель — попасть в топ по метрикам вроде SWE Bench. Все критические баги (P0) будут закрыты до релиза версии 1.0.
4. Open Source
Проект строится в диалоге с сообществом: быстрое реагирование на ишью и PR’ы, минимальный бэклог и удобные процессы участия.
🔄 Workstreams уже распределены:
- Качество модели (улучшение рассуждений, устранение повторов)
- Производительность (кеширование, умная маршрутизация моделей)
- Расширяемость (агенты в фоне, деплой в облако)
- Автоматизация сообщества (улучшение dev-флоу)
📌 Если хочешь участвовать в разработке следующего поколения AI-инструментов для кодинга — сейчас самое время подключиться к Gemini CLI.
https://github.com/google-gemini/gemini-cli/discussions/4226Как уменьшить расходы на КХД в 7 раз и не отстать от AI гонки?
Нужно использовать КХД на архитектуре Lakehouse. 74% западных корпораций уже мигрировали на архитектуру Lakehouse, которая объединяет сильные стороны DWH и Data Lake, а также служит фундаментом для быстрого внедрения AI-инициатив.
Протестируйте VK Data Lakehouse — КХД нового поколения для уменьшения стоимости хранения данных и ускорения аналитики до 10 раз.
→ Дешевое хранение данных в S3-хранилище. Стоимость хранения 1 ГБ с репликацией в облаке уменьшается в 10 раз — с 30 до 3 рублей по сравнению с DWH.
→ Транзакционность для данных в S3-хранилище. Табличный формат поверх S3 обеспечивает ACID и полноценную работу в сценариях DWH.
→ Ускорение аналитики. MPP SQL-движок для параллельной работы с данными из разных источников без тяжелого ETL.
→ Уменьшение расходов за счет разделения compute и storage. Платите только за то, что используете. Нет затрат на простаивающие ресурсы.
→ Линейный рост затрат вместо экспоненциального при масштабировании.
→ Не нужно содержать отдельные команды под DWH и Data Lake.
→ Универсальное решение для работы с любым объемом данных. От гигабайт до сотен петабайт. Без сложного масштабирования и миграций.
→ Работа с ML становится быстрее без рисков уронить DWH. DS команда может экспериментировать с ad hoc запросами без опаски уронить DWH и BI.
Чтобы получить до 150 000 бонусных рублей для тестирования VK Data Lakehouse в VK Cloud с поддержкой архитекторов:
👉Оставляйте заявку
Будем рядом на всех этапах пилота и поможем довести MVP до результата.
⚡️ Klavis AI — открытая платформа для интеграции MCP в AI-приложения. Проект предлагает готовые решения для работы с популярными сервисами вроде YouTube, Gmail и GitHub через единый API, избавляя разработчиков от необходимости писать клиентский код для каждого сервиса.
Инструмент имеет поддержку мультиплатформенных сценариев. Klavis позволяет одновременно использовать инструменты разных сервисов через единый интерфейс. Есть возможность как облачного использования, так и self-hosted развертывания.
🤖 GitHub
@data_analysis_ml
Не прошло и дня: эра 3D-вайфу на базе ИИ набирает обороты.
Первые open-source версии этого чуда уже на доступны на GitHub
https://github.com/Jackywine/Bella
@data_analysis_ml
#ai #ml
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
