Анализ данных (Data analysis)
前往频道在 Telegram
Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp
显示更多📈 Telegram 频道 Анализ данных (Data analysis) 的分析概览
频道 Анализ данных (Data analysis) (@data_analysis_ml) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 50 212 名订阅者,在 技术与应用 类别中位列第 2 666,并在 俄罗斯 地区排名第 12 538 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 50 212 名订阅者。
根据 18 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 10,过去 24 小时变化为 7,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 8.77%。内容发布后 24 小时内通常能获得 6.56% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 4 404 次浏览,首日通常累积 3 295 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 30。
- 主题关注点: 内容集中在 llm, контекст, openai, архитектура, deepseek 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Data science, наука о данных.
@haarrp - админ
РКН: clck.ru/3FmyAp”
凭借高频更新(最新数据采集于 19 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
50 212
订阅者
+724 小时
+227 天
+1030 天
帖子存档
🔥 Tabby — AI-ассистент для программирования, являющийся открытой альтернативой GitHub Copilot!
💡 Он разработан для локальной работы, исключая необходимость в облачных сервисах, что делает его подходящим для конфиденциальных или корпоративных сред. Tabby поддерживает пользовательские интерфейсы, такие как OpenAPI, и может интегрироваться с существующими инструментами, включая облачные IDE.
🔐 Лицензия: Apache-2.0
🖥 Github
@data_analysis_ml
✅ Ускорение обработки запросов через миграцию парсера
Выпускник Школы анализа данных Яндекса выкатил годноту — руководство по переносу парсера YQL (SQL-диалект для YDB и YTsaurus) с ANTLR3 на ANTLR4.
Основные моменты:
→ ANTLR — генератор парсеров, который переводит грамматики в исполняемые парсеры для разбора и анализа текстовых данных.
→ Для нового парсера использовалась генерация Protobuf-схем, что позволило сохранить структуру AST и упростить интеграцию с парсером.
→ Были разработаны специализированные шаблоны (stg-файлы) для генерации кода, что позволило адаптировать логику парсинга под изменяющиеся требования.
Ссылка на статью
🔥 Tabby — AI-ассистент для программирования, являющийся открытой альтернативой GitHub Copilot!
💡 Он разработан для локальной работы, исключая необходимость в облачных сервисах, что делает его подходящим для конфиденциальных или корпоративных сред. Tabby поддерживает пользовательские интерфейсы, такие как OpenAPI, и может интегрироваться с существующими инструментами, включая облачные IDE.
🔐 Лицензия: Apache-2.0
🖥 Github
@data_analysis_ml
+2
🔥Tencent выпустили новую генеративную модель для 3D - Hunyuan3D 2.0
Hunyuan3D 2.0, усовершенствованная система 3D-синтеза и генерации текстурированных 3D-объектов
высокого разрешения.
Эта система включает в себя два основных компонента: модель генерации формы - Hunyuan3D-DiT и модель синтеза текстуры - Hunyuan3D-Paint.
Генеративная модель формы, построена на масштабируемом диффузионном трансформере, и необходима для создания геометрии объекта и отвечает за согласование генерации.
Модель синтеза текстур генерирует карты текстур высокого разрешения для сгенерированных или созданных вручную сеток.
Hunyuan3D 2.0 превосходит предыдущие модели, как с открытым кодом, так и закрытые модели, по детализации геометрии, выравниванию генерации, качеству текстур и т. д.
GitHub: https://github.com/tencent/Hunyuan3D-2
🧠 Supermemory
Мощное поисковое ИИ-приложение с гибким и простым в работе API.
Вы можете создать свой собственный второй мозг с помощью supermemory.
По сути это ChatGPT для поиска в интернете .
▪Github: https://github.com/supermemoryai/supermemory
▪ Документация: https://docs.supermemory.ai/
▪Расширение для хрома: https://api.supermemory.ai/
🔥 openai-realtime-agents от OpenAI — пример, демонстрирующий использование более сложных агентов, построенных на основе Realtime API!
💡 В нём представлены паттерны взаимодействия агентов, такие как последовательная передача задач между агентами, эскалация к более интеллектуальным моделям и подход с использованием машины состояний для пошагового взаимодействия с пользователем (например, для проверки данных). Это прототип для создания голосовых приложений в реальном времени, в которых несколько агентов могут взаимодействовать с пользователями.
🔐 Лицензия: MIT
🖥 Github
@data_analysis_ml
Строим рекомендательную систему фильмов на Kaggle
Вы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬
Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом эфире покажет как построить рекомендательную систему фильмов на Kaggle.
Что будем делать на вебинаре:
• Разберем имеющиеся данные фильмов с их оценками
• Проведем предобработку данных
• Построим рекомендательную систему на основе машинного обучения
•Проведем расчет и анализ метрик на основе результатов работы модели
🕗Встречаемся 21 января 19:00 по мск
Вебинар будет интересен как новичкам, так и уже опытным специалистам
Зарегистрироваться на бесплатный вебинар
Все датасаентисты сегодня
P.S. Вышли новые модели DeepSeek если вы вдруг пропустили
#DeepSeek #deepseekv3 #reasoning #ml
🔥 NautilusTrader — это высокопроизводительная, открытая платформа для алгоритмической торговли и тестирования стратегий, разработанная для количественных трейдеров!
🌟 Она позволяет создавать, тестировать и внедрять автоматизированные торговые стратегии, обеспечивая их прямой переход от бэктестинга к реальной торговле без необходимости изменения кода.
🌟 Платформа поддерживает различные классы активов и может интегрироваться с любыми API (REST, WebSocket или FIX) через модульные адаптеры. NautilusTrader разработана с акцентом на производительность и надежность, предоставляя Python-ориентированную среду для разработки и развертывания стратегий. Она также поддерживает современные языковые модели, такие как GPT-4 и Claude 3.5, для предоставления рекомендаций и анализа.
🔐 Лицензия: LGPL-3.0
🖥 Github
@data_analysis_ml
Приглашаем на открытый урок «Инструменты обратного тестирования торговых стратегий» от Otus
Рассмотрим базовую методику и рассмотрим основные библиотеки для проведения обратного тестирования торговых стратегий.
✅ Практика: тест простой торговой стратегии
Оставляйте заявку на курс «ML для финансового анализа» и создайте торгового робота для автоматического проведения операций с оценкой уровня риска
👉 Регистрация на урок и подробности:
https://otus.pw/8ofB/?erid=2W5zFJ68uje
#реклама
О рекламодателе
🔥Google представили стратегию эволюционного поиска для масштабирования времени инференса в больших языковых моделях.
Предлагаемый подход, Mind Evolution, использует языковую модель для генерации, рекомбинации и уточнения ответов-модели.
Контролируя инференс модели, разработчики обнаружили, что Mind Evolution значительно превосходит другие стратегии инференса, такие как Best-of-N и Sequential Revision, в задачах планирования на естественном языке.
В бенчмарках TravelPlanner и Natural Plan Mind Evolution, модель решает успешно более 98 % задач с помощью Gemini 1.5 Pro без.
https://huggingface.co/papers/2501.09891
✅Генерация бесконечных 4D городов
CityDreamer4D - это новая генеративная модель создания городов в 4D, которая объединяет статические и динамические сцены.
Заявлена высокая управляемость и реалистичность генераций.
- Проект: https://infinitescript.com/project/city-dreamer-4d/
- Код (обещают залить в ближайшее время ): https://github.com/hzxie/CityDreamer4D
- Датасет CityTopia: https://gateway.infinitescript.com/s/CityTopia
🔥 Umi-OCR — бесплатное оффлайн-приложение для OCR (распознавания текста)!
🌟 Оно поддерживает распознавание текста на скриншотах, пакетную обработку изображений, PDF-документов, а также функции работы с QR-кодами и формулами. Инструмент ориентирован на удобство использования, прост в настройке (работает без установки) и поддерживает командную строку и HTTP-интерфейсы для интеграции с другими приложениями.
🔐 Лицензия: MIT
🖥 Github
@data_analysis_ml
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:
МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://t.me/gamedev
Haskell: t.me/haskell_tg
Физика: t.me/fizmat
💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy
🔥 Umi-OCR — бесплатное оффлайн-приложение для OCR (распознавания текста)!
🌟 Оно поддерживает распознавание текста на скриншотах, пакетную обработку изображений, PDF-документов, а также функции работы с QR-кодами и формулами. Инструмент ориентирован на удобство использования, прост в настройке (работает без установки) и поддерживает командную строку и HTTP-интерфейсы для интеграции с другими приложениями.
🔐 Лицензия: MIT
🖥 Github
@data_analysis_ml
🖥 LeetGPU - бесплатная платформа для написания и запуска кода на CUDA.
Вы можете практиковаться и изучать CUDA онлайн, без использования графического процессора!
https://leetgpu.com/
#cuda #gpu #cpu #playground
🖥 Свежий гайд от OPENAI
В нем рассказывается как правильно работать с функциями и вызывать их. Внутри много рекомендаций и рабочих примеров.
https://platform.openai.com/docs/guides/function-calling.
@data_analysis_ml
🔥 Awesome MCP Servers — это коллекция ресурсов, посвящённых серверам, использующим протокол Model Context Protocol (MCP)!
💡 MCP — это открытый протокол, который позволяет языковым моделям (LLMs) взаимодействовать с локальными и удалёнными ресурсами через стандартизированные серверные реализации. Репозиторий содержит список готовых к использованию и экспериментальных MCP-серверов, расширяющих возможности LLM за счёт доступа к файлам, базам данных, API, системам управления версиями и другим сервисам.
🖥 Github
@machinelearning_ru
🌮 TACO: Learning Multi-modal Action Models with Synthetic Chains-of-Thought-and-Action
TACO новое семейство мультимодальных моделей с открытым исходным кодом, которые хорошо справляются со сложными задачами визуального анализа, требующими нескольких шагов размышлений и использования внешних инструментов!
Модели TACO превосходят базовые, настроенные на основе прометав модели, по 8 тестам, достигая улучшения в среднем на 3,6%, а в задачах MMVet, связанных с распознаванием текста, математическим мышлением и пространственным мышлением, прирост достигает 15%.
▪Github
▪Paper
▪Dataset
▪Demo
@data_analysis_ml
🤖 FAST: Efficient Robot Action Tokenization
Новый токенизатор, который позволяет обучать VLA в 5 раз быстрее по сравнению с предыдущей SoTA.
Его очень легко использовать и это опенсорс.
▪Описание: http://pi.website/research/fast
▪HF: https://huggingface.co/physical-intelligence/fast
▪Статья: https://www.pi.website/download/fast.pdf
@data_analysis_ml
#robots #tokenization
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
