Machinelearning

Open in Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Network:Machinelearning Russia1 277 Technologies & Applications332...

📈 Analytical overview of Telegram channel Machinelearning

Channel Machinelearning (@ai_machinelearning_big_data) in the Russian language segment is an active participant. Currently, the community unites 294 814 subscribers, ranking 332 in the Technologies & Applications category and 1 277 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 294 814 subscribers.

According to the latest data from 26 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -6 463 over the last 30 days and by -216 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 7.82%. Within the first 24 hours after publication, content typically collects 5.40% reactions from the total number of subscribers.
Post reach: On average, each post receives 23 058 views. Within the first day, a publication typically gains 15 914 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 179.
Thematic interests: Content is focused on key topics such as openai, claude, api, gemini, контекст.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Thanks to the high frequency of updates (latest data received on 27 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

294 814

Subscribers

-21624 hours

-1 5507 days

-6 46330 days

23 058

Post views

~ 15 91424 hours

~ 17 79048 hours

7.82%

Engagement rate

~ 6

Posts per day

Ads index

beta

Posts Archive

294 756

🔇 Efficient Large-Scale Audio Tagging AudioSet pre-trained models ready for downstream training and extraction of audio embeddings. Трансформеры доминируют в области по работе с адуио и заменили CNN в качестве современной нейросетевой архитектуры. Трансформеры отлично справляются с огромными аудио датасетами и подходят для создания мощных предварительно обученных моделей. Однако трансформеры являются сложными моделями и масштабируются квадратично по отношению к длине данных, что делает их медленными. В данной модели используются динамические CNN, которые достигают лучшей производительности на задачах разметки аудио данных и хорошо масштабируются, достигая производительности трансформеров и даже превосходя их. 🖥 Github: https://github.com/fschmid56/efficientat 📕 Paper: https://arxiv.org/abs/2310.15648v1 ⏩ Demo: https://21527a47f03813481c.gradio.live/ ai_machinelearning_big_data

294 756

⚡В OTUS стартует набор в группу курса Reinforcement Learning. Отправьте заявку, для того чтобы получить доступ к открытым урокам и получите скидку на обучение. 31.10 в 20.00 (мск) приглашаем на welcome-вебинар «Основные алгоритмы в обучении с подкреплением» 📌На занятии вы: - познакомитесь с основными алгоритмами обучения с подкреплением; - узнаете, как применять нейросети для обучения агентов, как обучить агента в среде с дискретным и непрерывным набором действий; - изучите многообразие алгоритмов обучения с подкреплением и выбор наиболее подходящих из них. 👉Регистрация https://otus.pw/SJiV/ После прохождения курса студенты поймут сильные и слабые стороны основных алгоритмов RL и научатся применять их для решения разнообразных задач в реальном мире, включая игровую индустрию, робототехнику, управление энергетическими системами и управление финансовым портфелем. При оплате курса возможны разные способы оплаты и рассрочка платежа Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KbLVB

294 756

🦩 Woodpecker: Hallucination Correction for Multimodal Large Language Models Большие языковые модели могут вызывать галлюцинации и генерировать ложную информацию, что приводит к потенциальной дезинформации и путанице. Для борьбы с галлюцинациями в современных исследованиях в основном используется метод настройки по инструкции, требующий переобучения моделей на конкретных данных. В данной работе предлагается иной подход, представляя метод не требующий переобучения модели, который называется Woodpecker. Woodpecker работает в 5 этапов: извлечение ключевых понятий, формулировка вопроса, визуальная проверка знаний, формирование визуального утверждения и коррекция галлюцинаций. Реализованный по принципу постредактирования, Woodpecker может легко работать с различными МЛЛМ, оставаясь при этом эффективным за счет доступа к промежуточным результатам работы модели. 🖥 Github: https://github.com/bradyfu/woodpecker 📕 Paper: https://arxiv.org/abs/2310.15110v1 ⏩ Demo: https://21527a47f03813481c.gradio.live/ ai_machinelearning_big_data

294 756

Приглашаем на «Большую дату» — митап для аналитиков и дата-сайентистов в Москве Обсудим последние новости мира аналитики данных, поделимся реальными кейсами и их решениями. Будут спикеры из разных команд Яндекса: 🔸 Андрей Молотов, старший аналитик-разработчик. Расскажет, как предсказать отток сотрудников и уменьшить его с помощью ML-моделей и экспериментов. 🔸 Яна Кузнецова, руководитель группы платёжной аналитики. Объяснит, что такое FinOps и какую роль играет аналитика в C2B-платежах Яндекса. 🔸 Владислав Енин, менеджер проектов. Поделится историей о повышении конверсии платежей в Маркете. 🔸 Кирилл Черкашин, старший аналитик-разработчик. Объяснит, с какими сложностями столкнулись ребята при разработке NLP-пайплайна в модерации рекламы и как их решали. 🔸 Александр Самусенко, руководитель группы развития рекламных продуктов и стабильности. Расскажет, что такое аналитика ранжирования и зачем она нужна. После докладов сыграем в «Сто к одному», отдохнём, поболтаем о жизни и просто хорошо проведём время. Митап пройдёт 28 октября в Москве, для всех желающих мы проведём онлайн-трансляцию. Зарегистрироваться можно здесь. Реклама. ООО "Яндекс". erid: 2Vtzqx6YBjb

294 756

✅ Zero123++: a Single Image to Consistent Multi-view Diffusion Base Model Новая модель диффузии для генерации многоракурсных 3D изображений из одного изображения. Фреймворк позволяет получать высококачественные изображения, решая такие распространенные проблемы, как деградация текстуры и геометрическое несоответствие генерации. 🖥 Github: https://github.com/sudo-ai-3d/zero123plus 📕 Paper: https://arxiv.org/abs/2310.15110v1 ⭐️ Demo: https://huggingface.co/spaces/sudo-ai/zero123plus-demo-space 🚀Dataset: https://paperswithcode.com/dataset/shapenet ai_machinelearning_big_data

294 756

🏆 Yandex Cup 2023 — открытый чемпионат для настоящих творцов Разработчики — художники нового мира. Они создают смыслы, правила и законы, манифестируют идеи, творят миры и целые вселенные. И, если их предшественники делали это, используя слова, краски и звуки, то современные творцы создают новую реальность с помощью программного кода. Искусство писать код Тема чемпионата в этом году «Решаем искусство». Участников ждут нестандартные задачи на стыке IT и творчества, а лучшие встретятся лицом к лицу в финале, чтобы оживить арт-инсталляцию и разделить между собой 8 500 000 рублей. Показать своё мастерство можно в 6 направлениях: 🔸 Фронтенд 🔸 Бэкенд 🔸 Мобильная разработка 🔸 Аналитика 🔸 Алгоритмы 🔸 Машинное обучение Финал и церемония награждения пройдут офлайн в офисе Яндекса в Казахстане. Яндекс предоставит финалистам проезд и проживание в Алматы. Регистрация открыта до 29 октября включительно: 👉 Участвую! #Yandex_Cup23

294 756

🖥 AutoGen AutoGen provides multi-agent conversation framework as a high-level abstraction. AutoGen - это фреймворк от Майкрософт, позволяющий разрабатывать LLM-приложения с использованием нескольких агентов, способных взаимодействовать друг с другом для решения задач. Агенты AutoGen настраиваются, общаются и легко допускают участие человека. Агенту можно поручить действовать в качестве кодера, пишущего код на основе промыта. Второму агенту можно назначить роль ревьюера кода, который указывает на ошибки в коде. После обмена сообщениями агенты отдают пользователю финальный код с пояснениями. Такой подход приводит к значительному повышению эффективности работы генеративных моделей – по данным Microsoft, AutoGen может ускорить написание кода в несколько раз. 🖥 Github: https://github.com/microsoft/autogen 📕 Project: https://microsoft.github.io/autogen/ 🤗 FLAML.: https://github.com/microsoft/FLAML ai_machinelearning_big_data

294 756

🦙AgentTuning: Enabling Generalized Agent Abilities For LLMs. AgentTuning - простой и эффективный метод расширения агентских возможностей для решения сложных задачи реального мира при сохранении всех возможностей ЛЛМ. AgentTuning содержит датасет 1866 высококачественных взаимодействий, предназначенных для улучшения работы ИИ-агентов в 6 различных реальных задачах. 🖥 Github: https://github.com/THUDM/AgentTuning 📕 Paper: https://arxiv.org/abs/2310.12823 🤗 Model: https://huggingface.co/THUDM/agentlm-70b 🚀Dataset: https://huggingface.co/datasets/THUDM/AgentInstruct ⭐️ Project: https://thudm.github.io/AgentTuning/ ai_machinelearning_big_data

294 756

🐾 Putting the Object Back into Video Object Segmentation (Cutie) Cutie - это фреймворк для сегментации видеообъектов, обладающий большей высокой производительностью, устойчивостью и скоростью. Cutie четко отделяет семантику объекта переднего плана от фона. На сложном наборе данных MOSE Cutie превосходит все предыдущие методы сегментации. git clone https://github.com/hkchengrex/Cutie.git 🖥 Github: https://github.com/hkchengrex/Cutie 🖥 Colab: https://colab.research.google.com/drive/1yo43XTbjxuWA7XgCUO9qxAi7wBI6HzvP?usp=sharing 📕 Paper: https://arxiv.org/abs/2310.12982v1 🚀Project: https://hkchengrex.github.io/Cutie/ ai_machinelearning_big_data

294 756

Как начать развиваться в профессии дата-инженера? 👨‍💻Освойте лучшие практики работы с данными на онлайн-курсе «Data Engineer» от OTUS. ➡️За 4 месяца вы научитесь собирать данные, разрабатывать архитектуру данных в компании и создавать сервисы для обработки данных больших объемов. Одна из фишек курса — метод кейсов. На занятиях разбираем примеры внедрений, использования инструментов, оптимизации производительности, а также возможные проблемы и ошибки. Старт занятий — 27 октября. 👉 ПРОЙТИ ТЕСТ https://otus.pw/mWaY/ Успейте пройти вступительный тест и занять место в группе по спец.цене. Приобрести курс возможно в рассрочку. Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: LjN8KTHA4

294 756

📑 DocXChain: A Powerful Open-Source Toolchain for Document Parsing and Beyond DocXChain - мощный инструментарий с открытым исходным кодом для синтаксического анализа документов, предназначенный для автоматического преобразования разнородной информации, содержащейся в неструктурированных документах, таких как текст, таблицы и диаграммы, схемы в структурированные представления, доступные для машинного чтения и манипулирования. 🖥 Github: https://github.com/alibabaresearch/advancedliteratemachinery 📕 Paper: https://arxiv.org/abs/2310.12430v1 🚀Damo: https://damo.alibaba.com/labs/language-technology ai_machinelearning_big_data

294 756

🛠 Improving Long Document Topic Segmentation Models With Enhanced Coherence Modeling SpokenNLP: Официальный репозиторий кодовых баз по самым разным исследовательским проектам, разработанным командой SpokenNLP Speech Lab, Alibaba DAMO Academy. 🖥 Github: https://github.com/alibaba-damo-academy/spokennlp 📕 Paper: https://arxiv.org/pdf/2310.11772v1.pdf 🚀Dataset: https://paperswithcode.com/dataset/wikisection ai_machinelearning_big_data

294 756

Repost from Анализ данных (Data analysis)

📒 GigaChat нового поколения. Разработчики @gigachat_bot изменили подход к обучению модели, а потому практически все умения модели были улучшены. В частности, речь идет о сокращении текстов, ответов на вопросы и генерации идей. Появился и бот GigaChat в социальной сети «ВКонтакте» — после активации, его можно использовать для самых разных целей: от создания текстов до генерации изображений (за счет интеграции с Kandinsky). Число уникальных пользователей GigaChat достигло 1 млн. • Попробовать @data_analysis_ml

294 756

добрый день. текст предварительно выглядит так. посмотрите, ок ли такой вариент? Как автоматизировать переобучение ML-моделей Разработчики ML-моделей из Газпромбанка рассказывают, как в условиях банковской регуляторики, требований безопасников и запрета на использование некоторых инструментов (того же Git LFS) сократить срок переобучения модели с месяца до одного дня. В статье говорится об разделении и параллельном выполнение процесса сканирования и выкатки кода по CI/CD-процессу, благодаря архитектурному разграничению весов модели и самого кода как разных сущностей сборки. https://habr.com/ru/companies/gazprombank/articles/766736/

294 756

👨 AG3D: Learning to Generate 3D Avatars from 2D Image Collections (ICCV 2023) AG3D: Фреймворк для генерации трехмерных аватаров из двумерных изображений 🖥 Github: https://github.com/zj-dong/AG3D 📕 Paper: https://arxiv.org/abs/2305.02312 🚀Video: https://youtu.be/niP1YhJXEBE ⭐️ Project: https://zj-dong.github.io/AG3D/ ai_machinelearning_big_data

294 756

Всем, привет, мы исследовательское агентство SmartMinds и сейчас проводим опрос среди IT специалистов. Что хотим узнать: что важно при выборе работодателя, какие каналы являются эффективными при поиске работы и ходите ли вы на мероприятия для IT. Опрос анонимный, займет не более 3-х минут и мы будем благодарны всем, кто примет участие ❤️ Пройти опрос

294 756

✨ Cross-Episodic Curriculum for Transformer Agents Трансформеры отлично справляются с выявлением закономерностей, но не справляются с ограниченными данными, что часто встречается в робототехнике. При Cross-Episodic обучении, агент-трансформер учится совершенствоваться с помощью внутриконтекстной программы обучения. По сути, обучающий сигнал заложен в последовательность все более трудных задач и ии развивается, находя решение на них. pip install git+https://github.com/cec-agent/CEC 🖥 Github: https://github.com/CEC-Agent/CEC 📕 Paper: https://cec-agent.github.io/src/bib.txt ⭐️ Project: https://cec-agent.github.io ai_machinelearning_big_data