ru
Feedback
Machinelearning

Machinelearning

Открыть в Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Больше

📈 Аналитический обзор Telegram-канала Machinelearning

Канал Machinelearning (@ai_machinelearning_big_data) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 294 628 подписчиков, занимая 331 место в категории Технологии и приложения и 1 279 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 294 628 подписчиков.

Согласно последним данным от 27 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -6 411, а за последние 24 часа — -195, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 7.72%. В первые 24 часа после публикации контент обычно набирает 5.41% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 22 754 просмотров. В течение первых суток публикация набирает 15 946 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 179.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как openai, claude, api, gemini, контекст.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Благодаря высокой частоте обновлений (последние данные получены 28 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

294 628
Подписчики
-19524 часа
-1 5847 дней
-6 41130 день
Архив постов
🗣 DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection and Instruction-Aware Models for Conversational
+3
🗣 DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection and Instruction-Aware Models for Conversational AI. Studio: самая большая и разнообразная коллекция диалоговых датасетов, объединенных в единый формат. 🖥 Github: https://github.com/salesforce/DialogStudio 📕 Paper: https://arxiv.org/abs/2307.10172v2 🔥 Dataset: https://paperswithcode.com/dataset/dialogstudio ai_machinelearning_big_data

❗️Как пройти техническое собеседование на ML-специалиста? ⚠️ Узнайте на примере mock-интервью с преподавателями курса «MLOps»
❗️Как пройти техническое собеседование на ML-специалиста? ⚠️ Узнайте на примере mock-интервью с преподавателями курса «MLOps» в OTUS! На открытом уроке вы сможете наблюдать один из этапов собеседования при найме ML-специалистов — ML System Design секцию. 👉 Для удачного прохождения этого этапа не достаточно только знания алгоритмов машинного обучения. Также проверяются навыки проектирования ML систем, которые могут успешно работать в промышленной среде. Больше инструментов MLOps ждет вас на курсе. Обратите внимание: возможные способы оплаты обучения. 👉 РЕГИСТРАЦИЯ https://otus.pw/oCXA/ Нативная интеграция. Информация о продукте www.otus.ru

⭐️ CNOS: A Strong Baseline for CAD-based Novel Object Segmentation Three-stage approach to segment unseen objects in RGB imag
+1
⭐️ CNOS: A Strong Baseline for CAD-based Novel Object Segmentation Three-stage approach to segment unseen objects in RGB images using their CAD models. CNOS - это простой, но эффективный трехэтапный подход к сегментации объектов. 🖥 Github: https://github.com/nv-nguyen/cnos 📕 Paper: http://arxiv.org/abs/2307.11067 🚀 Dataset: https://bop.felk.cvut.cz/datasets/ ai_machinelearning_big_data

IT — одна из самых высокооплачиваемых сфер. А освоить ее можно уже в школе, не дожидаясь поступления в университет. Никаких с
IT — одна из самых высокооплачиваемых сфер. А освоить ее можно уже в школе, не дожидаясь поступления в университет. Никаких скучных лекций — только практика на реальных IT-проектах! Московская школа программистов (МШП) обучает детей IT уже с третьего класса, так что к поступлению в вузы многие из них соответствуют уровню Junior и имеют свое портфолио для будущей работы. Обучение в школе основано на университетской модели: дети изучают набор обязательных основных курсов, а со второго семестра могут выбрать спецкурсы по разным IT-направлениям и найти свою профессию! Учиться можно очно и онлайн из любой точки мира. Переходите по ссылке, чтобы подготовить ребенка к IT-карьере! В подарок после регистрации – Курс английского языка для 5-10 классов. Реклама. Рекламодатель ЧУ ДО "МОСКОВСКАЯ ШКОЛА ПРОГРАММИСТОВ". ИНН 9715290128. Erid: LdtCKYT95

↗️ L-Eval: Instituting Standardized Evaluation for Long Context Language Models Data and code for L-Eval, a comprehensive lon
↗️ L-Eval: Instituting Standardized Evaluation for Long Context Language Models Data and code for L-Eval, a comprehensive long context language models evaluation benchmark. Данные и код для L-Eval, комплексноого эталона оценки языковых моделей с длинным контекстом. L-Eval, содержащий 411 длинных документов и более 2000 пар "вопрос-ответ", аннотированных и проверенных авторами вручную, охватывает такие области, как право, финансы, школьные лекции, длинные разговоры, новости, длинные романы. 🖥 Github: https://github.com/bshall/urhythmic 🧑‍💻Model: https://huggingface.co/datasets/L4NLP/LEval 📕 Paper: https://arxiv.org/abs/2307.11088 🚀 Dataset: https://paperswithcode.com/dataset/quality ai_machinelearning_big_data

🐋 FreeWilly, Large And Mighty Instruction Fine-Tuned Models . FreeWilly1 and FreeWilly2 set a new standard in the field of o
+1
🐋 FreeWilly, Large And Mighty Instruction Fine-Tuned Models . FreeWilly1 and FreeWilly2 set a new standard in the field of open access Large Language Models. В freeWilly1 используется оригинальная базовая модель LLaMA 65B, которая была тщательно обучена на новом синтетически сгенерированном наборе данных с использованием технологии Supervised Fine-Tune (SFT) в стандартном формате Alpaca. FreeWilly2 использует базовую модель LLaMA 2 70B и достигает производительности, сравнимой с GPT-3.5. ⭐️ Post: https://stability.ai/blog/freewilly-large-instruction-fine-tuned-models 📌 FreeWilly1: https://huggingface.co/stabilityai/FreeWilly1-Delta-SafeTensor 📌 FreeWilly2: https://huggingface.co/stabilityai/FreeWilly1-Delta-SafeTensor ai_machinelearning_big_data

🆓 Free Courses and Guides for Learning Generative AI Бесплатные курсы и руководства по изучению генеративного ИИ 1. Building AI Products with OpenAIБесплатный курс от CoRise и OpenAI. 2. Подробное руководство по Prompt Engineering by DAIR.AI 3. LLM Bootcamp - Серия бесплатных лекций от The full Stack по созданию и развертыванию приложений LLM. 4. Что такое модели трансформеров и как они работают: Учебное пособие от Cohere AI. 5. Бесплатный курс от Activeloop на LangChain & Vector Databases in Production. 6. Pinecone learning centerМножество полезных гайдов. 7. Build AI Apps with ChatGPT, Dall-E and GPT-4бесплатный курс по Scrimba. 8. Gartner Experts Answer the Top Generative AI Questions for Your Enterpriseотчет компании Gartner. 9. GPT best practices: Руководство ****OpenAI, в котором рассказывается о стратегии и тактике получения лучших результатов от GPT. 10. OpenAI cookbook by OpenAIПримеры и руководства по использованию API OpenAI. 11. Prompt injection explained, 12. Generative AI short courses by DeepLearning.AIПять коротких курсов по генеративному ИИ, включая LangChain для разработки LLM-приложений, "Как работают диффузионные модели" и др. 13. Generative AI learning path by Google Cloud - серия из 10 курсов по продуктам и технологиям генеративного ИИ: от основ больших языковых моделей до создания и развертывания генеративного ИИ в Google Cloud. ai_machinelearning_big_data

Получите профессию NLP-инженера на онлайн-магистратуре “Анализ естественного языка в лингвистике и IT”. На программе вы будет
Получите профессию NLP-инженера на онлайн-магистратуре “Анализ естественного языка в лингвистике и IT”. На программе вы будете учиться обучать нейросети, учить машины распознавать и анализировать человеческую речь и генерировать ответы. ●Программа ориентирована на обучение с нуля, технический "бэкграунд" не обязателен; ●Обучение очное, но в онлайн-режиме, а обучающимся полагаются студенческие льготы и отсрочка от армии; ●У вас будет доступ к суперкомпьютерному центру CYBERIA от ТГУ, с помощью которого вы сможете обучать нейросети и решать задачи NLP в режиме онлайн; ●А после обучения вы получите очный диплом ТГУ и готовое портфолио для дальнейшего трудоустройства; ●А благодаря господдержке первый год обучения стоит всего 280 р/мес! Успейте записаться на бесплатный подготовительный курс: https://go.skillfactory.ru/ndod3w Реклама - ООО «Скиллфкэтори» Kra248FC3

📌 AlpaGasus: Training A Better Alpaca with Fewer Data The first framework to conduct instruction optimization for black-box LLM like ChatGPT, where Black-box API LLM can only provide textual output. Модель отбора, автоматически определяющая и удаляющая низкокачественные данные с помощью LLM. 🖥 Github: https://github.com/lichang-chen/instructzero ⭐️ Project: https://lichang-chen.github.io/InstructZero/ 📕 Paper: https://arxiv.org/abs/2307.08701v1 ai_machinelearning_big_data

Привет, Чемпион! 🏆 Хочешь покорить Kaggle и научиться выигрывать соревнования по анализу данных? Тогда курс "Введение в соре
Привет, Чемпион! 🏆 Хочешь покорить Kaggle и научиться выигрывать соревнования по анализу данных? Тогда курс "Введение в соревновательный Data Science" - это именно то, что тебе нужно! 🎯 Что ты получишь? - Первый русскоязычный курс по соревновательному Data Science с максимальным количеством практики. - Насыщенная программа, содержащая эффективные методы для выбивания максимального качества из твоих ML-моделей. - Более 200 практических заданий, интервью с Kaggle Grand Masters. - Большое русскоязычное коммьюнити 400+ студентов курса для совместного прохождения и участия в соревнованиях. - Поддержка преподавателей и даже собственный мерч курса за успехи. 🚀 На канале курса проводим еженедельные открытые вебинары, на которых разбираем решения победителей чемпионатов и делаем обзоры предстоящих соревнований. 🔗 Подписывайся на TG канал, чтобы узнать подробности о курсе, а также следить за открытыми вебинарами и другими активностями. 🔥Скидка 10% по промокоду: TGLETO (Сработает только при переходе по ссылке)

🔥 Llama 2: Open Foundation and Fine-Tuned Chat Models Llama 2 collection of pretrained and fine-tuned large language models
🔥 Llama 2: Open Foundation and Fine-Tuned Chat Models Llama 2 collection of pretrained and fine-tuned large language models (LLMs). Новая Llama 2 в открытом доступе . Доступны предварительно обученные и настроенные модели с параметрами от 7B до 70B. Llama 2 превосходит модели с открытым исходным кодом в большинстве протестированных бенчмарков и, судя по оценке полезности и безопасности, может стать достойной заменой моделям с закрытым исходным кодом. 🖥 Github: https://github.com/facebookresearch/llama ⭐️ Demo: https://huggingface.co/blog/llama2 🤗Hugging face: https://huggingface.co/meta-llama/Llama-2-70b 📕 Paper: https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/ ai_machinelearning_big_data

💬 Text2Cinemagraph: Synthesizing Artistic Cinemagraphs from Text Полностью автоматизированный метод Text2Cinemagraph для создания синемаграфов из текстового описания с учетом различных художественных стилей. 🖥 Github: https://github.com/text2cinemagraph/text2cinemagraph 🖥 Colab: https://colab.research.google.com/github/camenduru/AnimateDiff-colab/blob/main/AnimateDiff_colab.ipynb 📕 Paper: https://arxiv.org/pdf/2307.03190.pdf 🚀 Project: https://text2cinemagraph.github.io/website/ ai_machinelearning_big_data

Как бороться с утечкой данных в машинном обучении Команда VK Cloud перевела статью о том, как информация из тестового датасет
Как бороться с утечкой данных в машинном обучении Команда VK Cloud перевела статью о том, как информация из тестового датасета ошибочно попадает в обучающий, какие у этого могут быть последствия. В статье описываются примеры реальных датасетов со способами предотвращения утечки данных: проверки вручную, пайплайнами, перекрёстным контролем и др. 🔗 Хабр: https://habr.com/ru/companies/vk/articles/746360/ ai_machinelearning_big_data

🔥 Artificial Intelligence for Science (AIRS) AIRS - это коллекция инструментов с открытым исходным кодом, датасетов ии для н
+1
🔥 Artificial Intelligence for Science (AIRS) AIRS - это коллекция инструментов с открытым исходным кодом, датасетов ии для науки в квантовых системах. OpenQM: AI for Quantum Mechanics OpenDFT: AI for Density Functional Theory OpenMol: AI for Small Molecules OpenProt: AI for Protein Science OpenMat: AI for Materials Science OpenMI: AI for Molecular Interactions OpenPDE: AI for Partial Differential Equations 🖥 Github: https://github.com/divelab/AIRS 📕 Paper: https://arxiv.org/abs/2307.08423 ⭐️ Website: https://www.air4.science/ 📌 Dataset: https://paperswithcode.com/dataset/atom3d ai_machinelearning_big_data

🔥Открываем новые горизонты в машинном обучении! Присоединяйтесь 25 июля в 20:00 к открытому уроку «TD Learning и Q-learning»
🔥Открываем новые горизонты в машинном обучении! Присоединяйтесь 25 июля в 20:00 к открытому уроку «TD Learning и Q-learning». Это возможность протестировать новый онлайн-курс «Reinforcement Learning» в OTUS и начать изучать это перспективное направление. 📌Вместе с экспертом-практиком мы: — погрузимся во временно-разностное обучение и Q-learning; — поговорим об основных идеях обучения с подкреплением, которые делают алгоритм RL более гибким и эффективным; — разберем алгоритм SARSA с различными примерами реализации; — обсудим сильные и слабые стороны каждого решения. 👉🏻Регистрация для участия https://otus.pw/mPt2/ Урок будет полезен DS/ML/DL специалистам, IT-специалистам, которые хотят погрузиться в обучение с подкреплением. После вебинара курс можно приобрести удобным для вас способом. Нативная интеграция. Информация о продукте на сайте www.otus.ru

Fine-tuning Stable Diffusion Models on Intel CPUs This post will show you how to fine-tune a Stable Diffusion model on an Intel Sapphire Rapids CPU cluster. В этом посте показано, как провести тонкую настройку модели Stable Diffusion на кластере процессоров Intel Sapphire Rapids. Настройка с помощью текстовой инверсии - техники, которая требует лишь небольшого количества изображений-примеров. https://huggingface.co/blog/stable-diffusion-finetuning-intel 📌 Post: https://huggingface.co/blog/stable-diffusion-finetuning-intel ⭐️ Diffusers documentation: https://huggingface.co/docs/diffusers 📌 Optimum Intel documentation: https://huggingface.co/docs/optimum/main/en/intel/inference 🖥 Intel IPEX on GitHub: https://github.com/intel/intel-extension-for-pytorch ai_machinelearning_big_data

Салют, GigaChat! One Day Offer для NLP инженеров, разработчиков и исследователей уровня Middle/Senior/Senior++ состоится уже
Салют, GigaChat! One Day Offer для NLP инженеров, разработчиков и исследователей уровня Middle/Senior/Senior++ состоится уже 22 июля 📢 А это значит, что всего за один день вы сможете пройти все этапы отбора, познакомиться с командой, забрать оффер и начать работу над нашей большой языковой моделью GigaChat и амбициозными продуктами на его основе. Чем именно вам предстоит заниматься? 👉 Делать претрейн моделей. 👉 Обучать SOTA модели для решения задач NLP. 👉 Создавать наши основные NLP модели: GigaChat, Intent Recognition, NER, Smart Home и другие. 👉 Делать распознавание и синтез речи, выявлять ключевые слова и шумовые события. 👉 Совершенствовать существующие инструменты ИИ и создавать новые. 👉 Работать в новом кластере с большим числом A100'ых. Ваши шансы на оффер выше, если у вас есть профильное техническое образование и опыт работы от трех лет. Переходите по ссылке и регистрируйтесь на One Day Offer 💚

🔈 Urhythmic: Rhythm Modeling for Voice Conversion Unsupervised Rhythm Modeling for Voice Conversion. Проект для изменения ис
🔈 Urhythmic: Rhythm Modeling for Voice Conversion Unsupervised Rhythm Modeling for Voice Conversion. Проект для изменения исходного голоса на другие, позволяющая моделировать ритм речи. 🖥 Github: https://github.com/bshall/urhythmic 🖥 Documentation: https://colab.research.google.com/github/bshall/urhythmic/blob/main/urhythmic_demo.ipynb 📕 Paper: https://arxiv.org/abs/2307.06040v1 🚀 Dataset: https://paperswithcode.com/dataset/vctk ai_machinelearning_big_data

🌄 Kandinsky 2.2 попал в Diffusers Kandinsky 2.2 - это генеративная модель от Сбера, создающая изображения по текстовому описанию. Обновление привело к увеличению количества доступного функционала (ControlNet, Outpainting х2 и др.) Diffusers — это известный и крупнейший фреймворк генеративных моделей. Его используют такие инструменты и библиотеки, как DreamFusion, Segment Anything, ML Stable Diffusion (by Apple) и другие. Kandinsky 2.2 попал в основной репозиторий Diffusers на GitHub. 🖥 Github: https://github.com/huggingface/diffusers ai_machinelearning_big_data

🧭 OpenCompass OpenCompass is an LLM evaluation platform, supporting a wide range of models (LLaMA, ChatGLM2, ChatGPT, Claude
+2
🧭 OpenCompass OpenCompass is an LLM evaluation platform, supporting a wide range of models (LLaMA, ChatGLM2, ChatGPT, Claude, etc) over 50+ datasets. OpenCompass - это платформа для оценки LLM моделей, поддерживающая широкий спектр моделей (LLaMA, ChatGLM2, ChatGPT, Claude и др.) на 50+ наборах данных. Благодаря мощным алгоритмам и интуитивно понятному интерфейсу OpenCompass позволяет легко оценить качество и эффективность ваших моделей НЛП. 🖥 Github: https://github.com/InternLM/opencompass 🖥 Documentation: https://opencompass.readthedocs.io/en/latest/ 📕 Paper: https://arxiv.org/abs/2307.06281v1 🚀 Dataset: https://paperswithcode.com/dataset/mmbench ai_machinelearning_big_data