Machinelearning

Kanalga Telegram’da o‘tish

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya1 279 Texnologiyalar & Aralashmalar331...

📈 Telegram kanali Machinelearning analitikasi

Machinelearning (@ai_machinelearning_big_data) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 294 753 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 331-o'rinni va Rossiya mintaqasida 1 279-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 294 753 obunachiga ega bo‘ldi.

27 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -6 411 ga, so‘nggi 24 soatda esa -195 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 7.72% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.41% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 22 754 marta ko‘riladi; birinchi sutkada odatda 15 946 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 179 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent openai, claude, api, gemini, контекст kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 28 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

294 753

Obunachilar

-19524 soatlar

-1 5847 kunlar

-6 41130 kunlar

22 754

Post ko'rishlar

~ 15 94624 soatlar

~ 17 78748 soatlar

7.72%

Muloqot nisbati

~ 6

Kuniga postlar

Ads index

beta

Postlar arxiv

294 747

✔️ Lemur: Harmonizing Natural Language and Code for Language Agents Lemur - это открытая языковая модель, оптимизированная как для естественного языка, так и для кодинга, которая может служить основой для универсальных языковых агентов. Поскольку языковые модели продолжают превращаться из разговорных чат-ботов в функциональные агенты, способные действовать в реальном мире, им необходимо как глубокое понимание языка, так и способность выполнять различные действия. Lemur обеспечивает баланс между естественным языком и кодингом, позволяя агентам выполнять инструкции, обосновывать задачи и предпринимать обоснованные действия. 🖥 Github: https://github.com/openlemur/lemur 🤗 HF: https://huggingface.co/OpenLemur 📕 Paper: https://arxiv.org/abs/2310.06830v1 ⭐️ Dataset: https://paperswithcode.com/dataset/ds-1000 ai_machinelearning_big_data

294 747

💻 Graph Structure Learning Benchmark (GSLB) Комплексный бенчмарк для изучения и построения графов и (NeurIPS 2023 Datasets and Benchmarks Track). pip install GSLB 🖥 Github: https://github.com/gsl-benchmark/gslb 📕 Paper: https://arxiv.org/abs/2310.05163v1 ⭐️ Paper collection: https://github.com/GSL-Benchmark/Awesome-Graph-Structure-Learning ai_machinelearning_big_data

294 747

Привет! Это команда МТС и мы запустили бесплатный курс для тех, кто хочет стать сильным ML-разработчиком Что будет: 10 месяцев онлайн обучения от экспертов Big Data МТС с возможностью трудоустройства в компанию Что в программе: Python, математика, основы машинного обучения, ML Ops, ML System design и все, что необходимо для работы в Data Science Ждем на обучении тех, кто хочет развиваться и в анализе данных, и в ML, и в IT одновременно. Оставляй заявку и решай вступительное испытание. Лучших пригласим к обучению Подробности по ссылке, ждем тебя! Реклама. ПАО "МТС". ИНН 7740000076. erid: LjN8K11Qf

294 747

💸 Enhancing Financial Sentiment Analysis via Retrieval Augmented Large Language Models: Open Source Code Новый фреймворк больших языковых моделей с поисковым дополнением, предназначенный для анализа финансовых настроений и обеспечивающий точные и обоснованные прогнозы. Метод настройки промптов обеспечивает точные прогнозы на поставленные пользователем задачи анализа финансовых новостей. Проведя обширные оценки, показано, что подход значительно превосходит как традиционные модели анализа настроений, так и известные LLM общего назначения. git clone https://github.com/AI4Finance-Foundation/FinGPT.git 🖥 Github: https://github.com/AI4Finance-Foundation/FinGPT/tree/master/fingpt/FinGPT-RAG 📕 Paper: https://arxiv.org/abs/2310.04027v1 ⭐️ FinNLP: https://github.com/ai4finance-foundation/finnlp ai_machinelearning_big_data

294 747

Стать сотрудником Яндекса быстрее и проще, чем кажется. Участвуйте в днях быстрого найма: решите тестовое, пройдите несколько секций собеседования и получите офер за несколько дней. Ближайшее мероприятие: • 16-20 октября — Fast Track для технических менеджеров, офер за 5 дней в команду Crowd. Зарегистрироваться Реклама. ООО "Яндекс". erid:2Vtzqv5JoPP

294 747

Guideline following Large Language Model for Information Extraction Новая модель для извлечения информации, обученная следовать рекомендациям по аннотированию. GoLLIE превосходит предыдущие подходы по извлечению информации без использования обучающих примеров . 🖥 Github: https://github.com/hitz-zentroa/gollie ⏩ Tutorial: https://github.com/stanfordnlp/dspy/blob/main/intro.ipynb ⭐️ Project: https://hitz-zentroa.github.io/GoLLIE/ 📕 Paper: https://arxiv.org/abs/2310.03668v1 ⭐️ Dataset: https://paperswithcode.com/dataset/harveyner ai_machinelearning_big_data

294 747

✅️ T3Bench: Benchmarking Current Progress in Text-to-3D Generation T3Bench - это новый комплексный фреймворк преобразования текста в трехмерное изображение, содержащий разнообразные текстовые промпты трех уровней комплексности, специально разработанные для 3D-генерации. Для оценки качества и выравнивания текста содержит две автоматические метрики, основанные на многоракурсных изображениях, создаваемых 3D-контентом. 🖥 Github: https://github.com/THU-LYJ-Lab/T3Bench 📕 Paper: https://arxiv.org/abs/2310.02977v1 ⭐️ Dataset: https://paperswithcode.com/dataset/nerf ai_machinelearning_big_data

294 747

✅ Ключевой ML-специалист HuggingFace Ahsen Khaliq опубликовал статью о Kandinsky Khaliq в своем Twitter (X) поделился статьей Kandinsky: an Improved Text-to-Image Synthesis with Image Prior and Latent Diffusion, которая в разделе DailyPapers заняла первое место, обогнав статьи и Deepmind, и Carnegie Mellon. В статье рассказывается о диффузионной модели Kandinsky для генерации изображений по тексту. 🕊 X: https://twitter.com/_akhaliq/status/1710106706569478573?s=52&t=hSNPltUk1ZT1M605JGLRnA 📕 Paper: https://huggingface.co/papers @ai_machinelearning_big_data

294 747

✅ DSPy: Programming—not prompting—Foundation Models DSPy - это фреймворк от Stanfordnlp для решения сложных задач с помощью языковых моделей и поисковых моделей. DSPy объединяет методы промпт-инжиниринга и тонкой настройки ЛМ, а также подходы к рассуждениям, самосовершенствованию и дополнению поисковых моделей и инструментов. Все это выстроено в модулях, которые компонуются и обучаются. DSPy представляет автоматический компилятор, который учит LM, как выполнять декларативные шаги в вашей программе. В частности, компилятор DSPy осуществляет внутреннюю трассировку вашей программы и затем составляет высококачественные пропиты для больших ЛМ. pip install dspy-ai 🖥 Github: https://github.com/stanfordnlp/dspy ⏩ Tutorial: https://github.com/stanfordnlp/dspy/blob/main/intro.ipynb 🖥 Colab: https://colab.research.google.com/github/stanfordnlp/dspy/blob/main/intro.ipynb 📕 Paper: https://arxiv.org/abs/2308.05734 ⭐️ Dataset: https://paperswithcode.com/dataset/hotpotqa ai_machinelearning_big_data

294 747

🤖 GenSim: Generating Robotic Simulation Tasks via Large Language Models Фреймворк для генерации и моделирования симуляций для роботов с помощью больших языковых моделей. 🖥 Github: https://github.com/liruiw/gensim ✔️ Project: https://liruiw.github.io/gensim 📕 Paper: https://arxiv.org/abs/2310.01361v1 ✅ Dataset: https://huggingface.co/datasets/Gen-Sim/Gen-Sim ⭐️ Demos: https://huggingface.co/spaces/Gen-Sim/Gen-Sim ai_machinelearning_big_data

294 747

👀 Как используются нейросети для планирования движения беспилотных автомобилей Разработчик Яндекса рассказал, как беспилотный автомобиль предсказывает действия других участников движения и планирует свои действия с помощью нейросетей. Тут и разбор логики свёрточных и трансформерных архитектур моделей для предсказания движения, и много формул для расчёта вероятных траекторий других машин и пешеходов. Читайте о том, в чём проблемы Behavioral Cloning и как их решать, а ещё в чём преимущества машинного обучения перед эвристиками и чем может помочь Reinforcement Learning. Habr: https://habr.com/ru/companies/yandex/articles/763348/ ai_machinelearning_big_data

294 747

🦅 Jury: A Comprehensive Evaluation Toolkit Комплексный набор инструментов для оценки НЛП-экспериментов, предлагающий различные автоматизированные метрики. Jury предлагает удобный и простой в использовании интерфейс. pip install jury 🖥 Github: https://github.com/obss/jury 📕 Paper: https://arxiv.org/abs/2310.02040v1 🖥 Colab: https://colab.research.google.com/github/obss/jury/blob/main/examples/jury_evaluate.ipynb ⭐️ Demos: https://github.com/Parskatt/DeDoDe/blob/main/demo ai_machinelearning_big_data

294 747

Emcee — это раннер для параллельного тестирования. Разработчики из AvitoTech прокачали Emcee до облачного решения и нашли способ организовать сендбоксинг через виртуализацию на macOS, чтобы обезопасить трафик. Подробности и ссылка на сам Emcee ищите здесь Реклама ООО "Авито Тех", ИНН 9710089440 erid: LdtCK7JmP

294 747

☑️ Efficient Streaming Language Models with Attention Sinks StreamingLLM, an efficient framework that enables LLMs trained with a finite length attention window to generalize to infinite sequence length without any fine-tuning. Фреймворк для развертывания больших языковых моделей в потоковых приложениях, таких как многораундовые диалоги, где ожидается длительное взаимодействие, является настоятельной необходимостью, но сопряжено с двумя серьезными проблемами. StreamingLLM позволяет Llama-2, MPT, Falcon и Pythia стабильно и эффективно выполнять моделирование общения с количеством лексем до 4 млн. и более. 🖥 Github: https://github.com/mit-han-lab/streaming-llm 📕 Paper: http://arxiv.org/abs/2309.17453 ⭐️ Dataset: https://paperswithcode.com/dataset/pg-19 ai_machinelearning_big_data

294 747

⚡️ Memory Gym: Partially Observable Challenges to Memory-Based Agents in Endless Episodes Среда для обучения, тестирования и запуска агентов основе памяти. 🖥 Github: https://github.com/marcometer/endless-memory-gym 🖥 Colab: https://colab.research.google.com/drive/1LjlUOEer8vjGrz0rLM8pP5UyeNCsURkY?usp=sharing 📕 Paper: https://openreview.net/forum?id=jHc8dCx6DDr ⭐️ Dataset: https://paperswithcode.com/dataset/arcade-learning-environment ai_machinelearning_big_data

294 747

Яндекс опубликовал плейлист с докладами конференции Practical ML. Вот некоторые из них: — Алексей Морозов, руководитель группы модернизации нейронных сетей Яндекса. Про то, как можно полностью инкапсулировать от ML’щика и исследователя заботу о fault tolerance, распределённой транзакционной записи в storage, асинхронности и минимизации простоев GPU — Юлий Шамаев, Data Science Team Lead, Банк ВТБ. Про про геоэмбеддинги – векторное представление контекста в пространственной аналитике. Они помогают определить лучшее расположение для банкоматов и банковских отделений. — Евгений Сидоров, Head of AI, Third Opinion. Про то, как компенсировать недостаток трёхмерной информации на основе множественных проекций при анализе медицинских снимков.

294 747

🤖 AutoAgents: A Framework for Automatic Agent Generation Generate different roles for GPTs to form a collaborative entity for complex tasks. Мы представляем AutoAgents, инновационный фреймворк, который адаптивно генерирует и координирует множество специализированных агентов для создания ИИ-команды в соответствии с различными задачами. 🖥 Github: https://github.com/LinkSoul-AI/AutoAgents 📕 Paper: https://arxiv.org/abs/2309.17288v1 ⭐️ Demo: https://huggingface.co/spaces/LinkSoul/AutoAgents ai_machinelearning_big_data

294 747

Стать сотрудником Яндекса быстрее и проще, чем кажется. Участвуйте в днях быстрого найма: решите тестовое, пройдите несколько секций собеседования и получите офер за несколько дней. Ближайшее мероприятие: • 7-8 октября — Fast Track для дата-аналитиков, офер за 2 дня в команду Фудтеха. Зарегистрироваться Реклама. ООО "Яндекс". erid:2VtzqwaYy5b

294 747

✅ Demystifying CLIP Data MetaCLIP takes a raw data pool and metadata and yields a balanced subset over the metadata distribution. Новый масштабируемый алгоритм MetaCLIP, работающий в конвейере обработки данных. MetaCLIP, примененная к CommonCrawl с 400 млн. пар данных "изображение-текст", превосходит данные CLIP по многим стандартным показателям. В классификации ImageNet точность MetaCLIP составляет 70,8%, что превосходит точность CLIP в 68,3% на моделях ViT-B. 🖥 Github: https://github.com/facebookresearch/metaclip 📕 Paper: https://arxiv.org/pdf/2309.16671v1.pdf ⭐️ Dataset: https://paperswithcode.com/dataset/laion-400m ai_machinelearning_big_data

294 747

🔊 Diverse and Aligned Audio-to-Video Generation via Text-to-Video Model Adaptation Модель генерации реалистичных видео из Аудио. Фреймворк способен распознать природу звука и сгенерировать визуальный образ. git clone git@github.com:guyyariv/TempoTokens.git 🖥 Github: https://github.com/guyyariv/TempoTokens 📕 Paper: https://arxiv.org/abs/2309.16429v1 ⭐️ Dataset: https://paperswithcode.com/dataset/audioset ai_machinelearning_big_data