Machinelearning

رفتن به کانال در Telegram

Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri

نمایش بیشتر

شبکه:Machinelearning روسيا1 275 فناوری و برنامه‌ها333...

📈 تحلیل کانال تلگرام Machinelearning

کانال Machinelearning (@ai_machinelearning_big_data) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 295 417 مشترک است و جایگاه 333 را در دسته فناوری و برنامه‌ها و رتبه 1 275 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 295 417 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 24 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -6 346 و در ۲۴ ساعت گذشته برابر -267 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 7.94% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 5.71% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 23 454 بازدید دریافت می‌کند. در اولین روز معمولاً 16 873 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 183 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند openai, claude, api, gemini, контекст تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 25 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

295 417

مشترکین

-26724 ساعت

-1 5017 روز

-6 34630 روز

23 454

نمایش های پست

~ 16 87324 ساعت

~ 18 97748 ساعت

7.94%

نرخ مشارکت

~ 5

پست های در روز

Ads index

beta

آرشیو پست ها

295 387

🌟 CriticGPT — модель на основе GPT-4, которая помогает увидеть ошибки в ответах ChatGPT Вчера OpenAI выкатили CriticGPT, которая пишет критические замечания к ответам ChatGPT для нахождения ошибок в ответе, что особенно полезно для RLHF (обучения с подкреплением на основе человеческой обратной связи). А вот статья от OpenAi - "LLM Critics Help Catch LLM Bugs - для технарей, о том, как создавался CriticGPT. Из нее следует, что: - аннотаторам-людям в 63 % случаев больше нравились критические заметки CriticGCO, сделанные CriticGPT, чем заметки, сделанные людьми, особенно когда речь шла о поиске ошибок, связанных с LLM ( это к пункту поста про 60%), как видите - формулировка отличается, смысл совершенно другой. - новая техника под названием "Force Sampling Beam Search" используется в CriticGPT, чтобы помочь критикам писать более качественные и подробные рецензии.Этот метод также снижает вероятность "галлюцинаций", которые возникают, когда ИИ делает или предлагает ошибки, которых нет или которые не имеют значения. В CriticGPT одним из важнейших преимуществ является то, что пользователи могут изменять степень тщательности поиска ошибок.

То есть процесс не автоматический, вовлеченность человека важна на ранних этапах

- CriticGPT не справляется с длинными и сложными заданиями по кодированию, поскольку обучался на коротких ответах ChatGPT - CriticGPT не всегда находит ошибки, которые распространяются на несколько участков кода Плюсы: - Безусловно, это большой шаг вперед в области рецензирования кода с помощью ИИ. - Он улучшит прикладной подход рецензирования кода, позволит сочетать возможности GPT-4 с продвинутым обучением и новыми методами контроля качества ответов. 🟡 Б лог-пост OpenAI 🟡Статья @ai_machinelearning_big_data

295 387

⚡️ Gemma 2 9B GGUF — набор квантизованных версий Gemma 2 Встречайте набор моделей, полученных квантизацией Gemma 2 с разной степенью сжатия. Для квантизации использовался этот датасет Особенности: - GGuf версии очень слабы, более-менее адекватная - 9B (Q4 и Q5) - Фокус "специализации": текст (стилистика, словарный запас, обсуждения), применимо только к English-language content, программирование - обучение синтаксису и паттернам написания кода ( прокачка скиллов модели по ЯП не уточняются), математика - решение задач, логика постоения ответов. - Модель не поддерживает системные промты 🤗 Hugging Face 🟡 Неквантизованная Gemma 2 @ai_machinelearning_big_data

295 387

🖥 Unstructured — библиотека Python для предобработки сырых данных — pip install "unstructured[all-docs]" Unstructured предоставляет компоненты для предобработки изображений, текстовых документов; поддерживает многие форматы: PDF, HTML, Word docs и др. Запустить библиотеку в контейнере:

docker run -dt --name unstructured downloads.unstructured.io/unstructured-io/unstructured:latest
docker exec -it unstructured bash

🖥 GitHub 🟡 Доки @ai_machinelearning_big_data

295 387

Лето в самом разгаре, а это значит, что пора на фестиваль! “ЛЦТ.Фест” – событие, которое нельзя пропустить. Сегодня отгремел первый день феста, где гости могли посетить вдохновляющие лекции от топовых экспертов, инновационную выставку с современными решениями, астрошатер с тарологом, а также погрузиться в мир виртуальной реальности в киберпространстве. Завтра будет не менее насыщенный день. А вечером отметим окончание самого масштабного хакатона страны “Лидеры цифровой трансформации” концертом ANNA, группы ХЛЕБ и диджей-сеты от BARBARA и организаторов. Фестиваль проходит в кластере “Ломоносов” по адресу: Раменский бульвар, дом 1. Участие в фестивале бесплатное. У вас еще есть шанс попасть на фест, для этого надо зарегистрироваться на сайте. В поле промокода введите “Machinelearning”. Вход осуществляется строго по билетам. Реклама ГБУ «Агентство инноваций Москвы» ИНН 7703770430 erid: 2SDnjcN9xkS

295 387

🌟 Scikit-LLM — библиотека Python, призванная упростить разработку сложных и готовых к продакшену конвейеров NLP — pip install scikit-llm Scikit-LLM может взаимодействовать с различными провайдерами LLM, независимо от того, работают ли они локально (например, GPT4All) или в облаке (включая Azure, OpenAI и Vertex AI). Scikit-LLM поддерживает широкий спектр задач анализа текста, включая классификацию, анализ эмоциональной составляющей и т.д. Для сложных сценариев можно объединить несколько задач в конвейер scikit-learn. 🖥 GitHub 🟡 Доки @data_analysis_ml

295 387

В нейросети GigaChat появился новый персонаж - Контент-мейкер. Теперь большинство ваших задач вы можете поручить ему — он подробно расспросит о деталях задачи, уточнит, какая ЦА креатива, поможет с генерацией разного рода контента - и многое другое. Контент-мейкер может: 🔹Помочь с написанием SMM-стратегии 🔹Решить проблему "белого листа" и нагенерить креативов 🔹Разработать контент-план 🔹Разработать УТП для вашего бренда 🔹Сформировать тональность коммуникации для вашего сообщества Персонаж Контент-мейкер в GigaChat отлично справится с каждой из этих задач. Попробуй пообщаться с ним уже сейчас! 🖥 доступен в веб-версии и в боте Telegram 🖥 находится в разделе «Персонажи» или «Выбрать персонажа GigaChat» 🆘 — Контент-мейкер, придумай смешную подпись к этому посту 📝 — надо было попросить Контент-мейкера придумать смешную подпись к посту

295 387

🌟 EAGLE — метод, позволяющий ускорить генерацию ответов от LLM Можно ли генерировать ответ от LLM на двух RTX 3060 быстрее, чем на A100 (которая дороже в 16+ раз)? Да, это возможно с алгоритмом EAGLE (Extrapolation Algorithm for Greater Language-model Efficiency), точность ответов при этом сохраняется. EAGLE позволяет экстраполировать вектора контекстных признаков второго верхнего слоя LLM, что значительно повышает эффективность генерации. EAGLE в 2 раза быстрее Lookahead (13B), и в 1.6 раз быстрее, чем Medusa (13B). И да, EAGLE можно комбинировать с другими методами ускорения, такими как vLLM, DeepSpeed, Mamba, FlashAttention, квантование и аппаратная оптимизация. 🤗 Hugging Face 🖥 GitHub @ai_machinelearning_big_data

295 387

🌟 SPPO — инструмент оптимизации предпочтений языковой моделью. LLM показывают впечатляющие возможности, однако довольно сложно добиться соблюдения ими этических норм. Эту проблему можно частично решить при помощи обучения с подкреплением на основе человеческой обратной связи (RLHF), или обучения с подкреплением на основе предпочтений (PbRL). Оба метода имеют недостатки, и приводят к заметному снижению показателей моделей. В этой свежей работе Yue Wu с коллегами предлагает новый способ обеспечения этичности LLM — SPPO (Self-Play Preference Optimization). Как видно на графиках SPPO не снижает производительность моделей так сильно, как RLHF и PbRL, что позволяет повысить точность ответов, не рискуя допустить неэтичные ответы LLM. 🖥 GitHub 🤗 Hugging Face 🟡 Arxiv @ai_machinelearning_big_data

295 387

Deep Learning — суперсила, работающая подобно человеческому мозгу. Специалисты в этой области разрабатывают нейросети, объединяя анализ данных и программирование. Рекомендации фильмов, переводчики или генерация ответов на вопросы как от Siri - это все их работа. Deep Learning Инженеров нанимают крупные компании, а начальная зарплата в среднем 120 000 рублей в месяц. Создавать и обучать такие нейросети вы научитесь в онлайн-школе Data Science KARPOV.COURSES. Учиться вы будете у практикующих специалистов — поэтому за 4 месяца вы получите все знания и навыки, которые пригодятся в реальной работе. Школа поможет вам с трудоустройством — 89% студентов находят работу в первые 3 месяца благодаря карьерному сопровождению. Присоединяйтесь к курсу со скидкой 5% по промокоду AIMLBDD: https://clc.to/erid_LjN8KVWmd

295 387

🌟 Cambrian-1 — семейство мультимодальных LLM, ориентированных на CV-задачи Cambrian-1 — это семейство MLLM, разработанных с упором на работу с визуальной информацией. На страничке Cambrian-1 представлены модели 3 размеров (8B, 13B и 34B), данные для обучения, скрипты для обучения на TPU. Скоро на GitHub появится скрипт для обучения на GPU. 🟡 Страничка Cambrian-1 🖥 GitHub 🤗 Hugging Face @ai_machinelearning_big_data

295 387

⚡️ Еще один интересный анонс, Meta LLM Compiler - новое семейство моделей (7B и 13B), на базе Meta Code Llama, для задач оптимизации и генерации кода. LLVM Compiler - это новая SOTA в области оптимизации кода и дизассемблирования. Модели доступны под лицензией как для научных исследований, так и для коммерческого использования. Эти модели могут эмулировать компилятор, прогнозировать оптимальные проходы для создания кода и дизассемблировать код. ▪HF ▪Статья @ai_machinelearning_big_data

295 387

⚡️ Выпущена Gemma 2! Google только что выпустил новую версию своего открытого LLM! Gemma 2 выпущен в двух размерах, 9B и 27B, модели тренировались на 8T и 13T токенов. Модель Gemma 2 приближается к производительности Llama 3 70B, Claude 3 Sonnet и GPT-4! ▪HF: huggingface.co/collections/google/g-667d6600fd5220e7b967f315 ▪Blog: https://blog.google/technology/developers/google-gemma-2/ @ai_machinelearning_big_data

295 387

🔥В OTUS стартует курс "Machine Learning. Professional", обучение на котором позволит последовательно освоить современные инструменты анализа данных и на профессиональном уровне создавать модели машинного обучения. Студенты курса выбирают самостоятельно темы выпускных работ, поэтому все выпускные проекты на курсе–это ценные исследования для ML. ⚡08 июля в 18.00 мск приглашаем на открытый урок курса "Дерево решений - простой и интерпретируемый ML-алгоритм", на котором мы: - разберем алгоритм решающего дерева (дерева решений), который широко применяется для решения задач машинного обучения; - применим полученные знания на практике для решения задачи классификации. 👉Регистрация https://otus.pw/b6sE/?erid=LjN8KCQW9

295 387

✅ GPTCache : A Library for Creating Semantic Cache for LLM Queries GPTCache - инструмент, который позволяет ускорить работу и повысить масштабируемость вашего приложения, за счет кэширования ответов от LLM. GPTCache может помочь значительно сократить расходы на работу с LLM (до 10 раз)💰 и увеличить скорость вывода моделями( до 100 раз) ⚡ при работе с

API OpenAI/HuggingFace Hub/Bard/Anthropic.

В инструменте используется семантическое кэширование, для поиска и хранения похожих или взаимосвязанных запросов, что позволяет увеличить вероятность попадания данных в кэш и повысить эффективность кэширования. ❗️ После получения результатов поиска модель выполняет оценку сходства и возвращает результаты при достижении установленного порога. Вы можете настроить порог, который изменит точность результатов нечеткого поиска. Подробнее в документации. pip install gptcache ▪Github: https://github.com/zilliztech/GPTCache ▪Docs: gptcache.readthedocs.io @ai_machinelearning_big_data

295 387

🌟 Pyramid Attention Broadcast — подход, позволяющий генерировать видео в режиме реального времени PAB — это первый подход к созданию видео на основе диффузионных трансформеров в реальном времени, обеспечивающий качество без потерь и не требующий обучения. PAB оптимизирует работу с механизмом внимания, что позволяет достичь 21.6 FPS с 10.6-кратным ускорением для популярных моделей генерации видео на основе DiT, включая Open-Sora, Open-Sora-Plan и Latte. Поскольку метод PAB не требует дополнительного обучения, он может обеспечить любые будущие модели генерации видео на основе DiT возможностями генерации в режиме реального времени 🟡 Страничка Pyramid Attention Broadcast 🖥 GitHub @ai_machinelearning_big_data

295 387

💥 Масштабное обновление получила платформа для работы с исходным кодом GitVerse Глава СберТеха Максим Тятюшев отметил, что разработчики смогут зеркалировать репозитории с GitVerse на другие площадки для резервного копирования и в один клик смогут находить нужный репозиторий и открывать проект в локальной среде разработки. На полях GigaConf 2024 Сбер продемонстрировал как передовые цифровые технологии и решения изменят различные секторы экономики, повышая их эффективность и конкурентоспособность. @ai_machinelearning_big_data

295 387

🌟 Text-Animator — метод генерации видео с текстом в кадрах С текстом у генеративных моделей до недавнего времени были большие проблемы, как и с пальцами. Сейчас уже ситуация улучшилась, но только для моделей, создающих изображения. С генерацией текста в видео всё было ещё печальнее, но буквально вчера Tencent и Huawei выкатили Text-Animator — метод, который позволяет создавать видео с текстом в кадрах. 🟡 Страничка Text-Animator 🟡 Arxiv @ai_machinelearning_big_data

295 387

🔹 Как усилить технический анализ финансовых рынков методами машинного обучения? Рассмотрим, как современные технологии машинного обучения могут усилить и расширить классические подходы технического анализа на финансовых рынках на открытом уроке от Otus, посвященный курсу «ML для финансового анализа», 3 июля в 20:00. ✅ В течении часа рассмотрим реальные примеры и кейсы, демонстрирующие использование машинного обучения для улучшения торговых стратегий на основе технического анализа. Оставляйте заявку на курс «ML для финансового анализа» и создайте торгового робота для автоматического проведения операций с оценкой уровня риска 👉 Регистрация на урок и подробности: https://otus.pw/BYD9T/?erid=LjN8KPtzA

295 387

🌟 Тонкая настройка VLM модели Florence-2 Andres Marafioti с коллегами немного прокачали Florence-2 на датасете DocVQA, и теперь Florence может давать визуальные ответы на вопросы (VQA) Блокнот Colab с пошаговой настройкой Florence-2 ниже 🟡 Fine-tuning Florence-2 🟡 Google Colab 🤗 Hugging Face @ai_machinelearning_big_data

295 387

🌟 Быстрый способ переводить экраны любых приложений на русский язык Пользователь Хабра опубликовал рабочий способ переводить на русский экраны приложений на айфоне по одному двойному тапу. Лайфхак сильно упрощает жизнь, когда нужно разобраться в приложениях на других языках. ▪️Статья: https://habr.com/ru/companies/yandex/posts/824706 @ai_machinelearning_big_data