Data Science | Machinelearning [ru]

Kanalga Telegram’da o‘tish

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Ko'proq ko'rsatish

Tarmoq:Frontender's notes [ru]Rossiya33 717 Texnologiyalar & Aralashmalar6 722...

📈 Telegram kanali Data Science | Machinelearning [ru] analitikasi

Data Science | Machinelearning [ru] (@devsp) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 20 007 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 6 722-o'rinni va Rossiya mintaqasida 33 717-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 20 007 obunachiga ega bo‘ldi.

20 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -78 ga, so‘nggi 24 soatda esa -10 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 8.57% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 3.82% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 1 715 marta ko‘riladi; birinchi sutkada odatda 765 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 8 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, nvidia, контекст, openai, архитектура kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 21 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

20 007

Obunachilar

-1024 soatlar

-467 kunlar

-7830 kunlar

1 715

Post ko'rishlar

~ 76524 soatlar

~ 91148 soatlar

8.57%

Muloqot nisbati

~ 1

Kuniga postlar

Ads index

beta

Postlar arxiv

20 004

☕️ Latte: Latent Diffusion Transformer for Video Generation Новый трансформер скрытой диффузии Latte, для генерации видео. Latte сначала извлекает пространственно-временные маркеры из входных видео, а затем использует серию блоков-трансформеров для генерации видео в скрытом пространстве. Latte дает ценную информацию для будущих исследований по включению Трансформеров в модели диффузии для генерации видео. ▪️Github ▪️Project ▪️Paper @Devsp — Подписаться

20 004

Авито ищет аналитиков — получить оффер можно за одни выходные! Вот, что ждет вас на позиции: — зарплата от 200 до 480 тысяч рублей в зависимости от грейда; — расширенный ДМС, компенсация питания и другие бонусы; — формат работы на выбор: офис или удаленка; — возможность поучаствовать в разработке новых продуктов — обучать модели, делать прогнозы, экспериментировать и автоматизировать. Авито — это про карьерное развитие и комфортные условия. Регистрируйтесь на Weekend Offer до 4 апреля: https://u.to/nweIIA

20 004

🌊 LaVague: automate automation with Large Action Model framework LaVague — это проект с открытым исходным кодом, предназначенный для автоматизации рутинных задач от имени своих пользователей. ▪Github: https://github.com/lavague-ai/LaVague ▪Docs: https://docs.lavague.ai/en/latest/docs/ ▪Colab: https://colab.research.google.com/github/lavague-ai/LaVague/blob/main/docs/docs/get-started/quick-tour.ipynb @Devsp — Подписаться

20 004

⁉️ Что такое языковое моделирование и как с ним работать в машинном обучении? 💻 Расскажет Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ. Встречаемся на бесплатном практическом уроке от OTUS, где вы: — узнаете, что такое языковое моделирование и зачем в NLP используют языковые модели; — рассмотрите основные языковые модели: от простейших статистических до самых мощных трансформерных архитектур, таких как GPT; — получите ответы на все вопросы по теме. 📌 Встречаемся 1 апреля в 18:00 мск в рамках курса «Natural Language Processing (NLP)». Доступна рассрочка на обучение! 🔴 Пройдите короткий тест прямо сейчас, чтобы посетить бесплатный урок и получить запись: https://otus.pw/Vrc8/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 004

🐬 ShareGPT4V:Improving Large Multi-Modal Models with Better Captions В сфере больших мультимодальных моделей (LMM) эффективное согласование модальностей имеет решающее значение, но часто ограничивается нехваткой высококачественных данных изображения и текста. Чтобы устранить это узкое место, мы представляем набор данных ShareGPT4V, новаторский крупномасштабный ресурс, содержащий 1,2 миллиона высокоописательных подписей, который превосходит существующие наборы данных по разнообразию и информативности, охватывая мировые знания, свойства объектов, пространственные отношения и эстетические оценки. ShareGPT4V создан на основе 100 тысяч высококачественных подписей, собранных с помощью усовершенствованного GPT4-Vision, и был расширен до 1,2 миллиона с помощью превосходной модели подписей, обученной на этом подмножестве. 🖥Code: https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V 🦾 Project: https://sharegpt4v.github.io/ ⚡️Demo: https://huggingface.co/spaces/Lin-Chen/ShareGPT4V-7B 📚Paper: https://arxiv.org/pdf/2311.12793.pdf 🔗Dataset: https://huggingface.co/datasets/Lin-Chen/ShareGPT4V @Devsp — Подписаться

20 004

🎓 OS-Copilot: Towards Generalist Computer Agents with Self-Improvement Автономное взаимодействие с компьютером уже давно является проблемой с огромным потенциалом, а недавнее распространение больших языковых моделей (LLM) заметно ускорило прогресс в создании цифровых агентов. Однако большинство этих агентов предназначены для взаимодействия с узкой областью, например с конкретным программным обеспечением или веб-сайтом. OS-Copilot - это новаторская основа для создания универсальных компьютерных агентов, которая обеспечивает единый интерфейс для взаимодействия приложений в экосистеме ОС. Самосовершенствующийся помощник с искусственным интеллектом, способного решать общие компьютерные задачи. Агент может взаимодействовать со всеми элементами операционной системы (ОС), включая работу в сети, написание кода, работу с файлами и мультимедиа, работу различными сторонними приложениями. ▪️Github ▪️Project ▪️Статья @Devsp — Подписаться

20 004

Друзья! Получите одну из самых востребованных IT профессий. 1 апреля начинается курс “AI в 2024 году: создание и работа с нейронными сетями" Первые 2 потока ведет автор курса — Артур Сапрыкин www.arthursaprykin.ru Что внутри курса? - создание нейронных сетей для выполнения практических задач - решение типичных проблем при обучении сетей - продвинутые архитектуры нейронных сетей и их применение в Data Science Курс будет полезен, если вы: - Аналитик данных и хотите освоить продвинутые инструменты, чтобы выйти на новый уровень - Разработчик с опытом программирования и хотите применить свои знания в новой области - Студент или Junior и хотите освоить машинное обучение для старта карьеры в ML - Руководитель IT-проектов и хотите лидировать современные бизнес-процессы Что вы получите? 🏆 Сертификат/удостоверение о повышении квалификации 🏆 Рекомендации и помощь в трудоустройстве успешным ученикам Академия Кодебай образовательный центр для IT-профессионалов @Codeby_Academy 84994441750

20 004

🖼 One-Step Image Translation with Text-to-Image Models CycleGAN-Turbo — общий метод адаптации одношаговой диффузионной модели, такой как SD-Turbo, к новым задачам и областям посредством состязательного обучения. Это позволяет нам использовать внутренние знания предварительно обученных моделей диффузии, одновременно достигая эффективного вывода. ▪Paper: https://arxiv.org/abs/2403.12036 ▪Code: https://github.com/GaParmar/img2img-turbo ▪Demo: http://huggingface.co/spaces/gparmar/img2img-turbo-sketch @Devsp — Подписаться

20 004

⁉️ Как повысить производительность Spark? С помощью оптимизатора запросов Catalyst! О том, как работать с Catalyst, – мы поговорим на открытом вебинаре «Раскрытие мощности Apache Spark: Погружение в оптимизатор запросов Catalyst». Урок проведёт Андрей Чучалов, опытный специалист по технологиям на базе JVM и большим данным. 💻 Вы узнаете: — Каким образом Catalyst повышает производительность Spark — Из чего состоит архитектура Catalyst — Каким образом Catalyst обеспечивает расширяемость и настройку — Какие препятствия и ограничения возникают при работе с Catalyst После вебинара можно записаться на курс «Spark Developer». Курс доступен для приобретения в рассрочку. 🔛 Начало: 28 марта, 20:00 МСК 🟣 Записаться на событие - https://otus.pw/QIc9/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 004

🧬 Evolving New Foundation Models: Unleashing the Power of Automating Model Development Мы представляем новое применение эволюционных алгоритмов для автоматизации создания мощных базовых моделей. Хотя слияние моделей стало многообещающим подходом для развития LLM из-за его экономической эффективности, в настоящее время оно опирается на человеческую интуицию и знание предметной области, что ограничивает его потенциал. Авторы используют эволюционные алгоритмы для поиска лучших способов объединения моделей с открытым исходным кодом для автоматического создания новых мощных моделей с заданными пользователем возможностями! ▪Blog: https://sakana.ai/evolutionary-model-merge/ ▪Paper: https://arxiv.org/abs/2403.13187 @Devsp — Подписаться

20 004

😁Когда тебя завлекают на роботу программистом) @Devsp — Подписаться

20 004

🎧Video2Music: Suitable Music Generation from Videos using an Affective Multimodal Transformer model Эта платформа уникальным образом использует функции видео в качестве входных данных для создания соответствующей музыки с использованием архитектуры Transformer. Используя передовые технологии, наша система призвана предоставить создателям видео простое и эффективное решение для создания индивидуальной фоновой музыки. 🖥 Github: https://github.com/amaai-lab/video2music 📕Paper: https://arxiv.org/abs/2311.00968v1 ⏩Demo: https://llmrec.github.io/ 🌐 Dataset: https://zenodo.org/records/10057093 @Devsp — Подписаться

20 004

🏆 LLaMA2-Accessory: An Open-source Toolkit for LLM Development LLaMA2-Accessory — это набор инструментов с открытым исходным кодом для предварительного обучения, точной настройки и развертывания моделей большого языка (LLM) и мультимодальных LLM. 🐱 Github: https://github.com/alpha-vllm/llama2-accessory 🚀 Demo: http://imagebind-llm.opengvlab.com/ 📕Paper: https://arxiv.org/abs/2311.07575v1 ⏩Project: llama2-accessory.readthedocs.io/ ⭐Dataset: https://paperswithcode.com/dataset/vsr @Devsp — Подписаться

20 004

🔊 Qwen-Audio: Advancing Universal Audio Understanding via Unified Large-Scale Audio-Language Models Qwen-Audio — это мультимодальная версия большой серии моделей Qwen, предложенной Alibaba Cloud. Qwen-Audio принимает разнообразный звук (человеческую речь, естественный звук, музыку и песни) и текст в качестве входных данных и выводит текст. 🐱 Github: https://github.com/qwenlm/qwen-audio 🚀 Demo: https://qwen-audio.github.io/Qwen-Audio/ 📕Paper: https://arxiv.org/abs/2311.07919v1 ⏩Dataset: https://paperswithcode.com/dataset/vocalsound @Devsp — Подписаться

20 004

🪴 SceneScript: an AI model and method to understand and describe 3D spaces SceneScript — это метод представления и определения геометрии сцены с использованием авторегрессионной структурированной языковой модели и сквозного обучения. SceneScript использует тот же метод прогнозирования следующего токена, что и модели на большом языке. Это дает моделям ИИ словарный запас, необходимый для рассуждений о физических пространствах. ▪Paper ▪Project ▪Dataset @Devsp — Подписаться

20 004

📢 𝐕𝐨𝐢𝐜𝐞𝐂𝐫𝐚𝐟𝐭: Zero-Shot Speech Editing and Text-to-Speech in the Wild🪄 VoiceCraft — это языковая модель нейронного кодека, заполняющая токены, которая обеспечивает высочайшую производительность как при редактировании речи, так и при преобразовании текста в речь (TTS) с нулевым количеством кадров для реальных данных, включая аудиокниги, интернет-видео и подкасты. Чтобы клонировать или редактировать невидимый голос, VoiceCraft требуется всего несколько секунд справки. ▪Github ▪Paper ▪Project @Devsp — Подписаться

20 004

🚀 Откройте двери в мир машинного обучения и узнайте, что нужно знать новичкам, и профессионалам! Отус приглашает 27 марта в 18:00 по мск на бесплатный вебинар «Расставим точки над ML». Вебинар является частью полноценного онлайн-курса «Специализация Machine Learning». 💪 Спикером выступит: Мария Тихонова – PhD in Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ. На вебинаре вы: ✅ познакомитесь с ML и узнаете, чем оно отличается от классического программирования; ✅ посмотрите, какие задачи есть в ML; ✅ решите на практике одну из задач - научите компьютер определять, что изображено на картинке. ➡ Регистрация на вебинар: https://otus.pw/QIc9/ Кому подходит этот урок: - IT-специалистам которые хотят перейти в Data Science - Начинающим дата-сайентистам и специалиста по машинному обучению, желающим углубиться в профессию - Тем кто самостоятельно изучает Data Science - Кто хочет войти в IT, но не знает что выбрать Записывайтесь сейчас, а мы потом напомним. Участие бесплатно. Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

20 004

🖼 One-Step Image Translation with Text-to-Image Models Модели CycleGAN-Turbo и pix2pix-turbo могут выполнять различные задачи перевода изображения в изображение как для парных, так и для непарных настроек. CycleGAN-Turbo превосходит существующие методы на основе GAN и диффузии, а pix2pix-Turbo находится на одном уровне с недавними работами, такими как ControlNet для Sketch2Photo и Edge2Image, но с одношаговым выводом. ▪️Paper: https://arxiv.org/abs/2403.12036 ▪️Code: https://github.com/GaParmar/img2img-turbo ▪️Demo: http://huggingface.co/spaces/gparmar/img2img-turbo-sketch @Devsp — Подписаться

20 004

🔥 Нужны примеры кода, и настройка работы с API ChatGPT? Если вы интересуетесь актуальными техниками промпт-инжиниринга и хотите внедрять ChatGPT в бизнес-процессы – приглашаем на открытый вебинар «Промптинг языковых моделей и ChatGPT: продвинутые техники» — Узнаете какие существуют техники промптинга для языковых моделей — Поймёте, как работать с API ChatGPT — Познакомитесь с возможностями ChatGPT в реализации агентов — Увидите примеры кода для работы с агентами 📊 Урок проведёт Александр Брут-Бруляко. Занимается исследованиями с фокусом на персонализацию коммуникаций в СБЕР Neurolab. Начало: 25 марта, 20:00 МСК После вебинара можно записаться на курс «Natural Language Processing (NLP)». Курс доступен для приобретения в рассрочку. 🔴 Записаться на событие - https://otus.pw/QIc9/ Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru

20 004

🪄 InternLM-XComposer MORL-Baselines — это библиотека алгоритмов многоцелевого обучения с подкреплением (MORL). Цель этого репозитория — содержать надежные реализации алгоритмов MORL в PyTorch. 🖥Code: https://github.com/lucasalegre/morl-baselines 🦾 Project: lucasalegre.github.io/morl-baselines 🖥Colab: https://colab.research.google.com/drive/1ByjuUp8-CJeh1giPOACqPGiglPxDnlSq?usp=sharing 📚Paper: https://arxiv.org/abs/2311.12495v1 🔗Dataset: https://paperswithcode.com/dataset/mo-gymnasium @Devsp — Подписаться