uz
Feedback
Data Science | Machinelearning [ru]

Data Science | Machinelearning [ru]

Kanalga Telegram’da o‘tish

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Ko'proq ko'rsatish

📈 Telegram kanali Data Science | Machinelearning [ru] analitikasi

Data Science | Machinelearning [ru] (@devsp) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 20 010 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 6 722-o'rinni va Rossiya mintaqasida 33 728-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 20 010 obunachiga ega bo‘ldi.

19 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -73 ga, so‘nggi 24 soatda esa -9 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

  • Tasdiqlash holati: Tasdiqlanmagan
  • Jalb etish (ER): Auditoriya o‘rtacha 8.09% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 3.89% ini tashkil etuvchi reaksiyalarni to‘playdi.
  • Post qamrovi: Har bir post o‘rtacha 1 619 marta ko‘riladi; birinchi sutkada odatda 779 ta ko‘rish yig‘iladi.
  • Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 8 ta reaksiya keladi.
  • Tematik yo‘nalishlar: Kontent llm, nvidia, контекст, openai, архитектура kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Yuqori yangilanish chastotasi (oxirgi ma’lumot 20 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

20 010
Obunachilar
-924 soatlar
-557 kunlar
-7330 kunlar
Postlar arxiv
​​🌟ExVideo — техника тюнинга, позволяющая улучшить возможности моделей генерации видео ExVideo позволяет модели генерировать в 5 раз больше кадров, при этом требуется всего 1.5 тыс. часов обучения на GPU на датасете из 40 тыс. видео. 🟡Страничка ExVideo 🖥GitHub 🟡Hugging Face 🟡Arxiv @DevspПодписаться

​​😎 Hermes-2-Theta-Llama-3-70B — комбо на основе Hermes 2 Pro и Llama-3 Instruct Hermes-2 Θ (Theta) 70B — это экспериментальная модель, созданная компанией Nous Research в сотрудничестве с Arcee AI (командой, создавшей MergeKit) на основе Hermes 2 Pro и Llama-3 Instruct. 🤗 Hugging Face @DevspПодписаться

​​🌟Modded-NanoGPT — позволяет добиться качества GPT-2 (124M) при обучении всего на 5B лексем Modded-NanoGPT позволяет: — обучать в 2 раза эффективнее (требуется всего 5B лексем вместо 10B для достижения той же точности) — имеет более простой код (446 строк вместо 858) 🖥GitHub @DevspПодписаться

Хотите научиться создавать эксклюзивные изделия от скульптур до ювелирных украшений из различных металлов и камней?💎 Это воз
Хотите научиться создавать эксклюзивные изделия от скульптур до ювелирных украшений из различных металлов и камней?💎 Это возможно на программе «Цифровое производство и дизайн художественных изделий и новых материалов», реализуемой Университетом науки и технологий МИСИС – вузом №1 в России в сфере металлургии и материаловедения🥇 🎓 Вы научитесь организовывать производственный цикл изготовления эксклюзивных изделий в выбранном материале от создания цифровой 3D-модели до запуска их в мелкое и серийное производство. Наши выпускники работают инженерами и дизайнерами эксклюзивных изделий, научными сотрудниками в области технической эстетики и дизайна, материаловедения и конструирования оборудования.  💎Вы будете востребованы на производстве или сможете открыть собственное предприятие по изготовлению эксклюзивных изделий. 📌Подробнее о программе Открытия начинаются с тебя!

​​😵Он победил LLM RAG: реализуем BM25+ с самых азов В этой статье мы начнем с самого простого поиска, перейдем к TF-IDF, а затем выведем из него BM25+. Читать...

🌟Open Interpreter — полное управление компьютером при помощи запросов на естественном языке Open Interpreter предоставляет интерфейс естественного языка для управления компьютером. Можно общаться с Open Interpreter через ChatGPT-подобный интерфейс прямо в терминале. 🖥GitHub 🟡Доки @DevspПодписаться

6–9 июля проводим Weekend Offer Analytics Устроиться в Яндекс за выходные — реально. Ищем крутых аналитиков с опытом работы от 2 лет на Python или C++, готовых работать в офисном или гибридном режиме на территории России или Республики Беларусь. Подавайте заявку до 3 июля — и всего за 3 дня пройдите все технические собеседования. После сможете пообщаться с девятью нанимающими командами и выбрать ту, которая покажется самой интересной. Если всё сложится хорошо, сразу же пришлём вам офер. Узнать подробности и зарегистрироваться. Реклама. ООО "Яндекс". ИНН 7736207543

​​🎙️StreamSpeech: Мощная модель синхронного перевода речи. StreamSpeech - это бесшовная модель “Все в одном” для автономного и синхронного распознавания речи, перевода речи и синтеза речи. ▪page: https://ictnlp.github.io/StreamSpeech-site/paper: https://arxiv.org/abs/2406.03049code: https://github.com/ictnlp/streamspeech @DevspПодписаться

​​⚡️ DeepSeek-Coder-V2: Первая модель с открытым исходным кодом, превосходящая GPT4-Turbo в кодинге и математике DeepSeek-Coder-V2, модель языка кода Mixture-of-Experts (MoE) с открытым исходным кодом, которая обеспечивает производительность, сравнимую с GPT4-Turbo, в задачах, специфичных для кода. В частности, DeepSeek-Coder-V2 дополнительно проходит предварительное обучение на промежуточной контрольной точке DeepSeek-V2 с дополнительными 6 триллионами токенов. ▪HF: https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-InstructGithub: https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdfПопробовать: https://chat.deepseek.com/sign_in?from=coder @DevspПодписаться

​​🖥 Самые интересные публикации за последние дни:NLP, Catboost и тематическое моделирование: создаем модель для прогнозирования цен с использованием новостей • Погружение в xLSTM – обновленную LSTM, которая может оказаться заменой трансформера • MusicGPT — приложение для локального запуска моделей, генерирующих музыку

​​RecTools – OpenSource библиотека для рекомендательных систем Сегодня мы решили разобраться, что RecTools умеет, и как с этим работать. Читать...

Как устроены ChatGPT, Siri, Алиса и Маруся — и какие навыки нужны, чтобы запускать такие продукты? Узнайте у Владимира Василь
Как устроены ChatGPT, Siri, Алиса и Маруся — и какие навыки нужны, чтобы запускать такие продукты? Узнайте у Владимира Васильева, руководителя направления из Сбера, разрабатывающего русскую версию ChatGPT. Приходите на бесплатный онлайн-практикум от ТГУ и Skillfactory 27 июня в 19:00 мск. За 1,5 часа эксперт расскажет: — что такое обработка естественного языка; — как использовать ее для анализа текстов, проверки бизнес-идей и научных гипотез; — какие технологии сейчас востребованы на рынке. Регистрируйтесь бесплатно по ссылке: https://go.skillfactory.ru/&erid=2VtzqxGqxvb Получите в подарок курс по математике. Реклама ООО "Скилфэктори", ИНН 9702009530

​​Разбор статьи про KAN – принципиально новую архитектуру нейросетей В основе всех архитектур глубокого обучения лежит многослойный перцептрон (MLP). У него есть веса и нейроны, в которых расположены функции активации. Этой парадигмой ученые пользуются с 1957 года, когда ее предложил Фрэнк Розенблатт.  Сейчас, спустя 67 лет, исследователи из MIT представили альтернативу MLP – новую архитектуру нейронной сети, получившую название Kolmogorov-Arnold Networks (KAN), в которой реализовано перемещение активаций на «ребра» сети.  Читать...

​​📊 NLP, Catboost и тематическое моделирование: создаем модель для прогнозирования цен с использованием новостей В этой статье я расскажу, как на одном из проектов мы занимались прогнозированием на месяц вперед с помощью методов NLP, Catboost и тематического моделирования на новостном потоке. Читать...

​​Погружение в xLSTM – обновленную LSTM, которая может оказаться заменой трансформера Архитектура LSTM была предложена в 1997 году немецкими исследователями Зеппом Хохрайтером и Юргеном Шмидхубером. С тех пор она выдержала испытание временем: с ней связано много прорывов в глубоком обучении, в частности именно LSTM стали первыми большими языковыми моделями. Читать далее

​​⚡️VideoLLaMA 2 — набор open-source Video-LLM, предназначенных для генерации видео VideoLLaMA 2 — логическое развитие прошлых моделей, включает в себя специализированный компонент пространственно-временной свертки (STC), который эффективно улавливает сложную динамику на видео. 🖥GitHub 🤗 Демо на HF 🤗 Модель VideoLLaMA 2 на HF @DevspПодписаться

​​⚡️Semantic Kernel — open-source SDK, который позволяет интегрировать LLM от OpenAI, с Hugging Face и другие, с обычными языками программирования типо C#, Python и Java Семантическое ядро ​​достигает этого, позволяя вам определять плагины , которые можно объединить в цепочку всего за несколько строк кода. Однако что делает Semantic Kernel особенным , так это его способность автоматически управлять плагинами с помощью ИИ. 🖥GitHub 🟡Доки @DevspПодписаться

​​🌟MusicGPT — приложение для локального запуска моделей, генерирующих музыку MusicGPT — это приложение, которое позволяет эффективно запускать новейшие модели искусственного интеллекта музыкального поколения локально, на любой платформе и без установки тяжелых зависимостей, таких как Python или фреймворки машинного обучения. На данный момент он поддерживает только MusicGen от Meta, но планируется обеспечить прозрачную для пользователя поддержку различных моделей генерации музыки. 🖥GitHub @DevspПодписаться

​​🌟dstack — open-source cистема оркестрации контейнеров для запуска AI-систем в любом облаке или ЦОДе dstack— это механизм оркестрации контейнеров с открытым исходным кодом, предназначенный для рабочих нагрузок ИИ в любом облаке или центре обработки данных. Поддерживаемые поставщики облачных услуг включают AWS, GCP, Azure, OCI, Lambda, TensorDock, Vast.ai, RunPod и CUDO. 🖥GitHub 🟡Доки @DevspПодписаться

​​⚡️WebLLM — высокопроизводительный браузерный движок для инференса LLM WebLLM — это высокопроизводительный механизм вывода LLM в браузере, который переносит вывод языковой модели непосредственно в веб-браузеры с аппаратным ускорением. Все работает внутри браузера без поддержки сервера и ускоряется с помощью WebGPU. Также WebLLM поддерживает целый ряд моделей, включая Llama 3, Phi 3, Gemma, Mistral, Qwen и многие другие. 🖥GitHub 🟡Доки 🟡Чат с WebLLM @DevspПодписаться