Data Science | Machinelearning [ru]

Kanalga Telegram’da o‘tish

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Ko'proq ko'rsatish

Tarmoq:Frontender's notes [ru]Rossiya33 644 Texnologiyalar & Aralashmalar6 685...

📈 Telegram kanali Data Science | Machinelearning [ru] analitikasi

Data Science | Machinelearning [ru] (@devsp) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 19 949 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 6 685-o'rinni va Rossiya mintaqasida 33 644-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 19 949 obunachiga ega bo‘ldi.

01 Iyul, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -97 ga, so‘nggi 24 soatda esa -3 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 6.61% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 4.18% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 1 319 marta ko‘riladi; birinchi sutkada odatda 835 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 5 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, nvidia, контекст, openai, архитектура kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 02 Iyul, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

19 949

Obunachilar

-324 soatlar

-397 kunlar

-9730 kunlar

1 319

Post ko'rishlar

~ 83524 soatlar

~ 94448 soatlar

6.61%

Muloqot nisbati

~ 2

Kuniga postlar

Ads index

beta

Postlar arxiv

19 953

Когда стоит использовать глубокое обучение Глубокое обучение стоит использовать, когда: более простые модели (логистическая регрессия) не дают требуемой верности; требуется распознавать сложные паттерны в изображениях, NLP или звуковых данных; размерность данных велика; входные данные обладают временным измерением (последовательности).

19 953

Tick Tok стремительно завоёвывает мир. Согласно данным Sensor Tower, это приложение для коротких видео было загружено более 2 миллиардов раз с App Store и Google Play. Что же за магия стоит за этим сенсационным приложением, вызывающим такое пристрастие со стороны пользователей? Не удивительно, что ответ кроется в рекомендательном движке на основе ML.

19 953

Основным понятием в Spark является RDD (Resilient Distributed Dataset), который представляет собой Dataset, над которым можно делать преобразования двух типов (и, соответственно, вся работа с этими структурами заключается в последовательности этих двух действий).

19 953

Чек-лист для Data Science ➡️Наука о данных (Data Science) — не магия, а ваш бизнес никто не знает лучше вас. Помогайте специалисту инсайтами и информацией о бизнес-процессах, и результат не заставит себя ждать. Знание и понимание предметной области критически важно. ➡️Для анализа данных нужны данные. Лучше, если их много и они адекватные. Модель никогда не будет лучше данных, которые ей дадут. Не забывайте принцип «Мусор на входе — мусор на выходе». ➡️Исследователь данных не волшебник, способный спрогнозировать все изъяны нашего мира. Не рассчитывайте на это. ➡️Всегда перед постановкой ML-задачи (машинное обучение) спрашивайте себя: принесет ли решение значимую выгоду? Если нет, не беритесь за нее. ➡️Определите, к какому результату должна стремиться модель, какие ошибки критичны, а какими можно пренебречь. ➡️Если вы знаете конечную цель оптимизации (деньги, время), сосредоточьтесь сразу на ней. Так весь процесс будет проще и прозрачнее.

19 953

Что такое ETL? ETL (от англ. Extract, Transform, Load — дословно «извлечение, преобразование, загрузка») — один из основных процессов в управлении хранилищами данных, который включает в себя: извлечение данных из внешних источников; их трансформация и очистка, чтобы они соответствовали потребностям бизнес-модели; и загрузка их в хранилище данных. С точки зрения процесса ETL, архитектуру хранилища данных можно представить в виде трёх компонентов: источник данных: содержит структурированные данные в виде таблиц, совокупности таблиц или просто файла (данные в котором разделены символами-разделителями); промежуточная область: содержит вспомогательные таблицы, создаваемые временно, и, исключительно для организации процесса выгрузки; получатель данных: хранилище данных или база данных, в которую должны быть помещены извлечённые данные.

19 953

1. Не надо решать вопросы безопасности в последнюю очередь 2. Все приложения разные, у них разные нужды, поэтому выбирать технологии для разработки нужно, исходя из особенностей проектов. Не стоит ориентироваться на популярность технологий или поддаваться давлению руководства 3. Микросервисы нужны далеко не всем 4. Стандартизированное окружение разработки — это хорошо 5. Реализация подсистемы, отвечающей за настройки приложения, может оказаться более сложной, чем кажется на первый взгляд. Поэтому такие вещи нужно как следует планировать 6. Зависимости стоит использовать тогда, когда они нужны 7. Не нужно писать абстракции до тех пор, пока в этом не возникнет реальная необходимость 8. Иногда свой проект стоит «сжигать» и «возрождать из пепла» 9. Ваша компания — это не Google 10. Не стоит формировать свои взгляды на разработку ПО, полностью полагаясь на идеи случайных людей из интернета

19 953

Интересные концепции: утиная типизация Слышали фразу: "Если что-то выглядит как утка, плавает как утка и крякает как утка, то, вероятно, это утка"? Эта поговорка характеризует утиную типизацию == утипизацию

19 953

«Ростелеком» совместно с Devar запускает платформу для детей с использованием нейросетевых технологий, искусственного интеллекта (AI) и дополненной реальности (AR). С помощью мобильного приложения дети смогут выполнять обучающие задания, рассказали в пресс-службе «Ростелекома». Курсы разделены на три возрастные категории: для детей 3-5 лет; для детей 6-8 лет; для детей 9-14 лет. Учебные задания представлены в игровой форме. У ребёнка есть виртуальные помощники со своей историей и характером. Приложение помогает тренировать память, внимание, проводить опыты и эксперименты при помощи домашних предметов, снимать видео и фото для своих помощников в AR. Помимо учебных материалов на платформе представлен развлекательный контент — музыкальная библиотека, в июле к ней добавятся детские книги, аудиокниги и различные видео. Подборка курсов формируется по интересам ребёнка.

19 953

Применение искусственного интеллекта и 5G на заводе ABB в Финляндии Завод промышленных приводов ABB в Хельсинки является главным центром, где ведутся научно-исследовательские работы и опытно-конструкторские разработки приводов бизнес-направления «Электропривод». Пилотный проект ABB, Atostek и Telia создает основу для новых промышленных решений с использованием беспроводных технологий. Это первое промышленное применение искусственного интеллекта и 5G на производстве промышленных приводов на заводе ABB в Хельсинки. В рамках данного проекта создана автоматизированная система обеспечения качества производства в реальном времени с использованием 5G. Изображение с камер мгновенно передается в облако, где осуществляется анализ изображения и проверка состояния изделия. Такие технологии представляют собой бесценный ресурс для оценки качества и снижения брака в тех областях, где необходимо выполнять одинаковые операции сотни раз в день – как, например, при сборке конденсаторного блока промышленного привода.

19 953

HITACHI ПРИМЕНЯЕТ ИИ ДЛЯ УСКОРЕНИЯ СХД НА ФОНЕ СНИЖЕНИЯ СТОИМОСТИ ВЛАДЕНИЯ Анонсированные в апреле новейшие накопители Hitachi интересны как с технической стороны, так и с точки зрения экономики, а также рынка в целом. Hitachi представила Virtual Storage Platform E990 — all-flash-систему хранения данных, обладающую поддержкой NVMe, активно использующую AI и, что важно, позиционированную на наиболее массовый «средний класс» корпоративного рынка. На первый взгляд, новинка совершенно ординарная, но при ближайшем рассмотрении оказывается весьма интересной. Что любопытного в новом решении и почему оно интересно в контексте рынка?

19 953

Что такое тензор? Концепция тензора была создана в 1900 году двумя итальянскими математиками — Туллио Леви-Чивита и Грегорио Риччи-Курбастро, и, как это обычно бывает, основывалась на работе других математиков. Страница в Википедии о тензорах начинается так: Те́нзор (от лат. tensus, «напряжённый») — объект линейной алгебры, линейно преобразующий элементы одного линейного пространства в элементы другого. Частными случаями тензоров являются скаляры, векторы, билинейные формы и т. п. Звучит непросто для тех, кто не разбирается в математике! К счастью, на практике намного проще понять, что такое тензор и как он используется в науке о данных.

19 953

Российская команда сделала мощные беруши Veer с рекордным уровнем шумоизоляции и плавной регулировкой громкости. Беруши подойдут тем, кто устал от шума в офисе и дома и хочет работать в тишине, а не под музыку. Чтобы снизить уровень шума, просто покрутите кольцо на корпусе. Беруши не нужно вынимать каждый раз, когда вы собираетесь поговорить. В мае стартовали предзаказы долгожданных беруш Veer на официальном сайте https://clck.ru/P3cbL Первая эксклюзивная партия будет изготовлена из прочного и лёгкого авиационного алюминия в июле 2020 года. Оплатите сейчас и получите свои беруши со скидкой🤘🏻

19 953

Как Голливуд использует машинное обучение и другие современные технологии В декабре прошлого года трейлер фильма «Мстители: Финал» установил мировой рекорд популярности, набрав за первые 24 часа 289 млн просмотров в интернете. При создании фильма Marvel Studios активно использовала искусственный интеллект, чтобы скопировать лица людей и воспроизвести их в цифровых персонажах. Искусственный интеллект в Голливуде применяется прежде всего для создания визуальных эффектов. Но это далеко не единственная сфера его использования в современной киноиндустрии. Вот четыре компании, использующие ИИ, чтобы ее изменить.

19 953

Распространенные задачи, которые решают алгоритмы машинного обучения Распределение клиентских заявок по рейтингу Оценка входящих запросов на e-commerce площадках для их распределения по степени маржинальности и вероятности сделки. Качественные запросы (“горячие лиды”) направляются отделу продаж для обработки в первую очередь. На них можно назначить самых опытных менеджеров, чтобы повысить вероятность заключения сделки. Для некоторых ритейл-проектов конверсия повышается в 2 раза, если связаться с автором качественной заявки в течение первых 15 минут после заполнения.

19 953

Мишустин предложил снизить страховые взносы и налог на прибыль IT-компаниям Премьер-министр России Михаил Мишустин предложил снизить страховые взносы для IT-компаний с 14% до 7,6%, а также уменьшить налог на прибыль с 20% до 3%. Об этом сообщают «Ведомости» со ссылкой на двух федеральных чиновников. Помимо этого, предлагается отменить НДС с рекламы разработок и софта на зарубежных цифровых площадках. Также разработчики софта могут получить возможность на получение специальных субсидий. Все изменения будут бессрочными.

19 953

Российские программисты воплотили метафору в реальность. Выражение «говорящая голова» встречалось почти каждому. В различных контекстах оно может обозначать разные понятия: от телевизионного ведущего-новостника, диктора за столом в студии, до человека, который особо не раздумывает над смыслом произносимых тезисов. Российские программисты решили, что этому выражению пора обрести реальное воплощение.

19 953

Всем привет! В четверг 25 июня мы зовем всех, кого интересуют вопросы современных производительных баз данных, присоединиться к нашему Online Databases Meetup #2. В программе: 📌 Как собрать гибридное облако на Kubernetes, которое может заменить DBaaS, покажет Пётр Зайцев, CEO Percona. 📌 Как Mail.ru Cloud Storage эволюционировало за свои три года в проде и вместе с ним менялся подход к Tarantool в его архитектуре, поделится Владимир Перепелица, архитектор Mail.ru Cloud Solutions 📌 Всё о JSON в Postgres расскажет Олег Бартунов, сооснователь, CEO Postgres Professional. 📌 А стратегическими планами по развитию Postgres Pro поделится Иван Панченко, сооснователь, заместитель генерального директора Postgres Professional. Приходите, будет интересно! ✅Для участия необходимо зарегистрироваться: https://corp.mail.ru/ru/press/events/databases-2/

19 953

Пакеты Julia для машинного обучения Несмотря на то, что Julia все еще относительно молодой и перспективный язык, иногда он просто поражает своей не по годам зрелой экосистемой. Особенно это проявляется в области машинного обучения. И, хотя другие языки, например Python, могут похвастаться большим количеством проработанных пакетов для этой области, соответствующие им аналоги в Julia определенно заслуживают нашего внимания. Во-первых, эти пакеты написаны на быстром высокоуровневом языке, а во-вторых, они представляют собой великолепные компоненты ПО, простые в применении, независимо от того, из какого языка они используются.

19 953

В Москве внедрили проект по голосовому заполнению медицинских карт Группа компаний ЦРТ оптимизировала работу врачей лучевой диагностики с помощью интеллектуальных речевых технологий. В основе решения — Voice2med, продукт на основе искусственного интеллекта, созданный группой ЦРТ с нуля, который позволяет надиктовывать информацию для карт, протоколов и других документов через гарнитуру. Система распознает все медицинские термины и выражения. Как утверждают в компании, качество распознавания речи составляет 97–98%. Во время проведения исследования врач надиктовывает текст, который в режиме реального времени распознается и автоматически переносится в состав заполняемого протокола в медицинскую информационную систему. Решение позволяет избавить медицинских работников от рутинных записей и сфокусироваться на исследовании.