ru
Feedback
Data Science | Machinelearning [ru]

Data Science | Machinelearning [ru]

Открыть в Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Больше

📈 Аналитический обзор Telegram-канала Data Science | Machinelearning [ru]

Канал Data Science | Machinelearning [ru] (@devsp) языкового сегмента Русский является активным участником. Сейчас сообщество объединяет 19 980 подписчиков, занимая 6 706 место в категории Технологии и приложения и 33 686 место в регионе Россия.

📊 Показатели аудитории и динамика

С момента создания невідомо проект демонстрирует стремительный рост, собрав аудиторию из 19 980 подписчиков.

Согласно последним данным от 25 июня, 2026, канал показывает стабильную активность. За последние 30 дней изменение числа участников составило -75, а за последние 24 часа — -8, при этом общий охват остаётся высоким.

  • Статус верификации: Не верифицирован
  • Уровень вовлечённости (ER): Средний показатель вовлечённости аудитории составляет 7.47%. В первые 24 часа после публикации контент обычно набирает 3.67% реакций от общего числа подписчиков.
  • Охват публикаций: В среднем каждый пост получает 1 492 просмотров. В течение первых суток публикация набирает 733 просмотров.
  • Реакции и взаимодействия: Аудитория активно поддерживает контент: среднее количество реакций на один пост — 6.
  • Тематические интересы: Контент сосредоточен на ключевых темах, таких как llm, nvidia, контекст, openai, архитектура.

📝 Описание и контентная политика

Автор описывает ресурс как площадку для выражения субъективного мнения:
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

Благодаря высокой частоте обновлений (последние данные получены 26 июня, 2026) канал поддерживает актуальность и высокий уровень охвата публикаций. Аналитика показывает, что аудитория активно взаимодействует с контентом, что делает его важной точкой влияния в категории Технологии и приложения.

19 980
Подписчики
-824 часа
-457 дней
-7530 день
Архив постов
​​Мечтаешь стать дата саентистом, но математика рушит все планы?  Именно для тебя мы делаем скидку на один из наших наиболее популярных онлайн-курсов, в котором есть вся необходимая база — Математика для Data Science. Скидка 50% действует до 31 сентября. 💥Что тебя ждёт на курсе?  -Программа разработанная преподавателями ВМК МГУ, одного из лучших математических факультетов страны -Поддержка от предподавателя 24/7 -Полный набор знаний математики для старта в Data Science -Интересные и полезные практические задания -Ты научишься понимать специальную терминологию и сможешь читать статьи по Data Science без «словаря» К концу обучения ты освоишь математический аппарат, который необходим, для того чтобы стать специалистом в Data Science 👉🏻 Подробнее о курсе: https://proglib.io/w/9c8895be

​​Разбираемся с платформами обработки данных на примере барбершопа «Бородатый сисадмин». Какие бывают и всем ли они нужны Обычно тексты про работу с данными начинаются с числа, демонстрирующего объем производимых в мире данных. Или пассажа про то, что данные — новые золотые прииски («data is the new oil»). Это недалеко от правды: если раньше для понимания своих пользователей компаниям нужно было заказывать крупные социологические исследования, то сейчас, с глобальной цифровизацией, пользователи сами — осознанно или нет — предоставляет данные о себе. Читать...

​​Эволюция архитектуры данных: как потребности бизнеса изменили инструменты для хранения данных Команда VK Cloud перевела статью о том, как с течением времени менялась и развивалась архитектура данных и какие инструменты появлялись в ответ на потребности бизнеса. Читать...

​​Сколько нужно ждать, чтобы получить действительно стоящий оффер? Ждать не придётся — всё происходит за один день: интервью, этап отбора, предложение о работе. Если это One Day Offer от Сбера🏃 Команда по работе с данными Сбера в поиске Data Scientists. Заявите о себе на фаст-интервью и получите работу в крупнейшем банке страны, если вы: • Data Scientist, Data Analyst или Data Engineer c опытом работы от 1 года (рассмотрят все кандидатуры — от уровня Junior до руководителей подразделений); • готовы к решению масштабных задач на основе данных, аналитики, машинного обучения и искусственного интеллекта. Чем предстоит заниматься? Создавать информационные продукты для принятия решений во всех подразделениях Сбера. Когда: 22 октября. Где: онлайн. Узнайте больше и заполните заявку

​​Непрерывное обучение для продакшен-систем Методология agile-разработки ПО, популяризированная примерно в 2010 году манифестом Agile Software Development, продвигает идею адаптивного планирования, эволюционного развития, быстрой доставки и непрерывного совершенствования как ключевых свойств, обеспечивающих быстрый и гибкий отклик на постоянно ускоряющиеся изменения рынка и его требований. Поскольку линейные каскадные модели, позаимствованные из отраслей производства и строительства, оказались неспособны обеспечить конкурентное преимущество в постоянно усложняющемся и быстро меняющемся мире ПО, модели Agile и Scrum стали де-факто стандартом для современной разработки ПО. Но что произойдёт, когда мы осуществим переход к Software 2.0? Читать...

​​Кто такой T-shaped специалист по Data Science и зачем им становиться? T-shaped специалист — это сотрудник cо скиллами в виде буквы Т»: ◾️ c глубокими знаниями в экспертном направлении (|); ◾️ c базовыми знаниями в нескольких смежных областях (—). Универсальному специалисту проще работать. Он разбирается в процессах разных департаментов, говорит с коллегами на одном языке и может перейти на смежную должность. Таких экспертов хантят с большим рвением: они глубже погружены в работу и могут подхватить задачи другого сотрудника.  Первый шаг, чтобы стать T-shaped в DS — научиться работать с данными на ранних этапах.  На практике это означает:  — собирать сырые данные,  — проектировать архитектуру баз данных,  — строить пайплайны для перемещения, — очищать данные для анализа и так далее. Всё это — харды инженера данных, которые можно освоить на курсе Яндекс Практикума. Начините растить поперечную перекладину: попробуйте спроектировать первую витрину данных бесплатно.

​​Первый нейросетевой переводчик для эрзянского языка Эрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей. Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и целые предложения. Пока её качество оставляет желать лучшего, но пробовать пользоваться уже можно. Как я собирал для этого тексты и обучал модели – под катом. Читать...

​​Стартует одно из самых крупных в стране соревнований по решению задач в области машинного обучения и AI — AI Journey Contest 2022. Призовой фонд составляет 5.500.000 рублей 💰Победители получат крупные денежные призы. В этом году соревнование проходит при поддержке Института искусственного интеллекта AIRI. Познакомиться с DS Works, соревновательной платформой Cloud (самый быстрорастущий провайдер России и владелец двух суперкомпьютеров), можно будет на вебинаре 18 октября. Вы узнаете: ✅ Как получить доступ к ресурсам суперкомпьютера для обучения модели (46 место в топе самых мощных суперкомпьютеров мира); ✅ Как зарегистрироваться в DS Works и что обязательно стоит указать в своем профиле; ✅ Как принять участие в соревновании и загрузить свое решение; ✅ По каким критериям оцениваются решения (опыт предыдущих соревнований); ✅ Как выглядят публичная и приватная турнирные таблицы. Бесплатный вебинар будет полезен всем, кто знаком с AI/ML и хочет попробовать свои силы в борьбе за призы. Регистрируйтесь тут

​​Стартует одно из самых крупных в стране соревнований по решению задач в области машинного обучения и AI — AI Journey Contest 2022. Призовой фонд составляет 5.500.000 рублей 💰Победители получат крупные денежные призы. В этом году соревнование проходит при поддержке Института искусственного интеллекта AIRI. Познакомиться с DS Works, соревновательной платформой Cloud (самый быстрорастущий провайдер России и владелец двух суперкомпьютеров), можно будет на вебинаре 18 октября. Вы узнаете: ✅ Как получить доступ к ресурсам суперкомпьютера для обучения модели (46 место в топе самых мощных суперкомпьютеров мира); ✅ Как зарегистрироваться в DS Works и что обязательно стоит указать в своем профиле; ✅ Как принять участие в соревновании и загрузить свое решение; ✅ По каким критериям оцениваются решения (опыт предыдущих соревнований); ✅ Как выглядят публичная и приватная турнирные таблицы. Бесплатный вебинар будет полезен всем, кто знаком с AI/ML и хочет попробовать свои силы в борьбе за призы. Регистрируйтесь тут

​​Распознавание речи, генерация субтитров и изучение языков при помощи Whisper Есть ряд платных решений по переводу речи в текст (Automatic Speech Recognition). Сравнительно малыми усилиями можно сделать бесплатное решение, — дообучить на своих данных end2end модель (например, взять фреймворк NeMo от NVIDIA) или гибридную модель типа kaldi. Читать...

Repost from Сколково
🤖 Сможет ли робот написать симфонию проверить паспорт? Продолжаем рассказывать, как ИИ помогает компаниям с документами Нейросети хорошо справляются с типовыми задачами. Так почему бы не использовать это в бизнес-процессах? Так же подумал наш резидент «Биорг» — ИИ компании за считанные секунды может распознать и занести в базу данных информацию из документов. «Наше решение ценно для крупного бизнеса и ведомств, так как позволяет полностью отдать на откуп технологиям процедуры, связанные с очень большими объемами документов. Это и архивные фонды, где количество бумаги можно измерить десятками тонн, и потоки входящих документов — массовые обращения граждан, в том числе в МФЦ, заявки на ипотеку и кредиты», — говорит Георгий Зуев, основатель компании «Биорг». Как это работает? Посмотрим на примерах. 🤝 ИИ-страховщик Раньше сотрудники компании «Уралсиб Страхование» тратили 20 минут на то, чтобы перенести информацию о клиентах в корпоративную базу данных. ИИ от «Биорг» взял на себя эту монотонную задачу и сократил время выполнения до 7 минут. За это время нейросеть сортирует документы, извлекает данные, сопоставляет информацию, проверяет корректность заявки и наличие подписей. 💼 ИИ-кадровик В компании «Лотос» нейросети поручили оформлять сотрудников на работу — программа справляется с этим всего за 10 минут. Процесс устроен так: документы фотографируют через мобильное приложение, AI находит и распределяет нужные данные в информационной системе головного офиса, готовые бумаги и заявления отдают на подпись кандидату. Раньше этим занималось несколько человек! 🏠 ИИ-ипотечный брокер Благодаря технологиям «Биорг» уральский банк УБРиР сократил время обработки комплекта документов на кредит с 45 до 20 минут. Теперь клиенты банка могут в два раза быстрее выйти на сделку по ипотеке. ✍️ ИИ-регистратор Архангельская область сделала проект с «Биорг» для проверки конкурсных документов для госзакупок. Искусственный интеллект сократил срок проверки заявки с двух недель до трех дней. Аналогичный проект при регистрации сделок запустили и для Росреестра.

​​Как я пошла на хакатон Data Science с нулевым опытом в Data Science Всем, кто боится ходить на хакатоны, посвящается. Мой первый хакатон: опыт, впечатления и выводы, к которым я пришла. Читать...

​​Как дорасти до CDO, запустить стартап на основе ML и не свихнуться? Директор центра Big Data МТС Виктор Кантор обсудит с гостями подкаста «Техток».  Среди участников — успешные ИТ-специалисты из разных сфер: сооснователь data-стартапа Rubbles Александр Фонарев, CTO Ozon Антон Степаненко, R&D Project Manager в Skyeng Владислав Корнышев и многие другие. Честно поговорили о поиске себя, факапах, успехах и перспективах отрасли.  Ищите «Техток» на всех подкаст-площадках.

​​Big Data + Machine Learning = Love Ожидается, что в 2025 году ежегодный объем генерируемых данных превысит 160 зеттабайт. Однако почти все генерируемые сегодня данные (98%) затем удаляются или перезаписываются. Подобное отношение к генерируемым данным объясняется просто: у компаний пока еще не хватает инструментов для работы с такими колоссальными объемами. Но ведь эти данные — буквально золотая жила для бизнеса, поскольку оттуда можно выуживать ценнейшую информацию. И терять их для крупных компаний, значит, недополучать значительную долю прибыли.  Читать...

​​SkyNet придет не скоро: 10 вещей в Data Science, о которых вам никто не расскажет Специалисты обработки данных часто бывают удивлены, когда попадают в рабочую среду Data Science: существует большой разрыв между ожиданиями и реальностью. В этой статье мы поделимся 10 фактами о науке о данных, которые не подвергаются широкой огласке. Читать...

​​English for Developers - канал для тех, кто хочет учить технический английский. От создатателей популярного ит-канала Data analysis. 1. техническая лексика 2. опросы на английском 3. шутки на английском  Подписывайтесь, проходите опросы, читайте полезные прогерские фразы на английском: english_forprogrammers. 1 канал вместо тысячи учебников и курсов

​​Как мы доработали чат-бота «Дану» и сделали её проницательнее и сообразительнее На конференции BeeTech Conf 2022 мы рассказывали про первую версию «ванильного» чат-бота, а в статье представляем описание его новой версии 2.0 с дополненными инсайтами и лайфхаками. Читать...

Как нейросеть видит Вселенную? https://m.youtube.com/watch?v=KtKIr1bCt3g&feature=youtu.be

Вакансии для джунов Как найти подходящую работу и получить витамину бодрости в виде советов и тренингов?)💊 Young&Junior канал где ты сможешь найти:  🔹 вакансии с работой странах СНГ, на удаленке или с дальнейшей релокацией; 🔹 дайджесты с советами по трудоустройству. Актуальные вакансии для джунов и стажёров. Есть позиции для разработчиков, дизайнеров, тестировщиков, менеджеров и аналитиков. Мы делимся советами, участвуем в вашем развитии и при любой возможности протянем руку помощи)  Аудитория настоящая и живая. Собрана органически. Трудимся для вашего успеха и продвижения по карьерной лестнице 🔥 👉🏻Подписаться на канал🫰🏻

​​Ищем выбросы. Критерий Шовене Обнаружение выбросов и аномалий всегда актуально для исследователя. Если решаются задачи прогнозирования, то удаление нетипичных значений, как правило, повышает точность предсказаний, поскольку данные без аномалий представляют собой нормальный (типичный) объект. Кроме того, статистические характеристики чувствительны к наличию выбросов. Перед поиском выбросов следует помнить, что не существует формального определения выброса, и тот или иной алгоритм в силу своей жесткости или мягкости может удалять вместе с выбросами и часть нормальных данных или, наоборот, оставлять часть выбросов в данных. Существуют различные подходы к решению этой проблемы. Разберем один из них — критерий Шовене. Читать далее...