Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

网络:Frontender's notes [ru]俄罗斯33 686 技术与应用6 689...

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语语言赛道中的是活跃参与者。目前社区聚集了 19 953 名订阅者，在 技术与应用 类别中位列第 6 689，并在 俄罗斯 地区排名第 33 686 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 19 953 名订阅者。

根据 30 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -100，过去 24 小时变化为 -4，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 6.71%。内容发布后 24 小时内通常能获得 4.02% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 1 340 次浏览，首日通常累积 803 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 4。
主题关注点： 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD”

凭借高频更新（最新数据采集于 01 七月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

19 953

订阅者

-424 小时

-387 天

-10030 天

1 340

帖子浏览量

~ 80324 小时

~ 92848 小时

6.71%

参与率

~ 1

每日帖子数

Ads index

beta

帖子存档

19 953

IT-журнал «Завтра облачно» → @zavtra_oblachno Доступно рассказываем о технологиях и разработке, делимся свежими IT-новостями и тонкостями работы с облаками и не только. А ещё вас ждут ответы на любые вопросы об IT, анонсы интересных мероприятий и многое другое. Подписаться → https://t.me/zavtra_oblachno

19 953

Интересные концепции: REPL (Read-eval-print loop) REPL (Read-eval-print loop) — среда для интерактивного программирования. В такой среде пользователь может вводить выражения, которые среда тут же будет вычислять, а результат вычисления отображать пользователю.

19 953

В Тюменском университете ученые показали всему миру свое изобретение – биоморфный нейропроцессор. Чем же он отличается от уже существующих? А тем, что существующие нейропроцессоры ускоряют расчеты в искусственных нейросетях на простейших нейронах, обеспечивают работу компьютерного зрения, машинного обучения и других систем со слабым искусственным интеллектом (ИИ). Новый нейропроцессор способен генерировать новые ассоциации (новое знание), не заложенное в нем ранее. То есть искусственный интеллект получил возможность осмысливать новое знание. А это означает, что мы находимся на грани перехода от слабого ИИ к сильному ИИ. Ученые уже показали самообучение по ассоциациям и генерацию новых ассоциаций. Сейчас аппаратное тестирование новой системы продолжается.

19 953

В основе современных цифровых продуктов лежат технологии искусственного интеллекта, глубокого и машинного обучения. Индустрия востребована, но квалифицированных специалистов мало — самое время прокачаться в Data Science. На бесплатном занятии в Нетологии узнаете о возможностях обучения нейросетей, машинного и глубокого обучения, необходимом скилсете и путях входа в профессиональную область. Регистрируйтесь, это бесплатно → http://netolo.gy/fFb

19 953

Синтаксис Python: переменная __all__ Вы наверное слышали фразу "wild import - зло". В коде это выглядит так

19 953

Sequencer: алгоритм ищет зависимости в данных Sequencer — это алгоритм, который автоматически извлекает основные закономерности в данных. Для этого Sequencer переупорядочивает набор объектов, чтобы получить наиболее длинное многообразие, описывающее сходства объектов. Алгоритм использует четыре разные метрики. Метрики включают в себя евклидово расстояние, KL-дивергенцию, метрику Васерштейна и энергетическое расстояние. Sequencer масштабируется на любой датасет. Алгоритм принимает во внимание разные уровни в данных. Каждый объект во входном датасете делится на отдельные части (чанки). Между чанки измеряется схожесть. Затем информация о каждом чанке агрегируется отдельно для каждой метрики и уровня.

19 953

Генераторы списков Если вы использовали Python достаточно долго, вы должны были хотя бы слышать о понятии «list comprehensions». Это способ уместить цикл for, блок if и присваивание в одну строку. Генератор списков - яркий пример «синтаксического сахара». То есть конструкции, без которой легко можно обойтись, но с ней намного лучше :) Генераторы списков, как это не странно, предназначены для удобной обработки списков, к которой можно отнести и создание новых списков, и модификацию существующих. Допустим, нам необходимо получить список нечетных чисел, не превышающих 25. В принципе, только познакомившись с работой команды xrange решить эту проблему несложно.

19 953

Будущее рядом — освой профессию Data Scientist Раньше мы с огромным интересом смотрели фильмы про искусственный интеллект и гадали, как же это пришло в голову сценаристам и режиссёрам, ведь так не бывает. Но в реалиях настоящей жизни искусственный интеллект — это не фантазии американских сценаристов-выдумщиков. Это реальность, которая стремительно врывается в нашу жизнь. Но с одной поправкой. Незаменимый помощник Data Scientist — специалист по машинному обучению, который выбирает архитектуру и обучающие алгоритмы, для работы с этими данными. И у тебя как раз есть шанс стать тем самым незаменимым специалистом благодаря курсу от Skillbox «Профессия Data Scientist». На курсе тебе предстоит научиться очень многим интересным вещам: от программирования на Python и визуализации данных до программирования на R и применения нейронных сетей для решения реальных задач. Skillbox даёт возможность сначала уделить время обучению, а заботы с оплатой можно отложить на полгода. После прохождения курса не стоит переживать о том, где найти работу. Эти заботы берут на себя опытные HR-специалисты. Открой мир будущего — переходи по ссылке ▶ https://clc.to/yMN_xg и бронируй место на курсе со скидкой 40%.

19 953

Искусственный интеллект в международных отношениях: эпоха «цифровой дипломатии» Международные отношения на современном этапе находятся в плачевном состоянии, в связи с чем слышатся призывы усовершенствовать функционирование международной дипломатии. Один из способов сделать это мог бы заключаться в использовании некоторых достижений научно-технического прогресса для налаживания межгосударственного взаимодействия. В число областей, где такой подход уже применяется, вошла международная дипломатия, для развития которой применяется искусственный интеллект (ИИ). В частности, решения в области ИИ уже активно используются в Китае для проработки дипломатами сценариев развития событий на международной арене. ИИ также всё больше используется в рамках экономической дипломатии применительно к торговым переговорам. В будущем важно сделать так, чтобы развивающиеся страны имели возможность пользоваться ИИ при заключении международных договоров и развитии международного сотрудничества.

19 953

*args, **kwargs При написании кода не всегда хочется явно прописывать все аргументы. Например - на вход программы подается набор аргументов:

19 953

Для всех, кто интересуется Data Science и ищет работу в этом направлении — рекомендуем вам канал с предложениями по работе в этой области. @datasciencejobs специализируется только на узкоспециализированных релевантных вакансиях: ничего лишнего, только лучшие вакансии по теме с обязательным указанием предлагаемой зарплаты. Сбор, обработка и анализ данных; искуственный интеллект; нейросети; машинное и глубокое обучение; обработка натурального языка; рекомендательные системы; системы компьютерного зрения; распознавание образов и текстов; свёрточные сети и многое многое другое. Приходите в мир науки и искусственного интеллекта 👉 https://t.me/datasciencejobs

19 953

langid.py Представим ситуацию: есть блог, в котором публикуются посты на двух языках (а может и на 10). Необходимо рассортировать посты по языкам в разные RSS. (постов очень много, пускай 1000) Вопрос - как вы решили бы такую задачу? Чтобы решить подобную задачу можно воспользоваться библиотекой langid.py. Это небольшой инструмент, который без доступа в Интернет(!!!) может определить язык текста (и слова). Инструмент работает и из консоли, и как web сервис, а также как обычный Python-модуль: >>> import langid >>> langid.classify("This is a test") ('en', 0.99999999099035441) Ссылка на инструмент: https://github.com/saffsd/langid.py

19 953

Google представил пользователям YouTube функцию с искусcтвенным интеллектом Google SmartReply — это технология на основе искусственного интеллекта, которая помогает предлагать ответы на сообщения в Gmail, Android-сообщениях, Play Developer Console и других местах. В Google объявили о выпуске обновленной версии SmartReply, созданной для YouTube. Она позволит авторам легче и быстрее взаимодействовать со своими подписчиками в комментариях, сообщает Tech Crunch.

19 953

lambda-функции Python поддерживает интересный синтаксис, позволяющий определять небольшие однострочные функции на лету. Позаимствованные из Lisp, так называемые lambda-функции могут быть использованы везде, где требуется функция. Небольшой пример...

19 953

Vaex против Dask Vaex не похож на сам Dask, но имеет сходства с его DataFrame’ами, которые создаются на основе DataFrame’ов Pandas. Это означает, что Dask наследует проблемы Pandas, например необходимость полной загрузки данных в RAM для их обработки. В Vaex же этой проблемы нет. Vaex не создаёт копий DataFrame’ов, а значит может обрабатывать более крупные DataFrame’ы на машинах с меньшим количеством основной памяти. И Vaex, и Dask используют ленивую обработку. Единственное отличие в том, что первый вычисляет поле при необходимости, а для второго нам нужно явно использовать функцию вычисления. Для того, чтобы полноценно воспользоваться преимуществами Vaex, данные должны быть в формате HDF5 или Apache Arrow.

19 953

Vaex (eng) Vaex — это высокопроизводительная библиотека Python для ленивых DataFrame’ов, работающих по алгоритму out-of-core (обработка данных во внешней памяти). Предназначена она для визуализации и изучения больших наборов данных. Vaex может вычислять базовую статистику для более чем миллиарда строк за одну секунду. Она поддерживает несколько визуализаций, тем самым позволяя интерактивное изучение больших данных.

19 953

Компьютерное зрение против нежелательного видеоконтента Хотите узнать о практических кейсах применения computer vision и machine learning? Тогда подключайтесь к нашему онлайн-митапу МТС и КРОК 8 июля в 19:00. Участие бесплатно, регистрация по ссылке https://bit.ly/2NMBd1R Мы расскажем про: - анализ выкладки товаров на витринах в салонах МТС; - классификацию текстов узконаправленной тематики в условиях малого - количества данных; - детектирование нежелательного контента в видеопотоке; - калибровку камеры для адаптации существующих детекторов к различным условиям.

19 953

Почему ошибаются алгоритмы машинного обучения Мы часто слышим о том, как очередной сложный алгоритм искусственного интеллекта начал ошибаться или стал следовать предрассудкам, которым машины не должны быть подвержены. Почему так происходит? Из-за чего появляются эти ложные положительные и отрицательные ответы и так ли это важно? Для начала давайте определим три термина из Матрицы смешения: точность, возврат и правильность.

19 953

Наконец-то мы нашли этот канал! Друзья, кто работает, учится или планирует начать заниматься программированием – welcome в Твой Программист. 🔥 Здесь есть всё, что нужно IT-специалисту: от статей до новостей, от обучения до юмора, от интерактива до просто полезных советов. Автор собирает вокруг канала крутое коммьюнити, с которым познавать сферу будет ещё легче и интересней. Советуем подписаться 😌

19 953

Полезные инструменты: virtualenv + pip Опыт показывает, что каждый проект обладает своими зависимостями (библиотеками), а если и одинаковыми, то версии не совпадают. Чтобы упростить запуск и настройку проекта разработчики пишут INSTALL.md, README.md, make-файлы и что более важно - requirements.txt. Файл requirements.txt - это правило хорошего тона для Python проектов. Файл содержит список необходимых библиотек для запуска с указанием версий: