ch
Feedback
Data Science | Machinelearning [ru]

Data Science | Machinelearning [ru]

前往频道在 Telegram

Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

显示更多

📈 Telegram 频道 Data Science | Machinelearning [ru] 的分析概览

频道 Data Science | Machinelearning [ru] (@devsp) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 20 036 名订阅者,在 技术与应用 类别中位列第 6 734,并在 俄罗斯 地区排名第 33 730

📊 受众指标与增长动态

невідомо 创建以来,项目保持高速增长,吸引了 20 036 名订阅者。

根据 15 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -82,过去 24 小时变化为 -1,整体触达仍然可观。

  • 认证状态: 未认证
  • 互动率 (ER): 平均受众互动率为 7.88%。内容发布后 24 小时内通常能获得 4.47% 的反应,占订阅者总量。
  • 帖子覆盖: 每篇帖子平均可获得 1 580 次浏览,首日通常累积 896 次浏览。
  • 互动与反馈: 受众积极参与,单帖平均反应数为 7
  • 主题关注点: 内容集中在 llm, nvidia, контекст, openai, архитектура 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台:
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD

凭借高频更新(最新数据采集于 16 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。

20 036
订阅者
-124 小时
+307
-8230
帖子存档
📝 Подборка вакансий для лидов Team Lead Data Platform Python, SQL, Git, Apache Hadoop, Apache Spark, Apache Airflow, Apache Kafka, Управление людьми Уровень дохода не указан | Требуемый опыт не указан Team Lead Data Scientist (кредитный скоринг) Python, SQL, MatPlotLib, Pandas, NumPy, Машинное обучение, Математическое моделирование, XML, JSON Уровень дохода не указан | от 3 лет опыта Ведущий аналитик Microsoft Excel, Анализ данных, Pandas, Tableau, PowerBI, SQL, Python, NumPy, SQLAlchemy от 100 000 ₽ | Требуемый опыт не указан

⚙️ Что такое генераторы в Python и зачем они нужны? Генераторы — это функции в Python, которые возвращают значения по одному с помощью ключевого слова yield, вместо полного возврата всех значений сразу. Они полезны для работы с большими объемами данных, так как сохраняют память, генерируя значения на лету. ➡️ Пример:
# Генератор для получения первых N чисел Фибоначчи
def fibonacci(n):
    a, b = 0, 1
    for _ in range(n):
        yield a
        a, b = b, a + b

# Используем генератор
for num in fibonacci(5):
    print(num)

# Вывод: 0, 1, 1, 2, 3
🗣️ В этом примере генератор fibonacci вычисляет числа по запросу, вместо сохранения всех значений в памяти. Это делает генераторы особенно удобными для работы с потоками данных или бесконечными последовательностями.
🖥 Подробнее тут

🤖 Как развернуть LLM с помощью vLLM и TorchServe Хочешь запустить большую языковую модель в продакшене, но не знаешь, как совместить простоту развертывания с промышленной надежностью? Комбинация vLLM и TorchServe решает эту задачу. Она обеспечивает как простой запуск, так и продвинутые возможности для масштабирования. Читать...

📝 Подборка вакансий для сеньоров Prompt-инженер Технический перевод, техническая документация, Python до 200 000 ₽ | Старший (Senior) уровень Аналитик данных / Data Analyst SQL, Python, математическая статистика, Jupyter Notebook, A/B тестирование от 300 000 до 400 000 ₽ | Старший (Senior) уровень Database Administrator ClickHouse, PostgreSQL, Python до 5 000 $ | Старший (Senior) уровень

🤔 250 откликов за 20 минут: как я автоматизировал процесс ответов на вакансии Поиск работы часто превращается в рутину. Чтобы сэкономить время, разработчик создал систему автоматизации откликов на вакансии. Как это работает и какие результаты он получил — читайте в статье. Читать...

💬 Внедрение ИИ в общение с клиентами Статья исследует развитие ИИ в общении с клиентами и его интеграцию в бизнес. Обсуждаются успехи и сложности внедрения чат-ботов, важность настройки под бизнес-цели и перспективы замены сотрудников ИИ. Читать...

👩‍💻 Поиск самого часто встречающегося элемента в списке Напишите функцию, которая принимает список и возвращает элемент, который встречается чаще всего. Если таких элементов несколько, вернуть любой из них. Пример:
numbers = [1, 3, 2, 3, 4, 1, 3, 2, 1]
result = most_frequent(numbers)
print(result)  
# Ожидаемый результат: 3 (или 1, если в списке оба встречаются одинаково часто)
Решение задачи🔽
from collections import Counter def most_frequent(lst): count = Counter(lst) return max(count, key=count.get) # Пример использования: numbers = [1, 3, 2, 3, 4, 1, 3, 2, 1] result = most_frequent(numbers) print(result) # Ожидаемый результат: 3

⚙️ Нейросетевой апскейлинг дома: вторая молодость для классических мультфильмов Статья рассказывает, как с помощью нейросетей улучшить качество старых видеозаписей, включая VHS и DVD. Описываются инструменты, процесс и результаты с примерами, доступные каждому без глубоких технических знаний. Читать...

📝 Подборка вакансий для мидлов Аналитик данных Middle+ / Data Analyst Python, SQL, A/B тестирование от 200 000 до 300 000 ₽ | Средний (Middle) уровень Аналитик данных SQL, PostgreSQL, Greenplum, Apache Airflow, DWH, Apache Spark от 280 000 до 350 000 ₽ | Средний (Middle) уровень Инженер по компьютерному зрению Python, OpenCV, TensorFlow, PyTorch, машинное обучение, глубокое обучение Уровень дохода не указан | Требуемый опыт не указан

⚙️ Что такое train_test_split в Scikit-learn и зачем он используется? train_test_split — это функция из библиотеки Scikit-learn, которая используется для разделения данных на тренировочный и тестовый наборы. Это необходимо для оценки качества модели на данных, которые она не видела во время обучения. ➡️ Пример:
from sklearn.model_selection import train_test_split
import numpy as np

# Данные
X = np.array([[1], [2], [3], [4], [5]])
y = np.array([10, 20, 30, 40, 50])

# Разделение данных (80% на обучение, 20% на тест)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

print("Тренировочные данные:", X_train, y_train)
print("Тестовые данные:", X_test, y_test)
🗣️ В этом примере данные разделяются на тренировочный и тестовый наборы в соотношении 80/20. Это позволяет модели обучаться на одной части данных и проверять точность на другой, что предотвращает переобучение.
🖥 Подробнее тут

🤔 Данные — это ископаемое топливо для ИИ. Правда, что мы его исчерпали? В статье обсуждается заявление Ильи Суцкевера о том, что данные для ИИ сравнимы с ископаемым топливом, и их запас исчерпан. Объясняется концепция энтропии данных и её значение для LLM. Читать...

🔎 Подборка вакансий для джунов AI/Data Specialist (Эксперт по AI/ML / Data Ops) 🟢Python, pandas, numpy, scikit-learn, PyTorch, TensorFlow, MLOps, CI/CD, ML-пайплайны, компьютерное зрение, обработка естественного языка 🟢от 180 000 до 300 000 ₽ на руки | 1–3 года опыта Аналитик SQL / Data Analyst 🟢SQL, PostgreSQL, MySQL, Python, ETL, Airflow, API, анализ данных, визуализация данных, BI-инструменты, DataLens 🟢от 110 000 ₽ на руки | 1–3 года опыта Аналитик данных/data analyst контактного центра (CPA nutra) 🟢Excel, анализ данных, BI-отчётность, оптимизация процессов, контактные центры, CPA nutra 🟢от 80 000 ₽ на руки | 1–3 года опыта

👩‍💻 Проверка, являются ли две строки анаграммами Напишите функцию, которая принимает две строки и проверяет, являются ли они анаграммами. Анаграммы — это слова, которые содержат одинаковые буквы в одинаковом количестве, но в разном порядке. Игнорируйте регистр и пробелы. Пример:
result1 = are_anagrams("listen", "silent")
print(result1)  # Ожидаемый результат: True

result2 = are_anagrams("hello", "world")
print(result2)  # Ожидаемый результат: False
Решение задачи🔽
def are_anagrams(str1, str2): # Удаляем пробелы и приводим к одному регистру str1 = ''.join(str1.lower().split()) str2 = ''.join(str2.lower().split()) # Проверяем, равны ли отсортированные символы return sorted(str1) == sorted(str2) # Пример использования: result1 = are_anagrams("listen", "silent") print(result1) # Ожидаемый результат: True result2 = are_anagrams("hello", "world") print(result2) # Ожидаемый результат: False

➡️ Глубокое обучение: Алгоритм обратного распространения ошибки. Теория и реализация. С нуля Обратное распространение ошибки — основа обучения нейросетей. В статье: архитектура, расчет производных, реализация сетей для задач «ИЛИ» и MNIST. Простые шаги к пониманию алгоритма! Читать...

👀 Сравнение 30 фотореалистичных ИИ-изображений: Flux1.1 против SD3.5 В статье обсуждаются возможности Flux1.1 Pro и SD3.5 Large в генерации фотореалистичных изображений. Описаны различия моделей и их результаты после разделения команды разработчиков. Читать...

👩‍💻 Подсчёт количества слов в строке Напишите функцию, которая принимает строку и возвращает словарь, где ключами являются слова из строки, а значениями — количество их вхождений. Игнорируйте регистр и знаки препинания. Пример:
text = "Hello, world! Hello Python world."
result = count_words(text)
print(result)  
# Ожидаемый результат: {'hello': 2, 'world': 2, 'python': 1}
Решение задачи🔽
import re from collections import Counter def count_words(text): # Убираем знаки препинания и приводим к нижнему регистру words = re.findall(r'\b\w+\b', text.lower()) # Подсчитываем количество вхождений каждого слова return Counter(words) # Пример использования: text = "Hello, world! Hello Python world." result = count_words(text) print(result) # Ожидаемый результат: {'hello': 2, 'world': 2, 'python': 1}

🤖 Как удалить Excel навсегда: делегируем юнит-экономику на Wildberries нейронке Статья объясняет, как нейросети помогают оптимизировать юнит-экономику продавцов на WB, особенно при работе с большим ассортиментом. Рассматриваются подходы к автоматизации анализа и принятию решений. Читать...

🔎 Подборка зарубежных вакансий Marketing Analyst 🟢SQL, Power BI, Marketing Analysis, Google Analytics, Business English, API 🟢от 2 500 до 4 000 $ до вычета налогов | 1–3 года Data Scientist (mobile+web) 🟢Big Data, Amplitude, Power BI, A/B Testing, Predictive Modeling, Python 🟢от 4 000 $ до вычета налогов | 3–6 лет Data Analyst & Mathematical 🟢Python, Теория вероятностей, Математическая статистика, Статистический анализ, Оптимизационное моделирование 🟢Уровень дохода не указан | 3–6 лет