Data Science | Machinelearning [ru]
Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM. Личный блог автора - @just_genych По вопросам рекламы или разработки - @g_abashkin РКН: https://vk.cc/cJPGXD
Показати більше📈 Аналітичний огляд Telegram-каналу Data Science | Machinelearning [ru]
Канал Data Science | Machinelearning [ru] (@devsp) у мовному сегменті Російська є активним учасником. На даний момент спільнота об'єднує 20 028 підписників, посідаючи 6 726 місце в категорії Технології та додатки та 33 725 місце у регіоні Росія.
📊 Показники аудиторії та динаміка
З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 20 028 підписників.
За останніми даними від 18 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на -63, а за останні 24 години на -3, загальне охоплення залишається високим.
- Статус верифікації: Не верифікований
- Рівень залученості (ER): Середній показник залученості аудиторії становить 8.21%. Протягом перших 24 годин після публікації контент зазвичай збирає 4.21% реакцій від загальної кількості підписників.
- Охоплення публікацій: В середньому кожен допис отримує 1 645 переглядів. Протягом першої доби публікація в середньому набирає 843 переглядів.
- Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 7.
- Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як llm, nvidia, контекст, openai, архитектура.
📝 Опис та контентна політика
Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Все о Data Science, машинном обучении и искусственном интеллекте: от базовой теории до cutting-edge исследований и LLM.
Личный блог автора - @just_genych
По вопросам рекламы или разработки - @g_abashkin
РКН: https://vk.cc/cJPGXD”
Завдяки високій частоті оновлень (останні дані отримано 19 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.
functools.lru_cache в Python и зачем он используется?
functools.lru_cache — это декоратор, который позволяет кэшировать результаты функции для повышения производительности. Он запоминает результаты вызовов функции с определёнными аргументами и возвращает их из кэша при повторных вызовах.
➡️ Пример:
from functools import lru_cache
import time
@lru_cache(maxsize=3)
def slow_function(n):
time.sleep(2)
return n * 2
print(slow_function(5)) # Выполняется медленно (2 секунды)
print(slow_function(5)) # Возвращает результат мгновенно из кэша
🗣️ В этом примере функция slow_function кэширует результаты для трёх последних аргументов. Повторный вызов с теми же аргументами возвращает результат мгновенно, ускоряя выполнение.🖥 Подробнее тут
• Golang, ClickHouse, MySQL, MongoDB, Kubernetes, HTTP/gRPC API, Apache Kafka, Redis
• Уровень дохода не указан | от 3 лет
Data Scientist NLP (портал gosuslugi.ru)
• Python 3, numpy, pandas, scipy, sklearn, PyTorch, NLTK, transformers, FastAPI, Docker, Spark/Hadoop
• Уровень дохода не указан | от 1 года
Senior Data Engineer
• Apache Hadoop, Spark (batch/streaming), Scala, SQL, Parquet, Hive, Kafka, HBase, ClickHouse, PostgreSQL, Airflow, Zeppelin, Jupyter, S3 MinIO
• Уровень дохода не указан | от 5 лет
Senior Python Dev (AI, Big Data, LLM)
• Python, PostgreSQL, Big Data, AI, ML, ClickHouse, Time Series, Go
• от 3 000 $ | от 5 летtext = "Python is great, and Python is fun! Learning Python is rewarding."
result = most_common_word(text)
print(result)
# Ожидаемый результат: ('python', 3)
Решение задачи🔽
import re from collections import Counter def most_common_word(text): words = re.findall(r'\b\w+\b', text.lower()) counter = Counter(words) return counter.most_common(1)[0] # Пример использования: text = "Python is great, and Python is fun! Learning Python is rewarding." result = most_common_word(text) print(result)
shutil в Python и зачем он используется?
Модуль shutil предоставляет функции для работы с файлами и директориями, такие как копирование, перемещение и удаление. Он полезен для автоматизации задач управления файлами.
➡️ Пример:
import shutil
# Копирование файла
shutil.copy('source.txt', 'destination.txt')
# Перемещение файла
shutil.move('destination.txt', 'folder/destination.txt')
🗣️ В этом примере shutil.copy копирует файл, а shutil.move перемещает его в другую директорию. Это облегчает выполнение операций с файлами и папками.🖥 Подробнее тут
pandas.DataFrame и возвращает новый DataFrame, где все пропущенные значения (NaN) в числовых столбцах заменены на медиану соответствующего столбца.
Пример:
import pandas as pd
data = pd.DataFrame({
'age': [25, 30, None, 45, 50],
'salary': [50000, 60000, 55000, None, 65000],
'city': ['NY', 'LA', 'NY', 'SF', 'LA']
})
cleaned_data = fill_missing_with_median(data)
print(cleaned_data)
age salary city 0 25.0 50000.0 NY 1 30.0 60000.0 LA 2 37.5 55000.0 NY 3 45.0 57500.0 SF 4 50.0 65000.0 LAРешение задачи🔽
import pandas as pd def fill_missing_with_median(df): df_filled = df.copy() for col in df_filled.select_dtypes(include='number').columns: median = df_filled[col].median() df_filled[col].fillna(median, inplace=True) return df_filled # Пример использования: data = pd.DataFrame({ 'age': [25, 30, None, 45, 50], 'salary': [50000, 60000, 55000, None, 65000], 'city': ['NY', 'LA', 'NY', 'SF', 'LA'] }) cleaned_data = fill_missing_with_median(data) print(cleaned_data)
pandas.DataFrame и название столбца, а затем возвращает новый DataFrame, в котором выбросы (значения, выходящие за пределы 1.5 межквартильного размаха) удалены.
Пример:
import pandas as pd
data = pd.DataFrame({
"values": [10, 12, 15, 100, 14, 13, 11, 102, 16]
})
cleaned_data = remove_outliers(data, "values")
print(cleaned_data)
# Ожидаемый результат:
# values
# 0 10
# 1 12
# 2 15
# 4 14
# 5 13
# 6 11
# 8 16
Решение задачи🔽
import pandas as pd def remove_outliers(df, column): Q1 = df[column].quantile(0.25) Q3 = df[column].quantile(0.75) IQR = Q3 - Q1 lower_bound = Q1 - 1.5 * IQR upper_bound = Q3 + 1.5 * IQR return df[(df[column] >= lower_bound) & (df[column] <= upper_bound)] # Пример использования: data = pd.DataFrame({ "values": [10, 12, 15, 100, 14, 13, 11, 102, 16] }) cleaned_data = remove_outliers(data, "values") print(cleaned_data)
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
