Data science/ML/AI
Data science and machine learning hub Python, SQL, stats, ML, deep learning, projects, PDFs, roadmaps and AI resources. For beginners, data scientists and ML engineers 👉 https://rebrand.ly/bigdatachannels DMCA: @disclosure_bds Contact: @mldatascientist
Показати більше📈 Аналітичний огляд Telegram-каналу Data science/ML/AI
Канал Data science/ML/AI (@datascience_bds) у мовному сегменті Англійська є активним учасником. На даний момент спільнота об'єднує 13 672 підписників, посідаючи 9 377 місце в категорії Технології та додатки та 31 635 місце у регіоні Індія.
📊 Показники аудиторії та динаміка
З моменту свого створення невідомо, проект продемонстрував стрімке зростання, зібравши аудиторію у 13 672 підписників.
За останніми даними від 09 червня, 2026, канал демонструє стабільну активність. Хоча за останні 30 днів спостерігається зміна кількості учасників на 155, а за останні 24 години на 5, загальне охоплення залишається високим.
- Статус верифікації: Не верифікований
- Рівень залученості (ER): Середній показник залученості аудиторії становить 8.03%. Протягом перших 24 годин після публікації контент зазвичай збирає 2.25% реакцій від загальної кількості підписників.
- Охоплення публікацій: В середньому кожен допис отримує 1 098 переглядів. Протягом першої доби публікація в середньому набирає 308 переглядів.
- Реакції та взаємодія: Аудиторія активно підтримує контент: середня кількість реакцій на один пост – 5.
- Тематичні інтереси: Контент зосереджений навколо ключових тем, таких як panda, learning, row, api, ethic.
📝 Опис та контентна політика
Автор описує ресурс як майданчик для висловлення суб'єктивної думки:
“Data science and machine learning hub
Python, SQL, stats, ML, deep learning, projects, PDFs, roadmaps and AI resources.
For beginners, data scientists and ML engineers
👉 https://rebrand.ly/bigdatachannels
DMCA: @disclosure_bds
Contact: @mldatasci...”
Завдяки високій частоті оновлень (останні дані отримано 10 червня, 2026), канал підтримує актуальність та високий рівень охоплення публікацій. Аналітика показує, що аудиторія активно взаємодіє з контентом, що робить його важливою точкою впливу в категорії Технології та додатки.
Will this model work on unseen data?A single train/test split is unreliable, especially with small datasets. So K-Fold simulates multiple “future tests” using the same data. 🧠 What It Really Does Instead of one split, we: 🔀 Divide data into K folds 🔁 Train the model K times 📦 Each time: one fold validates, the rest train 📊 Average the scores Every sample gets validated once, which reduces evaluation noise and gives a more trustworthy estimate. Important: It improves evaluation, not the model itself. ⚠️ What People Often Miss 🚫 Do NOT use K-Fold as your final test. Keep a separate test set ⚖️ Use Stratified K-Fold for imbalanced classification. ⏳ Do NOT use standard K-Fold for time series. 📊 K = 5 or 10 is usually enough. ✅ In short K-Fold is just: A smart way to reuse limited data to simulate multiple real-world tests. No magic. Just careful evaluation.
How complex is your model’s decision boundary?VC dimension measures the largest number of points a model can shatter (perfectly classify in all labelings). Why this is important❔ Two models with similar parameter counts can have very different capacities. For example: 📦 k-NN → very high effective capacity 📐 Linear classifier → limited capacity 🌳 Deep trees → extremely high capacity What you need to understand Generalization depends on capacity relative to data size. Too much capacity with little data leads to overfitting. ✅ VC dimension is about expressive power, not just number of parameters.
df["age_scaled"] = (df["age"] - df["age"].mean()) / df["age"].std()
Why it is useful:
• Quick experiments
• Better intuition
• No pipeline overheadimport numpy as np
z = (df["salary"] - df["salary"].mean()) / df["salary"].std()
outliers = df[np.abs(z) > 3]
Why this matters:
• Clean data
• Better models
• Fewer surprises in production
Small code. Big impact.
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
