Data Science. SQL hub

前往频道在 Telegram

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

显示更多

网络:Machinelearning 俄罗斯18 125 技术与应用3 833...

📈 Telegram 频道 Data Science. SQL hub 的分析概览

频道 Data Science. SQL hub (@sqlhub) 俄语语言赛道中的是活跃参与者。目前社区聚集了 35 853 名订阅者，在 技术与应用 类别中位列第 3 833，并在 俄罗斯 地区排名第 18 125 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 35 853 名订阅者。

根据 12 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 8，过去 24 小时变化为 -2，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 10.08%。内容发布后 24 小时内通常能获得 4.38% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 3 614 次浏览，首日通常累积 1 571 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 15。
主题关注点： 内容集中在 sql, индекс, postgres, index, sqlite 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ”

凭借高频更新（最新数据采集于 13 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

35 853

订阅者

-224 小时

-287 天

+830 天

3 614

帖子浏览量

~ 1 57124 小时

~ 1 85748 小时

10.08%

参与率

无数据

每日帖子数

Ads index

beta

帖子存档

35 852

3 вида шардирования баз данных: • Range-based — разбивает данные по диапазонам значений ключа • Hash-based — выбирает шарду с помощью хеш-функции • Tenant-based — каждому клиенту (тенанту) выделяется своя отдельная база Пояснения: Range-based sharding делит данные по диапазонам ключа (например: ID 1–1 000 — первая шарда, 1 001–2 000 — вторая). Hash-based sharding использует хеш от ключа, чтобы определить, в какую шарду поместить или откуда прочитать запись. Это даёт более равномерное распределение. Tenant-based sharding выделяет каждому клиенту собственную базу данных, что упрощает изоляцию, миграции и управление данными. Просто, понятно и работает во всех масштабах.

35 852

🖥 Вышли новые релизы для тех, кто использует PostgreSQL в окружениях с несколькими СУБД. IvorySQL 5.0 Свежий релиз проекта, который развивает редакцию PostgreSQL с целью обеспечить максимальную совместимость с Oracle. Ключевые особенности: - работает как почти полная замена стандартного PostgreSQL - добавлена настройка compatible_db, включающая режим совместимости с Oracle - подходит для приложений, изначально написанных под Oracle - код на C - лицензия Apache 2.0 IvorySQL позиционируется как прозрачный переходный слой между экосистемами PostgreSQL и Oracle. Источник postgresql точка org слеш about слеш news слеш ivorysql 50 released major oracle compatibility expansion on postgresql 180 foundation 3180 https://www.postgresql.org/about/news/ivorysql-50-released-major-oracle-compatibility-expansion-on-postgresql-180-foundation-3180/

35 852

На AI Journey презентовали крупнейший open-source проект в Европе: Сбер открыл доступ к своим флагманским моделям - GigaChat Ultra-Preview и Lightning, а также новое поколение открытых моделей GigaAM-v3 для распознавания речи, все модели генерации изображений и видео новой линейки Kandinsky 5.0 — Video Pro, Video Lite и Image Lite. GigaChat Ultra-Preview, новая MoE-модель, 702 миллиарда параметров, собранная под русский язык и натренированная полностью с нуля. Читайте подробный пост от команды. Впервые в России обучена MoE-модель такого масштаба полностью с нуля — без зависимости от зарубежных весов. Обучение с нуля, да и ещё на таком масштабе, — это вызов, который приняли немногие команды в мире. Флагманская модель Kandinsky Video Pro сравнялась с Veo 3 по визуальному качеству и обогнала Wan 2.2-A14B. Читайте подробный пост от команды. Код и веса всех моделей теперь доступны всем пользователям по лицензии MIT, в том числе для использования в коммерческих целях.

35 852

🚨 SQL Никогда НЕ ДЕЛАЙ ТАК #sql НИКОГДА НЕ ЛОМАЙ ИНДЕКСЫ ФУНКЦИЯМИ: не оборачивай индексируемые поля в функции внутри WHERE. Как только ты пишешь LOWER(), CAST(), COALESCE() или любые вычисления по колонке — индекс перестаёт работать, и запрос падает в полное сканирование таблицы. Это одна из самых тихих причин, почему запросы внезапно превращаются в тормоза. Вместо этого приводи значения заранее или используй функциональные индексы.


 Плохо: индекс по email НЕ используется  
SELECT *  
FROM users  
WHERE LOWER(email) = 'user@example.com';

-- Хорошо: нормализуем значение заранее  
SELECT *  
FROM users  
WHERE email = 'user@example.com';

-- Или создаём функциональный индекс (PostgreSQL)  
CREATE INDEX idx_users_email_lower ON users (LOWER(email));

35 852

Он рассказал о том, как правильно оптимизировать SQL в бэкенде, чтобы запросы работали быстрее, снижали задержки и не создавали узких мест в системе. → Некачественно написанный SQL приводит к высоким задержкам, росту нагрузки на CPU и проблемам в нагруженных сервисах. Основные принципы оптимизации: ✓ 1. Анализ планов выполнения Он подчёркивает необходимость использовать EXPLAIN / EXPLAIN ANALYZE, чтобы увидеть, как база реально исполняет запрос: где происходят полные сканирования таблиц, плохие джоины или отсутствуют индексы. ✓ 2. Индексация Он рекомендует ставить индексы на часто используемые поля и ключи, применять составные индексы, но избегать чрезмерной индексации, чтобы не замедлять записи. ✓ 3. Отказ от SELECT * Он настаивает на выборе только нужных столбцов — это снижает трафик и ускоряет выполнение. ✓ 4. Оптимизация джоинов Нужно правильно выбирать тип JOIN, индексировать поля, участвующие в соединениях, и избегать слишком глубоких джоин-цепочек. ✓ 5. Грамотные WHERE-фильтры Фильтровать данные как можно раньше, использовать индексируемые колонки и избегать функций в WHERE, которые «ломают» индексы. ✓ 6. Ограничение числа строк Использовать LIMIT / OFFSET и постраничный вывод, а не отдавать пользователю огромные выборки. ✓ 7. Избежание проблемы N+1 Фетчить связанные данные заранее через JOIN или батч-запросы. ✓ 8. Кэширование Он предлагает кэшировать частые запросы с помощью Redis или Memcached, чтобы уменьшить нагрузку на базу. ✓ 9. Нормализация и денормализация Нормализация уменьшает дублирование, денормализация ускоряет чтение — важно выбирать подход под задачу. ✓ 10. Оптимизация вставок и обновлений Использовать bulk insert, проверять необходимость обновлений. ✓ 11. Партиционирование таблиц Он предлагает разбивать большие таблицы по дате или региону, что особенно полезно для логов и аналитики. Эти рекомендации помогают backend-разработчикам строить более быстрые, масштабируемые и надёжные системы.

35 852

AI VK рассказали, какой ML нужен, чтобы обрабатывать десятки миллиардов рекламных объявлений в режиме реального времени. Всё это завязано на единой Discovery-платформе, работающий как инфраструктурный слой для рекламы, рекомендаций и поиска.

35 852

🌊 ETL на стероидах: стриминг данных Postgres в реальном времени на Rust 🦀 Supabase выкатили интересный open-source фреймворк - supabase/etl, который позволяет стримить данные из Postgres куда угодно в реальном времени. Это набор простых, модульных Rust-блоков, из которых можно собрать собственный конвейер Change Data Capture (CDC). Вы получаете полный контроль над тем, как обрабатывать изменения в базе и куда их отправлять — без тяжёлых платформ и сложных конфигов. Что делает этот фреймворк полезным: - Прямой стриминг изменений из Postgres (CDC) - Rust — значит скорость, надёжность и низкие накладные расходы - Гибкие компоненты: можно строить свои конвейеры под любые нужды - Подходит для интеграций, аналитики, событийных систем, real-time обновлений - Легче и прозрачнее, чем классические ETL/ELT-платформы По сути, это конструктор, из которого можно быстро собрать real-time data pipeline: достал изменения из Postgres → преобразовал → отправил в Kafka, ClickHouse, S3, API — куда угодно. Если вы работаете с потоковыми данными, аналитикой или микросервисами - стоит попробовать. Rust + CDC - это мощное сочетание для стабильных и быстрых пайплайнов. https://github.com/supabase/etl

35 852

SQL СОВЕТ Ловите тяжёлые запросы на ранней стадии через контролируемые анти-джоины. Когда нужно узнать, какие записи *не имеют* соответствий в другой таблице, разработчики часто используют LEFT JOIN . Гораздо быстрее использовать NOT EXISTS — он позволяет планировщику остановиться сразу, как только найдено первое совпадение, и эффективно задействует индексы.


select u.user_id
from users u
where not exists (
    select 1
    from logins l
    where l.user_id = u.user_id
      and l.created_at >= now() - interval '7 days'
);

35 852

SQLModel — это библиотека для взаимодействия с базами данных SQL из кода Python с использованием объектов Python. Она интуитивно понятна, проста в использовании, обладает высокой совместимостью и надёжностью.

35 852

VK RecSys Challenge: проверьте свой алгоритм в деле! В самом разгаре ежегодное соревнование по разработке рекомендательных систем от VK — RecSys Challenge 2025. Участникам предстоит решить одну из самых сложных проблем в мире рекомендаций: задачу холодного старта. Суть соревнования — построить модель, которая предскажет, кому из пользователей понравится новый клип, даже если его ещё никто не видел. Что ждёт участников: • Реальные данные — датасет VK-LSVD с 40 млрд взаимодействий и 20 млн коротких видео • Можно участвовать соло или в команде до 4 человек • Техническая свобода — до 5 сабмитов в день, возможность экспериментировать • Общий призовой фонд — 2 500 000 рублей Приглашают студентов, исследователей, ML-инженеров — всех, кто хочет испытать свои силы на реальных данных и создать алгоритм, который работает в условиях, максимально приближенных к контентной жизни. Регистрация открыта до 15 декабря. Успейте подать заявку, скачать датасет и начать эксперименты! 👉 Подробности и регистрация на сайте

35 852

⚡️ Знакомство с MCP Toolbox for Databases (ранее Gen AI Toolbox for Databases) от Google Почему стоит обратить внимание Toolbox - это open-source сервер, который упрощает создание инструментов на базе ИИ, работающих с базами данных. Он берет на себя сложности вроде пулов соединений, аутентификации и телеметрии. Что даёт: - Можно интегрировать новые инструменты в агента (или ИИ-ассистента) всего в ~10 строках кода. - Производительность выше за счёт продвинутого управления соединениями и аутентификацией. - Безопасность: встроенная авторизация, контроль доступа к данным. - Полная видимость: метрики и трассировка (OpenTelemetry) сразу «из коробки». - Возможность общаться с БД на естественном языке, получить код, тесты, индексы — прямо из IDE. Архитектура в двух словах Toolbox размещается между вашим приложением (или агентом) и базой данных. Он действует как «контрольная плоскость» — управляет инструментами, хранит и обновляет их, позволяет нескольким агентам и приложениям использовать один и тот же набор инструментов без перекомпиляции. Быстрый старт: - Установите сервер (бинарник, контейнер или собрать из исходников). - Создайте файл tools.yaml и запустите: ./toolbox --tools-file "tools.yaml" - Используйте SDK (Python, JS/TS, Go) в своём приложении, подключитесь к серверу и загрузите нужный набор инструментов. Кому это полезно: Разработчикам приложений, где ИИ-агент делает работу с базами данных: запросы, обновления, анализ схем. Если хотите, могу подготовить мини-таск или пример использования Toolbox с вашим стеком. https://googleapis.github.io/genai-toolbox/getting-started/introduction/

35 852

Узнайте, как строить сложные AI-процессы на AI DevTools Conf 4 декабря команда Cloud.ru проводит практическую конференцию для AI/ML-инженеров, архитекторов, техлидов и всех, кто работает с AI.

В программе доклады и воркшопы, где вы научитесь: 😶‍🌫️собирать AI-агентов 😶‍🌫️управлять уязвимостями 😶‍🌫️внедрять AI-инструменты в разработку 😶‍🌫️тестировать LLM-агентов 😶‍🌫️и не только

А еще можно будет протестировать сервисы для работы с AI&ML, задать вопросы экспертам и остаться на afterparty. Места на офлайн-участие ограничены, поэтому советуем сразу перейти к регистрации. Зарегистрироваться

35 852

📚 Курс, который прокачает твои AI-скиллы в BigQuery Этот курс учит работать с Gemini прямо внутри BigQuery и закрывает полный набор практических навыков: - генерация и отладка SQL-запросов с помощью Gemini - анализ тональности текста - автоматические суммари и выделение ключевых слов - генерация эмбеддингов - построение RAG-пайплайна - мультимодальный векторный поиск Если хочешь уверенно использовать AI-инструменты в аналитике и продуктах — этот курс даёт полный набор необходимых умений. https://www.skills.google/paths/1803/course_templates/1232

35 852

Твои скиллы получат буст после IT Talk by Sber в Омске 🚀 Иного просто не может быть — за один вечер вы прокачаете навыки и узнаете: ▪️ Что такое E2E-система, зачем она нужна и как помогает решить проблемы разработки на практике? ▪️ Как вайб-кодинг помогает в проработке задач, проверке гипотез и концепций? ▪️ Как написать агента на Java и какой стек использовать? Подробная программа и регистрация по ссылке. Встречаемся 20 ноября в 18:00 в кампусе «Школы 21» по адресу: ул. Ленина, д. 26 Б.

35 852

Что делает оператор EXPLAIN PARTITIONS в MySQL?

Anonymous voting

35 852

🔥 Подборка полезных ресурсов для программистов. Здесь ты найдёшь всё это - коротко, по делу и без воды. Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты! AI: t.me/ai_machinelearning_big_data Python: t.me/pythonl Linux: t.me/linuxacademiya Devops: t.me/DevOPSitsec Собеседования DS: t.me/machinelearning_interview C++ t.me/cpluspluc Docker: t.me/DevopsDocker Хакинг: t.me/linuxkalii Data Science: t.me/data_analysis_ml Javascript: t.me/javascriptv C#: t.me/csharp_1001_notes Java: t.me/java_library Базы данных: t.me/sqlhub Python собеседования: t.me/python_job_interview Мобильная разработка: t.me/mobdevelop Golang: t.me/Golang_google React: t.me/react_tg Rust: t.me/rust_code ИИ: t.me/vistehno PHP: t.me/phpshka Android: t.me/android_its Frontend: t.me/front Big Data: t.me/bigdatai МАТЕМАТИКА: t.me/data_math Kubernets: t.me/kubernetc Разработка игр: https://t.me/gamedev Haskell: t.me/haskell_tg Физика: t.me/fizmat 💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy Папка Linux:https://t.me/addlist/w4Doot-XBG4xNzYy 😆ИТ-Мемы: t.me/memes_prog 🇬🇧Английский: t.me/english_forprogrammers 🧠ИИ: t.me/vistehno 🎓954ГБ ОПЕНСОРС КУРСОВ: @courses 📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy Сохрани себе, чтобы не потерять!

35 852

# ⚠️ Расследователи сомневается в AI-сделках Oracle на $300 млрд — и это тревожный сигнал Сейчас мы видим, как крупнейшие IT-компании (гиперскейлеры) заключают многолетние контракты на искусственный интеллект на сотни миллиардов долларов. Но никто ещё не проверял, насколько всё это реально окупается. Это - эксперимент на деньгах, технологиях и времени. 💸 Если хотя бы часть этих сделок не сработает, задержится или не принесёт ожидаемой прибыли, удар почувствует вся AI-индустрия - от чипов до облаков. 🧱 Да, AI-бум реален. Но его финансовый фундамент пока как мокрый цемент — выглядит крепко, но легко может просесть. 🎯 Если у Oracle получится - они войдут в список самых влиятельных компаний мира. ❗ Если нет — вся отрасль поймёт, насколько эта гонка на самом деле рискованна и нестабильна. > 📊 Пузыри не лопаются, когда в них перестают верить. > Они лопаются, когда кто-то наконец проверяет цифры. @sqlhub

35 852

🖥 PYTHON: ХИТРЫЙ ТРЮК С SQL Если вы работаете с большими таблицами в SQL через Python, и не хотите тянуть всё в память, используйте ленивую подгрузку данных с генерацией чанков. Это особенно полезно, если вы делаете агрегации, фильтрации или сохраняете результат в файл — можно обрабатывать данные частями, не загружая весь датасет сразу. Удобно, быстро и экономит память. Работает даже с миллионами строк.


import pandas as pd
from sqlalchemy import create_engine

# подключение к базе данных (пример для PostgreSQL)
engine = create_engine("postgresql://user:password@localhost:5432/dbname")

# читаем по 10000 строк за раз
chunk_iter = pd.read_sql("SELECT * FROM big_table", engine, chunksize=10000)

# обработка: сохраняем отфильтрованные строки в файл
with open("filtered_output.csv", "w", encoding="utf-8") as f:
    for i, chunk in enumerate(chunk_iter):
        filtered = chunk[chunk["amount"] > 1000]
        filtered.to_csv(f, index=False, header=(i == 0))

https://www.youtube.com/shorts/y5orXDD2mdU

35 852

Antares SQL Client Современный, быстрый и ориентированный на продуктивность SQL-клиент с акцентом на пользовательский опыт (UX). Текущие ключевые функции: - Подключение к нескольким базам данных одновременно. - Управление базами данных (добавление/редактирование/удаление). - Полное управление таблицами, включая индексы и внешние ключи. - Управление представлениями, триггерами, хранимыми процедурами, функциями и планировщиками (добавление/редактирование/удаление). - Современная и удобная система вкладок; держите открытыми все необходимые вкладки в вашем рабочем пространстве. - Заполнение тестовых данных в таблицах для генерации большого объема данных. - Подсказки и автозаполнение запросов. - История запросов: поиск по последним 1000 запросам. - Сохранение запросов, заметок или задач. - Поддержка SSH-туннелей. - Режим ручного выполнения транзакций. - Импорт и экспорт дампов баз данных. - Настраиваемые горячие клавиши. - Темная и светлая тема. - Темы редактора. https://github.com/antares-sql/antares

35 852

За 2,5 часа прокачаем маркетинг с нейросетями Технари, проходите мимо — здесь эфир для ребят из маркетинга. 25 ноября приходите на онлайн-интенсив по AI. Вас ждет: 📈 Кейс-стади. COFIX, CDEK, Звук и Gulliver расскажут, как оптимизировали маркетинг с ML и LLM. С результатами в цифрах! Например, Cofix ускорил обработку клиентских отзывов в 7000 раз. А Gulliver удвоил CTR товарных карточек на маркетплейсах. 👨‍🏫 Воркшоп по промптингу. Эксперты в прямом эфире помогут сегментировать клиентов, персонализировать рассылки и рекламу с ChatGPT. 📅 25 ноября, 11:00–13:30 мск 💻 Онлайн, бесплатно Зарегистрироваться erid: 2W5zFJPvCvk