uz
Feedback
Data Science. SQL hub

Data Science. SQL hub

Kanalga Telegram’da o‘tish

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

Ko'proq ko'rsatish

📈 Telegram kanali Data Science. SQL hub analitikasi

Data Science. SQL hub (@sqlhub) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 35 848 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 3 835-o'rinni va Rossiya mintaqasida 18 129-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 35 848 obunachiga ega bo‘ldi.

13 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -8 ga, so‘nggi 24 soatda esa -11 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

  • Tasdiqlash holati: Tasdiqlanmagan
  • Jalb etish (ER): Auditoriya o‘rtacha 9.82% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 4.08% ini tashkil etuvchi reaksiyalarni to‘playdi.
  • Post qamrovi: Har bir post o‘rtacha 3 522 marta ko‘riladi; birinchi sutkada odatda 1 461 ta ko‘rish yig‘iladi.
  • Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 13 ta reaksiya keladi.
  • Tematik yo‘nalishlar: Kontent sql, индекс, postgres, index, sqlite kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

Yuqori yangilanish chastotasi (oxirgi ma’lumot 14 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

35 848
Obunachilar
-1124 soatlar
-317 kunlar
-830 kunlar
Postlar arxiv
⚡️ Open-source инструмент для просмотра CSV, JSON, Excel и других таблиц прямо в терминале — без потери форматирования, аккуратно и читабельно. 🔥 Что умеет: — Встроенный SQL-движок: фильтры, джойны и анализ прямо в терминале; — Vim-подобные хоткеи (для фанатов, да 😁); — Быстрый поиск, работа с несколькими таблицами, поддержка тем (Monokai, Nord и др.). https://github.com/shshemi/tabiew

Data Scientist — одна из самых перспективных профессий 2025 года, по данным Мирового экономического форума 📊 Освоить эту про
Data Scientist — одна из самых перспективных профессий 2025 года, по данным Мирового экономического форума 📊 Освоить эту профессию можно на курсе Нетологии — с погружением в практику, сопровождением ментора, поддержкой профессионального комьюнити и экспертов из Яндекса, Сбера, VK и Amazon. В результате обучения вы: - изучите Apache Spark, pandas, PostgreSQL и другие инструменты для обработки больших данных; - научитесь применять технологии машинного обучения для решения бизнес-задач; - отработаете навыки на реальных проектах компаний-партнёров: «Северстали», «Гринатома», Neoflex. Чтобы ещё больше расширить скиллсет, сможете пройти бонусные модули по английскому языку, рекомендательным системам, нейросетям и deep learning. Сейчас на курс действует скидка 40% — записывайтесь Реклама. ООО "Нетология". ИНН 7726464125 Erid 2VSb5wDk42d

☕ Starbucks Korea ввела жёсткий запрет на «офис в кофейне» Теперь по всей стране нельзя приносить в залы стационарные компьют
+2
☕ Starbucks Korea ввела жёсткий запрет на «офис в кофейне» Теперь по всей стране нельзя приносить в залы стационарные компьютеры, принтеры, сетевые фильтры и сооружать перегородки. Причина — вирусное фото, на котором посетитель развернул полноценный офисный сетап, ушёл на три часа и оставил всё без присмотра. Ранее отдельные точки пытались ограничивать время за столом, отключать розетки и мягко намекать клиентам, что пора уходить. Теперь это закреплено официальным национальным правилом. 📌 Подробнее @sqlhub

🔥VK зовет всех поглитчевать и обсудить RecSys. 27 августа на встрече AI VK & Pro спецы обсудят реальные тренды и рекомендательные системы. Нетворкингу быть @sqlhub

🚀 sebastien/multiplex — Command‑Line Process Multiplexer Что это: простой CLI и Python API для запуска нескольких процессов
🚀 sebastien/multiplex — Command‑Line Process Multiplexer Что это: простой CLI и Python API для запуска нескольких процессов параллельно, с гибким управлением зависимостями, задержками и завершением. Фичи: - Параллельный или последовательный запуск процессов - Задержки: +2s, +500ms - Зависимости: :A, :A& - Именование процессов и цветной вывод - Управление через Python API 🔧 Примеры: - Запуск двух серверов:

  multiplex "python -m http.server -p 8000" "python -m http.server -p 8001"
  
- Сначала сервер, потом бенчмарк:

  multiplex "SERVER=python -m http.server" "+2s=ab -n1000 http://localhost:8000/"
  
- Сценарий: DB → API → тесты:
  multiplex "DB=mongod" "API:DB&+2=node server.js" ":API&|end=npm test"
  
📦 Установка: pip install multiplex-sh или просто multiplex.py напрямую с GitHub 🔗 GitHub: https://github.com/sebastien/multiplex 🧰 Подходит всем, кто запускает несколько сервисов — API, БД, фоновые задачи — и хочет сделать это красиво. @sqlhub

🔮 CozoDB — графовая база данных с поддержкой Datalog-запросов, временными срезами и векторным поиском через HNSW-индексы. Ин
🔮 CozoDB — графовая база данных с поддержкой Datalog-запросов, временными срезами и векторным поиском через HNSW-индексы. Инструмент имеет встроенные алгоритмы для работы с графами и кроссплатформенность: работает как embedded-решение на Python, Node.js, Android и даже в браузере через WASM. Поддерживает SQLite, RocksDB и распределённое хранилище TiKV. 🤖 GitHub @sqlhub

E-CUP возвращается. Реальные данные. Масштабные проекты. Большие призы E-CUP 2025 — соревнование, где Everything as code. Реш
E-CUP возвращается. Реальные данные. Масштабные проекты. Большие призы E-CUP 2025 — соревнование, где Everything as code. Решай ML-задачи в стиле Ozon Tech. Призовой фонд — 7 200 000 рублей 🔥 🗓 Регистрация: https://cnrlink.com/ecup25dshub 💻 Формат участия: онлайн 👥 Команда: от 1 до 5 человек 🎯 Для кого: Data Scientists, ML-специалисты, аналитики данных, дата-инженеры, специалисты Big Data и разработчики, которые интересуются ML/DS. Что вас ждёт: 🔹 Работа над проектом для миллионов пользователей на основе данных от ведущего e-com в России. 🔹 Призовой фонд — 7 200 000 рублей для девяти сильнейших команд. 🔹 Обмен опытом с экспертами Ozon Tech. 🔹 Эксклюзивный мерч и подарки. 🔹 Питчинг — онлайн или очно на конференции E-CODE. Финалистам Ozon Tech предоставит билеты и оплатит поездку. Регистрация открыта до 17 августа включительно

🗄️ Вышел первый стабильный релиз ветки MariaDB 12.0 — версия 12.0.2 MariaDB 12.0 относится к промежуточным (rolling) выпускам и пришла на смену ветке 11.8. Поддержка этой ветки продлится до выхода MariaDB 12.1.2. Параллельно представлен релиз-кандидат MariaDB 12.1.1. 📌 Напомним: MariaDB — форк MySQL, совместимый по API/CLI, но с дополнительными движками хранения и расширенными функциями. Развивается MariaDB Foundation с открытым процессом разработки. MariaDB уже заменяет MySQL во многих Linux-дистрибутивах (RHEL, Fedora, Debian, Arch и др.) и используется в крупных проектах вроде Wikipedia и Google Cloud SQL. ✨ Главное в MariaDB 12.0: - 🔐 Поддержка SSL-ключей с паролем (`ssl_passphrase` или ввод вручную при запуске). - 👤 Команда SET SESSION AUTHORIZATION — выполнение под другим пользователем (аналог sudo в БД). - 🗝️ Плагин file_key_management.so — поддержка SHA-2. - 🔄 Weak cursor variables (`SYS_REFCURSOR`) для возврата курсора из процедур и функций + настройка max_open_cursors. - 📅 TO_CHAR — режим FM (Fill Mode) без лишних пробелов. - 🛠 mariadb-check / CHECK TABLE теперь работают с таблицами SEQUENCE. - ⚡ Оптимизатор — поддержка MySQL-совместимых *hints*: QB_NAME, BKA, NO_BKA, MAX_EXECUTION_TIME и др. - 🌍 GIS-функции: ST_Validate, ST_GeoHash, ST_IsValid и др. - 🔔 Триггеры для нескольких событий в одном CREATE TRIGGER. - 📝 Audit-плагин пишет в лог и сетевой порт подключения. - 📂 mariadb — новая опция --script-dir для кастомного каталога скриптов. - 🗑️ Удалены устаревшие переменные: big_tables, large_page_size, storage_engine. https://github.com/MariaDB/server/releases/tag/mariadb-12.0.2 #MariaDB #Database #SQL #Opensource @sqlhub

📊 Mathesar — необычный веб-интерфейс для PostgreSQL, который превращает работу с базами данных в процесс, напоминающий табли
📊 Mathesar — необычный веб-интерфейс для PostgreSQL, который превращает работу с базами данных в процесс, напоминающий таблицы Excel. Проект разработан некоммерческой организацией и позволяет даже не-техническим специалистам редактировать данные, строить запросы через визуальный конструктор и управлять правами доступа через стандартные роли Postgres. Вместо создания промежуточного слоя Mathesar работает напрямую с вашей БД, сохраняя все возможности PostgreSQL — от внешних ключей до сложных ограничений. Можно подключить как новую, так и существующую базу данных, а развертывание через Docker занимает минуты. 🤖 GitHub @sqlhub

🔥SQL ТРЮК: Как выбрать первые N строк в каждой группе Вот полезный трюк: используем функцию роз намбер с патришн бай чтобы нумеровать строки внутри каждой группы, а потом фильтруем по номеру. Ты получишь первые два события для каждого пользователя. Можно легко адаптировать под «топ‑пять товаров в каждой категории. Этот трюк работает в большинстве современных СУБД, поддерживающих оконные функци

 sql
WITH ranked AS (
  SELECT
    user_id,
    event_time,
    event_type,
    ROW_NUMBER() OVER (
      PARTITION BY user_id
      ORDER BY event_time ASC
    ) AS rn
  FROM user_events
)
SELECT *
FROM ranked
WHERE rn <= 2;
📌 Этот запрос выберет первые 2 события *по каждому пользователю*. Просто, чисто и кросс‑совместимо — работает в PostgreSQL, MySQL 8+, SQL Server и других. https://www.youtube.com/shorts/X5CJn1eLW20 @sqlhub

🖥 MongoDB выпускает MCP Server — теперь любой может стать дата-инженером MongoDB представили открытый MCP сервер, который по
🖥 MongoDB выпускает MCP Server — теперь любой может стать дата-инженером MongoDB представили открытый MCP сервер, который позволяет AI-инструментам вроде Claude, Cursor и GitHub Copilot напрямую общаться с вашей MongoDB-базой. Теперь даже без знаний запросов можно просто написать: • «Покажи самых активных пользователей» • «Создай нового пользователя с правами только на чтение» • «Как устроена коллекция orders?» ⚙️ MCP Server поддерживает: • MongoDB Atlas • Community Edition • Enterprise Advanced 📌 Главное — не нужен SQL, не нужно знать синтаксис. Достаточно обычного языка. 💡 Под капотом: AI превращает ваши фразы в рабочие Mongo-запросы. Открытый исходный код. Готово к продакшену. 📌 GitHub #MongoDB #AItools #OpenSource #MCP @sqlhub

‼️‼️ SQL-задача с подвохом: почему COUNT(*) считает не так, как ты думаешь? ‼️‼️ 🧠 Условие: У тебя есть две таблицы:

users
---------
id | name
---|-----
1  | Alice
2  | Bob
3  | Charlie

orders
----------
id | user_id | total
----|---------|-------
1  |    1    | 100
2  |    1    | 200
3  |    2    | 300
Нужно вывести всех пользователей и количество их заказов, включая тех, у кого заказов нет вообще. Ты пишешь:

SELECT u.id, u.name, COUNT(o.id) AS order_count
FROM users u
JOIN orders o ON u.id = o.user_id
GROUP BY u.id, u.name;
❌ Результат:

1 | Alice   | 2  
2 | Bob     | 1  
А где Charlie? 😡
📌 Подвох: JOIN убирает строки без соответствий — Charlie не попадает в результат вообще. Нужно использовать LEFT JOIN, чтобы сохранить всех пользователей. ✅ Правильное решение:

SELECT u.id, u.name, COUNT(o.id) AS order_count
FROM users u
LEFT JOIN orders o ON u.id = o.user_id
GROUP BY u.id, u.name;
Теперь результат: 1 | Alice | 2 2 | Bob | 1 3 | Charlie | 0 💡 Вывод: Хочешь сохранить всех из "левой" таблицы — используй LEFT JOIN. А COUNT(о.id) не считает NULL — и это хорошо: ты получаешь реальное число заказов, а не просто 1 за NULL. @sqlhub

120 ключевых вопросов по SQL за 2025 год Статья содержит 120 ключевых вопросов по SQL для собеседований, разделённых по темам
120 ключевых вопросов по SQL за 2025 год Статья содержит 120 ключевых вопросов по SQL для собеседований, разделённых по темам и уровням сложности, с краткими пояснениями. Основываясь на актуальных требованиях 2025 года, вопросы охватывают базу данных, оптимизацию, практические задачи и нюансы СУБД (MySQL, PostgreSQL, SQL Server). 🔜 Подробности

🧪 uQLM — движок для SQL‑запросов к LLM, разработанный в CVS Health Что если к языковой модели можно обращаться как к обычной
🧪 uQLM — движок для SQL‑запросов к LLM, разработанный в CVS Health Что если к языковой модели можно обращаться как к обычной базе данных? 💡 uQLM (Universal Query Language for Models) позволяет писать SQL‑подобные запросы, чтобы: ✅ Обращаться к LLM как к таблице ✅ Фильтровать, агрегировать и комбинировать ответы ✅ Подключать собственные модели и источники данных ✅ Использовать привычный синтаксис SQL без prompt-инженерии 📌 Пример запроса:

SELECT generate_response(prompt) 
FROM gpt4 
WHERE prompt LIKE '%explain%' 
LIMIT 5;
uQLM работает как прослойка между пользователем и языковой моделью, облегчая интеграцию ИИ в аналитические пайплайны. 🔗 GitHub: https://github.com/cvs-health/uqlm @sqlhub

🔥 DbCls — мощный интерактивный клиент баз данных, который объединяет SQL-редактор с продвинутой визуализацией данных. Поддер
🔥 DbCls — мощный интерактивный клиент баз данных, который объединяет SQL-редактор с продвинутой визуализацией данных. Поддерживает MySQL, PostgreSQL, ClickHouse и SQLite. Встроенный редактор с подсветкой синтаксиса, автодополнением и горячими клавишами для мгновенного выполнения запросов. Результаты отображаются в интерактивных таблицах с возможностью форматирования и анализа. Идеальное решение для разработчиков и аналитиков данных, которым нужен быстрый и удобный доступ к базам данных ⚡️ Github @sqlhub

Продвинутый SQL-трюк: Как одним запросом вытащить только самую последнюю запись по каждой группе — и при этом сохранить все остальные поля Если ты хочешь, например, получить последний заказ по каждому клиенту, но у тебя нет оконных функций или ты хочешь максимально производительный запрос — вот чистый, понятный способ.

-- Найдём последнюю покупку по каждому customer_id
SELECT o.*
FROM orders o
JOIN (
    SELECT customer_id, MAX(order_date) AS max_date
    FROM orders
    GROUP BY customer_id
) latest
ON o.customer_id = latest.customer_id
AND o.order_date = latest.max_date;

-- Работает даже если в таблице десятки миллионов строк, индекс на order_date и customer_id ускорит запрос
@sqlhub

💡 Полезный SQL-трюк: как получить первую строку в каждой группе — без подзапросов и оконных функций (если они недоступны) Иногда нужно из каждой группы выбрать одну запись, например, самую раннюю по дате. Если у вас нет оконных функций (например, в старом MySQL), используйте трюк с GROUP BY и JOIN:

SELECT t1.*
FROM orders t1
JOIN (
  SELECT customer_id, MIN(order_date) AS min_date
  FROM orders
  GROUP BY customer_id
) t2 ON t1.customer_id = t2.customer_id AND t1.order_date = t2.min_date;
✅ Этот приём вытаскивает первую покупку каждого клиента без оконных функций. @sqlhub

Хочешь знать, что происходит внутри ИТ крупного банка? Команда ПСБ рассказывает о работе и жизни в блоке ИТ! 🔹 Знакомься с к
Хочешь знать, что происходит внутри ИТ крупного банка? Команда ПСБ рассказывает о работе и жизни в блоке ИТ!   🔹 Знакомься с командой, их проектами и хобби 🔹 Участвуй в активностях: митапы, конференции, спорт 🔹 Читай и комментируй экспертные статьи   Подписывайся на канал  ИТ ПСБ !

📊 GridDB — гибридная СУБД для IoT с поддержкой SQL и NoSQL. Этот проект предлагает необычное сочетание: ключ-значение хранил
📊 GridDB — гибридная СУБД для IoT с поддержкой SQL и NoSQL. Этот проект предлагает необычное сочетание: ключ-значение хранилище с возможностью SQL-запросов, что делает его удобным для промышленного IoT. Инструмент имеет встроенную поддержка временных рядов и распределённую архитектуру, оптимизированную под высокую нагрузку сенсорных данных. Система работает на Linux и предоставляет клиентские библиотеки для Java, Python, Go и других языков. Установка возможна через RPM/DEB-пакеты или сборку из исходников. Для управления есть CLI и WebAPI. 🤖 GitHub @sqlhub

⚡️ Replibyte — реалистичные данные для разработки без рисков. Инструмент для безопасного копирования продакшен-данных в тесто
⚡️ Replibyte — реалистичные данные для разработки без рисков. Инструмент для безопасного копирования продакшен-данных в тестовые окружения. Поддерживает PostgreSQL, MySQL и MongoDB, автоматически заменяя конфиденциальную информацию на правдоподобные фейковые значения. Инструмент умеет работать с большими БД (10+ ГБ), сжимать и шифровать данные на лету, а также масштабировать данные до разумного размера. Всё в одном бинарном файле без серверных компонентов. 🤖 GitHub @sqlhub