Data Science. SQL hub

Open in Telegram

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

Network:Machinelearning Russia18 125 Technologies & Applications3 833...

📈 Analytical overview of Telegram channel Data Science. SQL hub

Channel Data Science. SQL hub (@sqlhub) in the Russian language segment is an active participant. Currently, the community unites 35 857 subscribers, ranking 3 833 in the Technologies & Applications category and 18 125 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 35 857 subscribers.

According to the latest data from 12 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by 8 over the last 30 days and by -2 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 10.08%. Within the first 24 hours after publication, content typically collects 4.38% reactions from the total number of subscribers.
Post reach: On average, each post receives 3 614 views. Within the first day, a publication typically gains 1 571 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 15.
Thematic interests: Content is focused on key topics such as sql, индекс, postgres, index, sqlite.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ”

Thanks to the high frequency of updates (latest data received on 13 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

35 857

Subscribers

-224 hours

-287 days

+830 days

3 614

Post views

~ 1 57124 hours

~ 1 85748 hours

10.08%

Engagement rate

No data

Posts per day

Ads index

beta

Posts Archive

35 859

Типичная работа с ИИ? — Зачем ты удалил продакшн-базу данных? — Ты абсолютно прав!

35 859

Трюк дня. Сравнение с предыдущим. Решение. Решение: использование

DATEDIFF

DATEDIFF

: эта функция вычисляет разницу между двумя датами. Она используется для того, чтобы обеспечить сравнение именно «сегодняшних» и «вчерашних» температур. Если сформулировать обычным языком следующий запрос, то окажется, что он выражает следующую идею: нужно выбрать такие идентификаторы, чтобы температура, соответствующая представляемым ими датам, была бы больше, чем температура на «вчерашние» по отношению к ним даты.

SELECT DISTINCT a.Id
FROM Weather a, Weather b
WHERE a.Temperature > b.Temperature
AND DATEDIFF(a.Recorddate, b.Recorddate) = 1

#tips

35 859

Как ROSTIC'S ускорили аналитику в 3 раза: кейс от Яндекса Yandex B2B Tech выпустила «Техно на прокачку» — шоу, где показывают работу платформы данных на примере сети ROSTIC'S. Суть проекта: • Еженедельно рестораны генерируют больше 100 Гб данных: чеки, транзакции, история заказов • Чтобы бизнес получал аналитику без задержек, внедрили платформу данных от Яндекса • Отчеты теперь загружаются в 3 раза быстрее В шоу разобрали архитектуру решения: от интеграции касс и терминалов до managed-сервисов для опенсорсных баз данных. А комик Егор Кукса в роли «гуру успеха» проверяет инженеров на прочность и предлагает свои надежные, но не очень технологичные решения, от мотивационных речей до флешки деверя. Посмотреть как это было уже можно на YouTube, VK Видео или Кинопоиске.

35 859

У вас есть таблица sales с колонками country, product, amount. Как получить общий объем продаж для каждого продукта и для каждой страны, а также общую сумму продаж для всех стран и продуктов?

Anonymous voting

35 859

🐘 Бесплатная конференция по PostgreSQL — Москва, 19 марта PG BootCamp Russia 2026 — комьюнити-конференция российского сообщества PostgreSQL с подтвержденным официальным международным статусом. Мероприятие бесплатное, онлайн+офлайн, ориентировано на администраторов БД, разработчиков, инженеров, аналитиков, архитекторов. Эксперты из Tantor, Яндекс, СберТех, Тензор, Хи-квадрат, Luxms BI и других компаний выступят по темам, связанным с разработкой, эксплуатацией и взаимодействием PostgreSQL с другими системами. В предварительной программе:

📎Решение застарелых архитектурных проблем PostgreSQL для современных нагрузок и масштабирования 📎Временные таблицы для Postgres. Почему это важно для платформы 1С и что можно улучшить? 📎Разделение Compute и Storage: архитектурный прорыв для PostgreSQL в облаке 📎Опыт вынесения OLAP-нагрузки на реплику 📎Highload "из ниоткуда": когда проблема не в СУБД, а в клиентской архитектуре 📎Опыт эксплуатации, проблемы и производительность PostgreSQL на Эльбрус, Baikal-S, Loongson, Repka Pi, x86 📎Поиск проблем планирования запросов до их воздействия на производительность 📎Тестирование, баги и уроки работы с патчем 64-битного счетчика транзакций PostgreSQL 📎Работа с логами PostgreSQL 📎…и другие (всего 25 выступлений)

🗓 19 марта 📍 Москва, офлайн + онлайн ➡️ БЕСПЛАТНАЯ РЕГИСТРАЦИЯ

35 859

Ва

35 859

Repost from Machinelearning

🌟 Nemotron-Terminal: небольшое семейство для терминальных задач. NVIDIA обучила семейство моделей Nemotron-Terminal для автономной работы в терминале Linux: устанавливать зависимости, писать и запускать код, отлаживать окружения и выполнять сквозные инженерные задачи без участия человека. Семейство построено на базе Qwen3 и специально собранном датасете Terminal-Corpus. И фишка не в архитектуре, а в данных. 🟡NVIDIA собрала пайплайн Terminal-Task-Gen с 2 потоками. Первый адаптирует готовые датасеты по математике, коду и SWE-задачам под терминальный формат (без участия LLM в процессе адаптации). Второй генерирует синтетику 2 методами: seed-based (LLM создает новые задачи на основе существующих задач из смежных областей) и skill-based (LLM комбинирует до пяти примитивных навыков из таксономии по 9 доменам: Security, Data Science, System Administration и другим). 🟡В открытый релиз вошли все три модели на 8B, 14B, 32B параметров и 2 датасета:

Terminal-Corpus: около 366K траекторий выполнения задач, разбитых на два потока: ~226K адаптированных примеров из Math/Code/SWE и ~140K синтетических задач на основе skill-таксономии. Synthetic-Tasks: задачи в стандартизированном формате: инструкция, Docker-окружение из 9 преднастроенных образов и верификационный набор на pytest.

🟡Результаты прогонов на бенчах. На Terminal-Bench 2.0 все 3 модели показали кратный рост относительно базовой Qwen3: 8B - с 2.5% до 13%, 14B - с 4% до 20.2%, 32B - с 3.4% до 27.4%.

Для сравнения: Qwen3-Coder на 480B параметров набирает 23.9%, GPT-5-Mini - 24.0%, Grok 4 - 23.1%. Nemotron-Terminal-32B превосходит или вплотную конкурирует с ними всеми при разнице в размере на порядок.

🟡Несколько внезапных выводов из абляции. Фильтрация неудачных траекторий вредит. Модель, обученная на всех траекториях включая ошибочные, набирает 12.4% против 5.06% у варианта только с успешными. Curriculum learning (сначала простые данные, потом сложные) не дал преимуществ перед простым смешанным обучением. Увеличение контекстного окна с 32K до 65K токенов также не помогло, длинные траектории оказались шумнее. 📌Лицензирование моделей: NVIDIA Open Model License 📌Лицензирование датасетов : CC-BY-4.0 License. 🟡Набор моделей 🟡Arxiv @ai_machinelearning_big_data #AI #ML #LLM #NemotronTerminal #NVIDIA

35 859

Ваши дашборды грузятся по минуте? SQL-запросы «падают» на продакшене, а бизнес требует отчеты «еще вчера»? Руководители команд аналитики и senior-разработчики знают: узкое место — не мощность сервера, а эффективность кода и архитектуры запросов. Прокачайте скорость - получите бесплатно урок «Аналитика без тормозов» от Георгия Семенова, руководителя команды Analytics Engineering в Яндексе с 14-летним опытом (экс-VK, Wildberries, ВТБ). Вы узнаете: 🔸Тактические и стратегические методы ускорения запросов и дашбордов, применимые к любой СУБД 🔸Специфические нюансы оптимизации, которые отличают middle от senior. Но это не всё. Мы понимаем: результат дает прокачка всей команды и внедрение знаний в конкретные рабочие задачи. Для руководителей отделов аналитики: хотите масштабировать этот эффект? Симулейтив предлагает корпоративное обучение под ключ:

🔸Преподаватели-практики из “биг-теха” адаптируют программу под ваши бизнес-задачи 🔸Индивидуальный итоговый проект каждого сотрудника строится на его реальной рабочей задаче 🔸Бессрочная поддержка преподавателей и доступ к закрытым мастер-классам 🔸Выгода до 30% при пакетном обучении команды

Примените практику из бесплатного урока уже сегодня, а затем внедрите её в работу всего отдела аналитики - сделайте шаг, чтобы ваши процессы полетели: ТРЕНИНГ ПО SQL

35 859

🚀 SQLite, у которой недавно вышел новый релиз, имеет один из самых необычных Code of Ethics во всей индустрии. История появления документа довольно забавная. Некоторым компаниям, использующим SQLite, требовалось указывать ссылку на Code of Conduct в своих внутренних политиках. Тогда разработчики SQLite просто решили сделать собственный кодекс, но очень нестандартным способом. Вместо привычного корпоративного CoC они взяли «Правило святого Бенедикта» - монашеский свод принципов VI века и сделали его основой своего кодекса. Вот несколько первых пунктов: - Прежде всего возлюби Господа Бога всем своим сердцем, всей душой и всей силой - Затем возлюби ближнего своего как самого себя - Не убивай - Не прелюбодействуй - Не кради - Не желай чужого - Не лжесвидетельствуй - Почитай всех людей - Не делай другим того, чего не хотел бы для себя Всего таких правил - 72, и читаются они скорее как философские или духовные принципы, чем как стандартный документ для open-source проекта. И важная деталь: этот кодекс — обещание самих разработчиков SQLite, а не требования к пользователям или сообществу. То есть разработчики просто говорят: *мы будем придерживаться этих принципов в работе с вами*. В мире, где Code of Conduct обычно выглядит как длинный юридический документ, SQLite выбрала… правила монастыря VI века. sqlite.org/codeofethics.html

35 859

В основе любого сильного проекта стоит сильный специалист. В IT-мире сложно представить востребованного специалиста, который не разбирается в том, как работают: архитектура, API, базы данных, алгоритмы. Без этого никуда. И не страшно, если вы пока плохо разбираетесь в каких-то современных системах. Хуже, если продолжаете игнорировать свои пробелы в hard skills. Начните с бесплатных уроков по архитектуре и интеграциям: ▪️мощный инструмент — SOAP UI ▪️подробное описание процесса загрузки сайта ▪️модель TCP/IP и устройства ▪️XML — это вам не ХSD Присоединяйтесь в чат-боте по ссылке: 👇 @studyit_help_bot 🚀 Скидка на полный курс от канала — 1 500 ₽ на Stepik по промокоду SQLHUB до конца февраля.

35 859

Вы выполнили серию операций в рамках одной транзакции (изменили несколько строк). Как отменить все эти изменения?

Anonymous voting

35 859

🔥 Zero-cost поиск для AI-приложений — идея из turbopuffer Большинство систем поиска и векторных БД сегодня очень дорогие. Причина простая, они хранят данные в RAM или реплицированных SSD, где стоимость может доходить до $600–$3600 за TB в месяц. Но turbopuffer предлагает другой подход. Хранить данные не в памяти серверов, а в object storage (например S3 или GCS). Стоимость: - RAM + SSD инфраструктура - до $3600/TB - SSD-кластеры - около $600/TB - Object storage (S3) - примерно $20/TB - Разница может достигать до 100× дешевле для холодных данных. 📌 Архитектура turbopuffer:

Client  
↓  
Query layer  
↓  
SSD / memory cache (горячие данные)  
↓  
Object storage (источник истины)

То есть: - холодные данные хранятся дешево в object storage - часто используемые попадают в SSD или RAM cache - запросы остаются быстрыми (<100ms), но стоимость инфраструктуры падает на порядок Vector search становится ключевой частью AI-систем: - RAG - AI-ассистенты - semantic search - recommendation systems Но именно retrieval слой часто становится самой дорогой частью AI-инфраструктуры. Архитектура turbopuffer показывает, что: > дешевый storage + умный cache > может заменить дорогие memory-based search системы. Будущее AI-поиска может выглядеть так: - object storage как источник данных - stateless compute - дешёвый storage - кэш для hot data И тогда поиск по миллиардам документов становится почти “zero-cost” инфраструктурой. Подробнее: https://turbopuffer.com/blog/zero-cost

35 859

Модель с триллионом параметров буквально «удалила половину своего мозга» и стала умнее. Yuan3.0 Ultra**-— новая open-source мультимодальная **MoE-модель от Yuan Lab. Всего 1010 млрд параметров, но при инференсе активны только 68.8 млрд. На бенчмарках RAG она обошла GPT-5.2, Gemini 3.1 Pro и Claude Opus 4.6 с заметным отрывом. Например: - 67.4% на Docmatix против 56.8% у GPT-4o Что умеет модель: - Enterprise RAG - 68.2% средней точности на 10 задачах поиска - Анализ сложных таблиц - 62.3% на бенчмарке MMTab - Text-to-SQL - 83.9% на Spider 1.0 - Мультимодальный анализ документов с контекстом 64K Ключевая инновация — Layer-Adaptive Expert Pruning (LAEP). Во время предобучения у MoE возникает сильный дисбаланс: некоторые эксперты получают в 500 раз больше токенов, чем другие. LAEP постепенно удаляет малоиспользуемых экспертов слой за слоем, что позволяет: - сократить 33% параметров - увеличить эффективность обучения на 49% Также исследователи улучшили метод “fast-thinking” RL. Теперь система больше награждает ответы, которые: - правильные - используют меньше шагов рассуждения Это позволило: - уменьшить количество выходных токенов на 14.38% - повысить точность на 16.33% Главный сигнал из этого исследования: MoE-модели начинают сжимать себя прямо во время обучения, а не после. Если pruning станет частью pretraining, стоимость обучения триллионных моделей может резко снизиться. https://github.com/Yuan-lab-LLM/Yuan3.0-Ultra

35 859

ReadySet — это прозрачный кэш базы данных для Postgres и MySQL, который обеспечивает производительность и масштабируемость хранилища «ключ-значение» в оперативной памяти, не требуя от вас переписывать приложение или вручную обрабатывать аннулирование кэша. https://github.com/readysettech/readyset

35 859

У вас есть две таблицы: users (ID, name) и orders (user_id, amount). Какой тип JOIN вернёт всех пользователей, включая тех, у которых нет заказов?

Anonymous voting

35 859

Docker и Kubernetes: основы разработки под облачную инфраструктуру Курс для тех, кто хочет держать свой стэк и знания актуальными и глубоко разбираться, как устроены Docker, Kubernetes, и современная облачная инфраструктура в целом. 🌐 Чему вы научитесь: 🤩 Создавать облачную инфраструктуру «с нуля» управление и конфигурация серверов с Terraform, Ansible, cloud‑init 🤩 Уверенно работать с Docker: Dockerfile, слои, кэш, многоступенчатые сборки, реестры, безопасность, air‑gapped 🤩 Проектировать многоконтейнерные приложения: паттерны Sidecar, Ambassador, Adapter, проверки (liveness/readiness), DaemonSet и поды 🤩 Настраивать сеть и балансировку в Kubernetes ClusterIP, Services, Ingress, MetalLB, TLS/SNI, сервис‑меши (Istio) 🤩 Организовывать хранение данных: PersistentVolumes / PVC, StorageClasses, резервное копирование. Упаковка в Helm и поддержка через Operator 🥸 Кто мы: R&D-центр Devhands. Автор курса — Николай Ихалайнен, эксперт по СУБД и бекенду (ex-Percona), со-основатель MyDB, энтузиаст открытого ПО. 🗓 Старт курса: 25 февраля, 6 недель обучения. Изучить программу и записаться можно здесь. Ждем вас! Реклама. ИП Рыбак А.А. ИНН 771407709607 Erid: 2Vtzqwp4TvC

35 859

UPDATE без WHERE - самый быстрый способ обновить резюме. @sqlhub

35 859

👣 Большинство изучают Go ради синтаксиса. Ты научишься писать сервисы, которые работают в продакшене. Это не про «Hello, World» и горутины ради галочки. Это про бэкенд на Go, который: * выдерживает нагрузку * обрабатывает тысячи запросов одновременно * работает быстро и стабильно * легко масштабируется * выглядит как реальный сервис, а не учебный проект Ты начнёшь видеть Go не как язык, а как инструмент для построения систем. В итоге ты сможешь: * писать высоконагруженные API * создавать микросервисы * работать с базами данных и очередями * разбираться в конкурентности и производительности * брать коммерческие backend-проекты Это навык, который ценится на рынке. Не «знаю Go», а умею делать быстрые и надёжные сервисы. 🎁 48 часов скидка 50% на Stepik: https://stepik.org/a/274119/