Data Science. SQL hub

Kanalga Telegram’da o‘tish

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya18 125 Texnologiyalar & Aralashmalar3 833...

📈 Telegram kanali Data Science. SQL hub analitikasi

Data Science. SQL hub (@sqlhub) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 35 853 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 3 833-o'rinni va Rossiya mintaqasida 18 125-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 35 853 obunachiga ega bo‘ldi.

12 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni 8 ga, so‘nggi 24 soatda esa -2 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 10.08% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 4.38% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 3 614 marta ko‘riladi; birinchi sutkada odatda 1 571 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 15 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent sql, индекс, postgres, index, sqlite kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 13 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

35 853

Obunachilar

-224 soatlar

-287 kunlar

+830 kunlar

3 614

Post ko'rishlar

~ 1 57124 soatlar

~ 1 85748 soatlar

10.08%

Muloqot nisbati

Ma'lumot yo'q

Kuniga postlar

Ads index

beta

Postlar arxiv

35 852

💡 Продвинутый SQL-совет: используйте partial indexes как «селективный ускоритель», но не только для WHERE — ещё и для JOIN-ов. Большинство разработчиков делают частичные индексы так: CREATE INDEX idx_active_users ON users(id) WHERE active = true; Но фишка в том, что partial index может радикально ускорить запросы, где фильтр стоит не в WHERE, а «прячется» в JOIN-условии. Оптимизатор всё равно понимает условие и использует индекс. Например, у вас есть таблица logs, где 95% строк — архив, и только 5% актуальные. Запрос делает join:


SELECT u.id, l.event
FROM users u
JOIN logs l ON l.user_id = u.id AND l.is_archived = false;

Если делать обычный индекс, он будет огромный. Но partial index:


CREATE INDEX idx_logs_active ON logs(user_id)
WHERE is_archived = false;

Теперь: - индекс в 20–30 раз меньше - cache hit rate выше - планы меняются с seq scan на index scan - JOIN начинает работать почти как в in-memory базе Прикольно, что работает даже если в SELECT самого условия нет — главное, чтобы оно было в ON. Это отличный способ ускорять «холодные» большие таблицы, где часто обращаются только к маленькому активному сегменту. @sqlhub

35 852

Что из перечисленного верно для DELAYED вставок в MySQL?

Anonymous voting

35 852

🌊📊 pg_lake: Postgres для Iceberg и хранилищ данных pg_lake позволяет интегрировать файлы Iceberg и хранилищ данных в PostgreSQL, превращая его в полноценную lakehouse-систему. Поддерживает транзакции и быстрые запросы к таблицам Iceberg, а также работу с сырыми данными из облачных хранилищ, таких как S3. 🚀Основные моменты: - Создание и модификация таблиц Iceberg с полными транзакционными гарантиями. - Запрос и импорт данных из файлов в форматах Parquet, CSV, JSON. - Экспорт результатов запросов обратно в облачные хранилища. - Поддержка геопространственных форматов через GDAL. - Использование встроенного типа данных для полуструктурированных данных. 📌 GitHub: https://github.com/Snowflake-Labs/pg_lake #postgresql

35 852

AIJ Deep Dive: специальный очный трек для AI-профи в рамках международной конференции AI Journey! Среда для профессионального роста, общение с экспертами мировой AI-индустрии и другими AI-профи — всё это ждёт вас на треке AIJ Deep Dive. В программе — только главные аспекты работы с AI: Это событие точно нельзя пропустить

1️⃣20 ноября — день Бизнеса: разберём успешные кейсы внедрения, оценим эффективность и практические результаты. 2️⃣ 21 ноября — день Науки: проведём глубокий анализ IT-решений, прорывных научных исследований, R&D-разработок и передовых методик.

На треке вас ждут выступления ведущих экспертов в AI, постер-сессия, специальные форматы для нетворкинга и выставка R’n’D решений. Это уникальная возможность обсудить сложные вопросы с теми, кто действительно понимает ваши вызовы. Где? Офис Сбера, Кутузовский проспект, д. 32, к. 1 (Е) Когда? 20–21 ноября 2025 года По ссылке — форма регистрации на очное участие. Присоединяйтесь к профессиональному AI-сообществу!

35 852

🧠 UnisonDB - экспериментальная база, которая убирает боль синхронизации в распределённых системах Главная идея простая, но мощная: все узлы хранят одно и то же состояние, и оно автоматически синхронизируется без конфликтов — даже оффлайн. Как это работает - Используются CRDT — структуры данных, которые сами разрешают конфликты - Вся система построена как event log (каждое изменение — событие) - Данные сначала пишутся локально, потом догоняют сеть - Нет «главного сервера» — каждый узел может быть источником истины Что это даёт - Мгновенные локальные обновления (даже без интернета) - Автоматическая консистентность без ручных merge - Идеально для приложений, которые должны работать оффлайн и в real-time Где это полезно - мобильные и edge-приложения - коллаборативные редакторы - распределённые системы без единого центра - автономные агенты и IoT Почему это интересно Это не просто база данных - это попытка пересобрать модель хранения данных под эпоху распределённого ПО, где сеть ненадёжна, а приложение должно всегда работать. https://github.com/ankur-anand/unisondb #databases #crdt #distributedSystems #eventSourcing #edgecomputing #backend #systemdesign

35 852

⚡Открытая трансляция главного зала HighLoad++ 2025! 🖐️ Подключайтесь и слушайте доклады от спикеров MTС Web Services (MWS), VK Tech, Яндекса, Т-Банка, СберТеха и других компаний. HighLoad++ 2025 — это конференция, которая определяет будущее высоконагруженных систем. 📍6 и 7 ноября все желающие могут бесплатно посмотреть онлайн-трансляцию главного зала. Открытую трансляцию мы организовали совместно с генеральным партнером конференции — МТС Web Services (MWS). МТС Web Services (MWS) — бигтех-компания, предоставляющая облачные и Al-сервисы, а также платформенные решения под задачи бизнеса: от работы с данными до разработки продуктов и оптимизации бизнес-процессов. Как всегда, в главном зале — топовые эксперты и самые актуальные темы. ✅ Подробности и расписание на сайте

35 852

🖥 Инструмент для мониторинга активности PostgreSQL Следит за запросами, блокировками, использованием памяти и CPU - помогает мгновенно понять, что происходит с базой в реальном времени. 💻 Устанавливается одной командой: sudo apt install pg-activity Работает как локально, так и по сети. Если запускать от postgres или root, открывается полная статистика - системные процессы, временные файлы и всё, что нужно для анализа нагрузки. https://github.com/dalibo/pg_activity

35 852

🖥 Шардирование в базах данных: обзор концепции Шардирование или шардинг - это принцип проектирования базы данных, при котором данные разбиваются на части и размещаются на разных шардах. Интерактивный лонгрид по шардированию баз данных. В нем разобрано все - от принципов работы шардов и причин, зачем это вообще нужно, до тонкостей проектирования и типовых ошибок. Каждый раздел сопровождается интерактивными диаграммами, с которыми можно экспериментировать прямо в статье. Отличный материал, чтобы прокачать понимание распределённых БД на выходных 💡 Статья: https://planetscale.com/blog/database-sharding Видео: https://www.youtube.com/watch?v=R2ML2jLs3_U

35 852

🖥 Полный гайд: защита от SQL-инъекций для разработчиков SQL-инъекции остаются одной из самых частых и опасных уязвимостей в веб-приложениях. Ошибка в одном запросе — и злоумышленник получает доступ к базе данных, паролям и пользовательским данным. В этом материале — полный практический разбор: как именно происходят SQL-инъекции, какие ошибки разработчиков к ним приводят, как их распознать в коде и главное — как защититься. Разберём реальные примеры на Python, PHP и Go, посмотрим, как атакующий «взламывает» запрос, и научимся писать безопасный код с параметризованными запросами и ORM. Это не теория, а руководство, которое поможет понять уязвимость изнутри и навсегда закрыть её в своих проектах. 👉 Читать гайд

35 852

🤖 Авито готовит к запуску собственного ИИ-ассистента «Ави» Технологическая платформа Авито подала заявку на регистрацию товарного знака для своего интеллектуального ассистента — «Ави», сообщает «Коммерсант». 🧩 Что умеет «Ави» построен на базе большой языковой модели и умеет вести живой диалог с пользователем. Он не просто отвечает на вопросы — ассистент помогает разобраться в деталях покупки, уточняет цели и критерии выбора, советует подходящие предложения и объясняет различия между ними. Фактически, это персональный консультант внутри платформы, который знает рынок лучше любого менеджера. 💡 Почему это важно Крупные компании одна за другой внедряют собственные ИИ-решения — это уже не эксперимент, а стратегия. Такие ассистенты позволяют: • собирать контекст из разговоров с пользователями, • повышать вовлеченность и лояльность, • увеличивать продажи. Эксперты оценивают вложения в проект примерно в 500 млн рублей. Но для Авито эти траты — часть планомерного развития: компания уже заявляла о планах инвестировать в развитие генеративного ИИ около 12 млрд рублей и к 2028 году заработать более 21 млрд на новых технологиях. Собственные модели компании уже можно оценить в деле — Авито выпустила две нейросети: • A-Vibe — текстовая LLM, • A-Vision — мультимодальная модель, работающая с текстом и изображениями. Их успех говорит сам за себя: A-Vibe за первую неделю собрала 1400+ скачиваний и попала в топ трендовых моделей на Hugging Face. 🚀 Что дальше Сейчас «Ави» проходит тесты в разных категориях площадки. В планах — уже в следующем году запустить универсальную версию, которая сможет работать во всех вертикалях Авито.

35 852

Не пропустите! 05 ноября в 20:00 пройдет бесплатный урок по теме “PostgreSQL для администраторов и разработчиков” по теме “Работа с json в PostgreSQL: давно не просто текст.” Запись: https://otus.pw/9EAE/ JSON в PostgreSQL — это не временное хак-решение, это инструмент, который меняет подход к хранению данных. Он позволяет хранить гибкие, меняющиеся структуры прямо в таблице и при этом использовать мощь SQL: фильтрацию, индексы и транзакции. На уроке вы увидите, как использовать JSON/JSONB так, чтобы не терять скорость и предсказуемость, но объединять удобство JSON-формата с производительностью и гарантиями PostgreSQL. Рассмотрим: - работу с типами данных JSON и JSONB в PostgreSQL. - изучим операторы и функции для работы с JSON-документами. - определим применение индексов и функций для повышения производительности при работе с JSONB. Какие результаты на выходе: - научитесь выбирать между реляционной моделью и использованием JSON в конкретном кейсе; - получите готовые примеры и шаблоны запросов для использования в проектах. Записывайтесь на вебинар и получит спец. предложение на обучение: https://otus.pw/9EAE/?erid=2W5zFGUaPy2 Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

35 852

⚡️ Вышел pgbalancer 1.0 - интеллектуальный балансировщик нагрузки для PostgreSQL Представлен первый стабильный релиз pgbalancer 1.0 — балансировщика нагрузки для PostgreSQL, построенного на основе pgpool-II с существенными доработками. Проект позиционируется как решение с элементами адаптивной маршрутизации запросов, управляемое через REST API и поддерживающее MQTT для потоковой передачи событий в реальном времени. Ключевые особенности: • Управление пулом соединений и распределение нагрузки между репликами PostgreSQL; •Поддержка HTTP/REST для конфигурации и мониторинга; • Интеграция с MQTT для стриминга метрик и событий; • Реализация на языке C с сохранением производительности оригинального pgpool-II; • Распространяется под открытой лицензией PostgreSQL. https://www.pgelephant.com/pgbalancer

35 852

🪄 Открытая альтернатива Firebase — на стероидах PostgreSQL Платформа, которая даёт всё, чтобы собрать современное веб-, мобильное или AI-приложение — без проприетарных SDK и боли. Что внутри: ⚙️ Хостинг Postgres с realtime-синхронизацией 🧩 Автогенерация REST и GraphQL API 🔐 Аутентификация и авторизация через JWT ⚡ Edge-функции и серверные триггеры 📦 Хранилище файлов с поддержкой S3 🧠 AI-инструменты: векторные индексы, эмбеддинги, семантический поиск 🪶 Всё open source и доступно для self-host. По сути это Firebase-опыт, но построенный на «взрослых» open-source технологиях: PostgreSQL, Elixir, GoTrue, PostgREST, pg_graphql. Платформа, где можно запустить идею, вырастить продукт и не упереться в чьи-то закрытые лимиты. #Postgres #OpenSource #Backend #AI #GraphQL #Realtime #FirebaseAlternative https://github.com/supabase/supabase

35 852

Для многих разработчиков моменты, когда они пишут код не по работе, а для профессионального вызова, становятся ключевыми в их росте. Именно таким вызовом может стать Yandex Cup 2025 — чемпионат, где встречаются сильнейшие разработчики, и один из треков которого посвящён машинному обучению.

Здесь реальные задачи, близкие к тому, с чем сталкиваются инженеры в продакшне: ограничения по ресурсам, шумные данные, необходимость найти баланс между скоростью и качеством.

Участие — способ не просто проверить свои навыки, но и заявить о себе в профессиональном сообществе. Лучшие участники получают приглашения на упрощённый отбор в команды Яндекса.

Финал пройдёт в Стамбуле, призовой фонд — 12 млн ₽. Регистрация заканчивается совсем скоро. Если вы чувствуете, что готовы выйти за пределы привычных задач — самое время. 💡 yandex.ru/cup/2025

35 852

🚀 Удобный инструмент для миграции схем PostgreSQL pgschema — это CLI утилита, которая упрощает процесс миграции схем в PostgreSQL, используя декларативный подход, похожий на Terraform. Она позволяет создавать, редактировать и применять изменения к схемам, обеспечивая контроль над миграциями без необходимости в дополнительных таблицах. 🚀 Основные моменты: - Декларативное управление схемами PostgreSQL - Поддержка всех основных объектов и версий PostgreSQL - Генерация плана миграции с предварительным просмотром изменений - Прямое взаимодействие с файлами схем и базой данных без временных БД 📌 GitHub: https://github.com/pgschema/pgschema #go

35 852

🚀 Современный ORM и генератор SQL для C++20 sqlgen — это типобезопасный ORM и генератор SQL, вдохновленный SQLAlchemy и Diesel. Он обеспечивает компоновку запросов с проверкой типов на этапе компиляции и защитой от SQL-инъекций, что делает его идеальным для создания надежных ETL-пайплайнов. 🚀Основные моменты: - 🔒 Компиляция с проверкой схем таблиц и запросов - 🛡️ Защита от SQL-инъекций с параметризованными запросами - 🔄 Удобный интерфейс для составления сложных запросов - 🚀 Высокая производительность с пакетными операциями - 📦 Поддержка PostgreSQL и SQLite 📌 GitHub: https://github.com/getml/sqlgen #cpp

35 852

🖥 pg_flo — библиотека для работы с PostgreSQL, которая упрощает создание и выполнение потоковых операций в базе данных! Она также предоставляет удобный интерфейс для выполнения операций с данными, что может быть полезно для задач, требующих последовательной обработки данных. 🔐 Лицензия: Apache-2.0 🖥 Github @sqlhub

35 852

⚡️ Pytest совет: экономим время на тестах с большими данными Если в тестах используется тяжёлый датасет, важно правильно выбрать scope для фикстуры. ❌ По умолчанию (`scope="function"`) данные будут загружаться заново для каждого теста. Это тратит ресурсы и замедляет выполнение. ✅ С scope="session" датасет загружается один раз и переиспользуется во всех тестах. Это ускоряет процесс и снижает нагрузку. Используйте session scope для больших и неизменяемых данных, чтобы тесты работали быстрее и стабильнее.

35 852

🔍 Marker — инструмент от Datalab.to, который быстро и точно превращает документы в Markdown + JSON Что умеет Marker: - Поддержка PDF, изображений, PPTX, DOCX, XLSX, HTML, EPUB и др. - Форматирует таблицы, формы, уравнения, математические выражения, ссылки, кодовые блоки. - Извлекает изображения из документов. - Убирает колонтитулы, заголовки, другие артефакты форматирования. - Есть бета-версия для “структурированного извлечения” на основе схемы JSON. - Можно включить LLM-модуль, чтобы повысить точность в сложных местах (например, объединение таблиц, корректное форматирование). Преимущества: - Быстрота + точность по сравнению с конкурентами (Mathpix, Llamaparse и др.). - Работает и без LLM, но с флагом --use_llm становится ещё лучше. - Можно запускать локально, на серверах, GPU / CPU, использовать параллельную обработку. Ограничения и нюансы: - Сложные макеты и вложенные таблицы / формы ещё не всегда обрабатываются идеально. - Иногда требуется OCR, особенно если PDF плохо “разложен” на текст. Кому полезно: - Тем, кто работает с научными статьями, отчётами, бухгалтерскими документами, презентациями и хочет автоматизировать преобразование в читаемый формат. - Для RAG-pipelines, документации и любых задач, где надо извлечь структуру и контент. https://github.com/datalab-to/marker

35 852

🔥 no-code база данных, которая сама превращает SQL в Airtable-стиль интерфейс Что умеет: - Подключается к MySQL, Postgres, SQLite, MSSQL и сразу показывает данные в виде удобных таблиц - Делает представления: таблицы, календари, канбан, формы, Гантт - Генерирует готовые REST и GraphQL API прямо поверх базы - Делится видами: публично или под паролем, поддерживает загрузку файлов и картинок - Настраивает роли и доступ до уровня отдельного столбца Плюс интеграции со Slack, Discord, мессенджерами, почтой и десятками сервисов. По сути — Airtable, но напрямую поверх твоей базы. https://github.com/nocodb/nocodb