Data Science. SQL hub

Ir al canal en Telegram

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

Red:Machinelearning Rusia18 125 Tecnologías y Aplicaciones3 833...

📈 Análisis del canal de Telegram Data Science. SQL hub

El canal Data Science. SQL hub (@sqlhub) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 35 853 suscriptores, ocupando la posición 3 833 en la categoría Tecnologías y Aplicaciones y el puesto 18 125 en la región Rusia.

📊 Métricas de audiencia y dinámica

Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 35 853 suscriptores.

Según los últimos datos del 12 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de 8, y en las últimas 24 horas de -2, conservando un alto alcance.

Estado de verificación: No verificado
Tasa de interacción (ER): El promedio de interacción de la audiencia es 10.08%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 4.38% de reacciones respecto al total de suscriptores.
Alcance de las publicaciones: Cada publicación recibe en promedio 3 614 visualizaciones. En el primer día suele acumular 1 571 visualizaciones.
Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 15.
Intereses temáticos: El contenido se centra en temas clave como sql, индекс, postgres, index, sqlite.

📝 Descripción y política de contenido

El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ”

Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 13 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.

35 853

Suscriptores

-224 horas

-287 días

+830 días

3 614

Visitas de la publicación

~ 1 57124 horas

~ 1 85748 horas

10.08%

Tasa de compromiso

Sin datos

Mensajes por día

Ads index

beta

Archivo de publicaciones

35 852

💡 Продвинутый SQL-совет: используйте partial indexes как «селективный ускоритель», но не только для WHERE — ещё и для JOIN-ов. Большинство разработчиков делают частичные индексы так: CREATE INDEX idx_active_users ON users(id) WHERE active = true; Но фишка в том, что partial index может радикально ускорить запросы, где фильтр стоит не в WHERE, а «прячется» в JOIN-условии. Оптимизатор всё равно понимает условие и использует индекс. Например, у вас есть таблица logs, где 95% строк — архив, и только 5% актуальные. Запрос делает join:


SELECT u.id, l.event
FROM users u
JOIN logs l ON l.user_id = u.id AND l.is_archived = false;

Если делать обычный индекс, он будет огромный. Но partial index:


CREATE INDEX idx_logs_active ON logs(user_id)
WHERE is_archived = false;

Теперь: - индекс в 20–30 раз меньше - cache hit rate выше - планы меняются с seq scan на index scan - JOIN начинает работать почти как в in-memory базе Прикольно, что работает даже если в SELECT самого условия нет — главное, чтобы оно было в ON. Это отличный способ ускорять «холодные» большие таблицы, где часто обращаются только к маленькому активному сегменту. @sqlhub

35 852

Что из перечисленного верно для DELAYED вставок в MySQL?

Anonymous voting

35 852

🌊📊 pg_lake: Postgres для Iceberg и хранилищ данных pg_lake позволяет интегрировать файлы Iceberg и хранилищ данных в PostgreSQL, превращая его в полноценную lakehouse-систему. Поддерживает транзакции и быстрые запросы к таблицам Iceberg, а также работу с сырыми данными из облачных хранилищ, таких как S3. 🚀Основные моменты: - Создание и модификация таблиц Iceberg с полными транзакционными гарантиями. - Запрос и импорт данных из файлов в форматах Parquet, CSV, JSON. - Экспорт результатов запросов обратно в облачные хранилища. - Поддержка геопространственных форматов через GDAL. - Использование встроенного типа данных для полуструктурированных данных. 📌 GitHub: https://github.com/Snowflake-Labs/pg_lake #postgresql

35 852

AIJ Deep Dive: специальный очный трек для AI-профи в рамках международной конференции AI Journey! Среда для профессионального роста, общение с экспертами мировой AI-индустрии и другими AI-профи — всё это ждёт вас на треке AIJ Deep Dive. В программе — только главные аспекты работы с AI: Это событие точно нельзя пропустить

1️⃣20 ноября — день Бизнеса: разберём успешные кейсы внедрения, оценим эффективность и практические результаты. 2️⃣ 21 ноября — день Науки: проведём глубокий анализ IT-решений, прорывных научных исследований, R&D-разработок и передовых методик.

На треке вас ждут выступления ведущих экспертов в AI, постер-сессия, специальные форматы для нетворкинга и выставка R’n’D решений. Это уникальная возможность обсудить сложные вопросы с теми, кто действительно понимает ваши вызовы. Где? Офис Сбера, Кутузовский проспект, д. 32, к. 1 (Е) Когда? 20–21 ноября 2025 года По ссылке — форма регистрации на очное участие. Присоединяйтесь к профессиональному AI-сообществу!

35 852

🧠 UnisonDB - экспериментальная база, которая убирает боль синхронизации в распределённых системах Главная идея простая, но мощная: все узлы хранят одно и то же состояние, и оно автоматически синхронизируется без конфликтов — даже оффлайн. Как это работает - Используются CRDT — структуры данных, которые сами разрешают конфликты - Вся система построена как event log (каждое изменение — событие) - Данные сначала пишутся локально, потом догоняют сеть - Нет «главного сервера» — каждый узел может быть источником истины Что это даёт - Мгновенные локальные обновления (даже без интернета) - Автоматическая консистентность без ручных merge - Идеально для приложений, которые должны работать оффлайн и в real-time Где это полезно - мобильные и edge-приложения - коллаборативные редакторы - распределённые системы без единого центра - автономные агенты и IoT Почему это интересно Это не просто база данных - это попытка пересобрать модель хранения данных под эпоху распределённого ПО, где сеть ненадёжна, а приложение должно всегда работать. https://github.com/ankur-anand/unisondb #databases #crdt #distributedSystems #eventSourcing #edgecomputing #backend #systemdesign

35 852

⚡Открытая трансляция главного зала HighLoad++ 2025! 🖐️ Подключайтесь и слушайте доклады от спикеров MTС Web Services (MWS), VK Tech, Яндекса, Т-Банка, СберТеха и других компаний. HighLoad++ 2025 — это конференция, которая определяет будущее высоконагруженных систем. 📍6 и 7 ноября все желающие могут бесплатно посмотреть онлайн-трансляцию главного зала. Открытую трансляцию мы организовали совместно с генеральным партнером конференции — МТС Web Services (MWS). МТС Web Services (MWS) — бигтех-компания, предоставляющая облачные и Al-сервисы, а также платформенные решения под задачи бизнеса: от работы с данными до разработки продуктов и оптимизации бизнес-процессов. Как всегда, в главном зале — топовые эксперты и самые актуальные темы. ✅ Подробности и расписание на сайте

35 852

🖥 Инструмент для мониторинга активности PostgreSQL Следит за запросами, блокировками, использованием памяти и CPU - помогает мгновенно понять, что происходит с базой в реальном времени. 💻 Устанавливается одной командой: sudo apt install pg-activity Работает как локально, так и по сети. Если запускать от postgres или root, открывается полная статистика - системные процессы, временные файлы и всё, что нужно для анализа нагрузки. https://github.com/dalibo/pg_activity

35 852

🖥 Шардирование в базах данных: обзор концепции Шардирование или шардинг - это принцип проектирования базы данных, при котором данные разбиваются на части и размещаются на разных шардах. Интерактивный лонгрид по шардированию баз данных. В нем разобрано все - от принципов работы шардов и причин, зачем это вообще нужно, до тонкостей проектирования и типовых ошибок. Каждый раздел сопровождается интерактивными диаграммами, с которыми можно экспериментировать прямо в статье. Отличный материал, чтобы прокачать понимание распределённых БД на выходных 💡 Статья: https://planetscale.com/blog/database-sharding Видео: https://www.youtube.com/watch?v=R2ML2jLs3_U

35 852

🖥 Полный гайд: защита от SQL-инъекций для разработчиков SQL-инъекции остаются одной из самых частых и опасных уязвимостей в веб-приложениях. Ошибка в одном запросе — и злоумышленник получает доступ к базе данных, паролям и пользовательским данным. В этом материале — полный практический разбор: как именно происходят SQL-инъекции, какие ошибки разработчиков к ним приводят, как их распознать в коде и главное — как защититься. Разберём реальные примеры на Python, PHP и Go, посмотрим, как атакующий «взламывает» запрос, и научимся писать безопасный код с параметризованными запросами и ORM. Это не теория, а руководство, которое поможет понять уязвимость изнутри и навсегда закрыть её в своих проектах. 👉 Читать гайд

35 852

🤖 Авито готовит к запуску собственного ИИ-ассистента «Ави» Технологическая платформа Авито подала заявку на регистрацию товарного знака для своего интеллектуального ассистента — «Ави», сообщает «Коммерсант». 🧩 Что умеет «Ави» построен на базе большой языковой модели и умеет вести живой диалог с пользователем. Он не просто отвечает на вопросы — ассистент помогает разобраться в деталях покупки, уточняет цели и критерии выбора, советует подходящие предложения и объясняет различия между ними. Фактически, это персональный консультант внутри платформы, который знает рынок лучше любого менеджера. 💡 Почему это важно Крупные компании одна за другой внедряют собственные ИИ-решения — это уже не эксперимент, а стратегия. Такие ассистенты позволяют: • собирать контекст из разговоров с пользователями, • повышать вовлеченность и лояльность, • увеличивать продажи. Эксперты оценивают вложения в проект примерно в 500 млн рублей. Но для Авито эти траты — часть планомерного развития: компания уже заявляла о планах инвестировать в развитие генеративного ИИ около 12 млрд рублей и к 2028 году заработать более 21 млрд на новых технологиях. Собственные модели компании уже можно оценить в деле — Авито выпустила две нейросети: • A-Vibe — текстовая LLM, • A-Vision — мультимодальная модель, работающая с текстом и изображениями. Их успех говорит сам за себя: A-Vibe за первую неделю собрала 1400+ скачиваний и попала в топ трендовых моделей на Hugging Face. 🚀 Что дальше Сейчас «Ави» проходит тесты в разных категориях площадки. В планах — уже в следующем году запустить универсальную версию, которая сможет работать во всех вертикалях Авито.

35 852

Не пропустите! 05 ноября в 20:00 пройдет бесплатный урок по теме “PostgreSQL для администраторов и разработчиков” по теме “Работа с json в PostgreSQL: давно не просто текст.” Запись: https://otus.pw/9EAE/ JSON в PostgreSQL — это не временное хак-решение, это инструмент, который меняет подход к хранению данных. Он позволяет хранить гибкие, меняющиеся структуры прямо в таблице и при этом использовать мощь SQL: фильтрацию, индексы и транзакции. На уроке вы увидите, как использовать JSON/JSONB так, чтобы не терять скорость и предсказуемость, но объединять удобство JSON-формата с производительностью и гарантиями PostgreSQL. Рассмотрим: - работу с типами данных JSON и JSONB в PostgreSQL. - изучим операторы и функции для работы с JSON-документами. - определим применение индексов и функций для повышения производительности при работе с JSONB. Какие результаты на выходе: - научитесь выбирать между реляционной моделью и использованием JSON в конкретном кейсе; - получите готовые примеры и шаблоны запросов для использования в проектах. Записывайтесь на вебинар и получит спец. предложение на обучение: https://otus.pw/9EAE/?erid=2W5zFGUaPy2 Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

35 852

⚡️ Вышел pgbalancer 1.0 - интеллектуальный балансировщик нагрузки для PostgreSQL Представлен первый стабильный релиз pgbalancer 1.0 — балансировщика нагрузки для PostgreSQL, построенного на основе pgpool-II с существенными доработками. Проект позиционируется как решение с элементами адаптивной маршрутизации запросов, управляемое через REST API и поддерживающее MQTT для потоковой передачи событий в реальном времени. Ключевые особенности: • Управление пулом соединений и распределение нагрузки между репликами PostgreSQL; •Поддержка HTTP/REST для конфигурации и мониторинга; • Интеграция с MQTT для стриминга метрик и событий; • Реализация на языке C с сохранением производительности оригинального pgpool-II; • Распространяется под открытой лицензией PostgreSQL. https://www.pgelephant.com/pgbalancer

35 852

🪄 Открытая альтернатива Firebase — на стероидах PostgreSQL Платформа, которая даёт всё, чтобы собрать современное веб-, мобильное или AI-приложение — без проприетарных SDK и боли. Что внутри: ⚙️ Хостинг Postgres с realtime-синхронизацией 🧩 Автогенерация REST и GraphQL API 🔐 Аутентификация и авторизация через JWT ⚡ Edge-функции и серверные триггеры 📦 Хранилище файлов с поддержкой S3 🧠 AI-инструменты: векторные индексы, эмбеддинги, семантический поиск 🪶 Всё open source и доступно для self-host. По сути это Firebase-опыт, но построенный на «взрослых» open-source технологиях: PostgreSQL, Elixir, GoTrue, PostgREST, pg_graphql. Платформа, где можно запустить идею, вырастить продукт и не упереться в чьи-то закрытые лимиты. #Postgres #OpenSource #Backend #AI #GraphQL #Realtime #FirebaseAlternative https://github.com/supabase/supabase

35 852

Для многих разработчиков моменты, когда они пишут код не по работе, а для профессионального вызова, становятся ключевыми в их росте. Именно таким вызовом может стать Yandex Cup 2025 — чемпионат, где встречаются сильнейшие разработчики, и один из треков которого посвящён машинному обучению.

Здесь реальные задачи, близкие к тому, с чем сталкиваются инженеры в продакшне: ограничения по ресурсам, шумные данные, необходимость найти баланс между скоростью и качеством.

Участие — способ не просто проверить свои навыки, но и заявить о себе в профессиональном сообществе. Лучшие участники получают приглашения на упрощённый отбор в команды Яндекса.

Финал пройдёт в Стамбуле, призовой фонд — 12 млн ₽. Регистрация заканчивается совсем скоро. Если вы чувствуете, что готовы выйти за пределы привычных задач — самое время. 💡 yandex.ru/cup/2025

35 852

🚀 Удобный инструмент для миграции схем PostgreSQL pgschema — это CLI утилита, которая упрощает процесс миграции схем в PostgreSQL, используя декларативный подход, похожий на Terraform. Она позволяет создавать, редактировать и применять изменения к схемам, обеспечивая контроль над миграциями без необходимости в дополнительных таблицах. 🚀 Основные моменты: - Декларативное управление схемами PostgreSQL - Поддержка всех основных объектов и версий PostgreSQL - Генерация плана миграции с предварительным просмотром изменений - Прямое взаимодействие с файлами схем и базой данных без временных БД 📌 GitHub: https://github.com/pgschema/pgschema #go

35 852

🚀 Современный ORM и генератор SQL для C++20 sqlgen — это типобезопасный ORM и генератор SQL, вдохновленный SQLAlchemy и Diesel. Он обеспечивает компоновку запросов с проверкой типов на этапе компиляции и защитой от SQL-инъекций, что делает его идеальным для создания надежных ETL-пайплайнов. 🚀Основные моменты: - 🔒 Компиляция с проверкой схем таблиц и запросов - 🛡️ Защита от SQL-инъекций с параметризованными запросами - 🔄 Удобный интерфейс для составления сложных запросов - 🚀 Высокая производительность с пакетными операциями - 📦 Поддержка PostgreSQL и SQLite 📌 GitHub: https://github.com/getml/sqlgen #cpp

35 852

🖥 pg_flo — библиотека для работы с PostgreSQL, которая упрощает создание и выполнение потоковых операций в базе данных! Она также предоставляет удобный интерфейс для выполнения операций с данными, что может быть полезно для задач, требующих последовательной обработки данных. 🔐 Лицензия: Apache-2.0 🖥 Github @sqlhub

35 852

⚡️ Pytest совет: экономим время на тестах с большими данными Если в тестах используется тяжёлый датасет, важно правильно выбрать scope для фикстуры. ❌ По умолчанию (`scope="function"`) данные будут загружаться заново для каждого теста. Это тратит ресурсы и замедляет выполнение. ✅ С scope="session" датасет загружается один раз и переиспользуется во всех тестах. Это ускоряет процесс и снижает нагрузку. Используйте session scope для больших и неизменяемых данных, чтобы тесты работали быстрее и стабильнее.

35 852

🔍 Marker — инструмент от Datalab.to, который быстро и точно превращает документы в Markdown + JSON Что умеет Marker: - Поддержка PDF, изображений, PPTX, DOCX, XLSX, HTML, EPUB и др. - Форматирует таблицы, формы, уравнения, математические выражения, ссылки, кодовые блоки. - Извлекает изображения из документов. - Убирает колонтитулы, заголовки, другие артефакты форматирования. - Есть бета-версия для “структурированного извлечения” на основе схемы JSON. - Можно включить LLM-модуль, чтобы повысить точность в сложных местах (например, объединение таблиц, корректное форматирование). Преимущества: - Быстрота + точность по сравнению с конкурентами (Mathpix, Llamaparse и др.). - Работает и без LLM, но с флагом --use_llm становится ещё лучше. - Можно запускать локально, на серверах, GPU / CPU, использовать параллельную обработку. Ограничения и нюансы: - Сложные макеты и вложенные таблицы / формы ещё не всегда обрабатываются идеально. - Иногда требуется OCR, особенно если PDF плохо “разложен” на текст. Кому полезно: - Тем, кто работает с научными статьями, отчётами, бухгалтерскими документами, презентациями и хочет автоматизировать преобразование в читаемый формат. - Для RAG-pipelines, документации и любых задач, где надо извлечь структуру и контент. https://github.com/datalab-to/marker

35 852

🔥 no-code база данных, которая сама превращает SQL в Airtable-стиль интерфейс Что умеет: - Подключается к MySQL, Postgres, SQLite, MSSQL и сразу показывает данные в виде удобных таблиц - Делает представления: таблицы, календари, канбан, формы, Гантт - Генерирует готовые REST и GraphQL API прямо поверх базы - Делится видами: публично или под паролем, поддерживает загрузку файлов и картинок - Настраивает роли и доступ до уровня отдельного столбца Плюс интеграции со Slack, Discord, мессенджерами, почтой и десятками сервисов. По сути — Airtable, но напрямую поверх твоей базы. https://github.com/nocodb/nocodb