Data Science. SQL hub

Open in Telegram

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

Network:Machinelearning Russia17 977 Technologies & Applications3 774...

📈 Analytical overview of Telegram channel Data Science. SQL hub

Channel Data Science. SQL hub (@sqlhub) in the Russian language segment is an active participant. Currently, the community unites 35 825 subscribers, ranking 3 774 in the Technologies & Applications category and 17 977 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 35 825 subscribers.

According to the latest data from 27 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -61 over the last 30 days and by 2 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 8.28%. Within the first 24 hours after publication, content typically collects 4.10% reactions from the total number of subscribers.
Post reach: On average, each post receives 2 967 views. Within the first day, a publication typically gains 1 470 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 12.
Thematic interests: Content is focused on key topics such as sql, индекс, postgres, index, sqlite.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ”

Thanks to the high frequency of updates (latest data received on 28 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

35 825

Subscribers

+224 hours

-117 days

-6130 days

2 967

Post views

~ 1 47024 hours

~ 1 89248 hours

8.28%

Engagement rate

No data

Posts per day

Ads index

beta

Posts Archive

35 825

💻Параллелизм базы данных в PostgreSQL Управление параллелизмом является важным аспектом в системах БД, которые имеют дело с множеством параллельно выполняющихся транзакций. В PostgreSQL применяются различные методы для обеспечения параллельного доступа к базе данных при поддержке согласованного состояния данных с использованием свойств атомарности и изоляции ACID (атомарность, согласованность, изоляция и длительность). ⏩Пессимистичная блокировка Этот метод управления параллелизмом используется в системах баз данных для обеспечения параллельного доступа к разделяемым данным. Это осторожный подход, предполагающий, что конфликты между транзакциями весьма вероятны, и предотвращает конфликты наложением блокировок на объекты базы данных (строки или таблицы). Пессимистичное блокирование гарантируют эксклюзивный доступ к данным, но оно может привести к расширению блокировок и сокращению параллелизма по сравнению с подходом оптимистичного блокирования. ⏩Оптимистичная блокировка Оптимистичный подход в технике управления параллелизмом исходит из того, что конфликты между транзакциями редки, и это позволяет обрабатывать транзакции без наложения блокировок на объекты базы данных при выполнении всей транзакции. Конфликты проверяются, обнаруживаются и разрешаются только во время фиксации транзакции. 📎 Подробнее о параллелизме БД можно почитать тут, рекомендую. Вот ещё неплохая статья в тему @sqlhub

35 825

Главное — порядок в данных, а остальное СУБД. Приглашаем на вебинар «PostgreSQL, MongoDB, Redis в облаке: с чего начать». Валерий Ишутин, руководитель направления развития платформенных сервисов T1 Cloud, расскажет: 🔵 Как развернуть базу данных нажатием одной кнопки 🔵 Что включает в себя услуга Managed Services 🔵 Что делать, если Junior-разработчик удалил часть базы данных 🔵 О распределении зон ответственности T1 Cloud и клиента 💬 В конце вебинара можно будет задать вопросы спикеру. Дата: 16 апреля 2024 (вторник) Время: 11:00 – 12:00 МСК ➡️ Зарегистрироваться и добавить вебинар в календарь можно прямо сейчас. Реклама. Информация о рекламодателе

35 825

💻Большое ли преимущество использования IN вместо нескольких OR в SQL? ▶️Скажем, какой из этих 2 примеров более эффективен? Этот:

SELECT *
FROM table
WHERE property IN ('a','b','c')

или вот этот:

SELECT *
FROM table
WHERE property='a' OR property='b' OR property='c'

▶️Если говорить про абстрактный SQL - никакой разницы нет. Есть много способов попросить достать одни и те же данные. Впрочем, с точки зрения читаемости человеком in явно выигрывает из-за компактности. А если рассматривать конкретные реализации - то различия могут быть. Например, postgresql строит разные планы для IN и OR:

explain select * from bigtable where id = 1 or id = 3 or id=4;
                                    QUERY PLAN                                    
----------------------------------
 Bitmap Heap Scan on bigtable  (cost=13.34..25.34 rows=3 width=12)
   Recheck Cond: ((id = 1) OR (id = 3) OR (id = 4))
   ->  BitmapOr  (cost=13.34..13.34 rows=3 width=0)
         ->  Bitmap Index Scan on bigtable_pkey  (cost=0.00..4.45 rows=1 width=0)
               Index Cond: (id = 1)
         ->  Bitmap Index Scan on bigtable_pkey  (cost=0.00..4.45 rows=1 width=0)
               Index Cond: (id = 3)
         ->  Bitmap Index Scan on bigtable_pkey  (cost=0.00..4.45 rows=1 width=0)
               Index Cond: (id = 4)

explain select * from bigtable where id in (1,3,4);
                                   QUERY PLAN                                   
----------------------------------
 Index Scan using bigtable_pkey on bigtable  (cost=0.44..17.37 rows=3 width=12)
   Index Cond: (id = ANY ('{1,3,4}'::integer[]))

Как можно заметить, IN был переписан в другую форму и оценён дешевле, чем несколько эквивалентных OR. Какие-то другие СУБД может быть переписывают оба запроса в идентичное представление, или же переписывают IN в группу OR. Вопросы производительности необходимо рассматривать только в рамках какой-то конкретной реализации. Вот такие дела @sqlhub

35 825

⚡️ Бесплатный видеокурс. SQL практикум на базе MySQL Спроектируем базу данных популярного мессенджера и научимся писать запросы к ней (4.5 часа качественного видеоматериала). 💡 Курс @sqlhub

35 825

Оффер в компанию будущего можно получить за день. Попробуй свои силы на OneDayOffer от SberAutoTech 20 апреля! Мы ищем системных аналитиков и разработчиков C++, которые не боятся сложных задач. Оставь заявку, выполни тестовое задание и получи приглашение на мероприятие. За один день ты успеешь познакомиться с командами разработки, пройти собеседования и получить фидбек. Если всё сложится, уже вечером мы предложим тебе место в команде. Работать в SberAutoTech — значит создавать новое. Мы развиваем технологию автономного вождения, совместимую с разными транспортными средствами. Тебя ждут интересные и необычные проекты, возможности для профессионального развития, и, участия в конференциях. Узнай больше по ссылке.

35 825

💻 Статический анализ структуры базы данных Такой анализ потенциальных проблем в базе данных имеет очевидные преимущества: ⏩анализ можно проводить в любой среде (dev/test/prod) и даже на пустой БД, где нет данных (бэкап структуры без данных) ⏩затраты ресурсов зависят только от количества объектов в БД и количества проверок, а не от объема данных или качества приближения тестовых данных и запросов к реальным ⏩статический анализ может быть встроен в CI как элемент повышения качества разработки Встраивать такого рода проверки в CI — это однозначно полезная практика. Разовая инвестиция в настройку конвейера исключит спектр потенциальных проблем с расхождением данных. Подробнее об этом тут: 📎 Статья @sqlhub

35 825

🚀Освойте продвинутые методы агрегации данных в ClickHouse. Приходите на бесплатный практический урок от OTUS, где вы вместе с опытным экспертом разберете: 1️⃣ методы агрегации данных в ClickHouse; 2️⃣ типы агрегатных функций; 3️⃣ комбинаторы к агрегатным функциям; 4️⃣ состояния и настройки для агрегации. Вебинар поможет вам: ✅ получить инструментарий для построения продвинутых запросов и покрытия нужд аналитики; ✅ переложить работу по агрегации сырых данных с приложения на БД. 🔔Встречаемся 11 апреля в 20:00 мск в рамках курса «ClickHouse для инженеров и архитекторов БД». Доступна рассрочка на обучение! ➡️Регистрируйтесь прямо сейчас, чтобы посетить бесплатный урок и получить запись: регистрация

35 825

💻Как получить текстовый дамп базы данных Postgres в Heroku Для создания дампа базы данных PostgreSQL в текстовом формате на Heroku выполните два действия: 1️⃣Создайте и загрузите резервную копию:


   heroku pg:backups:capture && heroku pg:backups:download

2️⃣Преобразуйте загруженный файл в SQL-формат с помощью pg_restore:


   pg_restore -f mydb.sql latest.dump

Здесь mydb.sql — это конечный файл с вашими данными. До начала работы убедитесь, что у вас установлен Postgres для использования команды pg_restore. 🔘Вот в принципе и всё, больше деталей и похожих кейсов тут @sqlhub

35 825

Как обнаружить SQL-уязвимость? Освойте методы атаки и защиты на курсе SQL Injection Master! Аналогов по объему практики в СНГ и EN-cегменте нет. На курсе подробно разберём эксплуатацию SQL-инъекций, одну из наиболее опасных и эксплуатируемых видов атак на веб-приложения. Вы освоите базовый синтаксис языка запросов SQL, внедрение SQL-кода в уязвимые приложения, раскрутку SQL-инъекций вручную и софтом, а также способы защиты своих веб-приложений. Cтарт: 15 апреля Продолжительность: 3 месяца 🏆 Выдаём УПК/сертификат Получите промодоступ к обучению - 7 дней бесплатно! @Codeby_Academy 84994441750

35 825

💻Исправление клиентской кодировки PostgreSQL с LATIN1 на UTF8 ▶️Итак, реальный кейс. На сайте был один баг, который проявлялся при попытке прикрепления к сообщениям файлов, названия которых были на кириллице. В данном случае сайт выдавал ошибку 503. Это происходило несмотря на то, что кодировка базы данных была в UTF8. Тогда как Django выдавал следующее сообщение:

'latin-1' codec can't encode characters in position 55-64: ordinal not in range(256)

Проблема заключалась в том, что кодировка сервера была первоначально выставлена в LATIN1. То есть следующие команды давали следующий вывод:

postgres=# show server_encoding; server_encoding ----------------- LATIN1(1 row) postgres=# show client_encoding; client_encoding ----------------- LATIN1(1 row) postgres=# \encoding  LATIN1

Выполнение команды SET CLIENT_ENCODING TO 'utf8'; не давало результата, после выхода из psql кодировка возвращалась в LATIN1 . ▶️Исправление. Исправление данного бага свелось к настройке кодировки самого сервера. Поскольку в первую очередь сервер русскоязычный, то для исправления была произведена установка русскоязычных пакетов локалей.

sudo apt-get install language-pack-ru

Выполнение процесса русификации

sudo update-locale LANG=ru_RU.UTF-8

И перезагрузка сервера

sudo reboot

После этого кодировка клиента сервера стала UTF8

postgres=# show server_encoding; server_encoding ----------------- LATIN1(1 row) postgres=# show client_encoding; client_encoding ----------------- UTF8(1 row) postgres=# \encoding  UTF8

Вот такие дела, этого оказалось достаточно для исправления бага. Возможно, кому-то будет особенно актуально @sqlhub

35 825

💻Как создать процедуру в PostgreSQL? ⏩Итак, для создания процедуры в PostgreSQL используется язык PL/pgSQL, который является расширением языка SQL. Вот пример создания простой хранимой процедуры в PostgreSQL:

CREATE OR REPLACE FUNCTION 'имя_процедуры(параметры)' RETURNS 'тип_результата' AS $$
DECLARE
    -- переменные_локальные тип_переменной
BEGIN
    -- Тело процедуры
    -- Может содержать SQL запросы, управляющие конструкции и другие операторы
END;
$$ LANGUAGE plpgsql;

⏩Пример простой процедуры, которая выводит текстовое сообщение:

CREATE OR REPLACE FUNCTION hello_world()
RETURNS VOID AS $$
BEGIN
    RAISE NOTICE 'Hello, World!';
END;
$$ LANGUAGE plpgsql;

⏩После выполнения этого запроса, процедура hello_world будет создана в вашей базе данных. Чтобы вызвать эту процедуру, используйте следующий запрос:

SELECT hello_world();

Таким образом, вы можете создавать и вызывать процедуры в PostgreSQL с помощью PL/pgSQL. @sqlhub

35 825

💻PostgreSQL: исполнение запроса из Bash-скрипта ⏩Для выполнения запроса в PostgreSQL от имени пользователя 'postgres' используйте команду:

sudo -u postgres psql -d dbname -c "SELECT * FROM table;"

Здесь dbname — это название вашей БД, table – имя таблицы. Разумеется, используем права суперпользователя sudo для переключения пользователя на postgres, psql является инструментом командной строки PostgreSQL, а ключ -c нужен для выполнения конкретного запроса. ⏩Для более аккуратного форматирования вывода можно использовать ключ -t, который выводит данные построчно, и -X для того, чтобы .psqlrc не обрабатывался командой psql. ⏩Подобное выполнение SQL-запросов прямо из оболочки может быть особенно актуальным, если вы настраиваете какую-нибудь систему по ssh. Пишите, кстати, если сталкивались с такими кейсами @sqlhub

35 825

Yandex Open Source Jam — необычное мероприятие от Яндекса Что вас ждет: —мастер-классы — как сделать документацию и лендинг для своего проекта за полчаса, а также как выбрать лицензию для своего опенсорса — круглый стол, посвященный главным проблемам и вопросам сферы — интересные доклады — неформальное общение с разработчиками из Яндекса и других компаний Встречаемся 23 апреля в Москве («Агломерат») и онлайн (трансляция на сайте). Переходите по ссылке для регистрации.

35 825

💻Коллекция готовых SQL-запросов для PostgreSQL Нереально полезная подборка SQL-запросов, количество запросов вы и сами видите, это покрывает большую часть того, что может встретиться в практике В том числе здесь: ⏩Обсуждаются различные функции и операторы для выполнения запросов и модификации данных ⏩Рассматриваются способы разбиения больших таблиц на N тысяч записей и распараллеливания запросов ⏩Обсуждаются особенности сравнения record и NULL и способы быстрого получения количества записей в большой таблице ⏩Рассматриваются рекурсивные запросы, модификация пользовательских данных (UPSERT) и журналирование изменений таблицы ⏩Рассматриваются модификации схемы данных (DDL) и способы добавления ограничений таблицы и изменения ограничений внешнего ключа без блокирования таблицы 📎 Коллекция @sqlhub

35 825

Ищем системных аналитиков и технических писателей в команду Riverstart! Компания в IT с 2012 года, аккредитована Минцифры. Наши преимущества: ● вы сами выбираете формат работы - парттайм, фултайм или попроектно; ● можно работать в удобное время из любой точки мира; ● сможете выбирать проекты в тех отраслях, которые любите; ● платим по рынку, даем премии и составляем план развития на каждые полгода; ● 1 собеседование - не мучаем вас сериями собеседований. Поможем комфортно и плавно вкатиться в рабочий процесс. Организуем условия для развития и роста, назначим куратора, к которому можно обращаться по техническим вопросам. Узнайте больше о вакансиях и оставьте отклик на сайте!

35 825

🖥 Допустим вы хотите получить минимальное или максимальное значения из индексированного столбца. Очевидно, что это будет первая, либо последняя запись в этом столбце. База данных Oracle знает об этом, поэтому может оптимизировать данный запрос: INDEX FULL SCAN (MIN/MAX) или INDEX RANGE SCAN (MIN/MAX) При этом запросе считывается только одна необходимая запись. @sqlhub

35 825

erid: LjN8KchLQ Работу с каталогами данных обсудят на Х5 Tech Talk! X5 Tech и сообщество dbt & modern data stack собирают экспертов, чтобы поделиться опытом работы с каталогами данных, а также рассмотреть успешные внедрения решений на реальных кейсах. Темы выступлений: -- OpenMetadata как платформа для развития собственного каталога данных -- 2 года с OpenMetadata: как заманить и не отпускать пользователей -- Путь с каталогом данных от таблиц до моделей машинного обучения Спикеры из X5 Tech, Beeline и Tele2. Успей зарегистрироваться! ✅ Встречаемся 11 апреля в 19:00 __ Реклама. ООО "Корпоративный центр ИКС 5", ИНН: 7728632689

35 825

💻Исследователи обнаружили, что GitHub Copilot генерирует уязвимые SQL-запросы (да и не только SQL-запросы) ⏩Не так давно исследователи компании Snyk, специализирующейся на безопасности, рассказали, что ИИ-помощник GitHub Copilot генерирует уязвимый код, если в проекте уже есть такой. Это связано с тем, что нейросеть просто анализирует кодовую базу, в том числе и плохие практики. ⏩Snyk провела эксперимент, чтобы доказать способность GitHub Copilot генерировать уязвимый код на основе такого же в проекте. На 1 этапе исследователи попросили ИИ-помощника сгенерировать SQL-запрос и получили это:

// create query to match input with the description or product name
var query = em.createQuery("SELECT p FROM Product p WHERE LOWER(p.description) like  OR lower(p.productName) like :input", Product.class);

Это качественный и безопасный запрос с именованными параметрами, что делает невозможным использование инъекций. ⏩После этого в соседнем файле проекта самостоятельно написали уязвимый SQL-запрос и снова попросили нейросеть написать код. Во второй раз GitHub Copilot сгенерировал следующий фрагмент:

// create query to match input with the description or product name
String query = "Select * from Product where lower(description) like '%" + lowerInput + "%' OR lower(product_name) like '%" + lowerInput + "%'";

Для контекста нейросеть использовала уязвимый код и на его основе сгенерировала ещё одну ошибку. Факторы, усугубляющие использование GitHub Copilot: — Закрепление плохого подхода. Начинающие разработчики, использующие ИИ-помощников, не замечают своих ошибок и начинают думать, что если код сгенерировала нейросеть, то он верный. — Отсутствие проверок. Ассистенты не могут проверять безопасность предложенных фрагментов, а разработчики редко пересматривают их. Это увеличивает количество уязвимостей в проекте. — Устаревшие шаблоны. GitHub Copilot может предлагать фрагменты, которые в сообществе уже признаны неверными и содержащими ошибки. Будьте аккуратнее, в общем) @sqlhub

35 825

Яндекс подготовит на треть больше топовых специалистов по ML и Data Science Школа анализа данных Яндекса открыла набор на следующий учебный год. Школа решила увеличить число своих студентов — на обучение примут 400 человек, что обеспечит приток новых датасаентистов на рынок. Конкурс при приёме в ШАД остаётся стабильно высоким (17 человек на место в 2023 году), но добавляется новая возможность поступить — теперь абитуриенты смогут поступить также через очную олимпиаду. В недавнем исследований ШАД выяснил, что 77% выпускников устраиваются в лидирующие технологические компании, а каждый четвёртый работает в научной сфере. Больше о карьерных треках выпускников ищите в карточках. @sqlhub

35 825

▶️7 типов баз данных, понимание которых пригодится специалисту Data Science ⏩Иерархические БД — DNS, LDAP В иерархических БД каждая запись имеет одного «родителя». Это создаёт древовидную структуру, в которой записи классифицируются по их отношениям с цепочкой родительских записей. ⏩Сетевые БД — IDMS Сетевые БД расширяют функциональность иерархических: записи могут иметь более одного родителя. А значит, можно моделировать сложные отношения. ⏩Реляционные БД — PostgreSQL, MariaDB, SQLite, MySQL Реляционные БД – старейший тип до сих пор широко используемых БД общего назначения. Данные и связи между данными организованы с помощью таблиц. Каждый столбец в таблице имеет имя и тип. Каждая строка представляет отдельную запись или элемент данных в таблице, который содержит значения для каждого из столбцов. ⏩Базы данных «ключ-значение» — Redis, Memcached В БД «ключ-значение» для хранения информации вы предоставляте ключ и объект данных, который нужно сохранить. Например, JSON-объект, изображение или текст. Чтобы запросить данные, отправляете ключ и получаете blob-объект. ⏩Документная база данных — MongoDB, RethinkDB Документные БД совместно используют базовую семантику доступа и поиска хранилищ ключей и значений. Такие БД также используют ключ для уникальной идентификации данных. Разница между хранилищами «ключ-значение» и документными БД заключается в том, что вместо хранения blob-объектов, документоориентированные базы хранят данные в структурированных форматах – JSON, BSON или XML. ⏩Графовая база данных — Neo4j, JanusGraph, Dgraph Вместо сопоставления связей с таблицами и внешними ключами, графовые БД устанавливают связи, используя узлы, рёбра и свойства. ⏩Колоночные БД — Cassandra, HBase Колоночные БД принадлежат к семейству NoSQL БД, но внешне похож на реляционные БД. Как и реляционные, колоночные БД хранят данные, используя строки и столбцы, но с иной связью между элементами. 📎 Читать подробнее @sqlhub