Data Science. SQL hub

前往频道在 Telegram

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

显示更多

网络:Machinelearning 俄罗斯18 129 技术与应用3 835...

📈 Telegram 频道 Data Science. SQL hub 的分析概览

频道 Data Science. SQL hub (@sqlhub) 俄语语言赛道中的是活跃参与者。目前社区聚集了 35 848 名订阅者，在 技术与应用 类别中位列第 3 835，并在 俄罗斯 地区排名第 18 129 位。

📊 受众指标与增长动态

自 невідомо 创建以来，项目保持高速增长，吸引了 35 848 名订阅者。

根据 13 六月, 2026 的最新数据，频道保持稳定运转。过去 30 天订阅人数变化为 -8，过去 24 小时变化为 -11，整体触达仍然可观。

认证状态： 未认证
互动率 (ER)： 平均受众互动率为 9.82%。内容发布后 24 小时内通常能获得 4.08% 的反应，占订阅者总量。
帖子覆盖： 每篇帖子平均可获得 3 522 次浏览，首日通常累积 1 461 次浏览。
互动与反馈： 受众积极参与，单帖平均反应数为 13。
主题关注点： 内容集中在 sql, индекс, postgres, index, sqlite 等核心主题上。

📝 描述与内容策略

作者将该频道定位为表达主观观点的平台：
“По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ”

凭借高频更新（最新数据采集于 14 六月, 2026），频道始终保持新鲜度与高覆盖。分析显示受众积极互动，使其成为 技术与应用 类别中的关键影响点。

35 848

订阅者

-1124 小时

-317 天

-830 天

3 522

帖子浏览量

~ 1 46124 小时

~ 1 72448 小时

9.82%

参与率

无数据

每日帖子数

Ads index

beta

帖子存档

35 848

📚🎮 SQL + Покемоны = Querymon! Энтузиасты сделали игру, которая превращает изучение баз данных в настоящее приключение. ✨ С нуля — начнёте с простых таблиц и базовых запросов, сложность растёт постепенно. 🔎 Освоите SELECT, FROM, WHERE, фильтры LIKE, BETWEEN, IN и функции sum(), count(), avg(). 🎯 Геймплей — сотни миссий, где, чтобы пройти дальше, нужно правильно писать SQL-запросы. SQL ещё никогда не был таким весёлым: учиться теперь так же увлекательно, как ловить покемонов. И самое приятное — игра полностью бесплатная. 👉 Попробовать можно здесь.

35 848

🦆 Полезный интерактивный тренажёр по SQL Учитесь писать SQL-запросы через игру: - Пошаговые уроки с живым редактором — пишешь код и сразу видишь результат. - Задачи и мини-квесты, где вы помогаете Дакберту пробираться сквозь потоки данных. - Работает бесплатно, прямо в браузере или на телефоне. 🎮 Попробовать: https://dbquacks.com/

35 848

🚀 Jupyter Agent 2 Этот агент умеет: 📂 Загружать данные 💻 Запускать код 📊 Строить графики прямо в Jupyter — быстрее, чем вы успеете прокрутить экран! 🤖 Основан на движке Qwen3-Coder ⚡️ Работает на Cerebras ⚙️ Запускается в E2B ↕️ Поддерживает загрузку файлов 👉 Попробовать можно здесь: https://hf.co/spaces/lvwerra/jupyter-agent-2 @sqlhub

35 848

Как начать в Data Science, когда все вокруг уже сеньоры? До 15 сентября в Вышке продолжается набор на онлайн-магистратуру «Магистр по наукам о данных». Поступить можно даже без технического бэкграунда, а учиться — в удобном формате. Вы научитесь: ⚪️ работать с данными ⚪️ применять классические модели ML ⚪️ решать бизнес-задачи из сфер DA и DS Вам подходит программа, если вы ⭐️ Из другой сферы деятельности, но хотите войти в IT ⭐️ Самоучка и хотите подтвердить знания дипломом ⭐️ Хотите стать IT-специалистом, но пока не понимаете, каким именно ⭐️ Хотите освоить инструменты Data Science для своих проектов в другой сфере Как проходит обучение ⚪️ Онлайн-занятия в прямом эфире с возможностью задавать вопросы ⚪️ Диплом НИУ ВШЭ с указанием очной формы обучения ⚪️ Поддержка в чате 24/7 Прием документов до 15 сентября, 17:00. Подробнее о программе можно узнать тут. А чтобы узнать, как подать документы, вступайте в чат абитуриентов — там найдете инструкции и сможете получить ответы на любые вопросы по поступлению.

35 848

🌲 Datahike — персистентная база данных на основе Datalog. Это локальная база данных с поддержкой временных запросов и историчностью данных, совместимая с подмножеством API Datomic. Интрумент используется в проверенных решениях: ядра запросов из DataScript и устойчивой структуры данных hitchhiker-tree. Проект подходит для средних по размеру приложений, где важна простота развертывания и открытая лицензия. 🤖 GitHub @sqlhub

35 848

📉 На Уолл-стрит началась просадка AI-акций — и спусковым крючком оказался в отчёте MIT. В нём говорится, что 95% компаний не получают прибыли от внедрения generative AI, а реальные результаты видят только 5%. Почему так: - Компании запускают до того, как готовы пайплайны данных, безопасность и обучение сотрудников - Деньги уходят на сервера и модели, а внедрение в процессы оказывается долгим и дорогим ⚠️ На фоне разговоров про «AI-пузырь» фонды начали выходить из популярных AI-акций, что вызвало обвал. 👉 Но это похоже не на крах, а на проверку реальностью. Дальнейший рост будет зависеть от реальной экономики ИИ: снижения стоимости инференса и доказанного роста продуктивности. 📌 Источник

35 848

Где вы окажетесь завтра, зависит от того, что вы изучаете сегодня. PostgreSQL — инструмент, который ищут компании, а грамотных специалистов по нему все еще немного. Почему именно PostgreSQL? Потому что это не просто база данных, а сердце ваших проектов. Если вы администратор БД, разработчик, DevOps или администратор Linux, этот курс — ваш апгрейд. Мы научим настраивать кластеры, оптимизировать производительность, разбираться с блокировками и решать задачи работы с большими объемами данных. А также живые лекции, практические задания и диплом, который признают лидеры рынка. Учитесь у практиков, которые знают, как решать реальные задачи, и получите навыки, за которые платят топовые компании. Присоединяйтесь к курсу сейчас и начните свой путь к высокооплачиваемой карьере! Оставить заявку на курс и получить скидку: https://otus.pw/yEz4/?erid=2W5zFHAFsn8 Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

35 848

🎮 Учим SQL через захватывающую аркадную игру Разработчики замутили настоящий олдскульный шедевр, который сделает из вас МАСТЕРА баз данных и точно не даст заскучать. • Проходим уровни, собираем пазлы вместе с уткой DuckDB и прокачиваем SQL на максимум. • Квесты, задачи, подсказки — всё как в настоящем приключении. • Работает прямо в браузере и даже на телефоне. Любые запросы к базам — щёлкаем как семечки 👉 https://dbquacks.com/.

35 848

🗿 Монолит на 930 эндпоинтов: лечим по шагам С монолитом и 4+ ТБ данных можно работать! Доказано Яндекс Едой. Ребята применили классические методы для оптимизации запросов и перераспределения нагрузки, добавив к этому свой TableSwitcher для миграции данных. Базовое + новое = улучшенная производительность. Реклама. ООО «ЯНДЕКС», ИНН 7736207543

35 848

🚀 Ускоряем работу с данными с помощью Delta Lake Когда нужно добавить новые данные к уже существующему набору, есть два подхода: 🔴 Без Delta Lake - Сначала загружаешь все старые данные (например, 10 000 записей) из CSV. - Загружаешь новые данные (например, 50 записей). - Объединяешь их, что требует обработки всех 10 050 записей. - Это медленно, расходует память и ресурсы. 🟢 С Delta Lake - Хранишь данные в формате Delta Lake. - Загружаешь только новые записи (например, 50 штук). - Добавляешь их напрямую в существующую таблицу с помощью append, обрабатывая только новые данные. - Экономия времени, памяти и ресурсов. 💡 Преимущества Delta Lake: - Инкрементальная загрузка данных. - Работа с большими объёмами без полной перезагрузки. - Поддержка транзакций (ACID). - Совместимость с большими дата-платформами (Spark, Pandas и др.). 📊 Если у тебя миллионы строк — выигрыш в скорости будет колоссальным. @sqlhub

35 848

📊 Из PDF в DataFrame за пару строк кода Работаете с финансовыми отчётами или любыми табличными данными в PDF? С библиотекой docling это становится максимально просто. Большинство инструментов для работы с PDF заставляют собирать пайплайн вручную: одна библиотека для извлечения текста, другая для парсинга, третья для чанкинга. Docling закрывает весь процесс — от сырых PDF до структурированных и готовых к поиску данных — в одном решении. 📌 Преимущество Docling 🔹 Поддержка PDF, DOCX, PPTX, HTML и изображений 🔹 AI-модель TableFormer для понимания сложных таблиц 🔹 Vision-модели для OCR и image-to-text 🔹 Простой экспорт в pandas DataFrame, JSON и Markdown Пример: конвертируем PDF с отчётом о доходах и сразу получаем pandas DataFrame 👇


from docling.document_converter import DocumentConverter

converter = DocumentConverter()
result = converter.convert("financial_report.pdf")

for table in result.document.tables:
    df = table.export_to_dataframe()

📌 Github @sqlhub #AI #RAG #Docling #DataEngineering #PDF

35 848

🐘 Tarantool — необычная платформа, сочетающая in-memory базу данных с полноценным сервером приложений на Lua. Проект имеет два движка хранения: in-memory с WAL и LSM-дерево, поддерживает ANSI SQL и асинхронную репликацию. Инструмент имеет встроенный JIT-компилятор LuaJIT, позволяющий исполнять бизнес-логику прямо рядом с данными. При этом сохраняется совместимость с внешними СУБД вроде PostgreSQL через коннекторы. Проект полезен для высоконагруженных веб-сервисов, кэширующих слоёв и систем обработки очередей сообщений. 🤖 GitHub @sqlhub

35 848

💡 Полезный хинт для Oracle SQL — использование TRUNC с датами для фильтрации и агрегации В Oracle функция `TRUNC(date, 'fmt')` обрезает дату до заданного формата, обнуляя менее значимые части (часы, минуты, секунды и т.д.). Это помогает: - фильтровать данные по дням, месяцам, годам, неделям, кварталам, - делать группировки без сложных выражений, - избавляться от ошибок, когда время мешает сравнению дат. 📌 Форматы: - 'DD' — начало дня (по умолчанию) - 'MM' — первый день месяца - 'YYYY' — первый день года - 'IW' — начало ISO-недели - 'Q' — первый день квартала 📍 Примеры: - Все сделки за сегодня


select * 
from trades
where trunc(ts) = trunc(sysdate);

- Группировка по месяцам


select trunc(ts, 'MM') as month_start, sum(price) as total
from trades
group by trunc(ts, 'MM')
order by month_start;


-- Данные за текущий квартал
select * 
from trades
where trunc(ts, 'Q') = trunc(sysdate, 'Q');

⚡ Плюсы: - Удобно в чтении и написании - Убирает проблемы с «лишними» часами и минутами в датах - Работает напрямую с типом DATE без лишних кастов @sqlhub

35 848

Разбираем тестовое задание в Яндекс на позицию Junior аналитика данных Тестовое задание — важная часть трудоустройства аналитика. Это шанс показать свои навыки на практике и получить оффер мечты. Приглашаем на бесплатный вебинар, где Андрон Алексанян — эксперт в области аналитики и CEO школы аналитики Simulative — в прямом эфире разберет тестовое задание в Яндекс на позицию Junior аналитика данных. ⚡️На вебинаре вы:

🟠узнаете, какие навыки и знания необходимы для успешного выполнения заданий; 🟠поймёте, что хочет увидеть работодатель; 🟠получите советы и лайфхаки; 🟠вместе с Андроном разберете в прямом эфире реальный пример тестового 🔥

Чему именно научимся на вебинаре:

🟠С помощью Pandas проанализируем Яндекс-запросы за несколько недель, загрузив их из json-файла; 🟠Найдем закономерности и отличия использования сервиса на мобильных устройствах и компьютерах; 🟠Разберем фишки Pandas: сложную агрегацию, маппинг, конкатенацию, чейнинг и др.

🕗 Настоятельно рекомендуем не пропускать — для зрителей у нас есть особый бонус, который обеспечит вам уверенный старт в вашей карьере. 😶Зарегистрироваться на бесплатный вебинар

35 848

🧩 Продвинутая задача по SQL (Oracle): найти «бычьи серии» продаж и момент разворота Задача Есть таблица продаж по дням: sales(day_date DATE, customer_id NUMBER, amount NUMBER) Нужно для каждого клиента найти интервалы из не меньше 3 подряд идущих дней, где сумма amount строго возрастает каждый день, а на следующий день после интервала происходит разворот вниз (т.е. amount меньше, чем в последний день серии). Для каждого такого интервала вернуть: - customer_id - start_date, end_date серии - length (длина серии в днях) - last_amount (сумма в последний день серии) - drop_amount (сумма в день разворота) - drop_pct (процент падения относительно last_amount) Решение (Oracle 12c+): используем MATCH_RECOGNIZE


SELECT *
FROM sales
MATCH_RECOGNIZE (
  PARTITION BY customer_id
  ORDER BY day_date
  MEASURES
    FIRST(day_date)       AS start_date,
    LAST(day_date)        AS end_date,
    COUNT(A.*)            AS length,
    LAST(amount)          AS last_amount,
    NEXT(amount)          AS drop_amount,
    ROUND( (LAST(amount) - NEXT(amount)) / NULLIF(LAST(amount),0) * 100, 2 ) AS drop_pct
  ONE ROW PER MATCH
  AFTER MATCH SKIP PAST LAST ROW
  PATTERN (A{3,} D)
  DEFINE
    A AS ( PREV(amount) IS NULL OR amount > PREV(amount) ),
    D AS amount < PREV(amount)
);

Пояснение - PATTERN (A{3,} D) — ищем подпоследовательность из минимум трёх строго возрастающих дней A, за которой сразу идёт день падения D. - DEFINE A — рост относительно предыдущего дня в группе клиента. - DEFINE D — падение относительно предыдущего дня (последнего A). - MEASURES — извлекаем границы серии и метрики, NEXT(amount) берёт сумму в день разворота. - AFTER MATCH SKIP PAST LAST ROW — не пересекаем серии. Бонус: защита от «лестниц» с пропусками дат Если в данных бывают пропуски дней, а вам нужны подряд идущие даты, добавьте проверку календарной последовательности:


DEFINE
  A AS ( (PREV(amount) IS NULL OR amount > PREV(amount))
         AND (PREV(day_date) IS NULL OR day_date = PREV(day_date) + 1) ),
  D AS ( amount < PREV(amount) AND day_date = PREV(day_date) + 1 )

Зачем так делать MATCH_RECOGNIZE — мощный инструмент Oracle для поиска сложных паттернов по времени (распознавание трендов, разрывов, «голова-плечи», аномалий). Он заменяет громоздкие CTE с аналитиками и делает запрос короче, быстрее и точнее при работе с последовательностями. @sqlhub

35 848

Вебинар: Как защитить ИТ-инфраструктуру от кибератак. Комплексный подход 📅 Дата: 19 августа 2025г 🕙 Время: 11:00 Можно ли на 100% защитить бизнес от киберугроз? Как минимизировать потери бизнеса, если атака уже произошла? Две из трех российских компаний можно взломать менее чем за сутки, при этом наиболее уязвимы предприятия из сферы торговли, обрабатывающей промышленности, а также, как ни странно, информации и связи. Атаки способны нанести серьезный урон бизнесу вплоть до его закрытия. Неготовность компании, инфраструктуры и сотрудников к встрече с киберугрозами значительно упрощает работу хакеров. Приглашаем руководителей и специалистов ИТ и ИБ подразделений поговорить о том, как подготовить ИТ-инфраструктуру компании и сотрудников к кибератакам. 📋 Программа: ⚡️ Самые актуальные киберугрозы сегодня и риски для бизнеса ⚡️ Организация защиты – чек-лист для руководителя ⚡️ Обеспечение устойчивости ИТ-инфраструктуры ⚡️ Бэкап данных и приложений: сценарии применения ЗАРЕГИСТРИРОВАТЬСЯ

35 848

🔌 pREST (PostgreSQL REST) — проект, предлагающий готовое решение для создания RESTful API поверх PostgreSQL. Этот инструмент написан на Go и позволяет быстро развернуть высокопроизводительный API-сервер без сложной настройки. Поддержка начинается с PostgreSQL 9.5, что делает его совместимым с большинством существующих баз данных. Проект особенно удобен для разработчиков, которым нужно быстро создать API с минимальными затратами. Он поддерживает SQL-запросы через REST-эндпоинты, аутентификацию и кастомные маршруты. Развернуть pREST можно даже в один клик, например, на Heroku. 🤖 GitHub @sqlhub

35 848

Приглашаем на ежегодный хакатон от The Experts: School of Analytics! Зарегистрированные участники уже получили задание и приступили к работе — но у вас всё ещё есть шанс присоединиться и побороться за место в финале! 👉 Задание хакатона Участникам хакатона предстоит проанализировать данные A/B-теста нового рекомендательного алгоритма в музыкальном стриминговом сервисе, рассчитать ключевые метрики, проверить гипотезу о его эффективности и подготовить рекомендации о внедрении. Почему стоит участвовать? - Преимущества при поступлении в School of Analytics - Возможность попасть на годовую программу на трек Top Talents 2025/26 со скидкой до 94% - Доступ к fast track на позиции в компаниях - Скидки на экспресс-курсы и специальные условия на дополнительные программы Если хотите проверить свои силы — регистрируйтесь по ссылке, времени осталось немного! А если вам интересны количественные финансы, статистический анализ, машинное обучение и риск-менеджмент открыта регистрация на хакатон School of Quants. Все подробности и форма регистрации доступны по ссылке.

35 848

🚀 RisingLight — образовательная OLAP-база данных. Этот проект разрабатывается как учебная реализация OLAP-системы с поддержкой SQL-запросов, включая выполнение TPC-H тестов. Для тех, кто хочет заглянуть под капот аналитических баз данных, RisingLight предлагает отличную возможность изучить их устройство на практике. Хотя проект пока не готов для production, он уже даёт представление о ключевых компонентах СУБД: от парсера запросов до исполнителя. Сообщество активно развивается: есть Discord, Telegram и даже WeChat-чат для обсуждения. Авторы приветствуют вклад новичков и предлагают список "good first issues" для первых PR. 🤖 GitHub @sqlhub

35 848

Летняя школа по аналитике, Data Science и Data Engineering Центр непрерывного образования ФКН НИУ ВШЭ открывает регистрацию на летнюю школу «IT-сеанс: погружение в мир данных». Вас ждут выступления спикеров из таких компаний, как: Яндекс, Т-Банк, Ozon Tech, МТС Web Services, Альфа-Банк, X5 Tech, Magnit Tech, Авито и Вкусно — и точка. Приглашаем всех, кто хочет разобраться: 〰️〰️〰️〰️〰️〰️ Зачем переходить в IT: 🟣Как данные меняют бизнес-процессы и какие роли в этом играют аналитики, дата-сайентисты и инженеры данных? 🟣Какие тренды в Al и Big Data формируют будущее технологий и компаний? Как построить карьеру в аналитике, в Data Science и в Data Engineering: 🟣Какие навыки являются востребованными для каждого из трех карьерных путей и где их прокачать? 🟣Можно ли перейти в сферу данных с непрофильным образованием? 🟣На что смотрят HR и технические интервьюеры? Как аналитика, Data Science и Data Engineering применяются в разных индустриях: 🟣Какие задачи решают аналитики, дата-сайентисты и инженеры данных в банковской, телеком- и ритейл-отраслях? 🟣Какие инструменты и технологии входят в рабочий стек специалистов в ритейле, банках и digital-сервисах? Школа подойдет как тем, кто только решил освоить новую профессию, так и начинающим специалистам. Когда: 21 августа в онлайн-формате, 23 августа — очно. Где: Центр Культур НИУ ВШЭ, г. Москва, Покровский бульвар, 11. 📁Участие бесплатное для всех желающих, требуется регистрация: по ссылке 📍