uz
Feedback
Data Science. SQL hub

Data Science. SQL hub

Kanalga Telegram’da o‘tish

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

Ko'proq ko'rsatish

📈 Telegram kanali Data Science. SQL hub analitikasi

Data Science. SQL hub (@sqlhub) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 35 806 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 3 813-o'rinni va Rossiya mintaqasida 18 096-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 35 806 obunachiga ega bo‘ldi.

22 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -77 ga, so‘nggi 24 soatda esa -12 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

  • Tasdiqlash holati: Tasdiqlanmagan
  • Jalb etish (ER): Auditoriya o‘rtacha 7.69% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 3.63% ini tashkil etuvchi reaksiyalarni to‘playdi.
  • Post qamrovi: Har bir post o‘rtacha 2 755 marta ko‘riladi; birinchi sutkada odatda 1 301 ta ko‘rish yig‘iladi.
  • Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 11 ta reaksiya keladi.
  • Tematik yo‘nalishlar: Kontent sql, индекс, postgres, index, sqlite kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

Yuqori yangilanish chastotasi (oxirgi ma’lumot 23 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

35 806
Obunachilar
-1224 soatlar
-307 kunlar
-7730 kunlar
Postlar arxiv
Argus — это универсальный инструмент на базе Python, предназначенный для упрощения процесса сбора и анализа информации. Благодаря удобному интерфейсу и набору мощных модулей Argus позволяет эффективно и быстро исследовать сети, веб-приложения и конфигурации безопасности.

Есть ли сейчас какой-то ИИ лучше Claude для программирования?
Есть ли сейчас какой-то ИИ лучше Claude для программирования?

⚡️ Редкий SQL-прием: EXISTS часто лучше, чем COUNT(*) > 0 Если тебе нужно просто проверить, есть ли строки, не заставляй базу
⚡️ Редкий SQL-прием: EXISTS часто лучше, чем COUNT(*) > 0 Если тебе нужно просто проверить, есть ли строки, не заставляй базу считать их все. Плохо:

SELECT COUNT(*) > 0
FROM orders
WHERE user_id = 42;
База может пройти по всем подходящим строкам, чтобы посчитать количество. Лучше:

SELECT EXISTS (
    SELECT 1
    FROM orders
    WHERE user_id = 42
);
EXISTS останавливается сразу, как только нашел первую подходящую строку. Для больших таблиц это может быть заметно быстрее, особенно если есть индекс по условию:

CREATE INDEX idx_orders_user_id ON orders(user_id);
Если тебе нужен ответ “есть или нет”, используй EXISTS. COUNT(*) оставь для случаев, когда реально нужно точное количество строк. #sql #postgresql #database #backend

SQL и Python - это инструменты. Но чтобы строить реальные ML-системы и работать с данными на уровне топовых компаний, нужен ф
SQL и Python - это инструменты. Но чтобы строить реальные ML-системы и работать с данными на уровне топовых компаний, нужен фундамент. Поэтому рекомендация! Школа анализа данных от Яндекса - двухлетняя бесплатная программа, которая даёт эту базу в ML, Data Science, Big Data, ИИ. Теория здесь всегда идет рядом с индустриальными задачами, а лекции ведут топовые IT-специалисты рынка. Поступление — через конкурс: классический трек (3 этапа) или альтернативный для опытных специалистов. Формат обучения - офлайн, гибрид или онлайн. Если хотите бустануть карьеру в Data Science — переходите по ссылке

🖥 Text-to-SQL ломается не из-за модели. Он ломается из-за схемы Большинство думает, что проблема в LLM или плохом промпте. На практике всё проще. Модель не видит правильные связи между таблицами. Пример. Запрос вроде “какие издатели получили выплаты выше 5000”. Векторный поиск подтянет publisher и royalty_ledger. Всё логично. Но пропустит vendor_agreement, ту самую таблицу, которая их связывает. В итоге SQL выглядит валидно. Но возвращает ноль строк. Это системная проблема всех решений на embeddings. Они ищут по смыслу, но не понимают структуру базы. Нормальный подход другой. Схему нужно рассматривать как граф. Таблицы это узлы. Foreign keys это связи. Запрос решается не поиском похожих слов, а обходом графа и поиском join-пути. Именно так работает QueryWeaver. Он строит граф базы и при запросе сам находит весь путь, включая промежуточные таблицы. Даже если это цепочка из нескольких шагов. На практике это выглядит так. В тесте с базой на 60 таблиц он разобрал 5-шаговый запрос через цепочку superpower → capability_matrix → stakeholder_registry → resource_requisition → budget_allocation. Векторный поиск увидел только начало и конец. Всё между ними потерял, потому что “stakeholder” никак не связан по смыслу с “superpower”. Графу на это всё равно. Он просто находит единственный путь между сущностями. И это меняет всё. Open-source, можно развернуть у себя и наконец получить text-to-SQL, который реально работает. https://github.com/FalkorDB/QueryWeaver

Разрозненные инструменты, ручные операции, переключение консолей и долгий поиск причин сбоя — знакомая проблема для команд бе
+3
Разрозненные инструменты, ручные операции, переключение консолей и долгий поиск причин сбоя — знакомая проблема для команд без единой среды администрирования. Postgres Pro Enterprise Manager 2.5 помогает навести порядок. Это графическая платформа для управления базами данных Postgres Pro через веб-интерфейс. С новой версией команда тратит еще меньше времени на рутину и быстрее возвращает систему в нормальный режим. Преимущества для бизнеса: ✔️ Ниже нагрузка на администраторов и меньше ручных операций. ✔️ Больше порядка в работе с экземплярами, ролями и бэкапами. ✔️ Быстрее поиск причин сбоев и проще восстановление. ✔️ Более управляемая инфраструктура и предсказуемая работа команды. Что нового в версии 2.5: ✔️ BiHA-кластеры: мажорное обновление через GUI, улучшенная интеграция и поддержка узла-рефери. ✔️ Аудит и контроль доступа: аудит CRUD-операций, детали изменений, работа с ролями СУБД через формы. ✔️ Логи и диагностика: VictoriaLogs, раздел «Диагностика» и поддержка pg_diagdump. ✔️ Бэкапы: удаленный режим pg_probackup через SSH и стабилизация непривилегированного режима агента. Запросите тестирование и проверьте Postgres Pro Enterprise Manager 2.5 на своей инфраструктуре. Реклама ООО «ППГ» Инн: 7707083893 Erid: 2Vtzqwfck23

Edit Banana редактирует текст прямо на картинках за пару кликов. Нейросеть разбирает изображение на смысловые блоки, после че
Edit Banana редактирует текст прямо на картинках за пару кликов. Нейросеть разбирает изображение на смысловые блоки, после чего любой фрагмент можно переписать, не трогая остальное. Модель уверенно справляется с таблицами, формулами и диаграммами, сохраняет исходные цвета, шрифты и позиции элементов. Готовый результат экспортируется в DrawIO, SVG или PowerPoint. Проект полностью открытый, ставится локально с GitHub. Забираем, пока не закрыли: https://github.com/BIT-DataLab/Edit-Banana

🔥 NornicDB: База данных, которая объединяет Graph + Vector и летает в sub-ms Это гибрид: Graph + Vector + Temporal MVCC в од
🔥 NornicDB: База данных, которая объединяет Graph + Vector и летает в sub-ms Это гибрид: Graph + Vector + Temporal MVCC в одном ядре заточен под AI-агентов и knowledge systems Что внутри: • HNSW поиск <1ms • graph traversal без тормозов • writes тоже быстрые, не только чтение Из хорошего, это не Frankenstein из разных сервисов, а единая система. Под капотом: • Neo4j-compatible (Bolt + Cypher) • vector search как first-class citizen • GPU acceleration T- emporal модель с версионированием данных То есть ты можешь: • искать эмбецдинги • ходить по графу • делать time-travel запросы • всё это в одном запросе. Фактически это попытка сделать “память для AI”: где есть связи, смысл и история изменений, а не просто таблицы. Если делаешь RAG, multi-agent системы или сложные knowledge graph - будет полезно. GitHub: https://github.com/orneryd/NornicDB

⚡️ Вышло большое обновление популярного курса- Ai AI агенты, которые реально работают в проде! Вы всё ещё пишете обёртки над
⚡️ Вышло большое обновление популярного курса- Ai AI агенты, которые реально работают в проде! Вы всё ещё пишете обёртки над ChatGPT и называете это «AI-продуктом»? Пока вы промптите - рынок переходит на агентные системы. Те, что принимают решения, ходят в API, работают с Postgres и Redis, управляют браузером через Playwright. И 90% таких систем ломаются между ноутбуком и продом. AI Agents Engineering - курс, который закрывает этот разрыв. LangGraph, AutoGen, Computer Use, LLMOps. 8 модулей, 120+ шагов - от архитектуры до деплоя в Docker. На выходе: реальный опыт на большой практической базе, а production-агент и навыки, за которые уже платят. 👉 48 часов действует скидка на курс 55 процентов: https://stepik.org/a/276971/

Не пиши SELECT DISTINCT, если проблему создаёт плохой JOIN Частая ошибка - сначала размножают строки джойном, потом сверху лечат это DISTINCT. Это дорого и часто убивает план. Плохо:

SELECT DISTINCT u.id, u.name
FROM users u
JOIN orders o ON o.user_id = u.id
WHERE o.created_at >= CURRENT_DATE - INTERVAL '30 days';
Лучше так:

SELECT u.id, u.name
FROM users u
WHERE EXISTS (
    SELECT 1
    FROM orders o
    WHERE o.user_id = u.id
      AND o.created_at >= CURRENT_DATE - INTERVAL '30 days'
);
DISTINCT часто добавляет sort или hash aggregation на огромном объёме. EXISTS превращает задачу в semijoin: • оптимизатору проще остановиться на первом совпадении • меньше памяти, меньше лишних строк, стабильнее план Это один из тех рефакторингов, который на больших таблицах реально даёт заметный буст.

Трансформация профессии разработчика в эпоху ИИ Профессия разработчика меняется прямо сейчас: ИИ уже пишет код, предлагает ар
Трансформация профессии разработчика в эпоху ИИ Профессия разработчика меняется прямо сейчас: ИИ уже пишет код, предлагает архитектуру и собирает прототипы за минуты. Но без фундаментальных знаний архитектуры, алгоритмов, сетей, безопасности и DevOps использовать такие инструменты рискованно. Центральный университет запускает серию бесплатных вебинаров о том, как меняется роль разработчика в 2026 году, какие навыки остаются критически важными и как безопасно и эффективно использовать нейросети в разработке. На вебинарах разберем: — почему ИИ не заменит программиста, но изменит его роль; — какие навыки и языки будут востребованы; — чего ждут работодатели от разработчиков сегодня; — почему магистратура по бэкенд-разработке может стать преимуществом; — как вырасти в техлида и тимлида, не теряя технических экспертных знаний. Спикеры — лидеры индустрии из Центрального университета, Авито и cloud. ru. Даты вебинаров: 21, 23 и 27 апреля 2026, 19:00 мск. Регистрируйся по ссылке

Ты до сих пор выбираешь базу данных по привычке? Вот 13 типов БД, которые нужно понимать, если хочешь проектировать системы нормально: 1) Реляционные Хранят структурированные данные в таблицах со схемой и работают через SQL 2) Key-Value Простейшие пары ключ-значение для максимально быстрых чтений и кеширования 3) Колоночные Хранят данные по колонкам, а не по строкам, идеально для аналитики 4) Wide-Column Гибкие колоночные семейства для распределённых систем и больших нагрузок 5) Документные JSON-подобные документы со свободной структурой и вложенностью 6) Векторные Хранят эмбеддинги, основа для AI, поиска по смыслу и RAG 7) Time-Series Данные с таймстемпами, метрики, логи, события 8) Immutable Ledger Нельзя изменить или удалить, только добавлять, используется для audit и финтеха 9) Графовые Оптимизированы под связи между сущностями, соцсети, рекомендации, fraud 10) Геопространственные Работают с координатами, расстояниями и картами 11) In-Memory Хранят данные в RAM, минимальная задержка и максимум скорости 12) Blob Для хранения файлов, изображения, видео, бинарные данные 13) Полнотекстовый поиск Индексируют текст и позволяют быстро искать по содержимому Реальность такая: нет лучшей базы данных есть база под конкретную задачу И чем раньше это понимаешь, тем меньше костылей потом в проде Какой тип используешь чаще всего сейчас? https://www.youtube.com/shorts/9QiasqVw-50

Продвинутый SQL совет - всегда проверяй, можно ли заменить SELECT DISTINCT на правильный JOIN или EXISTS. Очень часто DISTINC
Продвинутый SQL совет - всегда проверяй, можно ли заменить SELECT DISTINCT на правильный JOIN или EXISTS. Очень часто DISTINCT добавляют просто чтобы убрать дубли после неудачного join. Запрос вроде работает, но по факту ты сначала раздуваешь результат, а потом заставляешь базу его чистить. На больших таблицах это легко убивает производительность. Плохой вариант:

SELECT DISTINCT u.id, u.name
FROM users u
JOIN orders o ON o.user_id = u.id;
Лучше так:

SELECT u.id, u.name
FROM users u
WHERE EXISTS (
    SELECT 1
    FROM orders o
    WHERE o.user_id = u.id
);
Почему это сильный приём: EXISTS останавливается, как только находит первое совпадение не нужно тащить лишние строки не нужно потом убирать дубли логика запроса становится честной - ты проверяешь наличие, а не собираешь мусор Это один из самых частых hidden performance fixes в SQL. Если видишь DISTINCT, сразу спрашивай себя: он тут реально нужен или просто маскирует плохую логику JOIN.

🚀 PageIndex - умный индекс документов для reasoning-RAG (без векторов) PageIndex от VectifyAI - open-source система, которая
+2
🚀 PageIndex - умный индекс документов для reasoning-RAG (без векторов) PageIndex от VectifyAI - open-source система, которая помогает работать с длинными документами (PDF, тексты, правила и т.д.) так, как это сделал бы эксперт-человек, а не обычный поисковик. В отличие от традиционных RAG-систем, которые разбивают текст на куски и используют vector search (векторное сопоставление), PageIndex создаёт иерархическое дерево структуры документа и позволяет моделям ИИ логически искать ответы через reasoning и tree search. 📄 Основная идея - Длинные документы индексируются как семантическое дерево — похожее на умный «оглавление» - Структура сохраняет контекст и древовидную иерархию секций - При запросе модель обходит дерево через reasoning-поиск, как человек, который листает книгу по разделам, а не просто ищет по похожести текста - Не нужны: векторная база данных, chunking и top-K-селекция, что снижает потери контекста и повышает точность поиска 🧠 Почему это важно ✔️ Лучше для сложных и больших документов (финансовые отчёты, юридические тексты, технические мануалы) ✔️ Сохранение структуры означает, что ИИ может понимать, где именно в документе находится нужная информация ✔️ В отличие от vector-RAG, здесь решение не основано на похожести, а на пошаговом анализе структуры документа 🔧 Что внутри - Скрипты и Jupyter-ноутбуки для генерации дерева из PDF или Markdown - Возможность делать reasoning-RAG напрямую без внешних Vector DB - Примеры использования и cookbooks для практических сценариев PageIndex - это не просто индекс, а иерархический, reasoning-ориентированный RAG-фреймворк. Он позволяет ИИ читать и анализировать документы, как эксперт, обходя ограничения простого векторного поиска в больших текстах. ▪ Github: https://github.com/VectifyAI/PageIndexBlog post: https://vectify.ai/blog/Mafin2.5

Repost from Machinelearning
🚀 Qwen 3.6-Plus забрал все три первых места на OpenRouter. Одновременно. Alibaba выкатили новую модель, и она сразу заняла #
🚀 Qwen 3.6-Plus забрал все три первых места на OpenRouter. Одновременно. Alibaba выкатили новую модель, и она сразу заняла #1 в трех рейтингах OpenRouter: Daily, Weekly и Trending. Такого там раньше никто не делал. Модель уже вышла из триала и доступна в проде. По первым отзывам: латенси ниже, рассуждения на уровне топовых моделей, а цена за токен заметно приятнее конкурентов. Доступна через Qwen Cloud, Alibaba Cloud Model Studio, OpenRouter и Fireworks AI. Из коробки интегрируется с OpenClaw, Kilo Code, Cline, opencode и Qoder. Для тех, кто сейчас выбирает модель под продакшен, есть смысл погонять на своих задачах. Достижения на OpenRouter звучат красиво, но синтетические бенчмарки и реальные пайплайны - вещи разные. Интересно посмотреть, как она поведет себя на длинных контекстах и сложных мультиэтапных цепочках. openrouter.ai/qwen/qwen3.6-plus fireworks.ai/models/fireworks/qwen3p6-plus @ai_machinelearning_big_data #qwen

🚀 GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией! Обе модели • Обучены с нуля — без инициализации
+1
🚀 GigaChat 3.1 Ultra и GigaChat 3.1 Lightning в опенсорс под MIT лицензией! Обе модели • Обучены с нуля — без инициализации зарубежными весами • MoE + MTP + MLA • Совместимы с HuggingFace, llama.cpp / vLLM / SGLang Код и веса уже на платформе GitVerse. Это не просто релиз весов, а результат большой инженерной работы над качеством, alignment и стабильностью модели. В блоге команда поделилась результатами и своими наработками. В релизе: высокие результаты на аренах, улучшенный function calling, решённая проблема циклов, DPO в нативном FP8, найденный и зарепорченный баг в SGLang при dp > 1.

🔥 Китайцы выкатили мощный голосовой ИИ - VoxCPM2 Модель от OpenBMB, которая умеет: • Понимать и генерировать речь • Работать
🔥 Китайцы выкатили мощный голосовой ИИ - VoxCPM2 Модель от OpenBMB, которая умеет: • Понимать и генерировать речь • Работать с голосом почти в реальном времени • Делать voice-to-voice без сложных пайплайнов • Подходит под ассистентов, звонки и голосовые агенты Главный плюс - всё это в одной модели, без костылей из ASR + TTS https://huggingface.co/openbmb/VoxCPM2

Проект растет, и быстро искать нужные данные становится все сложнее? Ждем вас на авторском практикуме Дмитрия Кириллова «Разр
Проект растет, и быстро искать нужные данные становится все сложнее? Ждем вас на авторском практикуме Дмитрия Кириллова «Разработка корпоративных RAG-систем на PostgreSQL» от ОТУС! О чём будет эфир: 💾Почему классический поиск и документация перестают работать в сложных системах 💾Что такое RAG-системы и как они устроены 💾Архитектура решения: от данных до ответа пользователю 💾Практика: реализация RAG на базе PostgreSQL 💾Как улучшать качество ответов и снижать галлюцинации Ведущий: Дмитрий Кириллов — педагог, соучредитель и технический директор одного из крупнейших сервисов онлайн-регистрации бизнеса в России. 🎁Бонусы для участников: 7% скидка на любой курс ОТУС + доступ к бесплатному пробному периоду корпоративной платформы 🎁Подарок - мини-курс по PostgreSQL Регистрация открыта: https://tglink.io/c2bbaf26a8a9fa Увидимся на эфире! Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. erid: 2W5zFJNYVwF

Repost from Machinelearning
🔥 Собери свой OpenClaw за вечер Репозиторий, в котором разобрано устройство OpenClaw по слоям. Это формат, которого не хвата
🔥 Собери свой OpenClaw за вечер Репозиторий, в котором разобрано устройство OpenClaw по слоям. Это формат, которого не хватает большинству гайдов, пошаговая сборка системы, где каждый этап добавляет новый уровень сложности Сначала обычный чат. Потом подключаются инструменты. Затем навыки, работа с вебом, память, маршрутизация задач и мультиагентная логика. В какой-то момент начинаешь ловить себя на мысли, что уже думаешь как оркестратор, а не как пользователь модели В гайде хорошо видно, где заканчивается модель и начинается обвязка. Как строится цикл принятия решений, как агент выбирает инструменты и как вообще появляется ощущение «интеллекта» Дает неплохое понимание архитектуры клешни. https://github.com/czl9707/build-your-own-openclaw @ai_machinelearning_big_data #opensource #openclaw

💨 Тормозят SQL-запросы и дашборды? Мы повторяем самый эффективный Практикум года! Спикер - Георгий Семенов, руководитель ком
💨 Тормозят SQL-запросы и дашборды? Мы повторяем самый эффективный Практикум года! Спикер - Георгий Семенов, руководитель команды Analytics Engineering в Яндексе. Его опыт (VK, Wildberries, ЦУМ, ВТБ) и 14 лет в управлении IT-проектами — это концентрат практических знаний без воды! Приглашаем вас на практикум «Аналитика без тормозов: разгоните свои дашборды и SQL-запросы» 7 апр в 19:00. Мы разберем, как радикально ускорить вашу работу. На вебинаре вы: 🔹 Узнаете об эффективных подходах — от тактических SQL-приёмов до стратегических архитектурных решений. 🔹 Разберёте конкретные методы, применимые к любой СУБД, и тонкие нюансы оптимизации. 🔹 Получите готовый набор фишек для ускорения запросов и витрин уже на следующий день. Устали каждый раз пить кофе, пока выполняется запрос? Раздражает, когда дашборд висит на последнем проценте загрузки? Пора это прекратить - регистрация прямо здесь: https://tglink.io/c3219750010c3e Реклама. ООО "АЙТИ РЕЗЮМЕ". ИНН 4025460134. erid: 2W5zFHzJgi5