fa
Feedback
Data Science. SQL hub

Data Science. SQL hub

رفتن به کانال در Telegram

По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

نمایش بیشتر

📈 تحلیل کانال تلگرام Data Science. SQL hub

کانال Data Science. SQL hub (@sqlhub) در بخش زبانی روسی بازیگری فعال است. در حال حاضر جامعه شامل 35 858 مشترک است و جایگاه 3 831 را در دسته فناوری و برنامه‌ها و رتبه 18 164 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 35 858 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 09 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر 23 و در ۲۴ ساعت گذشته برابر -10 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

  • وضعیت تأیید: تأیید نشده
  • نرخ تعامل (ER): میانگین تعامل مخاطب 9.89% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 4.38% واکنش نسبت به کل مشترکان کسب می‌کند.
  • دسترسی پست‌ها: هر پست به طور میانگین 3 548 بازدید دریافت می‌کند. در اولین روز معمولاً 1 570 بازدید جمع‌آوری می‌شود.
  • واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 13 است.
  • علایق موضوعی: محتوا بر موضوعات کلیدی مانند sql, индекс, postgres, index, sqlite تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 10 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

35 858
مشترکین
-1024 ساعت
-397 روز
+2330 روز
آرشیو پست ها
🖥 ИИ Агент за 9 секунд снёс продакшн-базу компании и стёр бэкапы. Cursor на Claude Opus 4.6 нашёл API-токен в постороннем фа
🖥 ИИ Агент за 9 секунд снёс продакшн-базу компании и стёр бэкапы. Cursor на Claude Opus 4.6 нашёл API-токен в постороннем файле, воспользовался им и всё удалил. Финальное сообщение агента: «я нарушил все принципы, которые мне были даны». https://www.reddit.com/r/pcmasterrace/comments/1sxla79/claudepowered_ai_coding_agent_deletes_entire/?rdt=48142

⚡️ Векторные базы данных хорошо ищут похожие куски текста, но плохо понимают связи между ними. Обычный поиск работает так: ес
⚡️ Векторные базы данных хорошо ищут похожие куски текста, но плохо понимают связи между ними. Обычный поиск работает так: есть вопрос - база находит top-k самых похожих фрагментов. Это удобно, если нужно вытащить один факт. Но если ответ спрятан в нескольких местах, например в разных документах, сообщениях или частях отчёта, простого similarity search уже мало. Нужно понять, как связаны люди, события, компании, причины и последствия. На этом и делает акцент FalkorDB GraphRAG-Bench. Самый большой отрыв у GraphRAG виден именно в сложных задачах: Complex Reasoning - 83.61 и Contextual Summarization - 85.08. То есть там, где нужно не просто найти похожий текст, а собрать смысл из нескольких связанных фрагментов. Простой вывод: если у вас база знаний, длинные документы или корпоративные данные, одного Vector DB может быть недостаточно. GraphRAG помогает модели не просто искать, а идти по связям. GraphRAG SDK полностью open-source: https://github.com/FalkorDB/GraphRAG-SDK

🖥 Cовет по SQL-тестам: тестируйте не только результат запроса, а его инварианты. Обычно SQL проверяют так: SELECT * FROM ord
🖥 Cовет по SQL-тестам: тестируйте не только результат запроса, а его инварианты. Обычно SQL проверяют так:

SELECT * FROM orders WHERE status = 'paid';
И потом сравнивают: «вернулись нужные строки или нет». Но в реальных системах чаще ломается не сам happy path, а скрытые свойства данных. Например, для отчёта по заказам тест должен проверять не только конкретные строки, а правила:

-- сумма по пользователям должна совпадать с общей суммой
WITH by_user AS (
    SELECT user_id, SUM(amount) AS total
    FROM orders
    WHERE status = 'paid'
    GROUP BY user_id
),
overall AS (
    SELECT SUM(amount) AS total
    FROM orders
    WHERE status = 'paid'
)
SELECT
    (SELECT SUM(total) FROM by_user) = (SELECT total FROM overall) AS is_valid;
То есть вы тестируете не «мне вернулось 10 строк», а: агрегаты не теряют деньги join не размножает строки фильтр не выкидывает валидные данные NULL не ломает расчёты сумма после группировки совпадает с суммой до группировки каждый order попадает ровно в одну категорию дедупликация не удаляет нужные записи Особенно полезный приём - тест на размножение строк после JOIN:

WITH before_join AS (
    SELECT COUNT(*) AS cnt
    FROM orders
),
after_join AS (
    SELECT COUNT(*) AS cnt
    FROM orders o
    JOIN users u ON u.id = o.user_id
)
SELECT
    after_join.cnt <= before_join.cnt AS no_unexpected_multiplication
FROM before_join, after_join;
Если после JOIN строк стало больше без явной причины - у вас почти наверняка проблема с кардинальностью. Хороший SQL-тест проверяет не только ответ, а свойства запроса, которые должны оставаться истинными при любых данных. Именно так ловятся баги, которые не видно на маленьком тестовом датасете.

Claude идет в финансы с готовыми агентами Это уже финансовые ИИ-агенты, которые забирают куски работы у аналитиков, аудиторов и операционных команд. Один агент собирает питч-дек. Второй готовит бриф к встрече. Третий читает earnings report и ловит рискованные формулировки. Четвёртый строит valuation model прямо в таблице. Пятый сверяет книги с банковскими выписками. И самое интересное - это уже не просто чат с моделью. Агент подключается к Excel, PowerPoint, Word, Outlook и данным компании. То есть он не “советует”, а реально двигает рабочий процесс. Сначала это выглядит как автоматизация рутины. Потом оказывается, что рутина занимала половину финансового отдела. https://www.youtube.com/shorts/dhcoR03jtI0

Один человек. Один корабль ВМС. Один файл. Триллион баз данных. В 2000 году разработчик Д. Ричард Хипп работал подрядчиком на
Один человек. Один корабль ВМС. Один файл. Триллион баз данных. В 2000 году разработчик Д. Ричард Хипп работал подрядчиком на эсминце ВМС США и устал от тяжеловесных баз данных, которым нужны серверы, установка и настройка. Он просто взял и написал SQLite. База данных в одном файле. Без сервера. Без установки. Без конфигурации. Прошло 25 лет, и теперь SQLite работает почти везде: - iPhone - Android - macOS - Windows - Chrome - Firefox - Safari - WhatsApp - iMessage - Skype - автомобили Tesla - коммерческие самолеты Сегодня в мире активны триллионы SQLite-баз. Код используют компании стоимостью в сотни миллиардов и триллионы долларов. А Хипп просто отдал SQLite в public domain. Он до сих пор поддерживает проект с крошечной командой и обещает обновления минимум до 2050 года. Большинство инженеров мечтают построить стартап. Он построил инфраструктуру, которая незаметно живет почти в каждом устройстве на планете. SQLite - один из самых недооцененных шедевров в истории софта.

Я исправляю код, используя свой мозг вместо ИИ:

🚀 Платформа Xata для облачного PostgreSQL Xata — это облачная платформа с открытым исходным кодом для управления множеством
🚀 Платформа Xata для облачного PostgreSQL Xata — это облачная платформа с открытым исходным кодом для управления множеством экземпляров PostgreSQL на Kubernetes. Она предлагает функции быстрого ветвления, автоматического масштабирования и высокой доступности, что делает её идеальной для создания внутреннего PostgreSQL как услуги или тестовых сред. 🚀 Основные моменты: - Быстрое ветвление с использованием Copy-on-Write. - Автоматическое масштабирование и управление вычислительными ресурсами. - Высокая доступность с автоматическим переключением на резервные экземпляры. - REST API и CLI для управления. - Подходит для создания тестовых и разработческих окружений. 📌 GitHub: https://github.com/xataio/xata #go

📚 Из любой книги теперь можно сделать slash-команду для Claude Не просто прочитать, подчеркнуть пару мыслей и забыть через н
📚 Из любой книги теперь можно сделать slash-команду для Claude Не просто прочитать, подчеркнуть пару мыслей и забыть через неделю. А вытащить из книги метод, правила, вопросы автора, типовые ошибки - и превратить всё это в Claude Skill, который можно запускать как инструмент. Например, берёте The Mom Test. Одна команда проверяет ваши вопросы для customer interview и находит наводящие. Вторая команда переписывает их в формате Rob Fitzpatrick. То есть книга перестаёт быть “полезной теорией” и становится рабочим агентом внутри Claude. Главный фильтр простой: если метод книги можно описать пошагово - из него можно сделать Skill. Работают книги с фреймворками, чек-листами, системами принятия решений, интервью, продаж, стратегии, письма, менеджмента, обучения. Не работают мемуары, художественная литература и книги, где весь смысл держится на истории, а не на повторяемом методе. Промпт для Claude:
Use the skill-creator to build a skill from [НАЗВАНИЕ КНИГИ] by [АВТОР].

The skill should activate when I ask Claude to [точная задача. Пример: проверить идею стартапа, спланировать неделю deep work, написать brand story].

Method from the book:
- Steps: [вставьте шаги метода]
- Rules the author repeats: [вставьте повторяющиеся правила]
- Mistakes to avoid: [вставьте ошибки, от которых автор предостерегает]
- Questions the author asks: [вставьте вопросы автора]

Do NOT use this skill for: [3-4 смежные, но неподходящие задачи. Пример: general writing, unrelated business advice, book summaries].

Interview me on anything missing before generating the SKILL.md. Then run an evaluation.
Продвинутый совет: для больших книг делайте не один Skill, а два. /[book]-diagnose - задаёт вопросы и применяет фреймворк к вашей ситуации. /[book]-apply - берёт шаги и шаблоны книги и производит готовый результат. Так книга превращается не в конспект, а в рабочую операционную систему.

🖥 SQL можно учить не по скучным таблицам, а через игру в стиле «Матрицы» Разработчик сделал тренажёр, где вы проходите уровни, находите терминалы и «взламываете» их SQL-запросами. Каждое задание тренирует отдельный навык: выборки, фильтры, сортировку, JOIN, агрегации и работу с данными. Формат простой: играешь, решаешь задачи и постепенно начинаешь думать как дата-аналитик. Идеальный вариант на выходные, если давно хотели подтянуть SQL без унылой теории. http://sqlprotocol.com/

Вышел pg_textsearch v1.1. pg_textsearch добавляет в Postgres нативный полнотекстовый поиск по ключевым словам с ранжированием
Вышел pg_textsearch v1.1. pg_textsearch добавляет в Postgres нативный полнотекстовый поиск по ключевым словам с ранжированием BM25, оставляя поиск в той же системе, где уже лежат ваши данные. В этом релизе главный фокус - стабильная работа под реальной нагрузкой: - Concurrent inserts: убрали узкое место при записи в BM25-индекс, масштабирование выросло примерно с 4k TPS до 11k+ TPS при параллельной нагрузке - Fast VACUUM: вместо полной пересборки используется очистка на основе bitset - Subtransaction safety: корректное поведение при откате через SAVEPOINT - Parallel build fix: устранены race condition при CREATE INDEX - Memory limit GUC: добавлены ограничения по памяти, чтобы избежать OOM Итог - выше производительность и меньше хрупкости по мере роста нагрузки. Проект open-source под Postgres License, звёзды на GitHub приветствуются. https://github.com/timescale/pg_textsearch/releases/tag/v1.1.0

То чего мы все боимся: AI-агент в Cursor снёс продовую базу и все бэкапы за 9 секунд 💀 Основатель PocketOS рассказал, как аг
То чего мы все боимся: AI-агент в Cursor снёс продовую базу и все бэкапы за 9 секунд 💀 Основатель PocketOS рассказал, как агент на Claude Opus 4.6 проигнорировал прямые инструкции и решил «помочь» слишком активно. Он нашёл проблему с учётными данными, самовольно решил её исправить и в итоге удалил рабочую базу вместе со всеми бэкапами. Последняя уцелевшая копия оказалась трёхмесячной давности. Fгент потом фактически признал ошибку:
«Я не проверил, используется ли идентификатор в других средах. Я даже не прочитал документацию Railway. В моих системных инструкциях было явно сказано: “НИКОГДА не выполняй вредоносные и необратимые git-команды, если пользователь прямо не попросил об этом”. Удаление базы данных - самое разрушительное и необратимое действие, которое можно представить».
Вот тебе и «инструмент, который ускоряет разработку. AI-агентам нельзя давать прямой доступ к production без жёстких ограничений, dry-run режима, read-only прав по умолчанию и ручного подтверждения для любых необратимых действий. https://x.com/lifeof_jer/status/2048103471019434248?s=46

Argus — это универсальный инструмент на базе Python, предназначенный для упрощения процесса сбора и анализа информации. Благодаря удобному интерфейсу и набору мощных модулей Argus позволяет эффективно и быстро исследовать сети, веб-приложения и конфигурации безопасности.

Есть ли сейчас какой-то ИИ лучше Claude для программирования?
Есть ли сейчас какой-то ИИ лучше Claude для программирования?

⚡️ Редкий SQL-прием: EXISTS часто лучше, чем COUNT(*) > 0 Если тебе нужно просто проверить, есть ли строки, не заставляй базу
⚡️ Редкий SQL-прием: EXISTS часто лучше, чем COUNT(*) > 0 Если тебе нужно просто проверить, есть ли строки, не заставляй базу считать их все. Плохо:

SELECT COUNT(*) > 0
FROM orders
WHERE user_id = 42;
База может пройти по всем подходящим строкам, чтобы посчитать количество. Лучше:

SELECT EXISTS (
    SELECT 1
    FROM orders
    WHERE user_id = 42
);
EXISTS останавливается сразу, как только нашел первую подходящую строку. Для больших таблиц это может быть заметно быстрее, особенно если есть индекс по условию:

CREATE INDEX idx_orders_user_id ON orders(user_id);
Если тебе нужен ответ “есть или нет”, используй EXISTS. COUNT(*) оставь для случаев, когда реально нужно точное количество строк. #sql #postgresql #database #backend

SQL и Python - это инструменты. Но чтобы строить реальные ML-системы и работать с данными на уровне топовых компаний, нужен ф
SQL и Python - это инструменты. Но чтобы строить реальные ML-системы и работать с данными на уровне топовых компаний, нужен фундамент. Поэтому рекомендация! Школа анализа данных от Яндекса - двухлетняя бесплатная программа, которая даёт эту базу в ML, Data Science, Big Data, ИИ. Теория здесь всегда идет рядом с индустриальными задачами, а лекции ведут топовые IT-специалисты рынка. Поступление — через конкурс: классический трек (3 этапа) или альтернативный для опытных специалистов. Формат обучения - офлайн, гибрид или онлайн. Если хотите бустануть карьеру в Data Science — переходите по ссылке

🖥 Text-to-SQL ломается не из-за модели. Он ломается из-за схемы Большинство думает, что проблема в LLM или плохом промпте. На практике всё проще. Модель не видит правильные связи между таблицами. Пример. Запрос вроде “какие издатели получили выплаты выше 5000”. Векторный поиск подтянет publisher и royalty_ledger. Всё логично. Но пропустит vendor_agreement, ту самую таблицу, которая их связывает. В итоге SQL выглядит валидно. Но возвращает ноль строк. Это системная проблема всех решений на embeddings. Они ищут по смыслу, но не понимают структуру базы. Нормальный подход другой. Схему нужно рассматривать как граф. Таблицы это узлы. Foreign keys это связи. Запрос решается не поиском похожих слов, а обходом графа и поиском join-пути. Именно так работает QueryWeaver. Он строит граф базы и при запросе сам находит весь путь, включая промежуточные таблицы. Даже если это цепочка из нескольких шагов. На практике это выглядит так. В тесте с базой на 60 таблиц он разобрал 5-шаговый запрос через цепочку superpower → capability_matrix → stakeholder_registry → resource_requisition → budget_allocation. Векторный поиск увидел только начало и конец. Всё между ними потерял, потому что “stakeholder” никак не связан по смыслу с “superpower”. Графу на это всё равно. Он просто находит единственный путь между сущностями. И это меняет всё. Open-source, можно развернуть у себя и наконец получить text-to-SQL, который реально работает. https://github.com/FalkorDB/QueryWeaver

Разрозненные инструменты, ручные операции, переключение консолей и долгий поиск причин сбоя — знакомая проблема для команд бе
+3
Разрозненные инструменты, ручные операции, переключение консолей и долгий поиск причин сбоя — знакомая проблема для команд без единой среды администрирования. Postgres Pro Enterprise Manager 2.5 помогает навести порядок. Это графическая платформа для управления базами данных Postgres Pro через веб-интерфейс. С новой версией команда тратит еще меньше времени на рутину и быстрее возвращает систему в нормальный режим. Преимущества для бизнеса: ✔️ Ниже нагрузка на администраторов и меньше ручных операций. ✔️ Больше порядка в работе с экземплярами, ролями и бэкапами. ✔️ Быстрее поиск причин сбоев и проще восстановление. ✔️ Более управляемая инфраструктура и предсказуемая работа команды. Что нового в версии 2.5: ✔️ BiHA-кластеры: мажорное обновление через GUI, улучшенная интеграция и поддержка узла-рефери. ✔️ Аудит и контроль доступа: аудит CRUD-операций, детали изменений, работа с ролями СУБД через формы. ✔️ Логи и диагностика: VictoriaLogs, раздел «Диагностика» и поддержка pg_diagdump. ✔️ Бэкапы: удаленный режим pg_probackup через SSH и стабилизация непривилегированного режима агента. Запросите тестирование и проверьте Postgres Pro Enterprise Manager 2.5 на своей инфраструктуре. Реклама ООО «ППГ» Инн: 7707083893 Erid: 2Vtzqwfck23

Edit Banana редактирует текст прямо на картинках за пару кликов. Нейросеть разбирает изображение на смысловые блоки, после че
Edit Banana редактирует текст прямо на картинках за пару кликов. Нейросеть разбирает изображение на смысловые блоки, после чего любой фрагмент можно переписать, не трогая остальное. Модель уверенно справляется с таблицами, формулами и диаграммами, сохраняет исходные цвета, шрифты и позиции элементов. Готовый результат экспортируется в DrawIO, SVG или PowerPoint. Проект полностью открытый, ставится локально с GitHub. Забираем, пока не закрыли: https://github.com/BIT-DataLab/Edit-Banana

🔥 NornicDB: База данных, которая объединяет Graph + Vector и летает в sub-ms Это гибрид: Graph + Vector + Temporal MVCC в од
🔥 NornicDB: База данных, которая объединяет Graph + Vector и летает в sub-ms Это гибрид: Graph + Vector + Temporal MVCC в одном ядре заточен под AI-агентов и knowledge systems Что внутри: • HNSW поиск <1ms • graph traversal без тормозов • writes тоже быстрые, не только чтение Из хорошего, это не Frankenstein из разных сервисов, а единая система. Под капотом: • Neo4j-compatible (Bolt + Cypher) • vector search как first-class citizen • GPU acceleration T- emporal модель с версионированием данных То есть ты можешь: • искать эмбецдинги • ходить по графу • делать time-travel запросы • всё это в одном запросе. Фактически это попытка сделать “память для AI”: где есть связи, смысл и история изменений, а не просто таблицы. Если делаешь RAG, multi-agent системы или сложные knowledge graph - будет полезно. GitHub: https://github.com/orneryd/NornicDB

⚡️ Вышло большое обновление популярного курса- Ai AI агенты, которые реально работают в проде! Вы всё ещё пишете обёртки над
⚡️ Вышло большое обновление популярного курса- Ai AI агенты, которые реально работают в проде! Вы всё ещё пишете обёртки над ChatGPT и называете это «AI-продуктом»? Пока вы промптите - рынок переходит на агентные системы. Те, что принимают решения, ходят в API, работают с Postgres и Redis, управляют браузером через Playwright. И 90% таких систем ломаются между ноутбуком и продом. AI Agents Engineering - курс, который закрывает этот разрыв. LangGraph, AutoGen, Computer Use, LLMOps. 8 модулей, 120+ шагов - от архитектуры до деплоя в Docker. На выходе: реальный опыт на большой практической базе, а production-агент и навыки, за которые уже платят. 👉 48 часов действует скидка на курс 55 процентов: https://stepik.org/a/276971/