Data Science. SQL hub
По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ
显示更多📈 Telegram 频道 Data Science. SQL hub 的分析概览
频道 Data Science. SQL hub (@sqlhub) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 35 818 名订阅者,在 技术与应用 类别中位列第 3 803,并在 俄罗斯 地区排名第 18 077 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 35 818 名订阅者。
根据 23 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -52,过去 24 小时变化为 11,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 7.89%。内容发布后 24 小时内通常能获得 3.50% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 2 825 次浏览,首日通常累积 1 252 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 11。
- 主题关注点: 内容集中在 sql, индекс, postgres, index, sqlite 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“По всем вопросам- @workakkk
@itchannels_telegram - 🔥лучшие ит-каналы
@ai_machinelearning_big_data - Machine learning
@pythonl - Python
@pythonlbooks- python книги📚
@datascienceiot - ml книги📚
РКН: https://vk.cc/cIi9vo
#VRHSZ”
凭借高频更新(最新数据采集于 24 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
数据加载中...
| 日期 | 订阅者增长 | 提及 | 频道 | |
| 24 六月 | +8 | |||
| 23 六月 | +15 | |||
| 22 六月 | +5 | |||
| 21 六月 | +3 | |||
| 20 六月 | +4 | |||
| 19 六月 | +14 | |||
| 18 六月 | +15 | |||
| 17 六月 | +8 | |||
| 16 六月 | +7 | |||
| 15 六月 | +12 | |||
| 14 六月 | +4 | |||
| 13 六月 | +6 | |||
| 12 六月 | +6 | |||
| 11 六月 | +12 | |||
| 10 六月 | +4 | |||
| 09 六月 | +9 | |||
| 08 六月 | +6 | |||
| 07 六月 | +8 | |||
| 06 六月 | +3 | |||
| 05 六月 | +8 | |||
| 04 六月 | +2 | |||
| 03 六月 | +7 | |||
| 02 六月 | +2 | |||
| 01 六月 | +6 |
| 2 | OpenAI выпустила полную версию GPT-5.5-Cyber — своей самой продвинутой модели для авторизованной защитной кибербезопасности.
Новая модель набрала 85,6% на CyberGym и обошла:
• Mythos 5 — 83,8%
• раннюю версию GPT-5.5-Cyber — 81,9%
• GPT-5.5 — 81,8%
• GPT-5.4 — 79,0%
• Claude Opus 4.7 — 73,1%
Главный акцент — не на «хакинге ради хакинга», а на легальной defensive security: анализе уязвимостей, проверке систем, аудите кода и помощи security-командам.
https://x.com/sama/status/2069121360744550796 | 1 646 |
| 3 | Учим SQL по «Тетради смерти» 😂 | 2 164 |
| 4 | QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.
Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.
Что важно:
- Колоночное хранение данных
Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.
- Многоуровневое хранение
От WAL до нативного колоночного формата и Parquet в object storage.
- SQL-расширения для time-series
Поддержка ASOF JOIN, SAMPLE BY и LATEST ON.
- Интеграции
Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.
https://github.com/questdb/questdb | 1 950 |
| 5 | Разберем математику бесконечности Сатору Годжо, которая работает не как обычный щит.
Он не просто останавливает удар в последний момент. Идея в том, что пространство между атакой и Годжо как будто делится на всё более маленькие отрезки.
Сначала объект проходит половину расстояния. Потом половину оставшегося. Потом ещё половину. И так снова и снова.
Математически это похоже на бесконечную сумму: одна вторая, одна четвёртая, одна восьмая, одна шестнадцатая.
Объект всё ближе, но до контакта так и не доходит.
На практике атака как будто замедляется почти до нуля. Чем ближе она к Годжо, тем сильнее падает её эффективная скорость.
Поэтому Бесконечность — это не просто барьер. Это контроль пространства, где противник застревает в бесконечном приближении. | 2 102 |
| 6 | Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.
Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.
Разные научные объекты записываются одним общим языком токенов.
Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.
По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.
🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905 | 1 957 |
| 7 | Google Research представила Gemini-SQL2 - новую систему text-to-SQL на базе Gemini 3.1 Pro.
Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.
На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.
BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.
https://x.com/GoogleResearch/status/2065475343205740911 | 2 374 |
| 8 | 📚 Библиотека для работы с SQLite в C++26 с использованием рефлексии
Reflite — это библиотека на C++26, которая упрощает взаимодействие с SQLite, позволяя использовать обычные структуры как основу для выполнения запросов. Она поддерживает основные операции: вставка, удаление, выборка и обновление, избавляя от лишнего шаблона кода.
🚀 Основные моменты:
- Легковесная библиотека в одном файле
- Поддержка операций INSERT, DELETE, SELECT, UPDATE
- Использует рефлексию для работы с типами структур
- Не требует полной реализации SQL, фокус на простоте
- Совместима с современными компиляторами C++26
📌 GitHub: https://github.com/KaruroChori/reflite
#cpp | 2 601 |
| 9 | OptimizerDuck - open-source утилита, после которой CCleaner уже не нужен
OptimizerDuck собирает в одном приложении 30+ твиков системы: от отключения телеметрии, Copilot, Cortana и рекламного ID до тонкой настройки автозагрузки, служб, питания и задержек ввода.
Укаждой настройки есть рейтинг риска. То есть вы заранее видите, что безопасно применить, а где лучше подумать, вместо классического сценария «нажал всё подряд и потом откатываешь систему».
Что умеет:
* отключать телеметрию Windows, Cortana, Copilot и рекламный ID
* управлять автозагрузкой приложений
* настраивать службы хоста под объём RAM
* включать кастомный план питания для высокой производительности
* снижать задержку клавиатуры для игр
* применять GPU-твики, которые обычно правят вручную через реестр
Все изменения обратимы. Не понравилось, можно откатить назад. можно откатить назад.
https://github.com/itsfatduck/optimizerDuck | 3 270 |
| 10 | ✔️ IPO OpenAI произойдет в 2027 году
Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.
Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.
Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.
В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com
✔️ Arcee AI переезжает из AWS на Hugging Face
Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.
Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.
На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co
✔️ NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5
Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.
Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.
В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.
Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.
Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google
✔️ Cohere выпустила свою первую открытую кодинг-модель
North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.
В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.
Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com
✔️ Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI
Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.
Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.
Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com
@ai_machinelearning_big_data
#news #ai #ml | 3 036 |
| 11 | Готов к космическому разгону AI‑продукта?
Приходи на One Day Offer для Product Analysts! 🚀
20 июня команда GigaChat планирует найти будущего коллегу — продуктового аналитика, который поможет вывести LLM‑платформу на новую орбиту.
Ты будешь:
✔️ анализировать поведение пользователей;
✔️ проводить A/B‑тесты;
✔️ создавать дашборды;
✔️ работать с метриками.
А ещё ты станешь частью крупнейшего IT‑комьюнити.
Хочешь влиять на продукт для миллионов? Регистрируйся на One Day Offer прямо сейчас! | 2 694 |
| 12 | SQLModel использует аннотации типов Python, чтобы объединить Pydantic и SQLAlchemy и уменьшить дублирование кода при работе с SQL-базами.
* одна аннотация типа заменяет отдельные модели Pydantic и SQLAlchemy
* хорошо совместим с FastAPI, Pydantic и SQLAlchemy
* внутри работает на базе Pydantic и SQLAlchemy
* разумные настройки по умолчанию уменьшают количество шаблонного кода
https://github.com/fastapi/sqlmodel | 2 880 |
| 13 | Сотрудники Авито ведут свой telegram-канал ⭐️
И знаете, получается мегалампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом знакомые весёлые коллеги из постов, и вам точно есть что обсудить.
А вообще, хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и атмосферу в команде ещё до трудоустройства.
🔥 Однозначно подписка — @TeamAvito
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career | 2 791 |
| 14 | PostgreSQL 19 Beta 1 добавляет ON CONFLICT DO SELECT.
Выглядит как незначительно изменение, но для разработки это очень удобная штука: теперь можно атомарно сделать get-or-create.
То есть логика становится простой:
- вставить строку
- если такой ключ уже есть - не обновлять её
- просто вернуть существующую запись
Пример:
INSERT INTO users (email, name)
VALUES ('alice@example.com', 'Alice')
ON CONFLICT (email) DO SELECT
RETURNING *;
Раньше для такого случая часто приходилось городить обходные варианты через DO NOTHING, отдельный SELECT, CTE или искусственный DO UPDATE, который ничего по сути не меняет.
Теперь PostgreSQL закрывает один из самых частых кейсов в backend-разработке: безопасно создать запись или получить уже существующую без лишней гонки между запросами.
Простой синтаксис, большой плюс к читаемости. | 2 952 |
| 15 | Как не потеряться в потоке кандидатов?
На каждую DS-вакансию десятки откликов, а работодатели становятся разборчивее: хотят не только технические навыки, но и понимание бизнеса, умение решать реальные задачи.
11 июня в 19:00 Вера Коливерда, старший аналитик данных Райффайзен Банка и преподаватель НИУ ВШЭ, расскажет, какие навыки востребованы в аналитике в 2026 году и как выстроить траекторию.
На бесплатном вебинаре разберем задачу предсказания оттока - реальный кейс: сегментация клиентов и алгоритмы ML без учебных датасетов.
Подойдет тем, кто входит в DS или хочет структурировать знания для уверенного старта на рынке/
Присоединяйтесь к эфиру 11 июня в 19:00 по ссылке: https://clc.to/erid_2W5zFG65QBs
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFG65QBs | 84 |
| 16 | Хорошая история из серии «скрипт был почти правильный, пока не удалил всё».
The Register рассказал кейс консультанта по тест-автоматизации. У клиента была система управления тестами, куда складывались видеозаписи test evidence. Роликов накопилось около 600, вручную удалять их было долго, поэтому консультант написал скрипт для очистки.
Он отладил код, прошёлся по значениям, проверил один файл, всё выглядело нормально. Потом скрипт удалил не только этот файл, а весь контейнер с видео и другими данными.
Проект был в разгаре, данные были важные, но консультант решил не признаваться. Он сообщил о потере данных как о проблеме системы и завёл тикет в поддержку.
Через неделю данные восстановили из бэкапа. Поддержка так и не нашла точную причину, зато взяла вину на себя: мол, один из SaaS-скриптов вышел из-под контроля и удалил контент.
Смешно читать, страшно узнавать себя.
Инженерный урок тут простой:
- destructive scripts должны сначала работать в dry-run
- удаление по контейнеру или префиксу требует явного allowlist
- перед массовой операцией нужен лимит на количество затронутых объектов
- лог «что будет удалено» важнее, чем уверенность автора
- бэкап спасает не от ошибки, а от катастрофы после ошибки
https://www.theregister.com/software/2026/06/08/consultant-mistakenly-deleted-a-ton-of-data-but-reported-it-as-a-bug/5245952 | 3 133 |
| 17 | SQL-приём: FILTER в агрегатах вместо пачки CASE WHEN.
Обычно пишут так:
SELECT
COUNT(*) AS total_orders,
SUM(CASE WHEN status = 'paid' THEN 1 ELSE 0 END) AS paid_orders,
SUM(CASE WHEN status = 'failed' THEN 1 ELSE 0 END) AS failed_orders,
SUM(CASE WHEN amount > 1000 THEN amount ELSE 0 END) AS big_order_revenue
FROM orders;
Но в PostgreSQL это можно сделать чище:
SELECT
COUNT(*) AS total_orders,
COUNT(*) FILTER (WHERE status = 'paid') AS paid_orders,
COUNT(*) FILTER (WHERE status = 'failed') AS failed_orders,
SUM(amount) FILTER (WHERE amount > 1000) AS big_order_revenue
FROM orders;
Чем полезно:
• запрос читается как аналитическая таблица
• меньше шума от CASE WHEN
• проще добавлять новые метрики
• условия не смешиваются с логикой агрегации
• особенно удобно для дашбордов и отчётов
А ещё можно делать несколько метрик по разным условиям за один проход по данным:
SELECT
date_trunc('day', created_at) AS day,
COUNT(*) FILTER (WHERE status = 'paid') AS paid,
COUNT(*) FILTER (WHERE status = 'refunded') AS refunded,
AVG(amount) FILTER (WHERE status = 'paid') AS avg_paid_amount
FROM orders
GROUP BY 1
ORDER BY 1;
Это маленькая фича, но в реальной аналитике она сильно повышает читаемость SQL. | 3 440 |
| 18 | 🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ.
Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект.
Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике.
Внутри:
- Python с нуля
- много практики без сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современная разработка с ИИ
- отдельный блок по вайбкодингу
Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния.
48 часов скидка 60%: https://stepik.org/course/288218/ | 3 151 |
| 19 | Nvidia выложила Nemotron 3 Ultra в открытых весах.
Архитектура та же, что в варианте Super: гибрид Mamba-2 с attention плюс LatentMoE. Только теперь всё крупнее и соотношение «качество к стоимости инференса» выглядит сильно.
Гибрид с Mamba бьёт в больное место трансформеров: линейная сложность по длине вместо квадратичной, дешевле на длинном контексте.
LatentMoE добавляет ёмкости без пропорционального роста вычислений.
Веса открыты - можно гонять локально и щупать самим.
🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf | 3 936 |
| 20 | Как получить БЕСКОНЕЧНЫЕ лимиты ChatGPT, Gemini, Claude и других хайповых нейронок - нашел инструмент, который позволяет максимально экономить токены.
Нашли расширение, которое делает почти магию: переносит диалог с нейронкой в другой аккаунт в один клик.
Когда лимит в ChatGPT, Gemini, Claude или другом сервисе заканчивается, не нужно вручную копировать промпты, ответы и весь контекст. Расширение сохраняет текущий чат и позволяет продолжить разговор с того же места.
Что умеет:
• переносить диалог между аккаунтами • сохранять контекст, результаты и важные данные • избавлять от ручного копирования • быстро продолжать работу после упора в лимиты
Для тех, кто постоянно работает с нейронками, это прям находка.
Ссылка на расширение - https://addons.mozilla.org/ru/firefox/addon/limit-skip/ | 5 590 |
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
