Data Science. SQL hub
По всем вопросам- @workakkk @itchannels_telegram - 🔥лучшие ит-каналы @ai_machinelearning_big_data - Machine learning @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚 РКН: https://vk.cc/cIi9vo #VRHSZ
Mostrar más📈 Análisis del canal de Telegram Data Science. SQL hub
El canal Data Science. SQL hub (@sqlhub) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 35 818 suscriptores, ocupando la posición 3 803 en la categoría Tecnologías y Aplicaciones y el puesto 18 077 en la región Rusia.
📊 Métricas de audiencia y dinámica
Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 35 818 suscriptores.
Según los últimos datos del 23 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -52, y en las últimas 24 horas de 11, conservando un alto alcance.
- Estado de verificación: No verificado
- Tasa de interacción (ER): El promedio de interacción de la audiencia es 7.89%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 3.50% de reacciones respecto al total de suscriptores.
- Alcance de las publicaciones: Cada publicación recibe en promedio 2 825 visualizaciones. En el primer día suele acumular 1 252 visualizaciones.
- Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 11.
- Intereses temáticos: El contenido se centra en temas clave como sql, индекс, postgres, index, sqlite.
📝 Descripción y política de contenido
El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“По всем вопросам- @workakkk
@itchannels_telegram - 🔥лучшие ит-каналы
@ai_machinelearning_big_data - Machine learning
@pythonl - Python
@pythonlbooks- python книги📚
@datascienceiot - ml книги📚
РКН: https://vk.cc/cIi9vo
#VRHSZ”
Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 24 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.
Carga de datos en curso...
| Fecha | Crecimiento de Suscriptores | Menciones | Canales | |
| 24 junio | +8 | |||
| 23 junio | +15 | |||
| 22 junio | +5 | |||
| 21 junio | +3 | |||
| 20 junio | +4 | |||
| 19 junio | +14 | |||
| 18 junio | +15 | |||
| 17 junio | +8 | |||
| 16 junio | +7 | |||
| 15 junio | +12 | |||
| 14 junio | +4 | |||
| 13 junio | +6 | |||
| 12 junio | +6 | |||
| 11 junio | +12 | |||
| 10 junio | +4 | |||
| 09 junio | +9 | |||
| 08 junio | +6 | |||
| 07 junio | +8 | |||
| 06 junio | +3 | |||
| 05 junio | +8 | |||
| 04 junio | +2 | |||
| 03 junio | +7 | |||
| 02 junio | +2 | |||
| 01 junio | +6 |
| 2 | OpenAI выпустила полную версию GPT-5.5-Cyber — своей самой продвинутой модели для авторизованной защитной кибербезопасности.
Новая модель набрала 85,6% на CyberGym и обошла:
• Mythos 5 — 83,8%
• раннюю версию GPT-5.5-Cyber — 81,9%
• GPT-5.5 — 81,8%
• GPT-5.4 — 79,0%
• Claude Opus 4.7 — 73,1%
Главный акцент — не на «хакинге ради хакинга», а на легальной defensive security: анализе уязвимостей, проверке систем, аудите кода и помощи security-командам.
https://x.com/sama/status/2069121360744550796 | 1 646 |
| 3 | Учим SQL по «Тетради смерти» 😂 | 2 164 |
| 4 | QuestDB - это open-source база данных для time-series данных, созданная для высокоскоростной записи и SQL-запросов с низкой задержкой.
Внутри у неё многоуровневый storage engine и SIMD-ускоренное выполнение.
Что важно:
- Колоночное хранение данных
Параллельное векторное выполнение запросов и использование SIMD-инструкций для ускорения обработки.
- Многоуровневое хранение
От WAL до нативного колоночного формата и Parquet в object storage.
- SQL-расширения для time-series
Поддержка ASOF JOIN, SAMPLE BY и LATEST ON.
- Интеграции
Поддерживает Postgres wire protocol и REST API, поэтому её проще подключать к существующей инфраструктуре.
https://github.com/questdb/questdb | 1 950 |
| 5 | Разберем математику бесконечности Сатору Годжо, которая работает не как обычный щит.
Он не просто останавливает удар в последний момент. Идея в том, что пространство между атакой и Годжо как будто делится на всё более маленькие отрезки.
Сначала объект проходит половину расстояния. Потом половину оставшегося. Потом ещё половину. И так снова и снова.
Математически это похоже на бесконечную сумму: одна вторая, одна четвёртая, одна восьмая, одна шестнадцатая.
Объект всё ближе, но до контакта так и не доходит.
На практике атака как будто замедляется почти до нуля. Чем ближе она к Годжо, тем сильнее падает её эффективная скорость.
Поэтому Бесконечность — это не просто барьер. Это контроль пространства, где противник застревает в бесконечном приближении. | 2 102 |
| 6 | Команда Tongyi Lab из Alibaba представила LOGOS, большую модель для всей естественной науки сразу.
Идея простая: если ChatGPT учится предсказывать следующее слово, то LOGOS так же предсказывает следующий кусочек белка, молекулы или реакции.
Разные научные объекты записываются одним общим языком токенов.
Плюс в том, что модель переносит знания между областями: понятое про молекулы помогает в работе с белками.
По словам авторов, на разных задачах LOGOS не уступает моделям, заточенным под конкретную область, а иногда и обходит их. Модель, код и статья уже выложены на HuggingFace, GitHub и arXiv.
🤗 HuggingFace: https://huggingface.co/LOGOS-Hub
💻 GitHub: https://github.com/LOGOS-Hub/LOGOS
📄 Paper: https://arxiv.org/abs/2606.16905 | 1 957 |
| 7 | Google Research представила Gemini-SQL2 - новую систему text-to-SQL на базе Gemini 3.1 Pro.
Она превращает вопросы на обычном языке в исполняемые SQL-запросы, позволяя получать данные из баз без ручного написания кода.
На бенчмарке BIRD система показала state-of-the-art результат - 80,04% execution accuracy.
BIRD реально запускает запрос и проверяет, возвращает ли он правильный результат.
https://x.com/GoogleResearch/status/2065475343205740911 | 2 374 |
| 8 | 📚 Библиотека для работы с SQLite в C++26 с использованием рефлексии
Reflite — это библиотека на C++26, которая упрощает взаимодействие с SQLite, позволяя использовать обычные структуры как основу для выполнения запросов. Она поддерживает основные операции: вставка, удаление, выборка и обновление, избавляя от лишнего шаблона кода.
🚀 Основные моменты:
- Легковесная библиотека в одном файле
- Поддержка операций INSERT, DELETE, SELECT, UPDATE
- Использует рефлексию для работы с типами структур
- Не требует полной реализации SQL, фокус на простоте
- Совместима с современными компиляторами C++26
📌 GitHub: https://github.com/KaruroChori/reflite
#cpp | 2 601 |
| 9 | OptimizerDuck - open-source утилита, после которой CCleaner уже не нужен
OptimizerDuck собирает в одном приложении 30+ твиков системы: от отключения телеметрии, Copilot, Cortana и рекламного ID до тонкой настройки автозагрузки, служб, питания и задержек ввода.
Укаждой настройки есть рейтинг риска. То есть вы заранее видите, что безопасно применить, а где лучше подумать, вместо классического сценария «нажал всё подряд и потом откатываешь систему».
Что умеет:
* отключать телеметрию Windows, Cortana, Copilot и рекламный ID
* управлять автозагрузкой приложений
* настраивать службы хоста под объём RAM
* включать кастомный план питания для высокой производительности
* снижать задержку клавиатуры для игр
* применять GPU-твики, которые обычно правят вручную через реестр
Все изменения обратимы. Не понравилось, можно откатить назад. можно откатить назад.
https://github.com/itsfatduck/optimizerDuck | 3 270 |
| 10 | ✔️ IPO OpenAI произойдет в 2027 году
Сэм Альтман сообщил сотрудникам, что выход на биржу откладывается на год. Поданный проспект эмиссии он назвал маневром для сохранения тактической свободы. В качестве альтернативы сотрудникам предложили выкупить их акции по цене $687,69 за штуку.
Задержка объясняется прогрессом в разработке самообучающегося ИИ. По мнению главы OpenAI, в период непредсказуемого развития технологий компании безопаснее оставаться непубличной.
Дополнительный фактор переноса - размещение акций Anthropic. Конкурент показывает лучшие метрики роста, тогда как OpenAI сжигает капитал.
В июне компания планирует выпустить новую модель с индексом 5.6, которую внутри оценивают как серьезный шаг вперед по сравнению с GPT-5.5.
theinformation.com
✔️ Arcee AI переезжает из AWS на Hugging Face
Данные компании разместят в сервисе Hugging Face Buckets, который оснащен встроенной CDN и оптимизирован для работы с весами моделей.
Главная причина миграции в отсутствии платы за исходящий трафик. Единое хранилище позволит Arcee AI избежать вендор-лока и запускать обучающие кластеры у любых облачных провайдеров без затрат на перенос данных.
На Hugging Face лаборатория поддерживает более 200 проектов. Среди них - файнтюн SuperNova на базе Llama 3.1, семейство моделей Trinity и открытый датасет The-Tome, включающий 1,75 млн образцов для обучения ИИ-агентов.
huggingface.co
✔️ NotebookLM получил среду для запуска кода, агентов и модель Gemini 3.5
Google обновила платформу NotebookLM. Система перешла на Gemini 3.5 и движок Antigravity, получила поддержку автономных агентов и возможность запуска кода.
Каждый блокнот теперь оснащается облачным инстансом, который включает более 100 скиллов для выполнения кода и анализа данных. В тестах новая архитектура превосходит предыдущую в 65% случаев по 5 ключевым метрикам.
В сервисе появилась возможность начинать исследования без загрузки данных через агентный поиск релевантных материалов. Результаты попадают в базу с сохранением атрибуции.
Расширились форматы экспорта: PDF-отчеты с графиками, структурированные данные, таблицы Excel, презентации PowerPoint, а также изображения с помощью Nano Banana.
Обновление доступно пользователям с подпиской AI Ultra и корпоративным клиентам.
blog.google
✔️ Cohere выпустила свою первую открытую кодинг-модель
North Mini Code - open-source модель для программирования и координации агентов, построена на архитектуре MoE с 30 млрд общих и 3 млрд активных параметров. Модель обучена управлять субагентами, проектировать архитектуру систем и проводить код-ревью.
В бенчмарке Artificial Analysis Coding Index новинка набрала 33,4 балла. В сравнении с Devstral Small 2 на аналогичной аппаратной нагрузке пропускная способность генерации текста выше в 2,8 раза. Задержка между токенами ниже на 30% при сопоставимом времени до вывода первого токена.
Веса опубликованы на Hugging Face. Тестовый доступ открыт через API и платформу Model Vault.
cohere.com
✔️ Warner Music Group приобрела разработчика цифровых отпечатков Sureel AI
Технология Sureel AI создает цифровые отпечатки аудиозаписей, декомпозируя их на базовые элементы. Алгоритмы определяют, попал ли контент артиста в тренировочный датасет ИИ-модели или использовался при генерации нового трека.
Дополнительный модуль системы выявляет дипфейки, клонирование голоса и копирование визуального стиля. Архитектура платформы поддерживает работу с видео и изображениями, в базе стартапа проиндексированы миллионы цифровых активов.
Лейбл сохранит проект как независимую платформу, рассчитывая сделать ее стандартом для музыкальной индустрии.
wmg.com
@ai_machinelearning_big_data
#news #ai #ml | 3 036 |
| 11 | Готов к космическому разгону AI‑продукта?
Приходи на One Day Offer для Product Analysts! 🚀
20 июня команда GigaChat планирует найти будущего коллегу — продуктового аналитика, который поможет вывести LLM‑платформу на новую орбиту.
Ты будешь:
✔️ анализировать поведение пользователей;
✔️ проводить A/B‑тесты;
✔️ создавать дашборды;
✔️ работать с метриками.
А ещё ты станешь частью крупнейшего IT‑комьюнити.
Хочешь влиять на продукт для миллионов? Регистрируйся на One Day Offer прямо сейчас! | 2 694 |
| 12 | SQLModel использует аннотации типов Python, чтобы объединить Pydantic и SQLAlchemy и уменьшить дублирование кода при работе с SQL-базами.
* одна аннотация типа заменяет отдельные модели Pydantic и SQLAlchemy
* хорошо совместим с FastAPI, Pydantic и SQLAlchemy
* внутри работает на базе Pydantic и SQLAlchemy
* разумные настройки по умолчанию уменьшают количество шаблонного кода
https://github.com/fastapi/sqlmodel | 2 880 |
| 13 | Сотрудники Авито ведут свой telegram-канал ⭐️
И знаете, получается мегалампово и увлекательно. Всего через несколько постов начинаешь уже чувствовать себя частью их уютного офиса: рядом знакомые весёлые коллеги из постов, и вам точно есть что обсудить.
А вообще, хвалим и одобряем. Во-первых, смело и интересно. Во-вторых, для тех, кто рассматривает работу в компании, это возможность изучить культуру и атмосферу в команде ещё до трудоустройства.
🔥 Однозначно подписка — @TeamAvito
🔥🔥 Если думаешь о работе в Авито, то добавляй сразу — @avito_career | 2 791 |
| 14 | PostgreSQL 19 Beta 1 добавляет ON CONFLICT DO SELECT.
Выглядит как незначительно изменение, но для разработки это очень удобная штука: теперь можно атомарно сделать get-or-create.
То есть логика становится простой:
- вставить строку
- если такой ключ уже есть - не обновлять её
- просто вернуть существующую запись
Пример:
INSERT INTO users (email, name)
VALUES ('alice@example.com', 'Alice')
ON CONFLICT (email) DO SELECT
RETURNING *;
Раньше для такого случая часто приходилось городить обходные варианты через DO NOTHING, отдельный SELECT, CTE или искусственный DO UPDATE, который ничего по сути не меняет.
Теперь PostgreSQL закрывает один из самых частых кейсов в backend-разработке: безопасно создать запись или получить уже существующую без лишней гонки между запросами.
Простой синтаксис, большой плюс к читаемости. | 2 952 |
| 15 | Как не потеряться в потоке кандидатов?
На каждую DS-вакансию десятки откликов, а работодатели становятся разборчивее: хотят не только технические навыки, но и понимание бизнеса, умение решать реальные задачи.
11 июня в 19:00 Вера Коливерда, старший аналитик данных Райффайзен Банка и преподаватель НИУ ВШЭ, расскажет, какие навыки востребованы в аналитике в 2026 году и как выстроить траекторию.
На бесплатном вебинаре разберем задачу предсказания оттока - реальный кейс: сегментация клиентов и алгоритмы ML без учебных датасетов.
Подойдет тем, кто входит в DS или хочет структурировать знания для уверенного старта на рынке/
Присоединяйтесь к эфиру 11 июня в 19:00 по ссылке: https://clc.to/erid_2W5zFG65QBs
Реклама. ООО "КАРПОВ КУРСЫ". ИНН 7811764627. erid: 2W5zFG65QBs | 84 |
| 16 | Хорошая история из серии «скрипт был почти правильный, пока не удалил всё».
The Register рассказал кейс консультанта по тест-автоматизации. У клиента была система управления тестами, куда складывались видеозаписи test evidence. Роликов накопилось около 600, вручную удалять их было долго, поэтому консультант написал скрипт для очистки.
Он отладил код, прошёлся по значениям, проверил один файл, всё выглядело нормально. Потом скрипт удалил не только этот файл, а весь контейнер с видео и другими данными.
Проект был в разгаре, данные были важные, но консультант решил не признаваться. Он сообщил о потере данных как о проблеме системы и завёл тикет в поддержку.
Через неделю данные восстановили из бэкапа. Поддержка так и не нашла точную причину, зато взяла вину на себя: мол, один из SaaS-скриптов вышел из-под контроля и удалил контент.
Смешно читать, страшно узнавать себя.
Инженерный урок тут простой:
- destructive scripts должны сначала работать в dry-run
- удаление по контейнеру или префиксу требует явного allowlist
- перед массовой операцией нужен лимит на количество затронутых объектов
- лог «что будет удалено» важнее, чем уверенность автора
- бэкап спасает не от ошибки, а от катастрофы после ошибки
https://www.theregister.com/software/2026/06/08/consultant-mistakenly-deleted-a-ton-of-data-but-reported-it-as-a-bug/5245952 | 3 133 |
| 17 | SQL-приём: FILTER в агрегатах вместо пачки CASE WHEN.
Обычно пишут так:
SELECT
COUNT(*) AS total_orders,
SUM(CASE WHEN status = 'paid' THEN 1 ELSE 0 END) AS paid_orders,
SUM(CASE WHEN status = 'failed' THEN 1 ELSE 0 END) AS failed_orders,
SUM(CASE WHEN amount > 1000 THEN amount ELSE 0 END) AS big_order_revenue
FROM orders;
Но в PostgreSQL это можно сделать чище:
SELECT
COUNT(*) AS total_orders,
COUNT(*) FILTER (WHERE status = 'paid') AS paid_orders,
COUNT(*) FILTER (WHERE status = 'failed') AS failed_orders,
SUM(amount) FILTER (WHERE amount > 1000) AS big_order_revenue
FROM orders;
Чем полезно:
• запрос читается как аналитическая таблица
• меньше шума от CASE WHEN
• проще добавлять новые метрики
• условия не смешиваются с логикой агрегации
• особенно удобно для дашбордов и отчётов
А ещё можно делать несколько метрик по разным условиям за один проход по данным:
SELECT
date_trunc('day', created_at) AS day,
COUNT(*) FILTER (WHERE status = 'paid') AS paid,
COUNT(*) FILTER (WHERE status = 'refunded') AS refunded,
AVG(amount) FILTER (WHERE status = 'paid') AS avg_paid_amount
FROM orders
GROUP BY 1
ORDER BY 1;
Это маленькая фича, но в реальной аналитике она сильно повышает читаемость SQL. | 3 440 |
| 18 | 🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ.
Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект.
Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике.
Внутри:
- Python с нуля
- много практики без сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современная разработка с ИИ
- отдельный блок по вайбкодингу
Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния.
48 часов скидка 60%: https://stepik.org/course/288218/ | 3 151 |
| 19 | Nvidia выложила Nemotron 3 Ultra в открытых весах.
Архитектура та же, что в варианте Super: гибрид Mamba-2 с attention плюс LatentMoE. Только теперь всё крупнее и соотношение «качество к стоимости инференса» выглядит сильно.
Гибрид с Mamba бьёт в больное место трансформеров: линейная сложность по длине вместо квадратичной, дешевле на длинном контексте.
LatentMoE добавляет ёмкости без пропорционального роста вычислений.
Веса открыты - можно гонять локально и щупать самим.
🤗BF16 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16
🤗NVFP4 checkpoint: https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-NVFP4
📜Technical Report: https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdf | 3 936 |
| 20 | Как получить БЕСКОНЕЧНЫЕ лимиты ChatGPT, Gemini, Claude и других хайповых нейронок - нашел инструмент, который позволяет максимально экономить токены.
Нашли расширение, которое делает почти магию: переносит диалог с нейронкой в другой аккаунт в один клик.
Когда лимит в ChatGPT, Gemini, Claude или другом сервисе заканчивается, не нужно вручную копировать промпты, ответы и весь контекст. Расширение сохраняет текущий чат и позволяет продолжить разговор с того же места.
Что умеет:
• переносить диалог между аккаунтами • сохранять контекст, результаты и важные данные • избавлять от ручного копирования • быстро продолжать работу после упора в лимиты
Для тех, кто постоянно работает с нейронками, это прям находка.
Ссылка на расширение - https://addons.mozilla.org/ru/firefox/addon/limit-skip/ | 5 590 |
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
