DATABASE DESIGN
Открыть в Telegram
Лучшие материалы по работе с хранилищами данных на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels Другие наши проекты: https://tprg.ru/media
Больше1 356
Подписчики
-124 часа
-57 дней
-1130 день
Загрузка данных...
Похожие каналы
Облако тегов
Входящие и исходящие упоминания
---
---
---
---
---
---
Привлечение подписчиков
июнь '26
июнь '260
в 0 каналах
май '26
+4
в 0 каналах
Get PRO
апрель '26
+9
в 0 каналах
Get PRO
март '26
+4
в 0 каналах
Get PRO
февраль '26
+5
в 0 каналах
Get PRO
январь '26
+8
в 0 каналах
Get PRO
декабрь '25
+9
в 0 каналах
Get PRO
ноябрь '25
+21
в 0 каналах
Get PRO
октябрь '25
+19
в 0 каналах
Get PRO
сентябрь '25
+27
в 0 каналах
Get PRO
август '25
+15
в 0 каналах
Get PRO
июль '25
+4
в 0 каналах
Get PRO
июнь '25
+7
в 0 каналах
Get PRO
май '25
+25
в 0 каналах
Get PRO
апрель '25
+13
в 0 каналах
Get PRO
март '25
+34
в 0 каналах
Get PRO
февраль '25
+18
в 0 каналах
Get PRO
январь '25
+15
в 0 каналах
Get PRO
декабрь '24
+14
в 0 каналах
Get PRO
ноябрь '24
+17
в 0 каналах
Get PRO
октябрь '24
+9
в 0 каналах
Get PRO
сентябрь '24
+17
в 0 каналах
Get PRO
август '24
+18
в 0 каналах
Get PRO
июль '24
+20
в 0 каналах
Get PRO
июнь '24
+24
в 0 каналах
Get PRO
май '24
+20
в 0 каналах
Get PRO
апрель '24
+18
в 0 каналах
Get PRO
март '24
+20
в 0 каналах
Get PRO
февраль '24
+20
в 0 каналах
Get PRO
январь '24
+26
в 0 каналах
Get PRO
декабрь '23
+51
в 0 каналах
Get PRO
ноябрь '23
+21
в 0 каналах
Get PRO
октябрь '23
+48
в 0 каналах
Get PRO
сентябрь '23
+47
в 0 каналах
Get PRO
август '23
+39
в 0 каналах
Get PRO
июль '23
+19
в 0 каналах
Get PRO
июнь '23
+28
в 0 каналах
Get PRO
май '23
+19
в 0 каналах
Get PRO
апрель '23
+43
в 0 каналах
Get PRO
март '23
+38
в 0 каналах
Get PRO
февраль '23
+29
в 0 каналах
Get PRO
январь '23
+25
в 0 каналах
Get PRO
декабрь '22
+69
в 0 каналах
Get PRO
ноябрь '22
+44
в 0 каналах
Get PRO
октябрь '22
+48
в 0 каналах
Get PRO
сентябрь '22
+67
в 0 каналах
Get PRO
август '22
+88
в 0 каналах
Get PRO
июль '22
+131
в 0 каналах
Get PRO
июнь '22
+68
в 0 каналах
Get PRO
май '22
+86
в 0 каналах
Get PRO
апрель '22
+358
в 0 каналах
Get PRO
март '22
+1 291
в 0 каналах
| Дата | Привлечение подписчиков | Упоминания | Каналы | |
| 04 июня | 0 | |||
| 03 июня | 0 | |||
| 02 июня | 0 | |||
| 01 июня | 0 |
Посты канала
Архитектура, которая не прощает ошибок
Представьте систему, где вы не можете накатить хотфикс, перезагрузить сервер или добавить памяти. Ваш код летит в межзвездном пространстве, и любая ошибка в проектировании приведет к полной потере данных.
Именно с такими вызовами сталкивались инженеры прошлого. Ребята из Яндекса и Tproger собрали главные архитектурные парадоксы в интерактивный квест.
Они нарисовали космическую карту, где каждая планета — это отдельный инструмент для разработчика (от облачных сред до сканера уязвимостей). Вы летите по планетарной системе, изучаете фичи и разминаете мозги историческими загадками.
А если хотите выиграть настоящие космические призы вроде профессионального телескопа:
1. Проходите квест. Каждый правильный ответ — плюс балл для розыгрыша.
2. Регистрируйтесь на платформе SourceCraft.
3. Присылайте ссылку на свой репозиторий.
Запускайте миссию и проверьте свою эрудицию.
| 2 | Один логический оператор ускоряет запрос в 32 раза: почему NOT EXISTS быстрее
Если в таблице есть булево поле (например, deleted), и большинство строк имеют одно значение, а меньшинство — другое, то способ написания запроса может кардинально повлиять на скорость.
Пример: 50 млн записей, удалено всего 2%. Для активных строк построен большой индекс (1 ГБ), для удалённых — маленький (22 МБ). Логически одинаковые запросы:
— EXISTS (SELECT ... WHERE NOT deleted) — ищет в большом индексе, находит строку почти всегда, и затем идёт в основную таблицу, чтобы проверить актуальность данных.
— NOT EXISTS (SELECT ... WHERE deleted) — ищет в маленьком индексе, не находит строку в 98% случаев и сразу завершает работу, не обращаясь к основной таблице.
Результат: 22,5 секунды против 717 миллисекунд. Разница в 32 раза.
Суть в том, что проверка «не найдено» обходится дешево. А «найдено» требует дополнительного чтения из основной таблицы. Эту логику можно применять к любым полям, где одно значение встречается редко: is_archived, is_banned, is_draft.
Подробные бенчмарки и объяснения : https://postgres.ai/blog/20260311-not-exists-vs-exists-partial-index | 0 |
| 3 | Cosine, Euclidean, Dot Product — что ставить в векторной базе
Разберём, что делает каждый из этих вариантов, и почему cosine стоит по умолчанию.
Euclidean (L2) — считает расстояние между двумя точками в пространстве. Чем ближе друг к другу точки, тем ближе и смыслы, стоящие за ними. Зависит и от направления векторов, и от их длины.
Cosine — считает угол между векторами, длина не учитывается. Два вектора с одинаковым направлением дадут сходство 1, даже если абсолютные значения их компонент различаются в разы.
Dot product — скалярное произведение, учитывает и направление, и длину. Чем больше значение, тем сильнее похожи векторы. Это полезно, когда длина вектора несёт смысл — например, отражает «уверенность» модели.
Большинство популярных моделей эмбеддингов (OpenAI, Cohere, модели из MTEB-лидербордов) выдают нормализованные векторы — единичной длины. Для таких векторов все три метрики дают одинаковый ранкинг результатов.
Тогда почему косинус дефолтный
Потому что он более безопасный и надёжный. Если векторы не нормализованы (вы используете кастомную модель, дообучали что-то своё, берёте эмбеддинги из промежуточных слоёв) — cosine всё равно будет работать корректно, потому что длина вектора на результат не повлияет. Euclidean и dot product в этой ситуации начнут учитывать длину вектора наравне со смысловой близостью, и порядок результатов будет другим.
Что делать
Проверить, нормализованы ли эмбеддинги модели (обычно это написано в документации). Если да — можно ставить что угодно, разницы не будет. Если нет или непонятно — cosine. Если длина вектора значима — dot product.
Если хотите разобраться более системно, посмотрите курс «Математика для анализа данных» от Яндекс Практикума PRO.
В курсе нужная вам база: линейная алгебра, матанализ, теория вероятностей и статистика. Те самые векторы, нормы, косинусные расстояния, градиентный спуск, регрессия, SVD, A/B-тесты. Попробуйте силы на вводной части, это бесплатно.
Реклама. Рекламодатель: АНО ДПО «Образовательные технологии Яндекса» ИНН 7704282033, erid: 2W5zFJLXwkm | 0 |
| 4 | Уже знаете свой уровень в Java-разработке?
В разработке, как и в карьере, важна конкретика. Сертификация для Java-разработчиков — это объективное измерение ваших навыков. Стандарт уже признан АПКИТ и получил награду как лучшее digital-решение для обучения.
В системе три уровня, подходящие для разного опыта: от новичков в профессии до экспертов, проектирующих сложные решения.
Плюсы:
➡️ После экзамена вы получаете отчёт с оценкой каждой компетенции в процентах: от Core до многопоточности — сразу видно, что стоит прокачать.
➡️ Данные сертификата публичны: работодатель может мгновенно проверить его подлинность на сайте.
Как подобрать свой уровень?
Пройдите бесплатный пробный тест — он займёт около 30 минут. Тест подскажет, какой экзамен выбрать, и позволит скачать полную карту компетенций Java-разработчика.
📎 Выбрать уровень или пройти бесплатное тестирование
Это #партнёрский пост | 0 |
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
