es
Feedback
DATABASE DESIGN

DATABASE DESIGN

Ir al canal en Telegram

Лучшие материалы по работе с хранилищами данных на русском и английском языке Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels Другие наши проекты: https://tprg.ru/media

Mostrar más
1 357
Suscriptores
-224 horas
-47 días
-1030 días
Archivo de publicaciones
Архитектура, которая не прощает ошибок Представьте систему, где вы не можете накатить хотфикс, перезагрузить сервер или добав
Архитектура, которая не прощает ошибок Представьте систему, где вы не можете накатить хотфикс, перезагрузить сервер или добавить памяти. Ваш код летит в межзвездном пространстве, и любая ошибка в проектировании приведет к полной потере данных. Именно с такими вызовами сталкивались инженеры прошлого. Ребята из Яндекса и Tproger собрали главные архитектурные парадоксы в интерактивный квест. Они нарисовали космическую карту, где каждая планета — это отдельный инструмент для разработчика (от облачных сред до сканера уязвимостей). Вы летите по планетарной системе, изучаете фичи и разминаете мозги историческими загадками. А если хотите выиграть настоящие космические призы вроде профессионального телескопа: 1. Проходите квест. Каждый правильный ответ — плюс балл для розыгрыша. 2. Регистрируйтесь на платформе SourceCraft. 3. Присылайте ссылку на свой репозиторий. Запускайте миссию и проверьте свою эрудицию.

Один логический оператор ускоряет запрос в 32 раза: почему NOT EXISTS быстрее Если в таблице есть булево поле (например, deleted), и большинство строк имеют одно значение, а меньшинство — другое, то способ написания запроса может кардинально повлиять на скорость. Пример: 50 млн записей, удалено всего 2%. Для активных строк построен большой индекс (1 ГБ), для удалённых — маленький (22 МБ). Логически одинаковые запросы: — EXISTS (SELECT ... WHERE NOT deleted) — ищет в большом индексе, находит строку почти всегда, и затем идёт в основную таблицу, чтобы проверить актуальность данных. — NOT EXISTS (SELECT ... WHERE deleted) — ищет в маленьком индексе, не находит строку в 98% случаев и сразу завершает работу, не обращаясь к основной таблице. Результат: 22,5 секунды против 717 миллисекунд. Разница в 32 раза. Суть в том, что проверка «не найдено» обходится дешево. А «найдено» требует дополнительного чтения из основной таблицы. Эту логику можно применять к любым полям, где одно значение встречается редко: is_archived, is_banned, is_draft. Подробные бенчмарки и объяснения : https://postgres.ai/blog/20260311-not-exists-vs-exists-partial-index

Cosine, Euclidean, Dot Product — что ставить в векторной базе Разберём, что делает каждый из этих вариантов, и почему cosine стоит по умолчанию.
Euclidean (L2) — считает расстояние между двумя точками в пространстве. Чем ближе друг к другу точки, тем ближе и смыслы, стоящие за ними. Зависит и от направления векторов, и от их длины.
Cosine — считает угол между векторами, длина не учитывается. Два вектора с одинаковым направлением дадут сходство 1, даже если абсолютные значения их компонент различаются в разы.
Dot product — скалярное произведение, учитывает и направление, и длину. Чем больше значение, тем сильнее похожи векторы. Это полезно, когда длина вектора несёт смысл — например, отражает «уверенность» модели.
Большинство популярных моделей эмбеддингов (OpenAI, Cohere, модели из MTEB-лидербордов) выдают нормализованные векторы — единичной длины. Для таких векторов все три метрики дают одинаковый ранкинг результатов. Тогда почему косинус дефолтный Потому что он более безопасный и надёжный. Если векторы не нормализованы (вы используете кастомную модель, дообучали что-то своё, берёте эмбеддинги из промежуточных слоёв) — cosine всё равно будет работать корректно, потому что длина вектора на результат не повлияет. Euclidean и dot product в этой ситуации начнут учитывать длину вектора наравне со смысловой близостью, и порядок результатов будет другим. Что делать Проверить, нормализованы ли эмбеддинги модели (обычно это написано в документации). Если да — можно ставить что угодно, разницы не будет. Если нет или непонятно — cosine. Если длина вектора значима — dot product. Если хотите разобраться более системно, посмотрите курс «Математика для анализа данных» от Яндекс Практикума PRO. В курсе нужная вам база: линейная алгебра, матанализ, теория вероятностей и статистика. Те самые векторы, нормы, косинусные расстояния, градиентный спуск, регрессия, SVD, A/B-тесты. Попробуйте силы на вводной части, это бесплатно. Реклама. Рекламодатель: АНО ДПО «Образовательные технологии Яндекса» ИНН 7704282033, erid: 2W5zFJLXwkm

Уже знаете свой уровень в Java-разработке? В разработке, как и в карьере, важна конкретика. Сертификация для Java-разработчик
Уже знаете свой уровень в Java-разработке? В разработке, как и в карьере, важна конкретика. Сертификация для Java-разработчиков — это объективное измерение ваших навыков. Стандарт уже признан АПКИТ и получил награду как лучшее digital-решение для обучения. В системе три уровня, подходящие для разного опыта: от новичков в профессии до экспертов, проектирующих сложные решения. Плюсы: ➡️ После экзамена вы получаете отчёт с оценкой каждой компетенции в процентах: от Core до многопоточности — сразу видно, что стоит прокачать. ➡️ Данные сертификата публичны: работодатель может мгновенно проверить его подлинность на сайте. Как подобрать свой уровень? Пройдите бесплатный пробный тест — он займёт около 30 минут. Тест подскажет, какой экзамен выбрать, и позволит скачать полную карту компетенций Java-разработчика. 📎 Выбрать уровень или пройти бесплатное тестирование Это #партнёрский пост

Последний день голосования в Tproger Award! Две недели, 16 компаний, 4 номинации — спасибо, что читали, участвовали и лайкали
Последний день голосования в Tproger Award! Две недели, 16 компаний, 4 номинации — спасибо, что читали, участвовали и лайкали. И отдельное спасибо, что голосовали! Вообще не представляем, что вы там наделали, уже узнать хочется! Давайте сегодня зафиналим голосовалку и раздадим по максимуму золотых мышей. Интересно, расстановка сил сможет измениться за один день? Если потеряли, то номинации вот: — Продукт года — Облачный продукт года — ИТ-ивент года — Дизайн года Только сайт не положите, очень просим 🙏 Пойти голосовать: https://tprg.ru/bWfy

Где лучшие тусовки? На тех-ивентах! Последняя по очереди, но не по значимости — номинация «IT-ивент года». Здесь тоже собрали
+3
Где лучшие тусовки? На тех-ивентах! Последняя по очереди, но не по значимости — номинация «IT-ивент года». Здесь тоже собрались три компании, и если вы еще не добрались до чтения их кейсов, то давайте сделаем это вместе. — Лаборатория Числитель собрала конференцию, на которой обсуждают строго только K8s. — Мероприятие Selectel, которое стало уже традицией, делали полностью in-house. — Специально для своего хакатона Островок создал платформу, чтобы участвовать могли разработчики из любой точки мира. Выбирайте компанию-фаворита и вручайте ей золотую мышь — голосование доступно на сайте.

Кейсы из номинации «Дизайн года» ждут ваших голосов Осталась ровно неделя до конца голосования в премии Tproger. Уже дико хоч
+3
Кейсы из номинации «Дизайн года» ждут ваших голосов Осталась ровно неделя до конца голосования в премии Tproger. Уже дико хочется узнать, кто в лидерах! Но даже мы в команде стараемся держать интригу. И чтобы скоротать время, давайте посмотрим на дизайнерские кейсы компаний:
— AcademiaDev представила интерактивную инсталляцию, которая разлетелась по СМИ и собрала 48 млн охвата.
— ИИ-платформа Сократик рассказала, как устроена их система по генерации готовых презентаций.
— Островок поделился, как они сделали отдельную айдентику для Ostrovok! Tech.
Закидайте их своими голосами: https://tprg.ru/WLvk

Какой кейс станет облачным продуктом года? Давайте думать, подсказывайте голосовать! В этой номинации Tproger Awards также уч
+5
Какой кейс станет облачным продуктом года? Давайте думать, подсказывайте голосовать! В этой номинации Tproger Awards также участвуют пять компаний. Вот статьи про их продукты:
👍ПАК виртуализации от Гравитона, который построен по гиперконвергентной архитектуре, что предусматривает простое и предсказуемое масштабирование.
👍ИИ-ассистент от Рунити, который начинался как внутренний продукт, но уже вышел на внешний рынок.
👍VPS от SmartApe, который помог онлайн-школе выдержать рост нагрузки в 5 раз.
👍Контейнерная платформа «Штурвал» от Лаборатории Числитель, благодаря которой система стала устойчива к высоким нагрузкам.
👍Облачная платформа от Selectel, которая позволяет компаниям самим управлять данными, подключать нужные сервисы в несколько кликов и иметь доступ к поддержке 24/7.
Что из этого достойно золотой мыши — решать вам. Переходите на сайт голосования и выбирайте тот самый кейс 👍

Выбираем лучший продукт года🐀 У нас в разгаре премия Tproger — в ней мы выбираем лучшие ИТ-разработки среди 16 компаний. Сег
+5
Выбираем лучший продукт года🐀 У нас в разгаре премия Tproger — в ней мы выбираем лучшие ИТ-разработки среди 16 компаний. Сегодня ближе знакомимся с участниками номинации «Продукт года». В ней участвуют пять компаний. Изучаем:
👍ОТП Банк представляет ASOC-сканер, который спроектировал один разработчик за месяц.
👍Гравитон делится кейсом создания ПО мониторинга без агентов, который можно затестить бесплатно.
👍NetVision борется с недобросовестными самокатчиками с помощью платформы интеллектуального мониторинга СИМ.
👍Solar показывает appScreener, который вырос из стартапа до стандарта рынка; при работе над ним сотрудники получили научные степени.
👍Reksoft рассказывает о платформе Brain ERM, который помогает компаниям экономить до 70% времени на рутинных HR-операциях.
Если вы еще не проголосовали за понравившийся продукт — самое время это сделать. Переходите на сайт премии и выбирайте свой релиз года. Пусть золотая мышь достанется команде лучших 🔥

Премия Tproger объявляется открытой! 🐀 Каждый год команды разработки фиксят баги, выкатывают редизайн, добавляют фичи или
+1
Премия Tproger объявляется открытой! 🐀 Каждый год команды разработки фиксят баги, выкатывают редизайн, добавляют фичи или создают совершенно новые продукты внутри известных нам брендов. Какие-то результаты работы мы видим, но чаще внутрянка не доступна и оценить по достоинству ее не получается. Отсюда родилась идея Премии Tproger. В ней ИТ-компании делятся успешными кейсами разработки, а аудитория решает, какой проект заслуживает награды — золотой мыши 🐀 В премии участвуют 16 компаний в 4 номинациях: ⚫ Продукт года
Здесь представлены платформенные решения, направленные на комплексную автоматизацию ключевых направлений деятельности: от контроля безопасности разработки ПО и ИТ-инфраструктуры до управления ресурсами компании.
⚫ Облачный продукт года
В этом разделе вас ждут платформы виртуализации, облачные среды для AI/ML, инструменты управления кластерами и микросервисами, обеспечивающие высокую производительность и быстрый запуск цифровых сервисов. ⚫
IT-ивент года
Участники рассказывают о профессиональных конференциях и хакатонах, объединяющих тысячи разработчиков и инженеров.
⚫ Дизайн года
В номинации представлены проекты, где дизайн встречается с инженерией: нейросети, создающие презентации за секунды; инсталляции, собравшие десятки миллионов контактов; и визуальные стратегии, транслирующие ценности разработки.
Теперь они в ваших руках 👍 1. Переходите на сайт премии. 2. Выбирайте понравившиеся кейсы в каждой категории. 3. И вручайте им золотую мышь. Голосование продлится до конца февраля и уже в марте мы объявим победителей. Stay tuned!

Хакер собрал публичную базу «навайбкоженных» приложений с сотнями уязвимостей Хакер собрал публичный реестр iOS-приложений, созданных вайб-кодингом с ИИ, где нашли сотни уязвимостей и открытые базы данных Читать: «Хакер собрал публичную базу «навайбкоженных» приложений с сотнями уязвимостей» #ru @database_design | Другие наши каналы

Платформы администрирования и мониторинга баз данных на основе PostgreSQL Как выбрать инструмент для администрирования Postgr
Платформы администрирования и мониторинга баз данных на основе PostgreSQL Как выбрать инструмент для администрирования PostgreSQL — разбираем коммерческие решения от российских вендоров. Читать: «Платформы администрирования и мониторинга баз данных на основе PostgreSQL» #ru @database_design | Другие наши каналы

СУБД 2026: что выбирают российские компании 5 систем управления базами данных, которые закрывают разные сценарии: от транзакц
СУБД 2026: что выбирают российские компании 5 систем управления базами данных, которые закрывают разные сценарии: от транзакционных нагрузок до аналитики петабайтных хранилищ. Читать: «СУБД 2026: что выбирают российские компании» #ru @database_design | Другие наши каналы

7 облаков, которые не падают в проде Сравнение 7 российских облачных платформ: от быстрых PaaS-решений до отказоустойчивых Ia
7 облаков, которые не падают в проде Сравнение 7 российских облачных платформ: от быстрых PaaS-решений до отказоустойчивых IaaS и выделенных серверов. На что смотреть при выборе облака для продакшена. Читать: «7 облаков, которые не падают в проде» #ru @database_design | Другие наши каналы

Кривая забывания Эббингауза в пользовательских приложениях Кривая забывания Эббингауза часто упоминается в теории обучения, н
Кривая забывания Эббингауза в пользовательских приложениях Кривая забывания Эббингауза часто упоминается в теории обучения, но редко в прикладном контексте. В статье разбираю саму модель и показываю, как её можно реализовать на SQL и Python для управления повторениями в пользовательском приложении. Читать: «Кривая забывания Эббингауза в пользовательских приложениях» #ru @database_design | Другие наши каналы

Хакеры взломали создателей единого реестра воинского учета РФ. И удалили данные оттуда Хакеры взломали «Микорд» — разработчик
Хакеры взломали создателей единого реестра воинского учета РФ. И удалили данные оттуда Хакеры взломали «Микорд» — разработчика реестра воинского учета РФ, заявив об удалении данных и доступе к исходникам и документации Читать: «Хакеры взломали создателей единого реестра воинского учета РФ. И удалили данные оттуда» #ru @database_design | Другие наши каналы

Сжать государственную VIN-базу с 1,5 ГБ до 21 МБ? Реально! Разработчик рассказал как Разработчик показал, как сократить госуд
Сжать государственную VIN-базу с 1,5 ГБ до 21 МБ? Реально! Разработчик рассказал как Разработчик показал, как сократить государственную VIN-базу с 1,5 ГБ до 21 МБ: анализ данных, удаление лишних таблиц, индексов и грамотная оптимизация под чтение Читать: «Сжать государственную VIN-базу с 1,5 ГБ до 21 МБ? Реально! Разработчик рассказал как» #ru @database_design | Другие наши каналы