ch
Feedback
Всё про Алгоритмы и Структуры данных

Всё про Алгоритмы и Структуры данных

前往频道在 Telegram

Мы не претендуем на оригинальность контента, мы лишь собираем материал из открытых источников. Ссылка: @Portal_v_IT Сотрудничество, авторские права: @oleginc, @tatiana_inc Канал на бирже: https://telega.in/c/structuredata

显示更多
7 761
订阅者
-224 小时
-67
-3430
帖子存档
Почему программистам нужно знать структуры данных и как я сэкономил компании $22 000 в год Правильное использование структур данных поможет оптимизировать скорость/память кода. В больших продуктах каждая оптимизация умножается на миллионы/миллиарды сессий пользователей. Так я сэкономил компании $22 000 в год используя базовые знания структуры данных Set. https://habr.com/ru/articles/664054/ Алгоритмы и Структуры данных

Останется ли это правдой завтра? Как проверка устойчивости фактов помогает LLM стать честнее и умнее Привет, Хабр! Мы в команде «Вычислительная семантика» в AIRI сфокусированы на исследовании галлюцинаций и решении проблем доверительной генерации. Мы учимся находить галлюцинации и бороться с ними. Большие языковые модели (LLMs) вроде GPT-4 стали незаменимыми помощниками в повседневной жизни — от генерации текстов до поддержки в кодинге и ответов на вопросы. Однако у них есть ахиллесова пята: они часто галлюцинируют. В этом посте мы разберем нашу последнюю работу Will It Still Be True Tomorrow?, посвященную тому, как на надёжность моделей влияет феномен неизменного вопроса (evergreen question) — то есть вопроса, ответ на который не зависит ни от времени, когда вы его задаёте, ни от места, вопроса про факт, который зафиксирован в истории и не меняется от обстоятельств. https://habr.com/ru/companies/airi/articles/915296/ Алгоритмы и Структуры данных

Как мы научились прогнозировать грозы на карте осадков в Яндекс Погоде Экстремальные погодные явления оказывают большое влияние на нашу жизнь. Это может проявляться в бытовых вещах, просто чтобы не попасть под сильный ливень или грозу. А ещё — в обеспечении бизнеса. Например, в прошлом году в Европе из‑за града погиб один из самых старых виноградников. Именно поэтому мы решили улучшить наш прогноз экстремальных погодных явлений. Прежде всего мы сфокусировались на суперкраткосрочном прогнозе молний на карте осадков, также известной как наукаст, чтобы расширить нашу технологию прогнозирования погоды Meteum. Таким образом мы стали первыми в России, кто сделал карту наукаста гроз на ближайшие два часа с шагом 10 минут. Дело в том, что экстремальные погодные явления часто связаны с конвективными явлениями в атмосфере, которые сложно прогнозировать на долгий срок. То есть если в прогнозе есть гроза, то часто вместе с ней будет ожидаться сильный дождь и ветер, а в некоторых регионах и град. Меня зовут Пётр Вытовтов. Я руководитель группы ML и качества прогноза в Яндекс Погоде. Сегодня я хочу рассказать вам о том, как мы добавляли прогноз молний в нашу модель наукаста с использованием данных со спутников, метеорологических радаров и применением трансформерных моделей. https://habr.com/ru/companies/yandex/articles/919492/ Алгоритмы и Структуры данных

Грокаем алгоритмы Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих от Бхаргава А. Эта книга рекомендована Яндекс Практикум при подготовке к алгоритмическому собеседованию. Сам автор указывает, что книга для самоучек, студентов, выпускников и тех, у кого программирование не является основным профилем. Мое впечатление неоднозначно. С одной стороны, до сего момента я не встречал описания динамического программирования, поиска кратчайшего пути в графе по алгоритму Дейкстры и использование K ближайших соседей для классификации и аппроксимации (возможно, все это есть в 4м или последующих томах Кнута, но в магазине они мне не встречались). С другой стороны, описания и примеры, приведенные в книге, таковы, что практической пользы не представляют. Описания очень поверхностны, примеры нарочно примитивны, код в половине случаев не приведен. Но даже там где есть код, он нарочито упрощен под конкретный пример и на практике бесполезен. https://habr.com/ru/articles/664360/ Алгоритмы и Структуры данных

Первый зампред правления Сбербанка Александр Ведяхин призвал защитить отечественный бизнес от возвращения западных компаний.
«Сбер» кредитует программы импортозамещения. Поэтому мы и как кредитор в этом заинтересованы, конечно, и как субъект экономики, и как граждане», — заявил Ведяхин.
Также, он напомнил, что немало иностранных вендоров ушли с российского рынка, бросив партнеров без предупреждения — и не из-за санкций, а по внутренним соображениям. По его словам, важно защищать тех, кто занял освободившиеся ниши. Сбербанк уже финансирует программы импортозамещения и намерен и дальше продолжать такую поддержку 🇷🇺 Подписаться на РОССИЮ СЕЙЧАС

Решаем задачу про ферзей при помощи SMT-солвера Автор статьи Modern SAT solvers: fast, neat and underused утверждает, что SAT-солверы «преступно мало используются в нашей отрасли». [SAT — Boolean SATisfiability Solver, то есть солвер, способный находить присвоения, делающие истинными сложные булевы выражения. Более подробно я писал о них ранее.] Какое-то время назад я задался вопросом, почему: как получилось, что они настолько мощны, но ими никто не пользуется? Многие специалисты заявили, что причина в неудобстве кодирования SAT: они лучше предпочтут работать с инструментами, которые выполняют компиляцию в SAT. https://habr.com/ru/articles/919106/ Алгоритмы и Структуры данных

Способы цветовой сегментации в задачах детектирования дорожных знаков Распознавание дорожных знаков основывается на анализе изображений, полученных с камер, установленных на автомобиле. Эффективность работы такой системы зависит от корректной предварительной обработки изображений, в частности – от точного выделения области, содержащей дорожный знак. Основой этой процедуры выступает цветовая сегментация, поскольку большинство дорожных знаков обладают характерной цветовой окраской (например, красный, синий, жёлтый), позволяющей отличить их от фона. На практике задача сегментации усложняется различиями в освещении, погодных условиях, наличием теней, бликов, а также загрязнением камеры. Это делает использование стандартного цветового пространства RGB неэффективным, поскольку оно неразрывно связано с яркостью. В связи с этим актуальной становится задача выбора более устойчивого цветового пространства – например, HSV, LAB или IHLS – для выделения дорожных знаков при помощи цветовой сегментации [1]. https://habr.com/ru/articles/919088/ Алгоритмы и Структуры данных

Когда O(n) мешает отбирать резюме в Росатоме Главная проблема поиска сотрудников — предвзятость. Порой кажется, что наше резюме подходит под свою роль на 100 %, а рекрутер отклоняет его. Проблема с противоположной стороны баррикад: рекрутер должен отсмотреть по 200, 300 и более резюме в день. По разным данным, на каждое уходит всего лишь 6–10 секунд. А что если можно решить эти две проблемы с помощью ML? Сделать модель, которая исключит любой байес и поможет рекрутеру объективно отбирать подходящих кандидатов (где «подходящесть» обусловлена красивой математикой!). Мы это сделали. Оказалось, что если вы хотите добиться непредвзятости, то вам придётся внести в систему предвзятость. Оксюморон в статистике! https://habr.com/ru/companies/greenatom/articles/917546/ Алгоритмы и Структуры данных

Способы цветовой сегментации в задачах детектирования дорожных знаков Распознавание дорожных знаков основывается на анализе изображений, полученных с камер, установленных на автомобиле. Эффективность работы такой системы зависит от корректной предварительной обработки изображений, в частности – от точного выделения области, содержащей дорожный знак. Основой этой процедуры выступает цветовая сегментация, поскольку большинство дорожных знаков обладают характерной цветовой окраской (например, красный, синий, жёлтый), позволяющей отличить их от фона. На практике задача сегментации усложняется различиями в освещении, погодных условиях, наличием теней, бликов, а также загрязнением камеры. Это делает использование стандартного цветового пространства RGB неэффективным, поскольку оно неразрывно связано с яркостью. В связи с этим актуальной становится задача выбора более устойчивого цветового пространства – например, HSV, LAB или IHSL – для выделения дорожных знаков при помощи цветовой сегментации [1]. https://habr.com/ru/articles/919088/ Алгоритмы и Структуры данных

Когда O(n) мешает отбирать резюме в Росатоме Главная проблема поиска сотрудников — предвзятость. Порой кажется, что наше резюме подходит под свою роль на 100 %, а рекрутер отклоняет его. Проблема с противоположной стороны баррикад: рекрутер должен отсмотреть по 200, 300 и более резюме в день. По разным данным, на каждое уходит всего лишь 6–10 секунд. А что если можно решить эти две проблемы с помощью ML? Сделать модель, которая исключит любой байес и поможет рекрутеру объективно отбирать подходящих кандидатов (где «подходящесть» обусловлена красивой математикой!). Мы это сделали. Оказалось, что если вы хотите добиться непредвзятости, то вам придётся внести в систему предвзятость. Оксюморон в статистике! https://habr.com/ru/companies/greenatom/articles/917546/ Алгоритмы и Структуры данных

В России можно посещать бесплатные IT-мероприятия хоть каждый день: как оффлайн, так и онлайн. Чтобы не пропустить полезные —
В России можно посещать бесплатные IT-мероприятия хоть каждый день: как оффлайн, так и онлайн. Чтобы не пропустить полезные — сохраните каналы 1. Бесплатные IT мероприятия 2. IT мероприятия Москва 3. IT мероприятия Санкт Петербург

Кривая спроса в недвижимости: «Как использовать то, чего нет» или Искусство стрельбы по движущимся мишеням В прошлой статье мы разобрали, почему детерминированной «кривой спроса» в недвижимости не существует. Спрос — это не просто функция от цены, а результирующая влияния бесконечного количества факторов: макроэкономики, ключевой ставки ЦБ, маркетинговых усилий застройщика, навыков команды продаж, действий конкурентов, сезонности, курса доллара и т.д. https://habr.com/ru/articles/918994/ Алгоритмы и Структуры данных

«Божественная комедия», или Девять кругов прогнозирования промоспроса в «Магните» Привет, Хабр! На связи команда направления прогнозирования промо в «Магните». В предыдущей статье «Магнитная аномалия: как предсказать продажи промо в ритейле» мы дали читателю общее представление о том, чем занимается наша команда. Теперь поговорим о конкретных сложностях и методах их решения, с которыми нам приходится сталкиваться в работе. Чтобы лучше разобраться во внутренней кухне, предлагаем читателю вместе прогуляться по нашим «девяти кругам прогнозирования промо спроса». https://habr.com/ru/companies/magnit/articles/664358/ Алгоритмы и Структуры данных

Кто выиграл? ChatGPT o3 Pro против конкурентов в двух тестах Хотите знать, какая нейросеть лучше генерирует код для 3D‑анимации или пишет научный реферат? Мы сравнили ChatGPT o3 Pro, Gemini 2.5 Pro, Claude Opus 4 и DeepSeek R1-0528 в двух примерах: создание веб‑презентации (анимированные алгоритмы сортировки) и подробное исследование о системах беспилотных авто. Кто справился с анимацией? Чей код запустился? Чей текст — как TED Talk на бумаге? Смотрите тесты, сравнивайте Codepen‑примеры и делайте выводы. (Спойлер: победил не o3 Pro!) https://habr.com/ru/companies/bothub/articles/918712/ Алгоритмы и Структуры данных

Бесплатный мини-курс по Java — начните программировать уже сегодня Java-разработчики востребованы и зарабатывают от 80 000 ₽. Хотите проверить свои силы? На мини-курсе вы создадите три проекта, освоите основы языка и поймете, подходит ли вам этот путь. Без опыта в IT, бесплатно и с поддержкой эксперта. А еще получите доступ к материалам и скидку на обучение. К тому же, каждый, кто посмотрит 1-е занятие, получит доступ к изучению английского языка на платформе Skillbox на год. Количество мест ограничено! Успейте записаться. Реклама. Информация о рекламодателе по ссылкам в посте.

Как мы выбирали консенсус для энтерпрайз-блокчейна Любому блокчейн-проекту, который рассчитывает на успех, стоит думать, что он будет с этим успехом делать. Больше пользователей, больше транзакций, больше нагрузка на сеть — рано или поздно встанет вопрос о масштабировании. В этом посте мы расскажем, куда нас привели вопросы масштабирования, согласованности и почему мы не взяли на вооружение какой-нибудь готовый консенсус. https://habr.com/ru/companies/web3_tech/articles/664624/ Алгоритмы и Структуры данных

Генетический алгоритм поиска решения для задачи по выбору планировок этажа многоквартирного дома Предложенный алгоритм - это очень ранний прототип рабочей версии. Суть публикации познакомить всех желающих с возможностями генетических алгоритмов в различных сферах бизнеса. https://habr.com/ru/articles/664766/ Алгоритмы и Структуры данных

Фундаментальные вопросы по ML/DL, часть 1: Вопрос → Краткий ответ → Разбор → Пример кода. Линейки. Байес. Регуляризация У каждого наступает момент, когда нужно быстро освежить в памяти огромный пласт информации по всему ML. Причины разные - подготовка к собеседованию, начало преподавания или просто найти вдохновение. Времени мало, объема много, цели амбициозные - нужно научиться легко и быстро объяснять, но так же не лишая полноты! Обращу внимание, самый действенный способ разобраться и запомнить - это своими руками поисследовать задачу! Это самое важное, оно происходит в секции с кодом. https://habr.com/ru/articles/918438/ Алгоритмы и Структуры данных

Динамическое ценообразование в недвижимости: Как поймать то, чего нет, или Искусство стрельбы по движущимся мишеням Если вы всерьёз рассчитываете построить «стабильную кривую спроса» на рынке недвижимости, то вы взялись за задачу, которая по сложности сравнима с предсказанием погоды на год вперед. Спрос в недвижимости — штука капризная, как погода в Питере. Вот жара и +28, прогноз на неделю - ни облачка... и вдруг гроза, ливень и +12. https://habr.com/ru/articles/917964/ Алгоритмы и Структуры данных

Как улучшить распознавание скелетов в MediaPipe Я люблю скелетные детекторы из Mediapipe. Чтобы запустить их нужно всего несколько минут. Работает на разных платформах (мобильные, pc, embedded, и.т.д.). И выдает достаточное качество для многих применений. Но надо признать что не всюду качества хватает. Давайте я расскажу как небольшими силами можно его улучшить. Приведенная тут логика будет построена вокруг Mediapipe, но она им не ограничена. Применяя аналогичные подходы можно улучшить практически любой скелетный алгоритм. https://habr.com/ru/companies/recognitor/articles/664558/ Алгоритмы и Структуры данных