Центр непрерывного образования ФКН НИУ ВШЭ

Открыть в Telegram

Дополнительное профессиональное образование от факультета компьютерных наук НИУ ВШЭ. Программы с нуля и продвинутые курсы по: - математике - программированию и ИИ - анализу данных и Data Science - фронтенду и геймдеву Сайт: https://cs.hse.ru/dpo

Больше

Сеть:ФКН НИУ ВШЭ Россия98 454 Образование28 488

6 036

Подписчики

Нет данных24 часа

+37 дней

+2230 день

757

Просмотры поста

~ 30624 часа

~ 37748 часов

12.54%

Коэффициент вовлеченности

Нет данных

Постов в день

Ads index

beta

Архив постов

6 036

RAG-архитектура на пальцах: как языковая модель достает информацию из вашей базы знаний Есть распространенное заблуждение, будто языковая модель «знает» только то, что видела при обучении. На самом деле, она работает с тем, что лежит в ее контекстном окне: с документами, присланными в чат, результатами поиска, выдержками из базы. Но контекстное окно не резиновое, и вы физически не можете загрузить в него всю корпоративную базу знаний. Тут и появляется RAG (Retrieval-Augmented Generation). Идея простая: не передавать в модель все подряд, а перед каждым ответом находить в базе именно те фрагменты, которые относятся к вопросу, и подкладывать в контекст только их. 1️⃣Сначала базу нужно подготовить 🟣Документы режутся на фрагменты — чанки. Именно здесь чаще всего закладывается будущее качество: если порежете слишком крупно, то в одном фрагменте смешается несколько тем, а поиск будет промахиваться; слишком мелко — фрагмент потеряет смысл. 🟣Каждый чанк прогоняется через модель-эмбеддер и превращается в вектор — длинный набор чисел, кодирующий смысл текста. Важный момент: близкие по смыслу тексты получают близкие векторы, даже если написаны разными словами, и это принципиально отличает подход от обычного поиска по ключевым словам. 🟣Векторы складываются в векторную базу данных — хранилище, заточенное под одну задачу: быстро находить ближайшие векторы среди миллионов. 2️⃣Что происходит, когда пользователь задает вопрос 🟣Вопрос проходит через тот же эмбеддер и тоже становится вектором, а система ищет в базе фрагменты, чьи векторы ближе всего к вектору запроса. Это шаг retrieval. 🟣Часто сюда добавляют еще один шаг — переранжирование. Первичный поиск по векторам быстрый, но недостаточно релевантный, он может выдасть более 20 кандидатов. Их прогоняют через более тяжелую и точную модель, которая пересортировывает результаты и оставляет действительно лучшие. 🟣Отобранные фрагменты вставляются в промпт рядом с исходным вопросом, модель генерирует ответ, опираясь на эти куски, а не на свои общие представления о запросе. Грамотно собранная система еще и возвращает ссылки на исходные документы, чтобы ответ можно было проверить. 3️⃣Почему RAG, а не дообучение 🟣Может возникнуть логичный вопрос: если нужно, чтобы модель работала с нашими данными, почему просто не дообучить ее на них? Ответ простой: для большинства задач RAG практичнее, ведь для того, чтобы обновить знания, надо всего лишь добавить документ в базу. Источник ответа будет виден, и его можно проверить, чего не дает дообученная модель. К тому же модель можно ограничить рамками контекста, снижая риск галлюцинаций. 4️⃣Особенности работы с RAG и точность ответа 🟣Главное, что надо знать и понимать про RAG: система отвечает настолько хорошо, насколько точен поиск. Если retrieval вытащил не те фрагменты, модель сгенерирует уверенный и складный ответ, но неверный. Поэтому большая часть работы над RAG-системами уходит не на модель, а на поиск: подбор размера чанков, выбор эмбеддера, настройку переранжирования и чистоту базы.

6 036

День открытых дверей онлайн-программ факультета компьютерных наук В эту субботу, 27 июня, пройдет День открытых дверей для абитуриентов бакалавриата и магистратуры. Вы разберетесь в преимуществах онлайн-образования, определитесь с программой и познакомитесь лично с командой ФКН Онлайн. На встрече расскажут: ⭐️️️️️️️️ какой набор навыков получают студенты и кем становятся выпускники ⭐️️️️️️️️ как устроено поступление и как получить максимальные баллы за портфолио ⭐️️️️️️️️ как получить образовательный кредит под 3% и другие льготы Онлайн-программы, о которых пойдет речь: ⚪️ Искусственный интеллект ⚪️ Прикладные нейросетевые технологии ⚪️ Аналитика больших данных ⚪️ Инженерия данных ⚪️ Бэкенд-разработка и архитектура программных систем ⚪️ Искусственный интеллект в маркетинге и управлении продуктом ⚪️ Компьютерные науки и анализ данных, онлайн-бакалавриат 📆 Когда: 27 июня, 14:00 💻 Формат: онлайн + запись и полезные материалы после мероприятия 🐭 Зарегистрироваться

6 036

Кардиогенетика: персонализированная медицина XXI века Сегодня искусственный интеллект и машинное обучение проникают в самые сложные области науки, и персонализированная медицина не исключение. Технологии секвенирования позволяют нам читать геном человека, а инструменты анализа данных — искать в нем мутации, связанные с заболеваниями. Центр непрерывного образования ФКН приглашает на открытый вебинар, на котором мы определим, какую роль в кардиогенетике играют современные технологии. Поговорим о том: 🟣какие задачи в биоинформатическом анализе могут быть автоматизированы, а где критически важны экспертные знания врача и исследователя; 🟣что такое «цифровой двойник» пациента и как с его помощью можно отработать весь цикл кардиогенетического тестирования — от сырых данных до клинического заключения; 🟣какие навыки действительно необходимы, чтобы начать карьеру на стыке Data Science, биоинформатики и медицины, и почему базовые знания биологии и клинического контекста остаются незаменимыми. Вебинар пройдет в рамках подготовки к Летней школе «Кардиогенетика: от секвенирования к разработке кардиопанели» от Центра биомедицинских исследований и технологий ФКН. 🎙Спикер: Мария Попцова, директор центра биомедицинских исследований и технологий ФКН НИУ ВШЭ. 📁Когда: 29 июня в 17:30. Регистрация 📍

6 036

Что изучают на программе «Специалист по Data Science»? Скоро стартует очное обучение на программе профессиональной переподготовки «Специалист по Data Science», аккредитованной Альянсом в сфере ИИ. В течение 15 месяцев слушатели будут изучать все направления современной науки о данных. В сегодняшних карточках подробно рассказываем о том, какие дисциплины включены в программу и какие навыки удастся приобрести. 🟣Python для автоматизации и анализа данных и SQL 🟣Алгоритмы и структуры данных 🟣Математика для анализа данных 🟣Прикладная статистика для машинного обучения 🟣Машинное обучение 🟣Промышленное машинное обучение на Spark 🟣Глубинное обучение 🟣Введение в MLOps Старт: 30 июня. Подробнее о программе 📍

6 036

Говорим с ИИ на его языке: мастер-класс по техникам промпт-инжиниринга Многие думают, что использование LLM — простая задача. Однако один и тот же запрос можно сформулировать десятью разными способами, а результаты бывают разными: от точного ответа до получения нерелевантной информации. Вся разница в промпте. Приглашаем на открытый вебинар от Центра непрерывного образования ФКН всех, кто имеет небольшой опыт во взаимодействии с ИИ и хочет начать развиваться в этом направлении. На вебинаре мы обсудим и посмотрим на примерах: 🟣почему нейросети так чувствительны к формулировкам; 🟣какие техники промптинга работают; 🟣чем отличаются техники в GigaChat, QWEN, Perplexity и Yandex Cloud; 🟣как писать промпты, чтобы получать аналитический результат. Все участники получат перечень техник промптинга и список задач для их применения. 🎙Спикер: Маргарита Бурова, эксперт и академический руководитель программы «Аналитик данных» Центра непрерывного образования ФКН, руководитель edtech-программ по data science и аналитике Wildberries. 📁Когда: 24 июня в 17:30. Регистрация 📍

6 036

Успеть подать заявку летом и начать учиться осенью Напоминаем, что в Центре непрерывного образования ФКН НИУ ВШЭ действует летняя акция: вы можете оставить заявку на программы с осенним стартом до 31 июля и заморозить стоимость — в сентябре цены будут повышены. Акция распространяется на восемь программ: 1️⃣Программа профессиональной переподготовки (очный формат): 🟣Аналитик данных Годовая программа полного цикла подготовки специалиста: Python, SQL, статистика, A/B-тестирование, ML и продуктовая аналитика. По окончании слушатели получают диплом НИУ ВШЭ о переподготовке. Подать заявку 📍 2️⃣Курсы повышения квалификации (очный формат): 🟣Математика для анализа данных Фундаментальный курс по линейной алгебре, матанализу, дискретной математике и теории вероятностей для последующего изучения ML. Подать заявку 📍 🟣Алгоритмы и структуры данных Вы научитесь анализировать сложность алгоритмов, выбирать подходящие структуры данных и писать эффективный код, который не тормозит на больших объемах. Подать заявку 📍 🟣Прикладная статистика для машинного обучения Теория вероятностей и математическая статистика с реализацией на Python: от описательных статистик до A/B-тестирования, которое лежит в основе принятия решений в продуктовых командах. Подать заявку 📍 🟣Машинное обучение Изучение классических ML-алгоритмов (регрессии, классификации, кластеризации) с практикой на реальных задачах: от подготовки данных до оценки качества моделей. Подать заявку 📍 3️⃣Курсы повышения квалификации (онлайн): 🟣Python для автоматизации и анализа данных Освоите Python с нуля и научитесь автоматизировать рутину: сбор данных, обработка таблиц, визуализация, работа с API. Подать заявку 📍 🟣BI-аналитика и визуализация данных Научитесь строить интерактивные дашборды в Yandex DataLens и Tableau, проектировать визуализацию под бизнес-задачу и доносить выводы до нетехнических пользователей. Подать заявку 📍 🟣LLM: создание и интеграция интеллектуальных ассистентов Разберетесь в архитектуре трансформеров, научитесь проектировать RAG-пайплайны и создавать LLM-агентов для встраивания в реальные продукты. Подать заявку 📍 Как заморозить цену: оставьте заявку на странице выбранной программы до 31 июля. Менеджер подтвердит участие и зафиксирует для вас текущую стоимость обучения.

6 036

Компьютерное зрение на практике: распознавание кошек и собак Все слышали, что нейросети умеют распознавать лица, объекты на фото и даже ставить диагнозы по снимкам. Но как это работает на самом деле? Что происходит внутри, когда модель решает, кот на картинке или собака? И главное — как самому обучить такую модель, даже если ты только начинаешь? Приглашаем на вебинар от Центра непрерывного образования ФКН, на котором пройдем весь путь от теории до кода в Google Colab и поговорим о том: 🟣как нейросети на самом деле «видят» изображения (спойлер: совсем не как люди); 🟣что такое классификация изображений и какие задачи к ней относятся; 🟣как подготовить данные для обучения: от папки с картинками до готового датасета; 🟣как обучить простую модель распознавания котов и собак; 🟣как проверить качество модели и понять, ошибается она или нет; 🟣и самое интересное: как «обмануть» нейросеть и зачем это делать. По итогу вебинара все участники заберут готовый notebook с полным пайплайном обучения модели и веса обученной модели — можно сразу запустить у себя и поэкспериментировать. 🎙Спикер: Марк Блуменау, академический руководитель программы «Специалист по Data Science» Центра непрерывного образования ФКН и магистратуры «Умные устройства: аппаратная разработка». 📁Когда: 18 июня в 19:00. Регистрация 📍

6 036

ИИ для аналитики: какие задачи уже решают языковые модели, а где и зачем нужен аналитик Языковые модели уже генерируют SQL-запросы по текстовому описанию, автоматизируют очистку данных, строят простые графики и делают предварительные выводы. В связи с чем у многих новичков возникает ощущение: «а зачем тогда учиться на аналитика, если ИИ все делает сам?». На практике все сложнее — модели ошибаются, пропускают контекст, не чувствуют бизнес-задачи и часто дают ответ, который звучит красиво, но фактически не работает. Приглашаем вас на вебинар от Центра непрерывного образования ФКН, на котором разберем, что можно делегировать искусственному интеллекту, а где не обойтись без аналитика. Поговорим о том: 🟣какие задачи по анализу данных языковые модели уже закрывают хорошо, а где пока проваливаются; 🟣как выглядит нормальный рабочий процесс, в котором ИИ служит помощником; 🟣какие сервисы и инструменты использовать новичку; 🟣что такое хороший промпт для аналитической задачи; 🟣какие главные ограничения и подводные камни существуют при работе с ИИ в аналитике. Все участники вебинара получат чек-лист с сервисами для ИИ-аналитики, примеры промптов и список ключевых ограничений. 🎙Спикер: Маргарита Бурова, эксперт и академический руководитель программы «Аналитик данных» Центра непрерывного образования ФКН, руководитель edtech-программ по data science и аналитике Wildberries. 📁Когда: 17 июня в 17:30. Регистрация 📍

6 036

📢 Приглашаем на День карьеры Центра непрерывного образования ФКН НИУ ВШЭ В программе вечера: 1️⃣Мини-лекции от экспертов:

• «Рабочие ИИ-инструменты для поиска работы» — Анна Шангареева, GYROMIND • «Как развиваться в инженерии данных и не потерять работу в эпоху ИИ» — Кирилл Сысоев, Сбер • «Карьерный путь выпускника» — Михаил Арк, Сбер

2️⃣Карьерные зоны компаний-партнеров:

• Яндекс • Ozon Tech • ЦНО ФКН

Можно будет пообщаться с представителями компаний, задать вопросы о карьере и найме, получить рекомендации по резюме и узнать больше о карьерных возможностях. 3️⃣Нетворкинг и свободное общение со слушателями, выпускниками, спикерами и представителями компаний. Будем рады вновь увидеть участников наших прошлых мероприятий, слушателей и выпускников программ ЦНО, а также всех, кто интересуется карьерным развитием в IT, аналитике и data-направлениях. Регистрация 📍

6 036

Промпт-инжиниринг: методологии CO-STAR и TIDD-EC Языковые модели достраивают наиболее вероятные продолжения на основе того, что вы дали на вход, и чем больше в запросе неоднозначности, тем шире пространство возможных ответов и выше шанс получить размытый или нерелевантный результат. Методологии структурирования промптов решают эту проблему и превращают расплывчатое пожелание в спецификацию. Сегодня разберем 2️⃣ наиболее популярных. 1️⃣CO-STAR Основной концепт — разложение запроса на шесть измерений, каждое из которых закрывает отдельный источник неоднозначности. 🟣Context: фоновые данные, в которых существует задача, позволяющие модели сузить ответ до конкретной ситуации. 🟣Objective: одна четко сформулированная задача. 🟣Style: структура и манера изложения. 🟣Tone: эмоциональная окраска. И в данном случае стиль и тон намеренно разделены: текст может быть строго структурированным по стилю, но при этом дружелюбным по тону. 🟣Audience: на кого ориентирован ответ и какая глубина объяснений требуется. 🟣Response: объем, структура, формат вывода, лимит по длине. Этот компонент экономит больше всего итераций, так как именно несовпадение формата чаще всего заставляет переписывать запрос. CO-STAR сильнее всего в задачах генерации текста, в которых результат оценивается субъективно и важны попадание в аудиторию и выдержанная стилистика. 2️⃣TIDD-EC Более строгая методология, ориентированная на задачи, в которых ответ оценивается по объективным критериям: правильно/неправильно, соответствует формату/нет. Пять основных пунктов: 🟣Task type: категория операции: классификация, извлечение сущностей, суммаризация, переписывание. 🟣Instructions: пошаговый алгоритм выполнения. Здесь описывается не что нужно получить, а как к этому прийти. 🟣Do: признаки, которые обязательно должны присутствовать в ответе. 🟣Don't: ограничения и типичные ошибки, которые нужно исключить. Связка Do/Don't задает границы ответа с двух сторон и заметно снижает количество отклонений от ожидаемого результата. 🟣Examples & Content: образцы желаемого вывода плюс конкретные данные для обработки. Примеры работают как few-shot обучение прямо внутри запроса: модель ориентируется на эталон. TIDD-EC лучше применять в формализованных задачах с жесткими требованиями: парсинг в структурированный формат, разметка, классификация по заданным правилам. Как выбирать на практике: 🟣Результат оценивается субъективно (тексты, письма, контент, коммуникация): CO-STAR с упором на контекст, аудиторию и стилистику. 🟣Результат проверяется по четким критериям (обработка данных, извлечение, классификация): TIDD-EC с упором на инструкции, ограничения и примеры.

6 036

Карта галлюцинаций: где ИИ врет чаще всего и как это ловить Нейросети уверенно пишут код, анализируют данные и строят гипотезы, но даже лучшие модели периодически выдают убедительную ложь — так называемые «галлюцинации». Это прямая угроза, особенно для начинающих специалистов: от неверного вывода в отчете до сбоя в бизнес-логике. Приглашаем на вебинар от Центра непрерывного образования ФКН, на котором обсудим, как в таком случае отличить правду от вымысла. Разберем на реальных примерах: 🟣что такое галлюцинации ИИ и почему они возникают; 🟣какие задачи и данные чаще всего провоцируют нейросети на ошибки; 🟣где и как врет каждый из сервисов: GigaChat, QWEN, Perplexity, Yandex Cloud; 🟣как писать промпты так, чтобы снизить риск получения ложного ответа; 🟣пошаговый алгоритм фактчекинга для начинающих. Все участники вебинара получат карту галлюцинаций с чек-листом, которая поможет быстро проверять ответы нейросетей. 🎙Спикер: Маргарита Бурова, эксперт и академический руководитель программы «Аналитик данных» Центра непрерывного образования ФКН, руководитель edtech-программ по data science и аналитике Wildberries. 📁Когда: 10 июня в 17:30. Регистрация 📍

6 036

Ежемесячная подборка актуальных IT-вакансий: июнь Позиции стажера: 🟣Аналитик, Axenix 🟣Бизнес-аналитик, Kept, Технологическая практика 🟣Дата-аналитик Smart Rollout, «МТС» 🟣Системный аналитик, Т1 Иннотех 🟣Стажер по исследованию AI-агентов для хранилища данных, Сбер 🟣Data-аналитик, T2. IT и Digital 🟣Python-разработчик, ПАО ВТБ Бизнес-аналитика: 🟣Бизнес-аналитик, ООО РСХБ-Интех 🟣Бизнес-аналитик, Технопарк Офис 🟣Бизнес-аналитик, ПАО Ростелеком 🟣Бизнес-аналитик, VK 🟣Бизнес-аналитик, Туту 🟣Бизнес-аналитик, Т-Банк 🟣Бизнес-аналитик, Nestle Аналитика данных: 🟣Аналитик, Ozon fresh 🟣Аналитик данных, Сравни 🟣Аналитик данных, ООО HeadHunter::Analytics/Data Science 🟣Аналитик данных, RWB (Wildberries & Russ) 🟣Аналитик данных, Datanomica 🟣Дата-аналитик, «МТС» Data Science, ML и DE: 🟣AI-инженер, ООО GlowByte 🟣AI Engineer, Ингосстрах 🟣ML-инженер, OneTwoTrip 🟣ML Engineer, ПАО Ростелеком 🟣Data Scientist, Северсталь. IT & Digital 🟣Data Scientist, Альфа-Банк 🟣Data Scientist, Сбер. IT 🟣Data Engineer, Лента 🟣Data Engineer, Островок.Ostrovok!Tec 🟣Data Engineer, Платформа ОФД

6 036

Скидка 10% «ранним пташкам»: подать заявку летом — учиться осенью Центр непрерывного образования ФКН НИУ ВШЭ запускает летнюю акцию: оставьте заявку на программы с осенним стартом до 31 июля и получите скидку 10% на обучение. Акция распространяется на восемь программ: 1️⃣Программа профессиональной переподготовки (очный формат): 🟣Аналитик данных Годовая программа полного цикла подготовки специалиста: Python, SQL, статистика, A/B-тестирование, ML и продуктовая аналитика. По окончании слушатели получают диплом НИУ ВШЭ о переподготовке. Подать заявку 📍 2️⃣Курсы повышения квалификации (очный формат): 🟣Математика для анализа данных Фундаментальный курс по линейной алгебре, матанализу, дискретной математике и теории вероятностей для последующего изучения ML. Подать заявку 📍 🟣Алгоритмы и структуры данных Вы научитесь анализировать сложность алгоритмов, выбирать подходящие структуры данных и писать эффективный код, который не тормозит на больших объемах. Подать заявку 📍 🟣Прикладная статистика для машинного обучения Теория вероятностей и математическая статистика с реализацией на Python: от описательных статистик до A/B-тестирования, которое лежит в основе принятия решений в продуктовых командах. Подать заявку 📍 🟣Машинное обучение Изучение классических ML-алгоритмов (регрессии, классификации, кластеризации) с практикой на реальных задачах: от подготовки данных до оценки качества моделей. Подать заявку 📍 3️⃣Курсы повышения квалификации (онлайн): 🟣Python для автоматизации и анализа данных Освоите Python с нуля и научитесь автоматизировать рутину: сбор данных, обработка таблиц, визуализация, работа с API. Подать заявку 📍 🟣BI-аналитика и визуализация данных Научитесь строить интерактивные дашборды в Yandex DataLens и Tableau, проектировать визуализацию под бизнес-задачу и доносить выводы до нетехнических пользователей. Подать заявку 📍 🟣LLM: создание и интеграция интеллектуальных ассистентов Разберетесь в архитектуре трансформеров, научитесь проектировать RAG-пайплайны и создавать LLM-агентов для встраивания в реальные продукты. Подать заявку 📍 ⚡️ Как получить скидку: оставьте заявку на странице выбранной программы до 31 июля. Менеджер подтвердит участие и зафиксирует скидку 10% на стоимость обучения.

6 036

Основы компьютерного зрения и анализа изображений Центр непрерывного образования ФКН совместно с компанией MWS AI запустил бесплатный онлайн-курс «Основы компьютерного зрения и анализа изображений». В процессе обучения вы: 🟣погрузитесь в теоретические основы компьютерного зрения и познакомитесь с необходимыми практическими инструментами; 🟣освоите базовые операции обработки: свертки, ядра фильтров, выделение границ; 🟣изучите классические методы распознавания; 🟣познакомитесь с архитектурой сверточных нейросетей: от перцептрона и полносвязных слоев до CNN; 🟣на практике обучите модель классификации изображений; 🟣получите обзор продвинутых направлений: детекция объектов, семантическая и instance-сегментация, генеративные модели, стереозрение, трекинг и видеоаналитика. По итогам курса вы сможете подготовить проект для портфолио — приложение для анализа поведения объектов перед камерой. Курс подойдет специалистам смежных дисциплин и студентам старших курсов. Для комфортного освоения материала необходимо знание Python, основ машинного и глубинного обучения, а также линейной алгебры. 🎙Автор курса — Иван Копылов, ведущий разработчик центра компьютерного зрения департамента машинного обучения и фундаментальных исследований MWS AI, старший преподаватель факультета компьютерных наук НИУ ВШЭ. 📁Формат: онлайн по записям, лонгриды, презентации и задания с автопроверкой. Присоединиться к курсу 📍

6 036

Метрики, которые важны: как не утонуть в KPI Метрики — это измеримые показатели, которые используются в бизнесе для оценки эффективности процессов, маркетинговых кампаний и работы продуктов. Центр непрерывного образования ФКН приглашает на вебинар, который поможет разобраться в том, как переводить абстрактные данные в конкретные коэффициенты и признаки, отслеживать динамику и принимать обоснованные решения. Мы подробно рассмотрим: 🟣Какие метрики бывают; 🟣Какие из них используют аналитики в своей работе; 🟣Когда какие метрики лучше выбрать; 🟣Как вычислять метрики. Все участники вебинара получат набор инструментов, который поможет им легко ориентироваться в метриках и делать необходимые расчеты: чек-лист, дорожную карту выбора метрик и комплект формул с пояснениями. 🎙Спикер: Маргарита Бурова, эксперт и академический руководитель программы «Аналитик данных» Центра непрерывного образования ФКН, руководитель edtech-программ по data science и аналитике Wildberries. 📁Когда: 3 июня в 17:30. Регистрация 📍

6 036

Предсказываем что угодно: от цен квартир до оттока клиентов Центр непрерывного образования ФКН приглашает всех, кто владеет Python на базовом уровне и начинает погружаться в машинное обучение, на вебинар, посвященный одной из ключевых задач науки о данных— прогнозированию на основе исторических данных. В ходе вебинара мы пошагово разберем, как делать прогнозы на основе данных: 🟣Загрузим датасет; 🟣Обучим модель; 🟣Сделаем прогноз; 🟣Оценим качество модели. В результате все участники получат готовый notebook и ML-модель. Материалы можно будет применять на практике в качестве шаблонов, адаптируемых под ваши собственные данные и задачи. 🎙Спикер: Марк Блуменау, академический руководитель программы «Специалист по Data Science» Центра непрерывного образования ФКН и магистратуры «Умные устройства: аппаратная разработка». 📁Когда: 2 июня в 19:00. Регистрация 📍

6 036

Подборка каналов по инженерии данных Делимся подборкой телеграм-каналов по Data Engineering. Папка составлена Владиславом Бояром — экспертом Центра непрерывного образования ФКН и инженером данных во «Вкусно — и точка». Каналы будут полезны всем, кто интересуется карьерой в области инженерии данных, начиная с базовых знаний и заканчивая углубленным изучением баз данных, ETL-процессов и облачных решений. Сохранить папку 📍

6 036

🎥 Что посмотреть: подборка видеозаписей Собрали для вас записи вебинаров Центра непрерывного образования ФКН, раскрывающие ключевые темы аналитики данных и Data Science: от изучения основ SQL и методов визуализации до знакомства с большими языковыми моделями и методов промпт-инжиниринга. 1️⃣Метрики и аналитика после запуска маркетинговых кампаний: кейс-стади Способы превращения результатов маркетинговых и рекламных кампаний в понятную и интерпретируемую экономику продукта. Разбор реального маркетингового флайта и принятие продуктовых решений на основе цифр. 2️⃣Первый шаг в аналитику или SQL для начинающих Знакомство с одним из базовых инструментов работы аналитика — SQL. Основы синтаксиса, примеры простых запросов, отличия от Excel, устройство баз данных. 3️⃣Эффективный промптинг: как извлечь максимум пользы от языковой модели Современные возможности генеративного ИИ, основы промпт‑инжиниринга, наиболее эффективные техники формулирования запросов и управления контекстом, а также примеры применения в бизнесе, в образовании и повседневных задачах. 4️⃣Data Detective: BI как инструмент для проверки гипотез Поиск закономерностей и проверка гипотез с помощью BI-инструментов: подключение данных в DataLens, построение визуализаций, поиск проблем через детализацию и фильтры, построение интерактивного отчета. 5️⃣Как найти первую работу в направлениях Data Analysis, Data Science и Data Engineering? Анализ тенденций текущего рынка труда, требования работодателей и их ожидания от кандидатов, грамотное создание сопроводительных писем и резюме. Вебинар, прошедший в рамках Летней школы по аналитике, Data Science и Data Engineering. 6️⃣Как работает ChatGPT и как управлять генерацией чат-ботов из Python? Ключевые принципы работы современных генеративных чат-ботов, этапы обучения больших языковых моделей, формирование ответов и существующие стратегии генерации, практическая часть.

6 036

Работа с ИИ-ассистентами в рамках инженерного подхода Центр непрерывного образования ФКН НИУ ВШЭ открывает набор на онлайн-программу повышения квалификации, посвященную разработке прикладных решений с использованием ИИ-ассистентов. Программа построена вокруг подход, при котором значительная часть кода создается в связке с языковой моделью под управлением человека, однако фокус смещен на инженерные практики: проектирование решений, контроль качества генерируемого кода и обеспечение воспроизводимости результата. Инструментальный стек программы: 🟣Python как основной язык разработки 🟣Pandas и OpenPyXL для обработки табличных данных 🟣Requests для интеграции с внешними программными интерфейсами 🟣FastAPI и Streamlit для разработки внутренних сервисов и веб-интерфейсов 🟣Git/GitHub для версионирования 🟣Make, Taskfile, requirements.txt для управления зависимостями и воспроизводимости 🟣ИИ-ассистенты (Cursor, Claude, ChatGPT) для генерации, объяснения и рефакторинга кода В рамках программы слушатели разработают скрипты для автоматизации обработки данных, инструменты консолидации отчетности и прикладные сервисы с веб-интерфейсом. Особое внимание будет уделено критической оценке кода, сгенерированного языковой моделью, и обеспечению надежности итогового решения. Программа предназначена для специалистов финансовых, коммерческих и HR-подразделений, начинающих аналитиков и предпринимателей. Для прохождения необходим базовый опыт работы с любым языком программирования. 📁Старт: 27 мая в синхронном онлайн-формате. Подробнее о программе 📍

6 036

Контекст-менеджмент для агентов, синтетический контроль, Data Quality как продукт — все доклады на Stepik Записи выступлений зимней школы «IT-сеанс: погружение в мир данных», презентации спикеров и сопутствующие материалы доступны на Stepik. Внутри — три тематических трека и общая часть. 1️⃣Аналитика: 🟣Что необходимо знать аналитику и как использовать на практике. Виды аналитиков в бизнесе, этапы работы по уровням сложности, навыки продуктового аналитика. 🟣Как найти эффект, когда A/B невозможен. На примере кешбэк-кейса: подбор синтетической контрольной группы, измерение эффекта без A/B-теста, применение PSM и подключение ML-модели. 🟣Работа с множеством распределений на практике. Виды распределений и основы работы с ними, нахождение выбросов на одном распределении и на 6000 различных. 2️⃣Data Science: 🟣Почему фундамент важнее кода: как меняется Data Science с появлением AI-агентов. Как меняется работа DS, какие неожиданные вопросы про агентов задают на собеседованиях, почему фундамент становится главным преимуществом. 🟣Управление контекстными данными как ключ к качеству ИИ-агентов. Что такое контекст-менеджмент для агентов, какие техники применяются в современных ИИ-системах, возможности и ограничения на практике. 🟣Детекция аномалий в данных телеметрии. Как выстроить полноценный цикл observability, почему анализ в реальном времени и ML-модели стали стандартом проактивного мониторинга, как многоуровневая детекция и контекст данных помогают отличать реальные инциденты от ложных тревог. 3️⃣Data Engineering: 🟣Разговорный слой корпоративных данных: как построить agentic-доступ к Lakehouse под контролем Data Governance. Как построить разговорный слой поверх Lakehouse в крупной организации: от семантики и каталога до правил доступа и фиксации действий. Референс-архитектура с MCP. 🟣Архитектура данных в экосистеме: от реляционных баз к data-driven банкингу. Данные с двух сторон — контента и технологий: что такое контент данных и как его построить, как эволюционировали технологии и куда движется направление. 🟣«Data Quality» как продукт — как отмыть данные, не потеряв честь. Что считать качественными данными, где в data-пайплайне чаще всего возникают проблемы, как их быстро обнаруживать и устранять. Подход «Data Quality как продукт» и его интеграция в продовые пайплайны. Общий трек: 🟣Как перейти в IT без технического бэкграунда и использовать отраслевой опыт как преимущество. Навыки, важные в IT, роль отраслевого опыта, подготовка к переходу и роадмэпы для разных специальностей. 🟣Каким бывает ML: карьерный путь выпускника ЦНО. Примеры применения машинного обучения в России и мире на примере карьерного трека выпускника ЦНО ФКН НИУ ВШЭ. 🟣Управляем языковой моделью с помощью Python. Как генеративные языковые модели общаются с людьми, запуск LLM из Python, стратегии генерации на практике. Требуется знание основ Python. Получить материалы 📍