Центр непрерывного образования ФКН НИУ ВШЭ
Открыть в Telegram
Дополнительное профессиональное образование от факультета компьютерных наук НИУ ВШЭ. Программы с нуля и продвинутые курсы по: - математике - программированию и ИИ - анализу данных и Data Science - фронтенду и геймдеву Сайт: https://cs.hse.ru/dpo
Больше6 036
Подписчики
Нет данных24 часа
+37 дней
+2230 день
Архив постов
RAG-архитектура на пальцах: как языковая модель достает информацию из вашей базы знаний
Есть распространенное заблуждение, будто языковая модель «знает» только то, что видела при обучении. На самом деле, она работает с тем, что лежит в ее контекстном окне: с документами, присланными в чат, результатами поиска, выдержками из базы. Но контекстное окно не резиновое, и вы физически не можете загрузить в него всю корпоративную базу знаний.
Тут и появляется RAG (Retrieval-Augmented Generation). Идея простая: не передавать в модель все подряд, а перед каждым ответом находить в базе именно те фрагменты, которые относятся к вопросу, и подкладывать в контекст только их.
1️⃣Сначала базу нужно подготовить
🟣Документы режутся на фрагменты — чанки. Именно здесь чаще всего закладывается будущее качество: если порежете слишком крупно, то в одном фрагменте смешается несколько тем, а поиск будет промахиваться; слишком мелко — фрагмент потеряет смысл.
🟣Каждый чанк прогоняется через модель-эмбеддер и превращается в вектор — длинный набор чисел, кодирующий смысл текста. Важный момент: близкие по смыслу тексты получают близкие векторы, даже если написаны разными словами, и это принципиально отличает подход от обычного поиска по ключевым словам.
🟣Векторы складываются в векторную базу данных — хранилище, заточенное под одну задачу: быстро находить ближайшие векторы среди миллионов.
2️⃣Что происходит, когда пользователь задает вопрос
🟣Вопрос проходит через тот же эмбеддер и тоже становится вектором, а система ищет в базе фрагменты, чьи векторы ближе всего к вектору запроса. Это шаг retrieval.
🟣Часто сюда добавляют еще один шаг — переранжирование. Первичный поиск по векторам быстрый, но недостаточно релевантный, он может выдасть более 20 кандидатов. Их прогоняют через более тяжелую и точную модель, которая пересортировывает результаты и оставляет действительно лучшие.
🟣Отобранные фрагменты вставляются в промпт рядом с исходным вопросом, модель генерирует ответ, опираясь на эти куски, а не на свои общие представления о запросе. Грамотно собранная система еще и возвращает ссылки на исходные документы, чтобы ответ можно было проверить.
3️⃣Почему RAG, а не дообучение
🟣Может возникнуть логичный вопрос: если нужно, чтобы модель работала с нашими данными, почему просто не дообучить ее на них? Ответ простой: для большинства задач RAG практичнее, ведь для того, чтобы обновить знания, надо всего лишь добавить документ в базу. Источник ответа будет виден, и его можно проверить, чего не дает дообученная модель. К тому же модель можно ограничить рамками контекста, снижая риск галлюцинаций.
4️⃣Особенности работы с RAG и точность ответа
🟣Главное, что надо знать и понимать про RAG: система отвечает настолько хорошо, насколько точен поиск. Если retrieval вытащил не те фрагменты, модель сгенерирует уверенный и складный ответ, но неверный. Поэтому большая часть работы над RAG-системами уходит не на модель, а на поиск: подбор размера чанков, выбор эмбеддера, настройку переранжирования и чистоту базы.
День открытых дверей онлайн-программ факультета компьютерных наук
В эту субботу, 27 июня, пройдет День открытых дверей для абитуриентов бакалавриата и магистратуры. Вы разберетесь в преимуществах онлайн-образования, определитесь с программой и познакомитесь лично с командой ФКН Онлайн.
На встрече расскажут:
⭐️️️️️️️️ какой набор навыков получают студенты и кем становятся выпускники
⭐️️️️️️️️ как устроено поступление и как получить максимальные баллы за портфолио
⭐️️️️️️️️ как получить образовательный кредит под 3% и другие льготы
Онлайн-программы, о которых пойдет речь:
⚪️ Искусственный интеллект
⚪️ Прикладные нейросетевые технологии
⚪️ Аналитика больших данных
⚪️ Инженерия данных
⚪️ Бэкенд-разработка и архитектура программных систем
⚪️ Искусственный интеллект в маркетинге и управлении продуктом
⚪️ Компьютерные науки и анализ данных, онлайн-бакалавриат
📆 Когда: 27 июня, 14:00
💻 Формат: онлайн + запись и полезные материалы после мероприятия
🐭 Зарегистрироваться
Кардиогенетика: персонализированная медицина XXI века
Сегодня искусственный интеллект и машинное обучение проникают в самые сложные области науки, и персонализированная медицина не исключение. Технологии секвенирования позволяют нам читать геном человека, а инструменты анализа данных — искать в нем мутации, связанные с заболеваниями.
Центр непрерывного образования ФКН приглашает на открытый вебинар, на котором мы определим, какую роль в кардиогенетике играют современные технологии.
Поговорим о том:
🟣какие задачи в биоинформатическом анализе могут быть автоматизированы, а где критически важны экспертные знания врача и исследователя;
🟣что такое «цифровой двойник» пациента и как с его помощью можно отработать весь цикл кардиогенетического тестирования — от сырых данных до клинического заключения;
🟣какие навыки действительно необходимы, чтобы начать карьеру на стыке Data Science, биоинформатики и медицины, и почему базовые знания биологии и клинического контекста остаются незаменимыми.
Вебинар пройдет в рамках подготовки к Летней школе «Кардиогенетика: от секвенирования к разработке кардиопанели» от Центра биомедицинских исследований и технологий ФКН.
🎙Спикер: Мария Попцова, директор центра биомедицинских исследований и технологий ФКН НИУ ВШЭ.
📁Когда: 29 июня в 17:30.
Регистрация 📍
+9
Что изучают на программе «Специалист по Data Science»?
Скоро стартует очное обучение на программе профессиональной переподготовки «Специалист по Data Science», аккредитованной Альянсом в сфере ИИ. В течение 15 месяцев слушатели будут изучать все направления современной науки о данных.
В сегодняшних карточках подробно рассказываем о том, какие дисциплины включены в программу и какие навыки удастся приобрести.
🟣Python для автоматизации и анализа данных и SQL
🟣Алгоритмы и структуры данных
🟣Математика для анализа данных
🟣Прикладная статистика для машинного обучения
🟣Машинное обучение
🟣Промышленное машинное обучение на Spark
🟣Глубинное обучение
🟣Введение в MLOps
Старт: 30 июня.
Подробнее о программе 📍
Говорим с ИИ на его языке: мастер-класс по техникам промпт-инжиниринга
Многие думают, что использование LLM — простая задача. Однако один и тот же запрос можно сформулировать десятью разными способами, а результаты бывают разными: от точного ответа до получения нерелевантной информации. Вся разница в промпте.
Приглашаем на открытый вебинар от Центра непрерывного образования ФКН всех, кто имеет небольшой опыт во взаимодействии с ИИ и хочет начать развиваться в этом направлении.
На вебинаре мы обсудим и посмотрим на примерах:
🟣почему нейросети так чувствительны к формулировкам;
🟣какие техники промптинга работают;
🟣чем отличаются техники в GigaChat, QWEN, Perplexity и Yandex Cloud;
🟣как писать промпты, чтобы получать аналитический результат.
Все участники получат перечень техник промптинга и список задач для их применения.
🎙Спикер: Маргарита Бурова, эксперт и академический руководитель программы «Аналитик данных» Центра непрерывного образования ФКН, руководитель edtech-программ по data science и аналитике Wildberries.
📁Когда: 24 июня в 17:30.
Регистрация 📍
Успеть подать заявку летом и начать учиться осенью
Напоминаем, что в Центре непрерывного образования ФКН НИУ ВШЭ действует летняя акция: вы можете оставить заявку на программы с осенним стартом до 31 июля и заморозить стоимость — в сентябре цены будут повышены. Акция распространяется на восемь программ:
1️⃣Программа профессиональной переподготовки (очный формат):
🟣Аналитик данных
Годовая программа полного цикла подготовки специалиста: Python, SQL, статистика, A/B-тестирование, ML и продуктовая аналитика. По окончании слушатели получают диплом НИУ ВШЭ о переподготовке.
Подать заявку 📍
2️⃣Курсы повышения квалификации (очный формат):
🟣Математика для анализа данных
Фундаментальный курс по линейной алгебре, матанализу, дискретной математике и теории вероятностей для последующего изучения ML.
Подать заявку 📍
🟣Алгоритмы и структуры данных
Вы научитесь анализировать сложность алгоритмов, выбирать подходящие структуры данных и писать эффективный код, который не тормозит на больших объемах.
Подать заявку 📍
🟣Прикладная статистика для машинного обучения
Теория вероятностей и математическая статистика с реализацией на Python: от описательных статистик до A/B-тестирования, которое лежит в основе принятия решений в продуктовых командах.
Подать заявку 📍
🟣Машинное обучение
Изучение классических ML-алгоритмов (регрессии, классификации, кластеризации) с практикой на реальных задачах: от подготовки данных до оценки качества моделей.
Подать заявку 📍
3️⃣Курсы повышения квалификации (онлайн):
🟣Python для автоматизации и анализа данных
Освоите Python с нуля и научитесь автоматизировать рутину: сбор данных, обработка таблиц, визуализация, работа с API.
Подать заявку 📍
🟣BI-аналитика и визуализация данных
Научитесь строить интерактивные дашборды в Yandex DataLens и Tableau, проектировать визуализацию под бизнес-задачу и доносить выводы до нетехнических пользователей.
Подать заявку 📍
🟣LLM: создание и интеграция интеллектуальных ассистентов
Разберетесь в архитектуре трансформеров, научитесь проектировать RAG-пайплайны и создавать LLM-агентов для встраивания в реальные продукты.
Подать заявку 📍
Как заморозить цену: оставьте заявку на странице выбранной программы до 31 июля. Менеджер подтвердит участие и зафиксирует для вас текущую стоимость обучения.
Компьютерное зрение на практике: распознавание кошек и собак
Все слышали, что нейросети умеют распознавать лица, объекты на фото и даже ставить диагнозы по снимкам. Но как это работает на самом деле? Что происходит внутри, когда модель решает, кот на картинке или собака? И главное — как самому обучить такую модель, даже если ты только начинаешь?
Приглашаем на вебинар от Центра непрерывного образования ФКН, на котором пройдем весь путь от теории до кода в Google Colab и поговорим о том:
🟣как нейросети на самом деле «видят» изображения (спойлер: совсем не как люди);
🟣что такое классификация изображений и какие задачи к ней относятся;
🟣как подготовить данные для обучения: от папки с картинками до готового датасета;
🟣как обучить простую модель распознавания котов и собак;
🟣как проверить качество модели и понять, ошибается она или нет;
🟣и самое интересное: как «обмануть» нейросеть и зачем это делать.
По итогу вебинара все участники заберут готовый notebook с полным пайплайном обучения модели и веса обученной модели — можно сразу запустить у себя и поэкспериментировать.
🎙Спикер: Марк Блуменау, академический руководитель программы «Специалист по Data Science» Центра непрерывного образования ФКН и магистратуры «Умные устройства: аппаратная разработка».
📁Когда: 18 июня в 19:00.
Регистрация 📍
ИИ для аналитики: какие задачи уже решают языковые модели, а где и зачем нужен аналитик
Языковые модели уже генерируют SQL-запросы по текстовому описанию, автоматизируют очистку данных, строят простые графики и делают предварительные выводы. В связи с чем у многих новичков возникает ощущение: «а зачем тогда учиться на аналитика, если ИИ все делает сам?». На практике все сложнее — модели ошибаются, пропускают контекст, не чувствуют бизнес-задачи и часто дают ответ, который звучит красиво, но фактически не работает.
Приглашаем вас на вебинар от Центра непрерывного образования ФКН, на котором разберем, что можно делегировать искусственному интеллекту, а где не обойтись без аналитика.
Поговорим о том:
🟣какие задачи по анализу данных языковые модели уже закрывают хорошо, а где пока проваливаются;
🟣как выглядит нормальный рабочий процесс, в котором ИИ служит помощником;
🟣какие сервисы и инструменты использовать новичку;
🟣что такое хороший промпт для аналитической задачи;
🟣какие главные ограничения и подводные камни существуют при работе с ИИ в аналитике.
Все участники вебинара получат чек-лист с сервисами для ИИ-аналитики, примеры промптов и список ключевых ограничений.
🎙Спикер: Маргарита Бурова, эксперт и академический руководитель программы «Аналитик данных» Центра непрерывного образования ФКН, руководитель edtech-программ по data science и аналитике Wildberries.
📁Когда: 17 июня в 17:30.
Регистрация 📍
+1
📢 Приглашаем на День карьеры Центра непрерывного образования ФКН НИУ ВШЭ
В программе вечера:
1️⃣Мини-лекции от экспертов:
• «Рабочие ИИ-инструменты для поиска работы» — Анна Шангареева, GYROMIND • «Как развиваться в инженерии данных и не потерять работу в эпоху ИИ» — Кирилл Сысоев, Сбер • «Карьерный путь выпускника» — Михаил Арк, Сбер2️⃣Карьерные зоны компаний-партнеров:
• Яндекс • Ozon Tech • ЦНО ФКНМожно будет пообщаться с представителями компаний, задать вопросы о карьере и найме, получить рекомендации по резюме и узнать больше о карьерных возможностях. 3️⃣Нетворкинг и свободное общение со слушателями, выпускниками, спикерами и представителями компаний. Будем рады вновь увидеть участников наших прошлых мероприятий, слушателей и выпускников программ ЦНО, а также всех, кто интересуется карьерным развитием в IT, аналитике и data-направлениях. Регистрация 📍
Промпт-инжиниринг: методологии CO-STAR и TIDD-EC
Языковые модели достраивают наиболее вероятные продолжения на основе того, что вы дали на вход, и чем больше в запросе неоднозначности, тем шире пространство возможных ответов и выше шанс получить размытый или нерелевантный результат. Методологии структурирования промптов решают эту проблему и превращают расплывчатое пожелание в спецификацию. Сегодня разберем 2️⃣ наиболее популярных.
1️⃣CO-STAR
Основной концепт — разложение запроса на шесть измерений, каждое из которых закрывает отдельный источник неоднозначности.
🟣Context: фоновые данные, в которых существует задача, позволяющие модели сузить ответ до конкретной ситуации.
🟣Objective: одна четко сформулированная задача.
🟣Style: структура и манера изложения.
🟣Tone: эмоциональная окраска. И в данном случае стиль и тон намеренно разделены: текст может быть строго структурированным по стилю, но при этом дружелюбным по тону.
🟣Audience: на кого ориентирован ответ и какая глубина объяснений требуется.
🟣Response: объем, структура, формат вывода, лимит по длине. Этот компонент экономит больше всего итераций, так как именно несовпадение формата чаще всего заставляет переписывать запрос.
CO-STAR сильнее всего в задачах генерации текста, в которых результат оценивается субъективно и важны попадание в аудиторию и выдержанная стилистика.
2️⃣TIDD-EC
Более строгая методология, ориентированная на задачи, в которых ответ оценивается по объективным критериям: правильно/неправильно, соответствует формату/нет. Пять основных пунктов:
🟣Task type: категория операции: классификация, извлечение сущностей, суммаризация, переписывание.
🟣Instructions: пошаговый алгоритм выполнения. Здесь описывается не что нужно получить, а как к этому прийти.
🟣Do: признаки, которые обязательно должны присутствовать в ответе.
🟣Don't: ограничения и типичные ошибки, которые нужно исключить. Связка Do/Don't задает границы ответа с двух сторон и заметно снижает количество отклонений от ожидаемого результата.
🟣Examples & Content: образцы желаемого вывода плюс конкретные данные для обработки. Примеры работают как few-shot обучение прямо внутри запроса: модель ориентируется на эталон.
TIDD-EC лучше применять в формализованных задачах с жесткими требованиями: парсинг в структурированный формат, разметка, классификация по заданным правилам.
Как выбирать на практике:
🟣Результат оценивается субъективно (тексты, письма, контент, коммуникация): CO-STAR с упором на контекст, аудиторию и стилистику.
🟣Результат проверяется по четким критериям (обработка данных, извлечение, классификация): TIDD-EC с упором на инструкции, ограничения и примеры.
Карта галлюцинаций: где ИИ врет чаще всего и как это ловить
Нейросети уверенно пишут код, анализируют данные и строят гипотезы, но даже лучшие модели периодически выдают убедительную ложь — так называемые «галлюцинации». Это прямая угроза, особенно для начинающих специалистов: от неверного вывода в отчете до сбоя в бизнес-логике.
Приглашаем на вебинар от Центра непрерывного образования ФКН, на котором обсудим, как в таком случае отличить правду от вымысла.
Разберем на реальных примерах:
🟣что такое галлюцинации ИИ и почему они возникают;
🟣какие задачи и данные чаще всего провоцируют нейросети на ошибки;
🟣где и как врет каждый из сервисов: GigaChat, QWEN, Perplexity, Yandex Cloud;
🟣как писать промпты так, чтобы снизить риск получения ложного ответа;
🟣пошаговый алгоритм фактчекинга для начинающих.
Все участники вебинара получат карту галлюцинаций с чек-листом, которая поможет быстро проверять ответы нейросетей.
🎙Спикер: Маргарита Бурова, эксперт и академический руководитель программы «Аналитик данных» Центра непрерывного образования ФКН, руководитель edtech-программ по data science и аналитике Wildberries.
📁Когда: 10 июня в 17:30.
Регистрация 📍
Ежемесячная подборка актуальных IT-вакансий: июнь
Позиции стажера:
🟣Аналитик, Axenix
🟣Бизнес-аналитик, Kept, Технологическая практика
🟣Дата-аналитик Smart Rollout, «МТС»
🟣Системный аналитик, Т1 Иннотех
🟣Стажер по исследованию AI-агентов для хранилища данных, Сбер
🟣Data-аналитик, T2. IT и Digital
🟣Python-разработчик, ПАО ВТБ
Бизнес-аналитика:
🟣Бизнес-аналитик, ООО РСХБ-Интех
🟣Бизнес-аналитик, Технопарк Офис
🟣Бизнес-аналитик, ПАО Ростелеком
🟣Бизнес-аналитик, VK
🟣Бизнес-аналитик, Туту
🟣Бизнес-аналитик, Т-Банк
🟣Бизнес-аналитик, Nestle
Аналитика данных:
🟣Аналитик, Ozon fresh
🟣Аналитик данных, Сравни
🟣Аналитик данных, ООО HeadHunter::Analytics/Data Science
🟣Аналитик данных, RWB (Wildberries & Russ)
🟣Аналитик данных, Datanomica
🟣Дата-аналитик, «МТС»
Data Science, ML и DE:
🟣AI-инженер, ООО GlowByte
🟣AI Engineer, Ингосстрах
🟣ML-инженер, OneTwoTrip
🟣ML Engineer, ПАО Ростелеком
🟣Data Scientist, Северсталь. IT & Digital
🟣Data Scientist, Альфа-Банк
🟣Data Scientist, Сбер. IT
🟣Data Engineer, Лента
🟣Data Engineer, Островок.Ostrovok!Tec
🟣Data Engineer, Платформа ОФД
Скидка 10% «ранним пташкам»: подать заявку летом — учиться осенью
Центр непрерывного образования ФКН НИУ ВШЭ запускает летнюю акцию: оставьте заявку на программы с осенним стартом до 31 июля и получите скидку 10% на обучение. Акция распространяется на восемь программ:
1️⃣Программа профессиональной переподготовки (очный формат):
🟣Аналитик данных
Годовая программа полного цикла подготовки специалиста: Python, SQL, статистика, A/B-тестирование, ML и продуктовая аналитика. По окончании слушатели получают диплом НИУ ВШЭ о переподготовке.
Подать заявку 📍
2️⃣Курсы повышения квалификации (очный формат):
🟣Математика для анализа данных
Фундаментальный курс по линейной алгебре, матанализу, дискретной математике и теории вероятностей для последующего изучения ML.
Подать заявку 📍
🟣Алгоритмы и структуры данных
Вы научитесь анализировать сложность алгоритмов, выбирать подходящие структуры данных и писать эффективный код, который не тормозит на больших объемах.
Подать заявку 📍
🟣Прикладная статистика для машинного обучения
Теория вероятностей и математическая статистика с реализацией на Python: от описательных статистик до A/B-тестирования, которое лежит в основе принятия решений в продуктовых командах.
Подать заявку 📍
🟣Машинное обучение
Изучение классических ML-алгоритмов (регрессии, классификации, кластеризации) с практикой на реальных задачах: от подготовки данных до оценки качества моделей.
Подать заявку 📍
3️⃣Курсы повышения квалификации (онлайн):
🟣Python для автоматизации и анализа данных
Освоите Python с нуля и научитесь автоматизировать рутину: сбор данных, обработка таблиц, визуализация, работа с API.
Подать заявку 📍
🟣BI-аналитика и визуализация данных
Научитесь строить интерактивные дашборды в Yandex DataLens и Tableau, проектировать визуализацию под бизнес-задачу и доносить выводы до нетехнических пользователей.
Подать заявку 📍
🟣LLM: создание и интеграция интеллектуальных ассистентов
Разберетесь в архитектуре трансформеров, научитесь проектировать RAG-пайплайны и создавать LLM-агентов для встраивания в реальные продукты.
Подать заявку 📍
⚡️ Как получить скидку: оставьте заявку на странице выбранной программы до 31 июля. Менеджер подтвердит участие и зафиксирует скидку 10% на стоимость обучения.
Основы компьютерного зрения и анализа изображений
Центр непрерывного образования ФКН совместно с компанией MWS AI запустил бесплатный онлайн-курс «Основы компьютерного зрения и анализа изображений».
В процессе обучения вы:
🟣погрузитесь в теоретические основы компьютерного зрения и познакомитесь с необходимыми практическими инструментами;
🟣освоите базовые операции обработки: свертки, ядра фильтров, выделение границ;
🟣изучите классические методы распознавания;
🟣познакомитесь с архитектурой сверточных нейросетей: от перцептрона и полносвязных слоев до CNN;
🟣на практике обучите модель классификации изображений;
🟣получите обзор продвинутых направлений: детекция объектов, семантическая и instance-сегментация, генеративные модели, стереозрение, трекинг и видеоаналитика.
По итогам курса вы сможете подготовить проект для портфолио — приложение для анализа поведения объектов перед камерой. Курс подойдет специалистам смежных дисциплин и студентам старших курсов. Для комфортного освоения материала необходимо знание Python, основ машинного и глубинного обучения, а также линейной алгебры.
🎙Автор курса — Иван Копылов, ведущий разработчик центра компьютерного зрения департамента машинного обучения и фундаментальных исследований MWS AI, старший преподаватель факультета компьютерных наук НИУ ВШЭ.
📁Формат: онлайн по записям, лонгриды, презентации и задания с автопроверкой.
Присоединиться к курсу 📍
Метрики, которые важны: как не утонуть в KPI
Метрики — это измеримые показатели, которые используются в бизнесе для оценки эффективности процессов, маркетинговых кампаний и работы продуктов. Центр непрерывного образования ФКН приглашает на вебинар, который поможет разобраться в том, как переводить абстрактные данные в конкретные коэффициенты и признаки, отслеживать динамику и принимать обоснованные решения.
Мы подробно рассмотрим:
🟣Какие метрики бывают;
🟣Какие из них используют аналитики в своей работе;
🟣Когда какие метрики лучше выбрать;
🟣Как вычислять метрики.
Все участники вебинара получат набор инструментов, который поможет им легко ориентироваться в метриках и делать необходимые расчеты: чек-лист, дорожную карту выбора метрик и комплект формул с пояснениями.
🎙Спикер: Маргарита Бурова, эксперт и академический руководитель программы «Аналитик данных» Центра непрерывного образования ФКН, руководитель edtech-программ по data science и аналитике Wildberries.
📁Когда: 3 июня в 17:30.
Регистрация 📍
Предсказываем что угодно: от цен квартир до оттока клиентов
Центр непрерывного образования ФКН приглашает всех, кто владеет Python на базовом уровне и начинает погружаться в машинное обучение, на вебинар, посвященный одной из ключевых задач науки о данных— прогнозированию на основе исторических данных.
В ходе вебинара мы пошагово разберем, как делать прогнозы на основе данных:
🟣Загрузим датасет;
🟣Обучим модель;
🟣Сделаем прогноз;
🟣Оценим качество модели.
В результате все участники получат готовый notebook и ML-модель. Материалы можно будет применять на практике в качестве шаблонов, адаптируемых под ваши собственные данные и задачи.
🎙Спикер: Марк Блуменау, академический руководитель программы «Специалист по Data Science» Центра непрерывного образования ФКН и магистратуры «Умные устройства: аппаратная разработка».
📁Когда: 2 июня в 19:00.
Регистрация 📍
Подборка каналов по инженерии данных
Делимся подборкой телеграм-каналов по Data Engineering. Папка составлена Владиславом Бояром — экспертом Центра непрерывного образования ФКН и инженером данных во «Вкусно — и точка».
Каналы будут полезны всем, кто интересуется карьерой в области инженерии данных, начиная с базовых знаний и заканчивая углубленным изучением баз данных, ETL-процессов и облачных решений.
Сохранить папку 📍
🎥 Что посмотреть: подборка видеозаписей
Собрали для вас записи вебинаров Центра непрерывного образования ФКН, раскрывающие ключевые темы аналитики данных и Data Science: от изучения основ SQL и методов визуализации до знакомства с большими языковыми моделями и методов промпт-инжиниринга.
1️⃣Метрики и аналитика после запуска маркетинговых кампаний: кейс-стади
Способы превращения результатов маркетинговых и рекламных кампаний в понятную и интерпретируемую экономику продукта. Разбор реального маркетингового флайта и принятие продуктовых решений на основе цифр.
2️⃣Первый шаг в аналитику или SQL для начинающих
Знакомство с одним из базовых инструментов работы аналитика — SQL. Основы синтаксиса, примеры простых запросов, отличия от Excel, устройство баз данных.
3️⃣Эффективный промптинг: как извлечь максимум пользы от языковой модели
Современные возможности генеративного ИИ, основы промпт‑инжиниринга, наиболее эффективные техники формулирования запросов и управления контекстом, а также примеры применения в бизнесе, в образовании и повседневных задачах.
4️⃣Data Detective: BI как инструмент для проверки гипотез
Поиск закономерностей и проверка гипотез с помощью BI-инструментов: подключение данных в DataLens, построение визуализаций, поиск проблем через детализацию и фильтры, построение интерактивного отчета.
5️⃣Как найти первую работу в направлениях Data Analysis, Data Science и Data Engineering?
Анализ тенденций текущего рынка труда, требования работодателей и их ожидания от кандидатов, грамотное создание сопроводительных писем и резюме. Вебинар, прошедший в рамках Летней школы по аналитике, Data Science и Data Engineering.
6️⃣Как работает ChatGPT и как управлять генерацией чат-ботов из Python?
Ключевые принципы работы современных генеративных чат-ботов, этапы обучения больших языковых моделей, формирование ответов и существующие стратегии генерации, практическая часть.
Работа с ИИ-ассистентами в рамках инженерного подхода
Центр непрерывного образования ФКН НИУ ВШЭ открывает набор на онлайн-программу повышения квалификации, посвященную разработке прикладных решений с использованием ИИ-ассистентов.
Программа построена вокруг подход, при котором значительная часть кода создается в связке с языковой моделью под управлением человека, однако фокус смещен на инженерные практики: проектирование решений, контроль качества генерируемого кода и обеспечение воспроизводимости результата.
Инструментальный стек программы:
🟣Python как основной язык разработки
🟣Pandas и OpenPyXL для обработки табличных данных
🟣Requests для интеграции с внешними программными интерфейсами
🟣FastAPI и Streamlit для разработки внутренних сервисов и веб-интерфейсов
🟣Git/GitHub для версионирования
🟣Make, Taskfile, requirements.txt для управления зависимостями и воспроизводимости
🟣ИИ-ассистенты (Cursor, Claude, ChatGPT) для генерации, объяснения и рефакторинга кода
В рамках программы слушатели разработают скрипты для автоматизации обработки данных, инструменты консолидации отчетности и прикладные сервисы с веб-интерфейсом. Особое внимание будет уделено критической оценке кода, сгенерированного языковой моделью, и обеспечению надежности итогового решения.
Программа предназначена для специалистов финансовых, коммерческих и HR-подразделений, начинающих аналитиков и предпринимателей. Для прохождения необходим базовый опыт работы с любым языком программирования.
📁Старт: 27 мая в синхронном онлайн-формате.
Подробнее о программе 📍
Контекст-менеджмент для агентов, синтетический контроль, Data Quality как продукт — все доклады на Stepik
Записи выступлений зимней школы «IT-сеанс: погружение в мир данных», презентации спикеров и сопутствующие материалы доступны на Stepik. Внутри — три тематических трека и общая часть.
1️⃣Аналитика:
🟣Что необходимо знать аналитику и как использовать на практике.
Виды аналитиков в бизнесе, этапы работы по уровням сложности, навыки продуктового аналитика.
🟣Как найти эффект, когда A/B невозможен.
На примере кешбэк-кейса: подбор синтетической контрольной группы, измерение эффекта без A/B-теста, применение PSM и подключение ML-модели.
🟣Работа с множеством распределений на практике.
Виды распределений и основы работы с ними, нахождение выбросов на одном распределении и на 6000 различных.
2️⃣Data Science:
🟣Почему фундамент важнее кода: как меняется Data Science с появлением AI-агентов.
Как меняется работа DS, какие неожиданные вопросы про агентов задают на собеседованиях, почему фундамент становится главным преимуществом.
🟣Управление контекстными данными как ключ к качеству ИИ-агентов.
Что такое контекст-менеджмент для агентов, какие техники применяются в современных ИИ-системах, возможности и ограничения на практике.
🟣Детекция аномалий в данных телеметрии.
Как выстроить полноценный цикл observability, почему анализ в реальном времени и ML-модели стали стандартом проактивного мониторинга, как многоуровневая детекция и контекст данных помогают отличать реальные инциденты от ложных тревог.
3️⃣Data Engineering:
🟣Разговорный слой корпоративных данных: как построить agentic-доступ к Lakehouse под контролем Data Governance.
Как построить разговорный слой поверх Lakehouse в крупной организации: от семантики и каталога до правил доступа и фиксации действий. Референс-архитектура с MCP.
🟣Архитектура данных в экосистеме: от реляционных баз к data-driven банкингу.
Данные с двух сторон — контента и технологий: что такое контент данных и как его построить, как эволюционировали технологии и куда движется направление.
🟣«Data Quality» как продукт — как отмыть данные, не потеряв честь.
Что считать качественными данными, где в data-пайплайне чаще всего возникают проблемы, как их быстро обнаруживать и устранять. Подход «Data Quality как продукт» и его интеграция в продовые пайплайны.
Общий трек:
🟣Как перейти в IT без технического бэкграунда и использовать отраслевой опыт как преимущество.
Навыки, важные в IT, роль отраслевого опыта, подготовка к переходу и роадмэпы для разных специальностей.
🟣Каким бывает ML: карьерный путь выпускника ЦНО.
Примеры применения машинного обучения в России и мире на примере карьерного трека выпускника ЦНО ФКН НИУ ВШЭ.
🟣Управляем языковой моделью с помощью Python.
Как генеративные языковые модели общаются с людьми, запуск LLM из Python, стратегии генерации на практике. Требуется знание основ Python.
Получить материалы 📍
Уже доступно! Исследование Telegram 2025 — ключевые инсайты года 
