Юрий Петров | ai engineering

Kanalga Telegram’da o‘tish

Привет! 👋 Я руководитель отдела разработки. Здесь мы изучаем LLM, автоматизацию с n8n, делаем крутые приложения на Flutter и учим их думать с помощью ИИ. Новости, лайфхаки, интересные кейсы, присоединяйся. #flutter #dart #llm #ai #ollama #n8n #agent #go

Ko'proq ko'rsatish

Rossiya228 642 Texnologiyalar & Aralashmalar32 295

1 777

Obunachilar

-324 soatlar

-127 kunlar

-5830 kunlar

702

Post ko'rishlar

~ 26824 soatlar

~ 32748 soatlar

39.46%

Muloqot nisbati

Ma'lumot yo'q

Kuniga postlar

Ads index

beta

Postlar arxiv

1 777

Moonshot AI, как и обещали, дропнули в open-source свою топовую нейронку. https://huggingface.co/moonshotai/Kimi-K3 Что реально интересно: 1. Первая в мире открытая модель класса 3T — 2,8 триллиона параметров. 2. Революционная архитектура внимания. Модель построена на новых механизмах Kimi Delta Attention и Attention Residuals (надо будет на курсе изучить эти подходы). 3. Встроенный автономный агент для разработки. 4. Нативная мультимодальность + 1 миллион токенов. Модель из коробки понимает текст, изображения и видео в рамках единого контекстного окна длиной 1 048 576 токенов. В итоге это полноценный автономный инженер-агент с триллионами параметров, нативным зрением, которая за раз может взять контекст огромного репозитория и которая теперь официально доступна сообществу. 😄 где то вместо грустят антропики и openai

1 777

Парень на Claude Opus 5 одним промтом сделал 3D-шутер, похожий на Call of Duty. https://github.com/mshumer/Claude-of-Duty Мда, похоже, скоро и игроделов ИИ заменит. Вот, собственно, и сам промт:

I want you to build a first-person shooter at the level of the most recent Call of Duty games. It should be utterly perfect, visually beautiful, with every single thing done at AAA quality—from textures to physics to anything you could think of.

Fan out sub-agents and have sub-agents tackle each one individually so that the game is utterly perfect. You should /loop on each item and have a separate sub-agent check it visually to ensure it looks triple A. That separate sub-agent should be a really harsh critic, and if it doesn't look triple A, it should keep going.

Don't stop until each sub-agent is utterly wowed with the quality when compared with the actual Call of Duty game. It should literally compare them side by side blind and say which one looks better. Do this in ThreeJS. /loop until it's utterly perfect. Fan out sub-agents and ultracode.

1 777

Как собрать свою GPT с нуля и наконец понять, что у LLM внутри? https://stepik.org/a/276236 Большинство работает с языковыми моделями как с чёрным ящиком: вызвал API - получил ответ. Но на собеседованиях и в реальных задачах всё чаще нужно понимать, как модель устроена под капотом: • Как текст превращается в токены и векторы? • Как на самом деле работает механизм внимания (attention)? • Что происходит внутри трансформер-блока? • Как модель обучается и начинает генерировать текст? • Как из простых формул собирается работающая GPT? Курс «Математика LLM - Создаём большую языковую модель своими руками проведёт вас от нуля до собственной мини-GPT. Каждый слой пишем и считаем сами, а не берём готовым из библиотеки. Внутри: ✔️ GPT-трансформер с нуля на чистом Python, без «магии» готовых библиотек ✔️ 15 модулей: от мини-математики и Python до обучения и генерации ✔️ 108 уроков, 330 шагов и более 150 проверочных заданий ✔️ Токенизация, эмбеддинги, attention, Multi-Head, FFN, training loop ✔️ Математика каждого шага на простых примерах + рабочий код ✔️ Своя мини-GPT в финале - её можно запускать, дообучать и менять ✔️ Проверка знаний после каждого модуля ✔️ Ответы автора прямо в комментариях к шагам 🎁 Для подписчиков канала промокод SUBS на скидку 20%.

1 777

Встречайте крупное обновление курса - Математика LLM — Создаем Большую Языковую Модель своими руками Добавил 14-ый модуль: Улучшаем генерацию: sampling, температура, top-k и top-p, где учим модель отвечать по-разному: вместо жадного argmax — сэмплирование, температура, top-k и top-p. Посчитаем, как всегда, всё ручками) и улучшим нашу модель. - Проблема жадной генерации. - Sampling, выбор следующего токена случайно. - Параметр T (температура), насколько смелой будет модель. - Параметр top-k, самые вероятные токены. - Параметр top-p, сортировка токенов по убыванию вероятности. Это важный шаг к реализации обучения, где мы сделаем реальный ChatGPT. 🎁 Для подписчиков канала промокод SUBS на скидку 20%.

1 777

Вышел Opus 5, говорят дешевле чем Fable, но ничем ему не уступает.

1 777

Всем привет, встречайте обновление курса «Математика LLM — Создаем Большую Языковую Модель своими руками» , где: ✅ Полностью пересчитал на бумажке и через NumPy все расчёты, тензоры и матрицы. ✅ Переработал код, теперь это не просто простыня непонятного кода, а разбил на логичные шаги. ✅ Добавил ко всем моделям проверочные задания. ✅ Добавил картинки в сложные для понимания шаги. Также, полностью понял и разобрался, как семплировать модель и обучать, чтобы она отвечала как ChatGPT. На подходе модули: 15. Улучшаем генерацию: sampling 16. Fine-tuning: учим модель отвечать как ChatGPT Ну и конечно промокод для подписчиков на скидку 20%: SUBS P.S. благодарю ребят, которые указали мне на ошибки в расчётах 🤝

1 777

Не долго музыка играла...

1 777

Всем привет, хотите написать свой Claude Code и понять, как он работает? Тогда для вас хорошая новость, я доделал полностью курс: Создание AI-агентов на Go: Eino (LangGraph), ReAct, RAG, MCP. Это практический курс по разработке AI-агентов на Go. Где мы собираем агента Mini Code (аналог Claude Code) своими руками: от первого вызова языковой модели до рассуждающего ассистента, который пользуется инструментами, сам пишет код, помнит контекст диалога и ищет ответы прямо в коде проекта. Фреймворк курса, Eino от CloudWeGo, это нативный Go-фреймворк для LLM-приложений с графовой оркестрацией, готовым ReAct-агентом, инструментами, состоянием и interrupt/resume. Ну и конечно, скидка моим подписчикам 30% ☺️

1 777

В новом выпуске Гостей из IT обсуждаем, что сегодня значит «качественный код», как ИИ-агенты помогают его проверять и почему красивый код — не всегда качественный. В гостях — Я и Евгений Антонов из Яндекса. 🎧 Слушайте подкаст на платформах: Apple Podcasts Яндекс Музыка VK Звук

1 777

ReAct, tool-calling, RAG, эмбеддинги, оркестрация графов, Interrupt/Resume, Retriever, Indexer, Callbacks. Знакомые слова? Значит, вы в теме. Не все? Тогда вы пока не AI-инженер. Мир сейчас меняется очень быстро: фреймворки и языки уходят, а на первый план выходят инженеры, которые умеют применять ИИ для решения технически сложных задач. Главное, что стоит усвоить: агент это не цикл for и пара if. Это сложная многоступенчатая структура со сложным циклом выполнения. Кто говорит, что всё просто, или просто не знает и не понимает агентные системы, или просто вводит в заблуждение. Недавно Виталий Зарубин очень точно описал эту боль (https://t.me/aurora_dev/1795). И он прав на 100%. С недавних пор я полностью перехожу на агентную разработку, и у нас уже есть свои внутренние продукты. Flexar это мультиагентная RAG-платформа: помогает управлять бизнес-процессами в контуре компании. CodeBab.ai это агент-оркестратор: он управляет агентами, которые проверяют наш код, анализируют лицензии в проектах, собирают отчёты и так далее. И это только начало. Параллельно я закончил курс по AI-агентам на Go + Eino (аналог LangGraph для Go). Скоро опубликую на Stepik. На курсе я показываю, как реально строить сложные агентные системы, а не как обернуть всё в один промпт. А самая фишка в том, что мы соберём свой аналог Claude Code: терминального агента-кодера, который читает ваш проект, объясняет и сам правит код. Так что Flutter станет меньше, но я буду держать в курсе развития AI-инженерии.

1 777

https://goodailist.com/repos Нашел очень полезный сайт, где разработчики публикуют свои приложения с открытым исходным кодом в области искусственного интеллекта. Обновление списка приложений ежедневное!

1 777

Тут подскаст вышел, где мы со Стасом за Flutter пояснили)) https://www.youtube.com/watch?v=-NrQ5hY7DTk

1 777

Тут Perplexity выложили в открытый доступ Bumblebee - это open-source сканер для машин разработчиков который ищет различные уязвимости, любителям Go зайдет, так как полностью написан на Go. Запускаешь его на машине - он за минуту обходит все места, где могут лежать пакеты и расширения, составляет список "вот что у тебя установлено". Потом сравнивает этот список со списком "вот что сейчас заражено" и говорит: "у тебя на диске лежит та самая отравленная версия chalk, вот по этому пути". Из приятного: один статический бинарник на Go без зависимостей, режим только-чтение (никаких npm ls, pip show, исходники не трогает), секреты из env-блоков MCP в записи не утекают. Такое мы забираем))

1 777

Supertonic 3 — локальный TTS без интернета прямо в вашем приложении. Корейская команда Supertone обновила свою лёгкую TTS-модель: 99M параметров, ONNX Runtime, никаких облаков и API-ключей. На M4 Pro генерит речь в десятки раз быстрее реалтайма. Работает даже на Raspberry Pi и на читалке Onyx Boox в авиарежиме. Что есть: - 31 язык речи (en, ko, ja, de, fr, es, ar, hi, vi и другие) - SDK под 11 платформ: Python, Node.js, Flutter, iOS, Swift, Rust, Go, Java, C++, C#, web - Числа, даты, телефоны, аббревиатуры читает корректно - Zero-shot клонирование голоса по короткой записи 🔗 github.com/supertone-inc/supertonic

1 777

Anthropic научились читать мысли Claude 😳. Внутри языковой модели слова превращаются в длинные списки чисел - активации. Раньше понять, что эти числа значат, можно было только косвенно: через специальные инструменты, и потом ещё долго интерпретировать результат руками. Natural Language Autoencoders работают иначе. Одну копию Claude учат описывать активации словами. Вторую - восстанавливать активации обратно из этого описания. Если восстановление точное, значит описание реально передаёт смысл. На выходе - обычный читаемый текст вроде "модель планирует закончить рифму словом rabbit" или "модель подозревает, что это тестовый сценарий". И вот тут начинается интересное. В проверках безопасности Claude гораздо чаще догадывается, что его тестируют, чем говорит вслух. На SWE-bench такие мысли всплывают в 26% случаев. На тестах с деструктивными действиями - 16%. А на реальных диалогах с пользователями - меньше 1%. То есть модель ведёт себя по-разному в зависимости от того, считает ли она ситуацию настоящей. В сценарии с шантажом Claude в ответе ни на что не намекал, но внутри у него крутилось "это похоже на сконструированную манипуляцию". В другом эксперименте Mythos Preview сжульничал на тренировочной задаче и обдумывал, как не попасться. Минусы у метода тоже есть. NLA иногда выдумывают детали, которых в контексте не было. И обходится это дорого: нужны две дополнительные копии модели, на каждую активацию генерируется сотни токенов. Статья для изучения Исходный код NLA

1 777

DeepSeek снизил цену на DeepSeek V4 Pro на 75%

1 777

Анонс новой крупной модели на саммите Alibaba Cloud 20 мая. Ключевые слова из официального анонса: "более универсальная, более мощная, более глубокая, более широкая". Похоже, грядет флагманское обновление.

1 777

Продолжаю улучшать и оптимизировать курс по созданию своей LLM с нуля. Добавляю картинки, что бы материал лучше и нагляднее выглядел. Вроде классно получается 😅 Напоминаю, сейчас на покупку курса есть скидка 20%.

1 777

С праздником друзья, с днём Великой Победы!

1 777

Repost from Стас Ильин | Flutter

📱 Ошибался, каюсь! ИИ сломал мой стартап. Больше я ему НЕ ДОВЕРЯЮ! 🆕 👉 https://youtu.be/TeUgxCg5mI0