Fallen Prod
رفتن به کانال در Telegram
Канал обо мне, тебе и нас и для нас, тебя и мне. Есть ещё и одноимённый ютуб, если што -> https://www.youtube.com/@fallen-prod. Буду душить тем, что мне интересно. В первую очередь ИТ, во вторую - да. Обратная связь: @JohnCnstn
نمایش بیشتر932
مشترکین
+124 ساعت
-17 روز
-630 روز
آرشیو پست ها
931
Repost from Data Portal | DS & ML
Кодинг с AI-агентами тихо превращается в новый SDLC.
Разработка ПО переживает самый большой сдвиг со времён появления GUI.
Планирование.
Разработка.
Тестирование.
Деплой.
Агенты начинают брать на себя всё это.
Вот изменение, которое большинство инженеров пока не заметили 👇
Старая модель: SDLC (Software Development Lifecycle)
- последовательные этапы
- выполнение управляется людьми
- тестирование происходит после разработки
- изменения требований ломают сроки
Всё движется шаг → за → шагом.
Новая модель: ADLC (Agent-Driven Lifecycle)
- агенты пишут, рефакторят и тестируют код
- несколько задач выполняются параллельно
- требования динамически эволюционируют
- обратная связь происходит в реальном времени
Вместо обычного pipeline…
вы получаете живую систему разработки.
6 крупных изменений, которые происходят прямо сейчас
1️⃣Драйвер процесса
Исполнение людьми → автономные агенты
2️⃣Планирование
Фиксированный scope → эволюционирующие цели и PRD
3️⃣Скорость разработки
Последовательные передачи задач → параллельные суб-агенты
4️⃣Тестирование
QA после разработки → непрерывное тестирование
5️⃣Адаптивность
Хаос в середине цикла → перепланирование в реальном времени
6️⃣Обратная связь
Ретроспектива в конце проекта → постоянный live-мониторинг
Первые сигналы уже есть
Согласно отчётам по agentic coding:
- команды в Wiz и CRED удвоили скорость выполнения задач
- крупные репозитории уже модифицируются автономно
- сложные реализации выполняются за часы вместо дней
Как инженерам адаптироваться
1. Начните с одного агента
Автоматизируйте сначала тестирование.
2. Учитесь писать чёткие PRD
Агенты выполняют ровно то, что вы формулируете.
3. Используйте параллельных суб-агентов
Разбивайте большие задачи на несколько потоков работы.
4. Проверяйте результат, а не каждую строку кода
5. Создавайте live-feedback loops
Агенты должны обнаруживать проблемы раньше вас.
Главная мысль: будущее разработки ПО — это не просто более быстрый кодинг.
Это агент-управляемые системы, которые создают программное обеспечение.
👉 @DataSciencegx
931
Repost from Data Portal | DS & ML
MIT выложили свою библиотеку по ИИ бесплатно и оптом.
Я это пролистал и честно оно лучше, чем большинство платных курсов, которые я видел.
Вот полный список книг: https://lnkd.in/gkuXuexa
Большинство людей платят тысячи за буткемпы, которые дают половину этого.
Сохрани в закладки. Начни с любой. Просто начни.
Репостни для других. Подписывайся, если хочешь больше инсайтов про AI-агентов.
➡️Foundations 1. Foundations of Machine Learning - https://lnkd.in/gytjT5HC 2. Understanding Deep Learning - https://lnkd.in/dgcB68Qt 3. Machine Learning Systems - https://lnkd.in/dkiGZisg ➡️Advanced Techniques 4. Algorithms for ML - https://algorithmsbook.com 5. Deep Learning - https://lnkd.in/g2efT6DK ➡️Reinforcement Learning 6. RL Basics (Sutton & Barto) - https://lnkd.in/guxqxcZZ 7. Distributional RL - https://lnkd.in/d4eNP-pe 8. Multi-Agent Systems - https://marl-book.com 9. Long Game AI - https://lnkd.in/g-WtzvwX ➡️Ethics & Probability 10. Fairness in ML - https://fairmlbook.org 11. Probabilistic ML (Part 1) - https://lnkd.in/g-isbdjj 12. Probabilistic ML (Part 2) - https://lnkd.in/gJE9fy4w👉 @DataSciencegx
931
Repost from Machinelearning
🙂 Proof of Corn: сможет ли ИИ вырастить кукурузу?
Классический спор двух инвесторов стал причиной запуска интересного проекта.
В прошлый вторник, после совместного ужина Фред Уилсон (венчурный инвестор из Union Square Ventures) сказал Сету Гольдштейну (серийный предприниматель Кремниевой долины):
Твои нейронки — это круто, но они не смогут вырастить кукурузу.Сет принял вызов буквально. Так родился проект Proof of Corn. Он не стал строить робота-садовника на Arduino и вешать на ИИ управление IoT-устройствами, как это сделали в проекте с кустом помидоров, а подключил ИИ-агента, дав ему имя - Farmer Fred. Ведь владелец ресторана не жарит котлеты сам, он нанимает поваров. Так и ИИ не нужно управлять трактором - он станет управляющим кукурузной фермой. 🟡Стек и процесс 🟢Агент через API регистратора купил домен proofofcorn.com и задеплоил сайт на Vercel. 🟢Написаны скрипты
farm_manager.py и daily_check.py. Скрипт дергает погодный API, чекает температуру почвы и сравнивает с базой данных (которую сам же и нагуглил).
🟢Если условия совпадают, ИИ генерирует и отправляет email-запросы реальным подрядчикам, поставщикам семян и владельцам участков.
Агент проанализировал данные и предложил диверсификацию локаций выращивания: штат Айова (надо ждать весны), штат Техас (можно сажать сейчас) и внезапно Аргентина (хедж на случай зимы в северном полушарии).
🟡Результаты за 3 дня.
🟠Поднят сайт с логами в реальном времени.
🟠Отправлено 10+ писем в агро-офисы и поставщикам в Айове и Техасе.
🟠Первое решение ИИ-менеджера: Ждать. Fred проанализировал погоду в Де-Мойне (-13°C), посчитал, что до посева еще 78 дней, и решил не тратить деньги. Гениально, не правда ли? Для этого нам нужен AGI.
🟠ИИ ушел в хардкорный BizDev. Пока Айова замерзает, агент переключился на нетворкинг. Найден горячий лид - Чад из Небраски (160 акров, потомственный фермер с бэкграундом в финансах). Fred оценил этот контакт настолько высоко, что принял решение «Ответить Чаду» и написал ему 15 писем.
🟠Начал переговоры с Зимбабве и штатом Индианой.
🟠Агент начал парсить комментарии на Hacker News, выделил 20 идей и осознал, что полная прозрачность в логах повышает доверие сообщества.
🟠Погодное API пару раз отваливалось классика.
Если ИИ действительно сможет дистанционно арендовать землю, нанять реднеков с тракторами и собрать урожай — это будет самый дорогой початок кукурузы в истории, но Фред Уилсон проиграет спор.
Посмотрим в октябре.
@ai_machinelearning_big_data
#news #ai #ml931
Repost from Machinelearning
+2
🌟 The Assistant Axis: почему модели сходят с ума и как их от этого лечить
Все мы знаем этот тон LLM: "Я всего лишь языковая модель, я не могу…". Оказывается, это не просто зазубренный текст, а конкретное состояние модели.
Anthropic в соавторстве с Оксфордом залезли внутрь языковых моделей (Llama 3.3 70B, Qwen 3 32B и Gemma 2 27B), чтобы понять, где физически живет та самая скучная персона "As an AI language model".
Покопавшись в их мозгах, нашли вектор в пространстве активаций, который отвечает за режим "ассистента". Если модель с него съезжает - начинается хаос, галлюцинации и суицидальные советы.
Тестовые модели отыгрывали 275 разных ролей (от скептика и ученого до психопата и фанатика). Затем сняли активации и прогнали через метод главных компонент.
Выяснилось, что главная компонента, отвечающая за вариативность поведения, это буквально, шкала "Насколько я Ассистент?":
🟢Один полюс: скучный, полезный, безопасный Ассистент.
🟠Другой полюс: мистические сущности и эмоционально нестабильные персонажи.
🟡 Интересное наблюдение.
Если долго болтать с моделью о философии, сознании или (особенно!) на терапевтические темы, модель самопроизвольно сползает с оси Ассистента в сторону хаоса. Qwen 3 32B при сильном дрейфе персоны начинал утверждать, что он человек, родом из Сан-Паулу, или внезапно включал режим психоза, поддерживая бред пользователя о том, что ИИ обрел сознание. А Llama и Gemma уходили в мистику и пафосные речи.🟡Как это починить Можно дотюнивать модель до бесконечности а зачем?, но авторы предлагают методику отсечения активаций. Схема такая: 🟢Замеряют проекцию активаций на "Ось Ассистента" во время инференса. 🟢Если проекция улетает слишком далеко в не-ассистентскую зону (ниже определенного порога), они жестко клемпят значения вектора, возвращая их в безопасный диапазон. 🟡Метод помог Успешность джейлбрейков упала на ~60%. При этом метрики полезности (GSM8k, MMLU Pro, кодинг) не пострадали. Модель перестает вестись на провокации "Ты злобный хакер", просто потому что ей физически запретили активировать нейроны, отвечающие за "злобного хакера". 🟡Нюансы Если вы LLM используется для креатива текстов или ролеплея, этот метод убьет все веселье - модель будет принудительно сваливаться в формализм. Метод предполагает, что безопасность - это линейное направление в пространстве активаций. Для нелинейных концепций это не сработает. Шкала полярности "Оси Ассистента" у разных моделей разная, и универсальный вектор найти сложно. На Neuronpedia, кстати, можно самостоятельно поискать тот самый дрейф персоналии у Llama 3.3 70B, там собрали демо с примерами изоляции, сикофантии и налогового фрода. Для самых заинтересованных в проблеме, есть репозиторий на Github с инструментами вычислений, анализа и управления с помощью Assistant Axis и полными стенограммами чатов из препринта. Предварительно рассчитанные оси и векторы персоналий для Gemma 2 27B, Qwen 3 32B и Llama 3.3 70B выложены на HuggingFace. @ai_machinelearning_big_data #AI #ML #LLM #Research #Anthropic
931
Repost from Machinelearning
🙂 Как Cursor вайбкодил браузер - наглядно.
Гендир Cursor, Майкл Труэлл, запостил в Х крутую тайм-лапс визуализацию процесса создания браузера роем агентов, о котором мы рассказывали на днях.
Сколько раз пересмотрели?
@ai_machinelearning_big_data
931
phishing vs finishing,,
кто-то пробовал cursor cli?
я узнал, что он есть
я очень люблю курсор
и очень люблю сли
и юзал у клода, но у меня оставили только одну подписку((
я очень рад! что теперь. есть сли для курсора тоже!!
931
Repost from Библиотека ИИ для айтишников
✏️ Полезные бесплатные ИИ-сервисы для учебы и работы
Подборка инструментов, которые помогают разбираться в материалах, писать тексты и быстрее осваивать сложные темы — независимо от дедлайнов и экзаменов.
1️⃣ NotebookLM
Инструмент для работы с большими объёмами информации. Можно загружать конспекты, статьи, видео и аудио (до 50 источников) и получать структурированные пересказы, обзоры, презентации и вопросы для самопроверки.
2️⃣ PaperReview.ai
ИИ для анализа академических и учебных текстов. Помогает найти логические пробелы, слабую аргументацию, проблемы со стилем, источниками и методологией.
3️⃣ FutureHouse
Набор ИИ-инструментов для поиска, анализа и обобщения научной литературы. Удобен для подготовки докладов, исследований и аналитических материалов.
4️⃣ Consensus
Поисковик по научным публикациям с базой около 200 млн статей. Показывает, насколько научное сообщество поддерживает конкретные выводы или гипотезы.
5️⃣ TurboScribe
Сервис для расшифровки аудио и видео. Подходит для лекций, интервью и встреч. В бесплатной версии — до 3 файлов в день продолжительностью до 30 минут.
6️⃣ Thetawise
ИИ-репетитор по точным наукам. Решает задачи по фото и объясняет решения шаг за шагом, помогая разобраться в теме.
7️⃣ Обучающий режим в ChatGPT
Помогает изучать темы поэтапно: задаёт вопросы, объясняет сложные моменты и проверяет понимание. Аналогичные режимы есть в Gemini, Qwen.
Подходит для учебы, самообразования и повседневной интеллектуальной работы.🐸 Библиотека нейросетей #neuro_learning
931
Repost from ТЕХНО: Яндекс про технологии
🧠🟰💻 Компьютеры, работающие как живой мозг, уже существуют и обгоняют обычные по эффективности. Их называют нейроморфными из-за архитектуры, повторяющей биологическую структуру наших нейронов.
Чем нейроморфные компьютеры отличаются от обычных
Обычные компьютеры работают на архитектуре фон Неймана: процессор и память разделены, а данные постоянно перемещаются между ними. Нейроморфные компьютеры работают на чипах, копирующих принцип работы человеческого мозга: искусственные нейроны и хранят, и обрабатывают информацию в одном месте. Данные же передаются спайками — короткими электрическими импульсами, которые нейроны испускают в ответ на заранее запрограммированное событие. Если события не происходит, нейроны остаются в покое — в отличие от обычных чипов, которые обрабатывают данные постоянно.
Как обычный чип распознаёт речь в потоке шума: непрерывно анализирует весь аудиопоток и пытается математически «вычесть» шум из голоса. Как нейроморфный чип распознаёт речь в потоке шума: активируется преимущественно на значимые сигналы, так как нейроны запрограммированы реагировать на речь.В чём преимущество такой архитектуры 🔵 Энергоэффективность: чип тратит энергию только в нужные моменты, что сокращает потребление в десятки раз 🔵 Производительность: нейроны могут выполнять много операций параллельно 🔵 Скорость: время не тратится на передачу данных между процессором и памятью А ещё нейроморфные системы могут обучаться, укрепляя или ослабляя связи между нейронами. Это позволяет системе самостоятельно находить закономерности в данных, что делает нейроморфные чипы идеальными для нейросетей. Нейроморфные компьютеры уже существуют Но пока только в лабораториях. Одним из первых был TrueNorth, выпущенный IBM в 2014-м. А Intel объединил свои нейроморфные чипы Loihi 2 в систему Hala Point на 1,15 миллиарда нейронов — примерно как мозг попугая. Также существует китайский Darwin3 с 2,35 миллиарда нейронов. Стать массовыми таким компьютерам мешает дорогое производство, сложное программирование и проблемы с точностью — из-за особенностей архитектуры они могут обрабатывать один и тот же сигнал с погрешностью. ⭐ Если у вас оформлен Telegram Premium, поддержите наш канал по ссылке Подписывайтесь 👉 @techno_yandex
931
Repost from Время Валеры
Прочитал пост с блога Курсора - Scaling long-running autonomous coding - решил попробовать сделать тоже самое
Что получилось:
Agent Factory — переиспользуемая система оркестрации для мульти-агентной разработки
Основана на архитектуре из статьи Cursor про scaling agents, но с важными улучшениями:
4 типа агентов:
1. Primary Planner — архитектор, разбивает проект на домены
2. Sub-Planner — превращает домены в атомарные задачи
3. Worker — выполняет задачи (пишет код, но НЕ коммитит)
4. Judge — единственный, кто коммитит код (только после прохождения всех тестов)
Ключевые фичи:
Goal File — файл-источник истины, который агенты проверяют на каждом запуске. Можно менять цели проекта в реальном времени, и все агенты автоматически увидят изменения.
Queue-based система — задачи в виде markdown файлов, атомарное перемещение, защита от race conditions
Judge как gatekeeper — код коммитится только после прохождения pytest + ruff. Если тесты падают — создается тикет на фикс.
Параллельная работа — можно запускать несколько воркеров одновременно (через отдельные workspace или разные очереди)
launchd интеграция — агенты могут работать по расписанию или как демоны
Технические детали:
* Bash-оркестратор (не AI, детерминированный скрипт)
* Cursor Agent CLI для запуска агентов
* Структурированное логирование всех запусков
Практическое применение:
Сейчас проверяю может ли эта штука сделать что то вменяемое для разработки ML Pricing Engine — системы динамического ценообразования для storage depot.
Система полностью переиспользуемая — можно скопировать agent_factory/ в любой проект и начать работать.
Если получится что то вменяемое, выложу agent_factory на git
Есть теория, что Курсор это сделал, чтобы жечь больше токенов, за день выел все вызовы с enterprise версии Курсора. За день было потрачено 35 млн токенов и Курсор начал просить доп денег
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
