ar
Feedback
Agentic Engineer

Agentic Engineer

الذهاب إلى القناة على Telegram

Data Engineering Technologies. SQL, Python, Kafka, Spark, Pandas, Airflow, Clickhouse, Greenplum, Postgres, dbt, LLM agentic systems, AI, robots, drones etc. Boost channel - https://t.me/boost/data_engi

إظهار المزيد
607
المشتركون
لا توجد بيانات24 ساعات
+17 أيام
لا توجد بيانات30 أيام
أرشيف المشاركات
Сделал AlbumentationsX MCP. Это MCP-сервер, который помогает тебе не страдать с CV-аугментациями вручную: подобрать pipeline, проверить, отрендерить previews, сравнить варианты, дать feedback и экспортировать финальный конфиг. Старт: uvx --from albumentationsx-mcp albumentationsx-mcp @data_engi #dev #albumentations #augmentations #mcp #bounding_boxes #object_detection #computer_vision #data_augmentation #bbox #coco #yolo #python #deep_learning

И видео по теме циклов в агентах. #dev #ai #agentic #loops #agents #engineering

Промпт-инжиниринг постепенно уступает место loop engineering. Идея простая: вместо того чтобы каждый раз вручную писать агенту новый промпт, мы проектируем повторяемый цикл работы. Например: агент сам формулирует следующий шаг, пишет код, отдаёт результат другому агенту на ревью — и продолжает, пока задача не закрыта. По сути, роль человека смещается: меньше "напиши мне X", больше "вот процесс, вот критерии, вот когда остановиться". Главный нюанс — стоимость. Чем больше агентов, сабагентов и проверок, тем быстрее горят токены. Поэтому loop engineering — это не магия, а нормальная инженерия: автоматизация там, где повторяемость и качество стоят дороже API-вызовов. Похоже, следующий скилл в AI-разработке — не писать идеальные промпты, а проектировать устойчивые циклы. #dev #ai #agentic #loops #agents #engineering

Repost from N/a

Альберт Эйнштейн однажды сказал: «Знаешь, Анри, я начинал с математики, но в итоге ушёл в физику». Анри Пуанкаре спросил: «По
Альберт Эйнштейн однажды сказал:
«Знаешь, Анри, я начинал с математики, но в итоге ушёл в физику».
Анри Пуанкаре спросил:
«Почему?»
Эйнштейн ответил:
«Потому что я мог отличать истинные утверждения от ложных, но не мог понять, какие из них действительно важны».
Пуанкаре улыбнулся и сказал:
«Забавно, Альберт. А я начинал с физики, но в итоге выбрал математику».
Эйнштейн заинтересовался:
«И почему ты сделал такой выбор?»
Пуанкаре ответил:
«Потому что я не мог понять, какие из важных фактов на самом деле истинны».
Этот обмен остроумно показывает разницу во взглядах двух великих умов: физика ищет важное в реальности, математик — истину внутри важного.

🍺 В этот день 150 лет назад родился Уильям Сили Госсет. Всю карьеру он проработал пивоваром в Guinness и занимался задачей,
🍺 В этот день 150 лет назад родился Уильям Сили Госсет. Всю карьеру он проработал пивоваром в Guinness и занимался задачей, которую учебники почти не трогали: как делать выводы по крошечным выборкам — например, по четырём участкам ячменя или небольшой партии хмеля. Статистика того времени в основном исходила из больших выборок, поэтому Госсет фактически изобрёл статистику для малых. Guinness запрещала сотрудникам публиковаться после того, как один из них слил коммерческие секреты. Компания также не хотела, чтобы конкуренты знали: пиво там варят с помощью науки. Поэтому, когда Госсет в 1908 году опубликовал свой метод, он подписался псевдонимом: Student. Каждое клиническое испытание, лабораторный эксперимент и A/B-тест, где сегодня используют t-test, опирается на работу Student. Одна из самых известных фамилий в статистике - ненастоящая.

Repost from Dealer.AI
Счетчик апокалипсиса окупаемости ИИ... 🔥 А вы уже или ещё нет? 👍 #meme
Счетчик апокалипсиса окупаемости ИИ... 🔥 А вы уже или ещё нет? 👍 #meme

Тем временем Антропик и СпейсЭкс уверенно продает свои лимонные плантации в народ Компанию Маска говорят, даже по-братски уже включили в индексы. Это загоняет триллионы индексных фондов от нефтяных шейхов и американских пенсионеров в компанию по безумной оценке. Это как если бы я продал канал Архитектора Данных за 2 миллиарда рублей и обязал всех купить его часть.

@data_engi #dev #memes #ai #fable
@data_engi #dev #memes #ai #fable

#dev #memes #ai #agents

#openai #codex #timetofly

После начисления призовых OpenAI решили сразу же объявить следующую сореву, и теперь это gamedev, призовые интереснее, участв
После начисления призовых OpenAI решили сразу же объявить следующую сореву, и теперь это gamedev, призовые интереснее, участвуешь? @data_engi #openai #codex #challenge #gamedev #ai #devchallenge #llm #agentic #buildit #prizes #playit

#dev #memes #ai #agentic #prompt #skill @data_engi
#dev #memes #ai #agentic #prompt #skill @data_engi

Начислили долгожданную награду 🪙 #openai #challenge #dev #agentic #ai
Начислили долгожданную награду 🪙 #openai #challenge #dev #agentic #ai

Repost from Сиолошная
Ребята из Nebius обновили SWE-rebench после двухмесячного перерыва, добавив 110 новых задач. В отличии от многих других бенче
+1
Ребята из Nebius обновили SWE-rebench после двухмесячного перерыва, добавив 110 новых задач. В отличии от многих других бенчей, наконец-то добавляют запуски в Codex и Claude Code. Просто писать «GPT-5.5 в очередной раз статистически значимо лучше моделей Anthropic» не хотелось, но Ибрагим, первый автор статьи, добавил немного аналитики по эффективности. — GPT-5.5 medium выглядит заметно эффективнее, чем Opus 4.8 high (обе настройки — значения по умолчанию) — Opus 4.6 -> 4.8 стал более оптимизирован: больше решенных задач, на 45% меньше токенов на задачу и примерно на 39% ниже стоимость решения задачи. — Opus 4.8 high практически не превосходит Opus 4.7 high по качеству, но значительно дешевле в плане вычислительных ресурсов. Количество токенов на задачу снизилось с 1.5 млн до 1 млн, а среднее количество шагов уменьшилось с 44 до 34.  — Полезной метрикой является pass^5. Здесь мы засчитываем задачу только в том случае, если она была решена во всех 5 независимых запусках. GPT-5.5 vs GPT-5.4 – 51 vs 39 задач, модель гораздо меньше полагается на «везение», что один раз получилось решить, другой нет. Для Opus это число практически одинаково во всех версиях модели. — опенсурс очень сильно отстаёт — Composer 2.5 от Cursor на этом наборе задач выглядит очень перспективно за счёт цены (см. колонку) — в 4 раза дешевле GPT-5.5 medium — ещё отмечу, что Claude получает гораздо больший прирост качества из-за использования родного скаффолда, в то время как GPT показывает +- тот же результат (хотя цена отличается в два раза, интересно почему). В целом думаю честно сказать, что модели OpenAI с появлением 5.5 перешли в новую эпоху. Если давно в программировании они отставали от Anthropic, и потом +- сравнялись, то теперь они часто обходят конкурентов (особенно если закрыть глаза на фронтенд).

Make Django Great Again! 🎉🎉🎉 Никита Соболев выпустил очередную клёвую штуку да, я слоупок и только сейчас прочитал статью. Это библиотека к обычному Django, но реализующая REST нормальным образом. С документацией, openapi схемами и интеграцией с LLM. И если вы хотели помочь open source, то это отличный проект для старта. Я люблю Django за его набор библиотек, которые просто подключил и всё завелось. Действительно богатая экосистема... Но вот DRF — это тяжёлое странное нечто, с которым не просто работать. Рад, что появилась достойная альтернатива. В том числе и для FastAPI/Litestar/etc... https://habr.com/ru/articles/1017036/

🖼️ Выкатили релиз Apache Airflow 3.2.2. Ключевой фикс: устранение race/deadlock в triggerer, из-за которого deferrable tasks зависали. Релиз делает ветку 3.2.x безопаснее. 1️⃣ Фикс triggerer race/deadlock + watchdog: Triggerer мог показывать heartbeat, но не обрабатывать triggers, что вело к таймаутам. Исправлено через multiplexing ответов и watchdog [triggerer] runner_health_check_threshold для обнаружения зависших процессов. Критично для инсталляций с deferrable operators и sensors. 2️⃣ Безопасность: SMTP STARTTLS теперь валидирует сертификат через системный CA bundle. Ужесточено [core] allowed_deserialization_classes_regexp: full-string match вместо prefix match. 3️⃣ Масштабируемость UI/API: Поиск перешел с ILIKE '%term%' на индекс-дружелюбный prefix search LIKE 'term%' (параметры *_prefix_pattern). Стараый substring-поиск доступен как опция. 4️⃣ Стабильность: Меньше дублей и stuck tasks. Предварительное назначение external_executor_id, восстановление stuck task instances, фикс stale executor success. 5️⃣ RBAC hardening: Default-deny в API/UI, отказ от fallback при отказе authorization, фикс bypass RBAC, запрет log symlink traversal. Важно для multi-tenant. 6️⃣ Ключевые фичи ветки 3.2.x: Asset Partitioning (триггеринг по партициям) и Multi-Team Deployments (изоляция ресурсов, experimental). ✏️ Вывод: Обновление 3.2.2 нужно для стабилизации 3.2.x перед продакшеном. Для 3.2.0/3.2.1 апдейт желателен. Для миграции с 3.1/2.x — 3.2.2 безопаснее 3.2.0. @data_engi #airflow #de #release #sql

@data_engi #dev #memes #ai #agents #agentic #llm
@data_engi #dev #memes #ai #agents #agentic #llm

В Google переосмыслили Colab как AI-first среду для работы с ноутбуками. Теперь Colab AI на базе Gemini 2.5 Flash работает не просто как чат, а как агент внутри ноутбука: понимает контекст кода, предлагает правки в diff, помогает чинить ошибки, трансформирует ячейки и может запускать data science workflow — от анализа файлов до выполнения кода и итоговых выводов. По сути, Colab постепенно превращается из "Jupyter в облаке" в полноценного AI-партнёра для анализа данных и разработки. Уже раскатили для первых пользователей, дальше доступ будут расширять еженедельно. Интересно посмотреть, насколько это изменит привычный workflow в ноутбуках — особенно для быстрых экспериментов, анализа данных и прототипирования ML. @data_engi #data #agentic #ai #google #colab #llm #jupyternotebook

Продолжаю развивать Agent Anvil после победы в OpenAI Discord Dev Challenge 🥇 Проект постепенно растёт из локального CLI для eval’ов в небольшой набор инструментов для проверки AI-агентов. Сделал отдельный публичный leaderboard: https://github.com/agent-axiom/agent-anvil-leaderboard Идея проста: ты прогоняешь Agent Anvil у себя локально или в CI, экспортируешь результат, отправляешь PR и попадаешь в общий leaderboard. При этом raw traces и чувствительные данные остаются у тебя, наружу уходят только компактные метрики и проверяемые хэши. Основной репозиторий тоже продолжает развиваться: https://github.com/agent-axiom/agent-anvil Там уже есть trace-aware evals, policy checks, repair plans, GitHub Actions integration, MCP tool-safety audit, benchmark artifacts и экспорт для leaderboard. Цель всё та же: помогать разработчикам ловить проблемы, которые обычные eval’ы по финальному ответу часто пропускают, например: 🔘неправильный tool 🔘опасный порядок вызовов 🔘кривые аргументы 🔘отсутствие уточняющего вопроса 🔘нарушение policy Если тебе интересна тема eval’ов для AI-агентов — буду рад фидбеку, идеям, сабмитам в leaderboard и звезде на GitHub 🙂 #dev #ai #agentic #agentanvil