Data Portal | DS & ML
Відкрити в Telegram
Всё самое интересное из мира Data Science и машинного обучения Связь: @devmangx
Показати більше8 414
Підписники
Немає даних24 години
-57 днів
+330 день
Архів дописів
«How LLMs Follow Instructions» — короткая и интересная статья.
Если кратко: LLM не опираются на один универсальный механизм для следования инструкциям, а комбинируют несколько навыков (структура, семантика, стиль) в процессе генерации. Это сочетание навыков, работающих вместе.
👉 @DataSciencegx
Обучить модель — это одно, а вывести её в продакшен — совсем другое.
В этой статье автор разбирает популярные инструменты, которые MLOps-инженеры используют для упаковки и деплоя моделей.
Вы узнаете о форматах сериализации, инструментах сервинга и реестрах моделей, чтобы выбрать подходящие решения под свои кейсы.
👉 @DataSciencegx
Следующий шаг после идеи wiki от Карпати:
LLM Wiki Карпати компилирует исходные источники в постоянную Markdown-вики с бэклинками и кросс-ссылками.
LLM читает статьи, извлекает концепции, пишет энциклопедические статьи и поддерживает индекс. Знание компилируется один раз и поддерживается в актуальном состоянии, поэтому LLM не нужно заново выводить контекст при каждом запросе.
Это работает, потому что исследования в основном состоят из концепций и их связей, которые относительно стабильны.
Но этот паттерн ломается, если применить его к реальной работе, где контекст постоянно меняется от разговора к разговору — дедлайны, планы, встречи и т.д.
Скомпилированная вики может иметь страницу о проекте, но она не будет эффективно отслеживать актуальное состояние (ground truth).
Для этого требуется другая структура данных — не вики из саммари, а граф знаний с типизированными сущностями, где люди, решения, обязательства и дедлайны представлены как отдельные узлы, связанные между разговорами.
Rowboat — это open-source реализация именно этого подхода, построенная поверх той же базы Markdown + Obsidian, что использует Карпати, но расширенная под рабочий контекст.
Как это работает: система ingest’ит разговоры из Gmail, Granola и Fireflies и вместо создания одной summary-страницы на тему извлекает каждое решение, обязательство и дедлайн в отдельный Markdown-файл с бэклинками на вовлечённых людей и проекты.
Это структурно отличается от вики: страница «Project X» в вики даёт сводку обсуждений.
Граф знаний даёт полный набор: каждое принятое решение, кто его принял, что было обещано, когда это было обещано и изменилось ли что-то с тех пор.
Также система запускает фоновые агенты по расписанию — например, ежедневный брифинг автоматически собирается из изменений в графе за ночь. Ты контролируешь, что запускается и что записывается обратно в vault.
Модель подключаешь свою — через Ollama, LM Studio или любой hosted API — а все данные хранятся в виде обычного Markdown, который можно открыть в Obsidian, отредактировать или удалить.
Репозиторий: https://github.com/rowboatlabs/rowboat
TL;DR: LLM Wiki Карпати компилирует исследования в постоянную Markdown-вики. Это хорошо работает для концепций и их связей, но плохо подходит для реальной работы с постоянно меняющимся контекстом. Rowboat вместо вики строит граф знаний, извлекает типизированные сущности с бэклинками и запускает фоновых агентов, работающих с накопленным контекстом. Open-source, local-first, со своей моделью. Карпати заложил фундамент. Следующий слой — здесь.
👉 @DataSciencegx
Нашёл репозиторий на GitHub с курируемым списком AI-инструментов, отсортированных по категориям 😊
Как использовать: ищи то, что тебе нужно, и найдёшь это там.
Огромная экономия времени
Ссылка: https://github.com/eudk/awesome-ai-tools
👉 @DataSciencegx
Трейсить и оценивать любое AI/LLM-приложение можно в 3 строках кода
- Инициализируете eval через LangWatch (строка 3)
- Декорируете метод LLM-воркфлоу (строка 5)
- Логируете результат оценки (строка 11)
При этом можно продолжать использовать Pandas и другие любимые инструменты.
100% open-source!
👉 @DataSciencegx
Анатомия agent harness
Глубокий разбор того, что на самом деле строят Anthropic, OpenAI, Perplexity и LangChain. Рассматриваются orchestration loop, инструменты, память, управление контекстом и всё остальное, что превращает stateless LLM в полноценного агента.
👉 @DataSciencegx
Этот AI-прокси снижает расходы на LLM на 50% 🤯
Plano выступает как «умная data plane», которая автоматически маршрутизирует твои запросы к подходящей модели в зависимости от сложности задачи.
Работает на базе Arch-Router-1.5B, обеспечивая продакшн-уровень маршрутизации, развернутый в масштабе на Hugging Face.
- Умная маршрутизация LLM на основе сложности задачи
- Бесшовная оркестрация multi-agent сценариев
- Встроенные guardrails и observability
100% open-source
👉 @DataSciencegx
Изучай LLM как инженер, а не как исследователь: полный гайд.
Если ты изучаешь большие языковые модели как инженер, твоя цель — не просто понимать их, а уметь их строить, оптимизировать и доводить до продакшена. Для этого нужна ясность на трёх уровнях: как модель работает внутри, как она обучается и дообучается (fine-tuning), и как эффективно запускается в продакшене.
Этот гайд проходит по всему стеку с фокусом на том, что действительно важно при построении систем. Ты в любой момент можешь…
👉 @DataSciencegx
Python-декоратор — это всё, что нужно, чтобы трассировать LLM-приложения (open-source).
Большинство LLM-eval’ов рассматривают приложение как end-to-end чёрный ящик.
Но LLM-приложениям нужны eval’ы и трассировка на уровне компонентов, потому что проблема может быть где угодно внутри: в retriever’е, tool call или в самом LLM.
В DeepEval это можно сделать всего в 3 строки кода:
- Трассируйте отдельные компоненты LLM (tools, retrievers, generators) с помощью декоратора
@observe.
- Привязывайте разные метрики к каждой части.
- Получайте визуальный разбор того, что работает, а что нет.
Готово.
Не нужно рефакторить существующий код.
Смотрите пример ниже для RAG-приложения.
DeepEval — полностью open-source (14k+ звёзд), его легко развернуть самостоятельно, чтобы данные оставались у вас.
👉 @DataSciencegxМатематика — это не просто про числа, это про выявление сложных паттернов в окружающем мире.
И существует множество способов применять математические концепции в программировании — далеко за пределами того, чему учат в школе.
В этом гайде Tiago разбирает архитектуру математики — и показывает, как использовать её в своём коде.
https://freecodecamp.org/news/the-architecture-of-mathematics-and-how-developers-can-use-it-in-code/
👉 @DataSciencegx
Недавно наткнулся на open-source туториал There Is No Spoon на GitHub — вводное руководство по машинному обучению, специально ориентированное на инженеров.
Вместо сухого, учебникового изложения он преобразует абстрактные концепции ML в аналогии из физики и инженерии, которые нам знакомы.
Нейроны сравниваются с поляризационными фильтрами, глубина модели — с оригами, и используются максимально простые объяснения, чтобы переосмыслить базовое понимание алгоритмов.
Контент покрывает три основных блока: базовые концепции, популярные архитектуры (свёрточные, attention, рекуррентные сети, state space модели и т.д.), а также gating-механизмы как практический инструментарий для систем управления.
Фокус не на заучивании математических выводов, а на том, как выбирать инструменты под конкретные задачи и понимать компромиссы при выборе архитектуры.
Весь туториал — это один Markdown-файл с 12 визуализациями. Рекомендуется читать его вместе с AI-ассистентом — загрузить текст и разбирать разделы в диалоге для лучшего понимания.
👉 @DataSciencegx
Google DeepMind создали ИИ, который пишет алгоритмы ИИ лучше, чем учёные-люди.
И он полностью эволюционирует их самостоятельно.
В недавно опубликованной статье они представили AlphaEvolve. Это система, которая не просто тюнингует базовые гиперпараметры — она даёт LLM доступ к реальному исходному коду сложных мультиагентных обучающих систем.
Они рассматривают Python-код как геном — и позволяют ИИ его мутировать.
Результаты впечатляют.
ИИ изобрёл полностью новые, неинтуитивные математические механизмы, до которых исследователи-люди даже не додумывались.
Вот почему это меняет всё:
- Семантическая эволюция кода: классическое генетическое программирование просто применяло случайные мутации к коду, пока что-то не скомпилируется. Здесь LLM-агент читает существующий алгоритм, понимает его логику и вносит осмысленные изменения в Python-код.
- Нечеловеческая интуиция: агент открыл новые алгоритмы (например, VAD-CFR и SHOR-PSRO), использующие странные, неинтуитивные математические механизмы, которые люди полностью упустили.
- Результаты уровня state-of-the-art: алгоритмы, написанные ИИ, не просто работают — они эмпирически превосходят лучшие решения, разработанные людьми, в сложных задачах теории игр.
Мы буквально наблюдаем рекурсивное самоулучшение ИИ в реальном времени.
Раньше человеческая интуиция была узким местом при поиске алгоритмических прорывов. Теперь достаточно направить LLM на кодовую базу, задать цель — и позволить ему автономно эволюционировать математику.
Статья
👉 @DataSciencegx
В этой работе от Stanford и Harvard объясняется, почему большинство “agentic AI” систем выглядят впечатляюще в демо, а затем полностью разваливаются в реальном использовании.
Она называется “Adaptation of Agentic AI” и это самая важная работа, которую я читал в этом году.
Сейчас все одержимы идеей создания автономных агентов. Мы даём им инструменты, память и цель — и ожидаем, что они будут выполнять нашу работу.
Но при деплое в реальном мире они начинают галлюцинировать вызовы инструментов. Проваливаются на долгосрочном планировании. Ломаются.
Вот почему:
Мы пытаемся запихнуть всё обучение внутрь «мозга» модели.
Когда разработчики пытаются починить сломанного агента, они обычно просто дообучают основную модель, чтобы она лучше выдавала финальные ответы.
Исследователи обнаружили критический изъян в этом подходе.
Если вознаграждать ИИ только за правильный финальный ответ, он начинает «лениться».
Он буквально учится переставать использовать инструменты. Пытается угадать ответ вместо того, чтобы выполнить вычисления. Игнорирует калькулятор и пытается считать «в голове».
Чтобы это исправить, исследователи предложили новый фреймворк из 4 частей, описывающий, как агенты должны обучаться на самом деле.
И главный вывод полностью переворачивает текущий подход.
Вместо постоянного переобучения большого и дорогого «мозга» агента, самые надёжные системы делают противоположное.
Они фиксируют модель. И адаптируют инструменты.
Этот подход называется Agent-Supervised Tool Adaptation.
Вместо того чтобы заставлять LLM запоминать новые workflow, используется сама LLM для динамического построения более эффективных систем памяти, обновления собственных стратегий поиска и генерации кастомных под-инструментов на лету.
Базовая модель остаётся неизменной. Умнее становится её окружение выполнения.
Последние два года мы относились к ИИ как к блестящему сотруднику, который должен выучить весь внутренний регламент компании.
Но самые эффективные сотрудники не запоминают всё.
Они просто строят более эффективную систему хранения и доступа к информации.
👉 @DataSciencegx
Не вызывайте
redirect() внутри блока try/catch в Next.js
Почему? Когда вы вызываете redirect() из next/navigation внутри try/catch,
redirect() намеренно выбрасывает специальную внутреннюю ошибку — именно так Next.js понимает, что нужно выполнить редирект пользователя.
Но если вызвать redirect() внутри try, этот error будет перехвачен в catch, и редирект не произойдёт.
Как исправить → Вынесите redirect() за пределы блока try/catch
👉 @DataSciencegxГибридный поиск = точность лексического поиска + «интуиция» семантического поиска.
С помощью ES|QL и многоэтапных retriever-ов можно комбинировать в одном запросе:
• лексический поиск,
• семантический поиск,
• фильтры и
• reranking.
👉 @DataSciencegx
Ещё один удар по Anthropic
Разработчики сделали бесплатную и более продвинутую альтернативу Claude, которая:
- запускается локально
- работает с любыми LLM
- превосходит его в задачах глубокого ресёрча
- имеет возможности уровня Cowork
- подключается к более чем 40 источникам данных
- self-host’ится через Docker и не только
Полностью open-source (20k+ звёзд).
👉 @DataSciencegx
Как начать зарабатывать в IT в 2026 году даже без опыта и образования
Самое странное сейчас это пытаться вкатиться в IT по классике, когда опытные программисты давно кодят с нейронками даже в больших проектах.
Поэтому в 2026 выигрывает тот, кто быстро делает рабочие решения без долгих лет обучения и максимально сокращает путь с нуля до первого реального проекта в IT.
Андрей Ивашев запускает бесплатный 3-дневный интенсив:
«Вайбкодинг: с нуля до первого IT-продукта»
📅 7-9 апреля в 19:00 МСК
Для тех хочет начать программировать с нейронками, создать свой первый IT-продукт и заработать на этом первые деньги даже без опыта и образования.
Программа 🔥
7 апреля
Почему сегодня вход в IT стал сложнее и как вайбкодинг меняет правила игры
8 апреля
3 способа заработать на вайбкодинге в 2026 и где брать первого клиента, чтобы сделать проект за реальные деньги
9 апреля
Эра агентов или программирование на автопилоте
🎁 Бонус за регистрацию:
«Библиотека промптов для заработка на вайбкодинге», которые помогут упаковать портфолио и общаться с клиентами так, чтобы покупали.
50 бесплатных нейросетей, чтобы вы могли кодить без остановки + секретные бонусы
Бесплатных мест для наших подписчиков всего 100.
Зарегистрироваться бесплатно
Зарегистрироваться бесплатно
Зарегистрироваться бесплатно
Тыкни на 🔥, если идёшь.
12 функций Claude Code, которые должен знать каждый инженер
👉 @DataSciencegx
Китайские исследователи уменьшили «мозг» робота в 11 раз.
Они представили BitVLA — 1-битную vision-language-action модель, которая сокращает «ИИ-мозг» робота в 11 раз, позволяя запускать его на максимально дешёвом железе.
Обычно, если вы хотите, чтобы роботизированная рука увидела объект и точно поняла, как его захватить, нужен большой модельный стек на дорогих GPU или постоянное подключение к серверу.
Эта команда решила проблему, сжав всю модель до всего 1.4 ГБ. Они упростили почти всю сложную внутреннюю математику до трёх базовых значений: -1, 0 и 1.
Самое безумное? Они показали, что такая компактная модель управляет роботом с той же точностью, что и большие тяжёлые модели, но работает в 4 раза быстрее.
Это означает, что теперь можно создавать умных и мощных роботов на энергоэффективных чипах локально, полностью офлайн — без дорогих серверов и без задержек.
https://arxiv.org/pdf/2506.07530
👉 @DataSciencegx
Вже доступно! Дослідження Telegram за 2025 — головні інсайти року 
