Про AI: Лучшие cтатьи и исследования
前往频道在 Telegram
Качественные AI переводы лучших англоязычных статей и исследований про AI. Нашли интересную статью для перевода? Пришлите нашему боту: @ai_longreads_bot
显示更多1 655
订阅者
+324 小时
+147 天
+8530 天
帖子存档
Что сегодня в тренде в AI-индустрии:
DeepSpec от DeepSeek
Полносвязная кодовая база для обучения и оценки алгоритмов спекулятивного декодирования.
Exploitarium
Архив публичных PoC-эксплойтов и отчетов об исследовании уязвимостей в программном обеспечении.
Qwythos-9B-Claude-Mythos-5-1M в формате GGUF
Обновленные веса модели в формате GGUF, включающие специфические варианты MTP.
Unlimited-OCR от Baidu
Модель для оптического распознавания символов (OCR) от Baidu с доступным демонстрационным режимом.
Qwen-AgentWorld
Языковые модели мира (Language World Models) для разработки и обучения универсальных агентов.
YOLOv8 на Hugging Face
Репозиторий популярной модели компьютерного зрения YOLOv8 с руководствами по быстрой установке и инференсу.
Video Production Skills
Библиотека навыков для ИИ-видеопроизводства, предназначенная для создания моушн-дизайна, заставок и контроля качества.
Krea 2
Официальный исходный код для запуска инференса модели Krea 2.
ComfyUI-Conditioning-Rebalance
Ноды для оптимизации кондиционирования в ComfyUI, позволяющие редактировать изображения по референсу и обходить встроенные фильтры безопасности Krea 2.
OpenFugu
Открытая реализация Sakana Fugu — оркестратора больших языковых моделей для управления другими нейросетями.
Как Cursor индексирует вашу кодовую базу?
Разбор того, как Cursor находит нужный файл в монорепозитории из 50 000 файлов меньше чем за секунду: деревья Меркла, триграммные индексы, чанкинг на основе AST, собственная модель эмбеддингов и векторная база данных Turbopuffer с триллионом векторов.
Читать статью
Три способа, которыми Codex может управлять компьютером
У Codex есть три способа работать с компьютером — Computer Use, расширение для Chrome и встроенный браузер. Разбираемся, чем они отличаются, когда использовать каждый и что добавить в AGENTS.md, чтобы Codex сам выбирал нужную поверхность.
Читать статью
Чем живёт AI-сообщество сегодня:
Репозиторий YOLOv8 от Ultralytics
Популярная библиотека для задач компьютерного зрения, включая детекцию объектов, сегментацию и классификацию.
Qwythos-9B: модель для рассуждений без цензуры
Полнопараметрическая модель от Empero на базе Qwen3, оптимизированная для логического вывода и лишенная встроенных ограничений.
Lemma Platform — среда для совместной работы с ИИ-агентами
Платформа с открытым исходным кодом, позволяющая объединять людей и автономных агентов в единые рабочие команды.
Генерация коммерческих карт городов через GPT и ГИС
Инструмент для создания детализированных городских карт и путеводителей на основе запросов на естественном языке.
Project Muteki: рой ИИ-агентов для решения задач CTF
Автономная мультимодальная система, предназначенная для автоматического прохождения соревнований по информационной безопасности.
Оптимизатор профиля LinkedIn
Инструмент для автоматического улучшения и настройки профессионального аккаунта в социальной сети.
Навыки ИИ-письма для подготовки грантовых заявок
Набор методик и шаблонов для написания заявок на научные гранты, сформированный на основе анализа успешных кейсов.
MemGUI-Agent: агент для управления мобильным интерфейсом
Официальный код модели для работы с GUI мобильных устройств, поддерживающей проактивное управление контекстом в длинных цепочках задач.
База навыков для разведки и пентеста
Коллекция из 144 техник наступательной безопасности, охватывающая облачные среды, аудит WordPress и цепочки компрометации.
Ocelot-1-VL: мультимодальный LoRA-адаптер от Brave
Специализированная модель, дообученная на базе Qwen3-VL-4B-Instruct для расширения возможностей визуального анализа.
Anthropic теряет Небесный мандат
Ещё четыре месяца назад Anthropic была всеобщей любимицей и воплощением «ответственного» лидера в ИИ. Но теперь компания всё чаще ведёт себя не как осмотрительный распорядитель передового ИИ, а как суверенная власть, диктующая правила, — и накопленная годами легитимность тает на глазах.
Читать статью
Что вообще такое Loop? Часть 2: 15 циклов, которые люди реально запускают (и команды, чтобы их украсть)
Продолжение разбора про агентные циклы: пятнадцать loop'ов, goal'ов и routine'ов, которые разработчики действительно гоняют прямо сейчас, каждый — с атрибуцией и готовой к вставке командой. Плюс два предупреждения, которые хайп обходит стороной: деньги и верификация.
Читать статью
AI-новости утра — что обсуждают на GitHub, Reddit и Hugging Face:
Система распознавания текста Unlimited-OCR
Baidu опубликовала научную статью с описанием новой технологии OCR.
Универсальный трейнер для Paralives 2026
Инструмент для модификации игрового процесса, предлагающий бесконечные деньги, заморозку потребностей и разблокировку всех предметов.
Трейнер и оптимизатор для 007 First Light
Утилита с функциями бессмертия и скрытности, а также инструментами для глубокой оптимизации FPS и устранения статтеров.
Продвинутый трейнер для Paralives 2026
Позволяет управлять параметрами игры, включая старение персонажей и доступ к закрытому контенту.
Paralives Ultimate Trainer v2
Обновленный набор инструментов для изменения игровой механики, заморозки нужд и получения неограниченных ресурсов.
Инструментарий для Paralives 2026
Предоставляет возможности для тонкой настройки игрового процесса, от бесконечной валюты до управления состоянием персонажей.
Трейнер для Resident Evil Requiem (RE9)
Предлагает более 42 функций, включая режим бога, бесконечные патроны, редактор CP и настройку FOV.
Resident Evil Requiem Ultimate Trainer
Мощная утилита для RE9 с поддержкой бессмертия, неограниченного боезапаса и исправлением угла обзора.
Комплексный трейнер для Resident Evil Requiem
Позволяет изменять игровые параметры, редактировать ресурсы и использовать специальные режимы прохождения.
Модель Qwythos-9B-Claude-Mythos в формате GGUF
Выпущены обновленные веса в формате GGUF, включая новые варианты с префиксом `-MTP-`.
Локальные модели теперь действительно хороши
Локальные языковые модели наконец-то стали по-настоящему пригодными: на обычном ноутбуке уже можно вести агентное программирование со скоростью и точностью около 75% от фронтирных моделей. Вики Бойкис рассказывает о своём опыте и делится конкретной конфигурацией для запуска.
Читать статью
Внутренний и внешний циклы автоматизаций Codex
Хорошо написанный черновик всё равно может казаться шаблонным — и дело здесь не в недостатке интеллекта модели, а в нехватке контекста. Автор показывает, как два цикла автоматизации — внутренний и внешний — позволяют рабочему процессу приносить нужный контекст к задаче и сохранять контекст, который раскрывается уже в ходе проверки.
Читать статью
Как построить цикл самоулучшения для ваших Skills
Практический разбор того, как агент может сам улучшать качество своих Skills со временем на основе внешней обратной связи — на примере цикла триажа задач с внутренним и внешним агентскими циклами.
Читать статью
Фронтир без экосистемы нестабилен
Сатья Наделла размышляет о будущем компаний в эпоху ИИ: почему важно строить не просто передовые модели, а целые экосистемы, где каждая организация владеет собственным циклом обучения.
Читать статью
Чем живёт AI-сообщество сегодня:
Агент для инвестиционных исследований Zheng Xi
Инструмент на базе ИИ, обученный на публичных выступлениях и методах управляющего фондами Чжэн Си. Система позволяет анализировать данные фондов и выставлять оценки согласно инвестиционной стратегии автора.
Windows Copilot API
Обратный инжиниринг Windows Copilot в OpenAI-совместимый API. Проект открывает доступ к моделям GPT-4 и GPT-5 через простой REST-интерфейс без необходимости использования ключей API и оплаты.
Система долгосрочной памяти Recall для Claude Code
Офлайн-инструмент, обеспечивающий Claude Code устойчивую память между сессиями. Это позволяет ИИ сохранять контекст проекта и избавляет от необходимости повторно объяснять детали при каждом запуске.
ИИ-система «ястребиный глаз» для бадминтона
Программное обеспечение для отслеживания волана и анализа игровых моментов в реальном времени. Система предназначена для помощи в судействе и разбора траекторий полета.
Оптимизатор и тренер для 007 First Light
Продвинутая утилита для настройки производительности и игровых параметров. Включает функции оптимизации FPS, устранение задержек и возможность разблокировки внутриигрового контента.
Модификация Gemma-4-26B-A4B-StyleTune
Стилизованная версия модели Gemma-4-26B, адаптированная для специфических форматов ответов. Модель доступна на Hugging Face для тестирования и интеграции.
Unlimited-OCR от Baidu
Новая модель для высокоточного распознавания текста, развивающая идеи Deepseek-OCR. Проект нацелен на преодоление текущих ограничений в сегменте OCR-систем.
Нецензурированная Qwable-3.6-27b в формате GGUF
Версия модели Qwable-3 с удаленными фильтрами безопасности через процесс abliteration. Модель оптимизирована для локального запуска с использованием квантования GGUF.
Дистиллированная модель gpt-oss-120b-Fable-5
Масштабная модель с архитектурой MoE, упакованная в формат GGUF. Проект спонсирован AutoTrust AI Lab и представляет собой открытую альтернативу тяжелым проприетарным решениям.
MiniMax-M3 с 4-битным квантованием
Конвертация модели MiniMax-M3 в формат MLX для работы на устройствах Apple. Оптимизация выполнена с помощью mlx-vlm для обеспечения высокой производительности инференса.
Обзор Claude Fable 5: миллиард токенов глазами не-инженера
Автор потратил миллиард токенов, тестируя Claude Fable 5 на реальных проектах --- от UI/UX и написания текстов до стратегии, безопасности и инженерных задач --- и пришёл к выводу, что это первая модель за долгое время, которая действительно ощущается как качественный скачок.
Читать статью
Свежие темы из мира AI — GitHub, Reddit, Hugging Face:
Релиз модели GLM-5.2
Команда ZAI опубликовала веса новой итерации модели GLM-5.2 на Hugging Face.
fablize: Плагин для Claude Code
Расширение заставляет модель Opus следовать строгому регламенту Fable, внедряя этапы сбора доказательств и верификации в процесс генерации кода.
COMPASS: Операционная система навыков для ИИ-агентов
Система управления персонализированными навыками, предназначенная для координации и настройки задач автономных агентов.
Boogu-Image: Открытые модели для генерации изображений
Семейство моделей под лицензией Apache-2.0, которое показывает результаты на уровне закрытых решений, используя при этом значительно меньше данных для обучения.
shard: Параллельный инференс LLM на нескольких машинах
Инструмент для организации пайплайна вычислений, позволяющий распределять инференс больших языковых моделей между GPU на разных физических серверах.
MCP-панель управления для задач Codex
Реализация отказоустойчивого слоя управления на базе протокола MCP для выполнения длительных фоновых задач в Codex Desktop.
GLM-5.2 в формате GGUF
Команда Unsloth выпустила оптимизированные чекпоинты модели GLM-5.2 в формате GGUF для работы на локальных устройствах.
GLM-5.2 в квантовании FP8
Доступна версия модели GLM-5.2 с 8-битной точностью, предназначенная для ускоренного инференса с низким потреблением видеопамяти.
Qwable-3.6-27b: Модель на базе Qwen
Новая языковая модель на 27 миллиардов параметров, построенная на архитектуре Qwen и дообученная с применением техник Unsloth.
LFM2.5-Embedding-350M: Мультиязычные модели эмбеддингов
LiquidAI представила новые высокопроизводительные модели для мультиязычного поиска и извлечения информации, претендующие на лидерство в своем классе.
Как настроить несколько Mac для постоянно работающих ИИ-агентов
Практическое руководство по объединению нескольких Mac в единое рабочее пространство для запуска ИИ-агентов: SSH, Tailscale, единая структура папок и автоматизация через launchd.
Читать статью
Разработка через циклы обратной связи
Методология Loop Driven Development (LDD) предлагает новый подход к разработке с помощью ИИ-агентов: вместо того чтобы направлять модель напрямую, проектируйте циклы с правильным источником обратной связи — внешним, детерминированным и запрашиваемым по требованию.
Читать статью
Что сегодня в тренде в AI-индустрии:
Релиз GLM-5.2 от zai-org
Новая версия языковой модели GLM-5.2 опубликована на Hugging Face.
Open source модели Boogu-Image для генерации изображений
Семейство моделей с лицензией Apache-2.0, обеспечивающее качество уровня проприетарных решений при значительно меньшем объеме обучающих данных.
MCP-панель управления для задач Codex Desktop
Инструмент для управления долгосрочными задачами в Codex Desktop через протокол MCP.
Профессиональный генератор сид-фраз Seed-Generator
Инструментарий для создания BIP-39 фраз и HD-кошельков с поддержкой множества криптовалют и офлайн-генерацией через CSPRNG.
GLM-5.2 в формате GGUF от Unsloth
Команда Unsloth подготовила оптимизированные веса модели GLM-5.2 в формате GGUF для использования на локальных устройствах.
Новая модель Qwable-3.6-27b
Модель на 27 миллиардов параметров, базирующаяся на архитектуре Qwen и оптимизированная Mia-AiLab.
Навыки для торговых агентов Alpaca-skills
Набор инструкций в формате SKILL.md для ИИ-ассистентов, позволяющий интегрировать функции Alpaca Trading API и Broker API.
Трейнер для Gothic 1 Remake на Python
Универсальный инструмент для оптимизации, исправления FPS и активации читов в ремейке Gothic 1.
Аудио-токенизатор MiMo от Xiaomi
Новый инструмент для работы с аудио в языковых моделях, призванный упростить выполнение специфических задач без глубокого fine-tuning.
Мультиязычные эмбеддинг-модели LFM2.5 от LiquidAI
Релиз высокопроизводительных моделей для мультиязычного поиска, демонстрирующих лучшие в своем классе показатели эмбеддингов.
Опасные технологии только для американцев
Экспортные ограничения США на модели искусственного интеллекта превращают технологии в оружие, а гражданство — в критерий доверия. Европе пора перестать быть пешкой и начать строить собственные возможности.
Читать статью
Осваиваем Codex Mobile для инженерной работы
Практическое руководство по превращению телефона в центр управления Codex -- от настройки рабочего окружения до ревью кода и постановки целей, прямо с мобильного устройства.
Читать статью
Плавный, естественный голосовой перевод с Gemini 3.5 Live Translate
Google представляет Gemini 3.5 Live Translate — новую аудиомодель для перевода речи в реальном времени, которая автоматически определяет более 70 языков и генерирует естественно звучащий перевод с сохранением интонации, темпа и высоты голоса говорящего.
Читать статью
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
