Инженерная ИИ-шница
前往频道在 Telegram
305
订阅者
无数据24 小时
+127 天
+5330 天
帖子数量
过去30天的帖子
数据加载中...
反应
评论
Telegram 星星
按以下排序的热门帖子
数据加载中...
发布分析
帖子 | 浏览量动态 | |||||
Вышла Claude Sonnet 5: теперь это лучшая модель Anthropic для повседневных задач. В бенчмарках почти на одном уровне с Opus 4.8, но в 1,5 раза дешевле.
Sonnet 5 заточена под код и рабочую рутину: строит планы, работает с браузером и терминалом. Доводит до конца сложные задачи, на которых прошлые версии Sonnet сдавались, и проверяет свои результаты без напоминаний.
Уже можно тестить в Claude Code и чат-боте Claude. | 53 | 1 | 0 | 1 | Loading... | |
Минутка домашней конспирологии.
Этой весной случилась забавная ситуация, когда в API Anthropic случайно засветилась модель Claude Sonnet 5 и тут же исчезла.
А буквально через несколько дней анонсировали выход Claude Opus 4.7.
На основании этого случая возникла такая конспирологическая теория, что новые модели Anthropic стали настолько лучше, что компания решила сделать skip level и продавать Sonnet по цене Opus.
Якобы,
Opus превратился в Mythos,
Sonnet превратился в Opus.
И вот я смотрю на графики этого релиза и вижу одну такую очень режущую мне глаз деталь.
А именно: перформанс этой модели сильно размазан по доске и на низких уровнях мышления бывает даже хуже, чем у предыдущей версии - Sonnet 4.6. При этом в целом модель значительно лучше предшественника на большинстве задач.
А не продают ли нам новую Haiku под именем Sonnet 5?
Впрочем, что мы можем с этим поделать, кроме как поворчать. 🫠 | 77 | 0 | 0 | 1 | Loading... | |
Самые лучше бесплатные API нейронок
На Reddit мужик прогнал одинаковую нагрузку по разным провайдерам: дайджест утром, разбор 20–30 писем, 10–15 обычных диалогов и несколько ресерч-задач. В день выходило примерно 800–1200 запросов и 300–500 тысяч токенов. И вот, что он выяснил:
🟡 OpenRouter без депозита почти бесполезен. Там 50 бесплатных запросов в день, и это скорее демка, чем рабочий бесплатный тариф. Но если закинуть $10 на баланс, лимит бесплатных моделей поднимается до 1000 запросов в день. Деньги при этом не тратятся, если гонять именно free-модели.
🟡 Groq на больших моделях живет недолго. Llama 70B быстрая, прям очень, но дневной лимит по токенам улетает быстро. Зато маленькие модели Groq отлично подходят для фоновой рутины: классифицировать письма, проверять статусы, коротко отвечать, дергать простые задачи по расписанию. (У Llama 3.3 70B дают 1000 запросов в день и 100 тысяч токенов в день. У Llama 3.1 8B лимит намного жирнее: 14 400 запросов в день и 500 тысяч токенов в день.)
🟡 Gemini Flash оказался самым нормальным вариантом для основного агента. У автора он три недели тянул дайджесты, письма, диалоги, ресерч и саммари документов без упора в дневной лимит. Но есть минус: на бесплатном тарифе Google может использовать запросы для улучшения продуктов, так что личную почту, финансы и рабочие секреты туда лучше не тащить.
🟡 Cerebras хорош для больших пачек текста. Например, когда нужно прогнать длинный документ, собрать саммари, разобрать логи или обработать кучу заметок. Моделей меньше, чем в OpenRouter, зато токенов дают щедро и скорость высокая. (Дают примерно 1 млн токенов в день без карты. Но лимиты там считаются не только по токенам, но и по запросам, поэтому большой батч может упереться раньше.
🟡 Mistral Experiment очень хорош, но учится на ваших данных. Для личного ассистента с календарем, письмами и рабочими задачами уже такое себе. (Дают примерно 1 млрд токенов в месяц. Карта не нужна, но нужна верификация по телефону. Запросы в бесплатном Experiment-плане могут использоваться для обучения моделей Mistral.)
#инструкции
@neurozeh | 123 | 2 | 0 | 0 | Loading... | |
😮 Что нового в мире ИИ
💛 Sakana AI выпустила Fugu, модель, которая сама собирает команду из других ИИ под задачу. Снаружи это один OpenAI-совместимый API, а внутри система выбирает модели из пула, распределяет между ними работу, проверяет ответы и собирает итог. Есть обычная Fugu для повседневных задач и Fugu Ultra для сложных многошаговых сценариев.
💛 ByteDance обновила Seedance 2.0 и показала Seedance 2.5. В Seedance 2.0 добавили 4K-вывод, а новая версия должна генерировать ролики до 30 секунд одним куском, без склейки из коротких фрагментов.
🟡 ElevenLabs запустила Ads Engine, который адаптирует рекламу под 50+ языков. Сервис берет готовый ролик, делает дубляж, меняет текст, картинки и видео под нужный рынок, а на выходе собирает локальные версии одной кампании. Еще Ads Engine следит за выгоранием креатива и подсказывает, когда ролик пора обновить.
💛 Mistral выпустила OCR 4, модель для распознавания документов. Она не просто вытаскивает текст из сканов, а понимает структуру страницы: заголовки, таблицы, формулы, подписи и места, где распознавание получилось неуверенным. Поддерживает 170 языков, ставится на свои серверы и стоит $4 за 1000 страниц или $2 через batch API.
🟡 Genspark выпустила Design, инструмент для дизайна на базе Claude Opus 4.7. Внутри можно собирать UI-прототипы, постеры, HTML-анимации и видео. Главная фишка в том, что макет потом превращается в рабочий код через Genspark Code.
💛 DeepReinforce выпустила Ornith-1.0, семейство открытых моделей для агентного кодинга. В линейке четыре версии: 9B, 31B, 35B MoE и 397B MoE. Флагманская модель набрала 77.5 на Terminal-Bench 2.1 и 82.4 на SWE-Bench Verified, а веса выложили на Hugging Face.
🟡 OpenAI выпустила GPT-5.6, но пока только для проверенных партнеров. В семействе три модели: Sol самая мощная, Terra дешевле и сбалансированнее, Luna самая быстрая. Sol поставила новый рекорд OpenAI на Terminal-Bench 2.1, а в задачах по кибербезопасности показала уровень Mythos Preview при меньшем расходе токенов.
💛 Perplexity запустила отдельный продукт для юристов. Он ищет по судебным решениям, нормативке, публичным документам и файлам клиента, а к каждому ответу прикладывает источники. Еще собирает досье перед встречей, следит за изменениями в законах, вытаскивает пункты из договоров в таблицу и ищет патентные аналоги.
#дайджест
@neurozeh | 145 | 3 | 0 | 0 | Loading... | |
Так. Получилось что-то вот такое. Надо привести в порядок и проверить... | 177 | 3 | 0 | 0 | Loading... | |
没有文字... | 176 | 3 | 8 | 0 | Loading... | |
Кажется, что ChatGPT5.5-Pro не плохо генерирует символы для Kikad. Тут конечно Kikad в этом случае выглядит более выгодно потому что примитивы хранятся не в бинарном, а текстовом виде. Вот например символ одного из микроконтроллеров которых я использовал когда-то давно. По мне - вполне годно, за мной остается только сверка.
#пример | 175 | 4 | 4 | 0 | Loading... | |
GPT-5.6 может повторить судьбу Claude Fable 5. Белый дом потребовал от OpenAI не выпускать новую модель из-за рисков безопасности, пишет The Information.
Сэм Альтман объявил сотрудникам, что доступ к GPT-5.6 дадут только небольшой группе тестеров. Их будет утверждать правительство США.
По слухам, модель собирались открыть для всех в июле. | 211 | 2 | 0 | 1 | Loading... | |
Anthropic снова обвинили китайцев в дистилляции: Alibaba обучала свою модель Qwen при помощи ботов в Claude
Anthropic пожаловались американским властям, что почти 25 тысяч фейковых аккаунтов выкачивали из Claude знания, касающиеся программирования и агентного рассуждения.
Alibaba обошла правила доступа, т.к. в Китае Claude не работает из соображений нацбезопасности. Ранее Anthropic обвиняла в дистилляции китайские DeepSeek, Moonshot и MiniMax.
@shifrovalnya | 221 | 4 | 0 | 0 | Loading... |
现已上线!2025 年 Telegram 研究 — 年度关键洞察 

