uk
Feedback
Инженерная ИИ-шница

Инженерная ИИ-шница

Відкрити в Telegram

Канал о применении ИИ в разработке электроники и не только... Owner: @megalloid

Показати більше
Країна не вказанаКатегорія не вказана
305
Підписники
Немає даних24 години
+127 днів
+5330 день
Кількість дописів
Дописів за 30 днів

Триває завантаження даних...

Реакції
Коментарі
Telegram Stars
ТОП дописів по

Триває завантаження даних...

Аналітика дописів
Дописи
Динаміка переглядів
Вышла Claude Sonnet 5: теперь это лучшая модель Anthropic для повседневных задач. В бенчмарках почти на одном уровне с Opus 4
Вышла Claude Sonnet 5: теперь это лучшая модель Anthropic для повседневных задач. В бенчмарках почти на одном уровне с Opus 4.8, но в 1,5 раза дешевле. Sonnet 5 заточена под код и рабочую рутину: строит планы, работает с браузером и терминалом. Доводит до конца сложные задачи, на которых прошлые версии Sonnet сдавались, и проверяет свои результаты без напоминаний. Уже можно тестить в Claude Code и чат-боте Claude.
53101Loading...
Минутка домашней конспирологии. Этой весной случилась забавная ситуация, когда в API Anthropic случайно засветилась модель Cl
Минутка домашней конспирологии. Этой весной случилась забавная ситуация, когда в API Anthropic случайно засветилась модель Claude Sonnet 5 и тут же исчезла. А буквально через несколько дней анонсировали выход Claude Opus 4.7. На основании этого случая возникла такая конспирологическая теория, что новые модели Anthropic стали настолько лучше, что компания решила сделать skip level и продавать Sonnet по цене Opus. Якобы, Opus превратился в Mythos, Sonnet превратился в Opus. И вот я смотрю на графики этого релиза и вижу одну такую очень режущую мне глаз деталь. А именно: перформанс этой модели сильно размазан по доске и на низких уровнях мышления бывает даже хуже, чем у предыдущей версии - Sonnet 4.6. При этом в целом модель значительно лучше предшественника на большинстве задач. А не продают ли нам новую Haiku под именем Sonnet 5? Впрочем, что мы можем с этим поделать, кроме как поворчать. 🫠
77001Loading...
Самые лучше бесплатные API нейронок На Reddit мужик прогнал одинаковую нагрузку по разным провайдерам: дайджест утром, разбор 20–30 писем, 10–15 обычных диалогов и несколько ресерч-задач. В день выходило примерно 800–1200 запросов и 300–500 тысяч токенов. И вот, что он выяснил: 🟡 OpenRouter без депозита почти бесполезен. Там 50 бесплатных запросов в день, и это скорее демка, чем рабочий бесплатный тариф. Но если закинуть $10 на баланс, лимит бесплатных моделей поднимается до 1000 запросов в день. Деньги при этом не тратятся, если гонять именно free-модели. 🟡 Groq на больших моделях живет недолго. Llama 70B быстрая, прям очень, но дневной лимит по токенам улетает быстро. Зато маленькие модели Groq отлично подходят для фоновой рутины: классифицировать письма, проверять статусы, коротко отвечать, дергать простые задачи по расписанию. (У Llama 3.3 70B дают 1000 запросов в день и 100 тысяч токенов в день. У Llama 3.1 8B лимит намного жирнее: 14 400 запросов в день и 500 тысяч токенов в день.) 🟡 Gemini Flash оказался самым нормальным вариантом для основного агента. У автора он три недели тянул дайджесты, письма, диалоги, ресерч и саммари документов без упора в дневной лимит. Но есть минус: на бесплатном тарифе Google может использовать запросы для улучшения продуктов, так что личную почту, финансы и рабочие секреты туда лучше не тащить. 🟡 Cerebras хорош для больших пачек текста. Например, когда нужно прогнать длинный документ, собрать саммари, разобрать логи или обработать кучу заметок. Моделей меньше, чем в OpenRouter, зато токенов дают щедро и скорость высокая. (Дают примерно 1 млн токенов в день без карты. Но лимиты там считаются не только по токенам, но и по запросам, поэтому большой батч может упереться раньше. 🟡 Mistral Experiment очень хорош, но учится на ваших данных. Для личного ассистента с календарем, письмами и рабочими задачами уже такое себе. (Дают примерно 1 млрд токенов в месяц. Карта не нужна, но нужна верификация по телефону. Запросы в бесплатном Experiment-плане могут использоваться для обучения моделей Mistral.) #инструкции @neurozeh
123200Loading...
😮 Что нового в мире ИИ 💛 Sakana AI выпустила Fugu, модель, которая сама собирает команду из других ИИ под задачу. Снаружи это один OpenAI-совместимый API, а внутри система выбирает модели из пула, распределяет между ними работу, проверяет ответы и собирает итог. Есть обычная Fugu для повседневных задач и Fugu Ultra для сложных многошаговых сценариев. 💛 ByteDance обновила Seedance 2.0 и показала Seedance 2.5. В Seedance 2.0 добавили 4K-вывод, а новая версия должна генерировать ролики до 30 секунд одним куском, без склейки из коротких фрагментов. 🟡 ElevenLabs запустила Ads Engine, который адаптирует рекламу под 50+ языков. Сервис берет готовый ролик, делает дубляж, меняет текст, картинки и видео под нужный рынок, а на выходе собирает локальные версии одной кампании. Еще Ads Engine следит за выгоранием креатива и подсказывает, когда ролик пора обновить. 💛 Mistral выпустила OCR 4, модель для распознавания документов. Она не просто вытаскивает текст из сканов, а понимает структуру страницы: заголовки, таблицы, формулы, подписи и места, где распознавание получилось неуверенным. Поддерживает 170 языков, ставится на свои серверы и стоит $4 за 1000 страниц или $2 через batch API. 🟡 Genspark выпустила Design, инструмент для дизайна на базе Claude Opus 4.7. Внутри можно собирать UI-прототипы, постеры, HTML-анимации и видео. Главная фишка в том, что макет потом превращается в рабочий код через Genspark Code. 💛 DeepReinforce выпустила Ornith-1.0, семейство открытых моделей для агентного кодинга. В линейке четыре версии: 9B, 31B, 35B MoE и 397B MoE. Флагманская модель набрала 77.5 на Terminal-Bench 2.1 и 82.4 на SWE-Bench Verified, а веса выложили на Hugging Face. 🟡 OpenAI выпустила GPT-5.6, но пока только для проверенных партнеров. В семействе три модели: Sol самая мощная, Terra дешевле и сбалансированнее, Luna самая быстрая. Sol поставила новый рекорд OpenAI на Terminal-Bench 2.1, а в задачах по кибербезопасности показала уровень Mythos Preview при меньшем расходе токенов. 💛 Perplexity запустила отдельный продукт для юристов. Он ищет по судебным решениям, нормативке, публичным документам и файлам клиента, а к каждому ответу прикладывает источники. Еще собирает досье перед встречей, следит за изменениями в законах, вытаскивает пункты из договоров в таблицу и ищет патентные аналоги. #дайджест @neurozeh
145300Loading...
Так. Получилось что-то вот такое. Надо привести в порядок и проверить...
177300Loading...
Немає тексту...
176380Loading...
Кажется, что ChatGPT5.5-Pro не плохо генерирует символы для Kikad. Тут конечно Kikad в этом случае выглядит более выгодно потому что примитивы хранятся не в бинарном, а текстовом виде. Вот например символ одного из микроконтроллеров которых я использовал когда-то давно. По мне - вполне годно, за мной остается только сверка. #пример
175440Loading...
GPT-5.6 может повторить судьбу Claude Fable 5. Белый дом потребовал от OpenAI не выпускать новую модель из-за рисков безопасн
GPT-5.6 может повторить судьбу Claude Fable 5. Белый дом потребовал от OpenAI не выпускать новую модель из-за рисков безопасности, пишет The Information. Сэм Альтман объявил сотрудникам, что доступ к GPT-5.6 дадут только небольшой группе тестеров. Их будет утверждать правительство США. По слухам, модель собирались открыть для всех в июле.
211201Loading...
Anthropic снова обвинили китайцев в дистилляции: Alibaba обучала свою модель Qwen при помощи ботов в Claude Anthropic пожаловались американским властям, что почти 25 тысяч фейковых аккаунтов выкачивали из Claude знания, касающиеся программирования и агентного рассуждения. Alibaba обошла правила доступа, т.к. в Китае Claude не работает из соображений нацбезопасности. Ранее Anthropic обвиняла в дистилляции китайские DeepSeek, Moonshot и MiniMax. @shifrovalnya
221400Loading...