местный датасасер ☮️

الذهاب إلى القناة على Telegram

Пишу всякое о технологиях и моих проектах, @egorvoron

1 876

المشتركون

-124 ساعات

+77 أيام

+1130 أيام

442

عرض المشاهدات

~ 22924 ساعات

~ 26548 ساعات

23.56%

معدل المشاركة

لا توجد بيانات

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

1 875

Repost from Data Secrets

Anthropic нашли внутри Claude внутреннее пространство, где хранятся его мысли Стартап выпустил одну из самых интересных работ по интерпретируемости за последнее время. Они обнаружили, что в LLM есть отдельный небольшой внутренний набор нейронных активаций, который используется как рабочая память для сложного мышления: так называемый J-space. Мы часто представляем LLM как огромную мешанину чисел, где знания и рассуждения размазаны по миллиардам параметров. Но похоже, что это не совсем так. Любопытно, что человеческий мозг работает похожим образом. Есть когнитивная теория, утверждающая, что он состоит из множества специализированных подсистем, которые работают независимо; но иногда какая-то информация попадает в небольшой общий workspace, становится доступной сразу многим областям мозга и может использоваться для рассуждений и принятия решений. И вот именно такой механизм исследователи обнаружили в Claude. Вот как работает J-space: — Название происходит от разработанной учеными техники Jacobian Lens. Она позволяет по текущим активациям понимать, какие токены с большей вероятностью появятся в будущем. При этом то, что они появятся – далеко не факт, но это значит, что модель о них думает и держит их в J-space, чтобы использовать в рассуждениях. По сути, это чтение мыслей Claude. — Если спросить Claude, о чем он думает, то содержимое J-space хорошо совпадает с ответом модели. Другие внутренние представления таким свойством не обладают. А еще модель умеет сознательно менять J-space. Например, если сказать ей «думай о слонах, пока решаешь задачу», то эта концепция появится в J-space. При решении сложной задачи промежуточные шаги тоже появляются именно внутри J-space, даже если их при этом нет в цепочках мыслей. — Если полностью отключить J-space, то у модели почти исчезают способности, требующие сложного мышления и многошагового рассуждения. Например, она больше не может сочинять стихи. Самое важное во всем этом то, что J-space можно читать и менять. Anthropic приводят пример: исследователи специально внедряли модели скрытую цель во время обучения и затем наблюдали, как эта цель проявляется в J-space, хотя в ответах напрямую она ни разу не озвучивалась. При этом изменяя активации в J-space, они могли менять дальнейшие решения модели. Потенциально это путь к тому, чтобы создавать (полностью?) безопасные и контролируемые модели. По крайней мере, сегодня Anthropic уже сделали черный ящик немного более прозрачным. www.anthropic.com/research/global-workspace

1 875

Repost from vc.ru

Anthropic восстановит доступ к Fable 5 для пользователей по всему миру c июля 2026 года. Минторг США снял запрет на доступ к модели для иностранных граждан. Ограничения действовали с 12 июня 2025 года vc.ru/ai/3005331

1 875

Repost from эйай ньюз

Вышел Claude Sonnet 5 По перформансу ближе к Opus 4.8 чем к Sonnet 4.6. Модель уже доступна всем пользователям, включая бесплатных. Цена до конца лета $2/$10 за миллион токенов, потом поднимут до классических $3/$15. @ai_newz

1 875

Repost from Системный Блокъ

Национальный корпус русского языка вырос в шесть раз Национальный корпус русского языка (НКРЯ) пополнился новым разделом — Генеральным интернет-корпусом русского языка (ГИКРЯ). В него вошли тексты социальной сети ВКонтакте с 2007 по начало 2022 года. Общий объем НКРЯ вырос с 2,2 до 13,5 млрд словоупотреблений — более чем в шесть раз. НКРЯ существует с 2004 года и объединяет более 50 корпусов: от древнерусских летописей XI века до современной прессы. В нем есть сбалансированный Основной корпус, дающий общее представление о письменном русском языке последних 200–300 лет, а также множество специализированных корпусов: газетный, синтаксический, поэтический, устный, мультимедийный, диалектный, исторический и другие. В новом корпусе есть социолингвистическая разметка: каждому тексту приписаны данные об авторе — пол, возраст, город и регион проживания. Это позволяет изучать, как говорят люди разных поколений в разных частях страны, — и делать статистически значимые выводы на огромном массиве данных. В дальнейшем в ГИКРЯ планируют добавить тексты других платформ, в частности Живого журнала. Разработку НКРЯ на протяжении более чем 20 лет поддерживает компания «Яндекс» — в том числе поисковую платформу и морфологическую разметку, для которой используются нейросетевые модели. Почему это важно? Языковые корпусы — основной инструмент современной лингвистики. В них ищут примеры употребления слов, изучают грамматику, отслеживают появление новых выражений. НКРЯ с ГИКРЯ — самый масштабный российский корпус. Тексты соцсетей фиксируют то, что раньше почти не попадало в академические базы данных: живую разговорную речь, неологизмы, мемы, региональные словечки. Теперь все это доступно не только лингвистам, но и преподавателям, студентам и всем, кому интересно, как на самом деле выглядит современный русский язык. Подробнее — на сайте. 🤖 «Системный Блокъ» @sysblok

1 875

Китайская Moonshot AI выпустила Kimi Code CLI: у нас теперь есть опенсорсный аналог Claude Code

1 875

Repost from Метаверсище и ИИще

Krea сделала свой Midjourney Своя модель от Krea, натренированная с нуля и заточенная на разные художественные стили. Не ждите фоторил или рендеринг текста, ожидайте креатива в духе Миджорни. Доступна пока на планах Max и Businesses. https://www.krea.ai/krea-2 @cgevent

1 875

Сохраним Android открытым https://keepandroidopen.org/ru/

1 875

Repost from vc.ru

Глава Nvidia Дженсен Хуанг в ходе конференции GTC презентовал корпоративную платформу NemoClaw. Она представляет собой OpenClaw с дополнительными функциями безопасности, пишет TechCrunch. Компания хочет предложить для бизнеса систему, которая позволит использовать ИИ-агентов с соблюдением требований к конфиденциальности и возможностью контролировать их работу vc.ru/ai/2799287

1 875

Repost from Осцилляции WaveCut

Это было неизбежно: рано или поздно должны были появиться специализированные решения для инференса. И вот, Taalas (бывшая команда из Tenstorrent) выкатили то, чего я так ждал — настоящий Direct-to-Silicon. Ребята не стали мелочиться и буквально «запекли» модель в кремний. Никакой внешней памяти, никакого HBM, никакой сложной упаковки. Веса модели и архитектура — это и есть сам чип. Цифры выглядят дико: 17,000 токенов в секунду на Llama 3.1 8B. Это на порядок быстрее текущей SOTA GPU, при этом чип стоит в 20 раз дешевле в производстве и потребляет в 10 раз меньше энергии. Самое крутое, что это не просто красивые слайды для инвесторов. Железо уже существует, и его можно «потрогать» (ссылка на демо внизу). Конечно, это ASIC, и тут есть нюанс: чип заточен под одну конкретную модель. Но Taalas продумали этот момент — они оставили поддержку LoRA-адаптеров и изменяемого контекстного окна. То есть это не совсем уж «кирпич», гибкость для файн-тюнинга остается. Сейчас у них готов чип с Llama 8B (HC1). Весной обещают выкатить что-то среднеразмерное с ризонингом, а к зиме грозятся показать фронтир-модель на втором поколении кремния. У меня голова идет кругом от мыслей к чему это может привести. Ссылки: • Анонс • Демо (скорость реально впечатляет)

1 875

Repost from TechSparks

После перепалки Anthropic и OpenAI на тему допустимости рекламы в ИИ-чатботах решила высказаться и Perplexity. Руководство компании приняло сторону Anthropic и заявило, что недолгие эксперименты с рекламой решено свернуть. Доверие пользователя слишком дорогого стоит при общении с ИИ, и компания решила им не рисковать. А монетизацию обеспечить подпиской: компания сфокусируется на развитии сервисов, "за которые людям захочется платить". Похожим спорам о монетизации больших интернет-сервисов лет почти столько же, сколько и интернету. Попытки сделать поиск или почту, “за которые захочется платить”, на b2c рынке не привели к появлению сколь-нибудь крупных игроков. Интересно, как здесь разрешится спор моделей. Все-таки за последние годы подписочная модель в стримингах, например, вполне доказала свою состоятельность, так что привычка платить потихоньку у людей вырабатывается https://www.theverge.com/ai-artificial-intelligence/880562/perplexity-ditches-ai-ads

1 875

Repost from запуск завтра

О, война платежных стандартов в ИИ! 3 месяца назад OpenAI совместно со Stripe (крупнейший карточный процессинг с фокусом на разработчиков) разработали свой протокол для покупок внутри ChatGPT — Agentic Commerce Protocol (ACP). И вот вчера Google совместно с Shopify (крупнейшая платформа для создания интернет-магазинов) представили Universal Commerce Protocol (UCP). Совсем упрощая, это чтобы можно было покупать товары прямо на странице результатов поиска, не переходя на страницу интернет-магазина. Протокол гораздо более открытый, чем ACP. Хотелось бы поставить эмоджи 🍿, но мне кажется и так понятно, кто выиграет. Это как со государством соревноваться.

1 875

слоп в моих ушах - это значит я слышу слоп слоп на моих глаза - это значит я вижу слоп слоп на моей обуви - это значит я иду к слопу слоп на моей одежде - это значит я в слопе https://techcrunch.com/2025/11/19/warner-music-settles-copyright-lawsuit-with-udio-signs-deal-for-ai-music-platform/

1 875

Мы решили задачу омографов и ударений в русском языке Мы опубликовали библиотеку silero-stress для расстановки ударений в обычных словах и омографах: 1️⃣ Расставляет ударения, решает омографы, ставит букву ё; 2️⃣ "Знает" порядка 4М русских слов и словоформ и порядка 2K омографов; 3️⃣ Простановка ударения в обычном 1 слове занимает где-то 0.5 ms, а в предложении на 400 символов с 2 омографами - порядка 30 ms; 4️⃣ Общий размер библиотеки составляет порядка 50 мегабайт (архив весит порядка 30 мегабайт), что является сжатием словарей и всех датасетов примерно в 400 раз; 5️⃣ Опубликована под популярной и простой лицензией (MIT); 6️⃣ Не содержит раздутого кода, лишних библиотек, гигабайтов академических артефактов; 7️⃣ Зависит только от стандартной библиотеки питона и работает на всех последних версиях PyTorch. Ставим ⬆️ habr.com/ru/articles/955130/ Ставим ⭐️ https://github.com/snakers4/silero-stress

1 875

Repost from эйай ньюз

Wan 2.5 — китайский нейрокомбайн с генерацией видео по аудио Вышла моделька Wan 2.5, продолжение всеми любимой в опенсорсе 2.2 версии. Можно было бы написать просто про её релиз сразу, но после него выкатили ещё кучу фич. Оказалось, что платформа теперь моделька мультимодальная и чуть ли не единственная в своём роде. Считайте сами, Wan 2.5 поддерживает вход и выход в следующих форматах: Text, Image, Video, Audio. Только запах осталось добавить. Причём видео и картинки можно редактировать промптом, и, судя по всему, всё это можно комбинировать. Например, только что появилась возможность генерации видео по аудиовходу. Что это значит? Персонажи и окружение в видео теперь могут двигаться в такт музыке! Ну и наивный липсинк, конечно же. Кроме того, обновили интерфейс и добавили удобный редактор. Полноценно монтировать там, конечно, не получится, но генерацию в целом это упрощает. В опенсорс, как и ожидалось, пока не выложили. Анонс @ai_newz

1 875

А ведь гугл еще весной заанонсил протокол для взаимодействия агентов https://developers.googleblog.com/en/a2a-a-new-era-of-agent-interoperability/ github

1 875

Repost from Сиолошная

Вышло вышло вышло https://www.anthropic.com/news/claude-4

1 875

Repost from ML physicist

Кажется вайбкодинг зашел слишком далеко, что даже claude-3.7 отказывается кодить, пытаясь сбагрить это на ChatGPT

1 875

Repost from ML physicist

Кажется вайбкодинг зашел слишком далеко, что даже claude-3.7 отказывается кодить, пытаясь сбагрить это на ChatGPT

1 875

Repost from эйай ньюз

Релиз Gemini 2.5 Flash Gemini 2.5 Flash - это дистиллят из Gemini 2.5 Pro размером поменьше и побыстрее. По качеству она далеко ушла от 2.0 Flash, да даже от январского Flash Thinking отрыв гигантский. Но по сравнению с o4-mini модель меркнет — у OpenAI и модель сильнее, и нет странных ограничений, вроде невозможности подрубить и поиск и исполнение кода одновременно. Но у Gemini 2.5 Flash всё же есть что-то, чего нет у o4-mini — детальный бюджет на размышления в токенах, прямо как в Sonnet 3.7 (но в 2.5 Pro не добавили). Попробовать модельку можно прямо сейчас в AI Studio. Если вы не гоняете тысячи запросов по API, то Gemini 2.5 Pro для вас доступна бесплатно, которая, хоть и уступает o3, остаётся лучшей бесплатной моделью. Даже по скорости она не сильно медленнее версии Flash — на моих промптах 2.5 Pro думает всего на 10-20% дольше, при сильно лучше ответах. Всё равно, пока ждёшь, можно погенерить что-то в Veo 2, которую недавно добавили и туда. Но крышку в гвоздь гроба забивает цена — для обычного не-ризонинг режима она в полтора раза выше чем у 2.0. Но главная проблема в ризонинг режиме — за него просят $3.5 за миллион токенов, что немногим ниже чем $4.4 за o4-mini. Но даже эту разницу в цене может легко съесть разница в длине размышлений модели, но без тестов тут сложно судить. С уверенностью можно сказать одно — не будь таких драконовских цен на размышления, модель была бы сильно интереснее. Но все же для некоторых задач при вызовах по API, она может конкурировать с o4-mini. @ai_newz

1 875

Repost from Борис опять

https://www.docker.com/blog/introducing-docker-model-runner/ Docker сделал llama.cpp + хранилище моделей в Docker Hub + OpenAI API из коробки, в общем докеризация моделей от докера