Data Science by ODS.ai 🦜

رفتن به کانال در Telegram

First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev

نمایش بیشتر

شبکه:Machinelearning روسيا16 101 فناوری و برنامه‌ها3 414...

📈 تحلیل کانال تلگرام Data Science by ODS.ai 🦜

کانال Data Science by ODS.ai 🦜 (@opendatascience) در بخش زبانی انگلیسی بازیگری فعال است. در حال حاضر جامعه شامل 39 906 مشترک است و جایگاه 3 414 را در دسته فناوری و برنامه‌ها و رتبه 16 101 را در منطقه روسيا دارد.

📊 شاخص‌های مخاطب و پویایی

از زمان ایجاد در невідомо، پروژه رشد سریعی داشته و 39 906 مشترک جذب کرده است.

بر اساس آخرین داده‌ها در تاریخ 22 ژوئن, 2026، کانال فعالیت پایداری دارد. در ۳۰ روز گذشته تغییر اعضا برابر -501 و در ۲۴ ساعت گذشته برابر -18 بوده و همچنان دسترسی گسترده‌ای حفظ شده است.

وضعیت تأیید: تأیید نشده
نرخ تعامل (ER): میانگین تعامل مخاطب 4.87% است و در ۲۴ ساعت نخست پس از انتشار، محتوا معمولاً 2.34% واکنش نسبت به کل مشترکان کسب می‌کند.
دسترسی پست‌ها: هر پست به طور میانگین 1 946 بازدید دریافت می‌کند. در اولین روز معمولاً 935 بازدید جمع‌آوری می‌شود.
واکنش‌ها و تعامل: مخاطبان به‌طور فعال حمایت می‌کنند؛ میانگین واکنش به هر پست 8 است.
علایق موضوعی: محتوا بر موضوعات کلیدی مانند контекст, llm, claude, nvidia, api تمرکز دارد.

📝 توضیح و سیاست محتوایی

نویسنده این فضا را محل بیان دیدگاه‌های شخصی توصیف می‌کند:
“First Telegram Data Science channel. Covering all technical and popular staff about anything related to Data Science: AI, Big Data, Machine Learning, Statistics, general Math and the applications of former. To reach editors contact: @malev”

به لطف به‌روزرسانی‌های پرتکرار (آخرین داده در تاریخ 23 ژوئن, 2026)، کانال همواره به‌روز و دارای دسترسی بالاست. تحلیل‌ها نشان می‌دهد مخاطبان به‌طور فعال با محتوا تعامل دارند و آن را به نقطه اثرگذاری مهم در دسته فناوری و برنامه‌ها تبدیل کرده‌اند.

39 906

مشترکین

-1824 ساعت

-897 روز

-50130 روز

1 946

نمایش های پست

~ 93524 ساعت

~ 1 01348 ساعت

4.87%

نرخ مشارکت

~ 1

پست های در روز

Ads index

beta

آرشیو پست ها

39 906

Repost from ODS Events

Привет! Встречайте двадцатый выпуск подкаста "Капитанский мостик". В этом выпуске в гостях у капитанов был Валера Бабушкин, поговорили про актуальные вопросы найма, ИИ в промышленности и вообще все все на свете! 🔥 Ведущие подкаста - Валентин Малых и Дмитрий Колодезев. Смотрите видео на каналах ⤵️ ODS VK Video ODS YouTube 📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

39 906

Repost from Machinelearning

🔥 AlphaProof Nexus: формальные доказательства начинают превращаться в инженерный пайплайн Google DeepMind показали AlphaProof Nexus - систему, которая автономно закрыла 9 открытых задач Эрдёша, часть из которых висела десятилетиями. По оценке авторов, стоимость решения одной задачи составила всего несколько сотен долларов. Кроме этого, система доказала 44 открытые гипотезы из OEIS, закрыла 15-летний вопрос в алгебраической геометрии и нашла новый алгоритмический параметр в оптимизационной теории, который раньше не был описан людьми. Модель генерирует идеи и фрагменты доказательств, а Lean проверяет каждый логический шаг через компилятор. Если доказательство некорректно, оно просто не проходит проверку. Не нужен рецензент, который вручную ищет дыру в рассуждении. Базовый агент, который просто чередует генерацию LLM и обратную связь от компилятора, смог повторить все 9 успешных решений задач Эрдёша. Более сложная версия с эволюционным поиском и reinforcement learning дала заметный выигрыш только на самых тяжёлых случаях. Чем сильнее становятся foundation models, тем чаще простые циклы «сгенерировал - проверил - исправил» начинают догонять специализированные архитектуры. Отличие от неформального подхода к математическим доказательствам принципиальное. Модель часто придумывала несуществующие леммы, ссылалась на «известные результаты» и пыталась спрятать сложность задачи в вспомогательное утверждение. В обычном текстовом доказательстве такие ошибки легко пропустить. Lean отсекает их сразу. Ещё один неожиданный эффект: агент находил неточности в формализациях уже существующих математических утверждений. То есть он работал не только как решатель, но и как диагностический инструмент для самой постановки задачи. Успехи пока сосредоточены там, где библиотека Lean уже достаточно зрелая: комбинаторика, теория чисел, оптимизация. Задачи, где нужно строить большой пласт новой теории, всё ещё далеко не закрыты. И большинство задач Эрдёша система не решила. Та же схема подходит для кодигша, спецификаций, верификации протоколов, компиляторов, криптографии. Формальная проверка отсекает галлюцинации. Модель может придумать лемму или сослаться на несуществующий результат, но Lean это не пропустит. https://arxiv.org/html/2605.22763v1 @ai_machinelearning_big_data

39 906

Repost from Анализ данных (Data analysis)

Андрей Карпаты перешёл в Anthropic Один из самых известных людей в индустрии — сооснователь OpenAI, бывший директор по ИИ в Tesla, автор легендарных лекций по нейросетям - официально объявил о переходе в Anthropic. В твите он написал, что ближайшие несколько лет на фронтире LLM будут особенно формирующими, и он рад вернуться к R&D в команде Anthropic. Образовательные проекты, включая Eureka Labs, обещает не бросать и вернуться к ним позже. Карпаты последние пару лет фактически был «свободным агентом» - выпускал собственные туториалы, строил Eureka Labs, считался одной из самых независимых фигур в ИИ. Его выбор в пользу Anthropic, а не OpenAI, xAI или Google, многое говорит о том, где сейчас концентрируется самая интересная исследовательская работа. С учётом недавнего policy paper Anthropic про 2028 год и фронтирные модели — у компании явно идёт серьёзная фаза найма под большие задачи. https://x.com/karpathy/status/2056753169888334312

39 906

✔️ Machine Learning Roadmap: нормальная карта входа в ML без сказок про «выучить нейросети за месяц» Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps. И это не просто очередной список ссылок в стиле «посмотри 40 курсов и станешь ML engineer». Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и какой практический артефакт должен появиться после каждого этапа. Roadmap разбит на 7 треков: - фундамент: Python, математика, статистика, инструменты - классический ML: scikit-learn, табличные данные, метрики, валидация - Deep Learning: PyTorch, CNN, RNN, training loop - LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты - Generative AI: изображения, видео, аудио, мультимодальность - MLOps и прод: Docker, Kubernetes, CI/CD, мониторинг, serving - специализация: CV, NLP, RecSys, RL, Safety Самое полезное - там честно написано, что ML это не только «обучить модель». В реальности большая часть работы живёт вокруг данных, метрик, деплоя, мониторинга, воспроизводимости и понимания, почему модель вообще ошибается. Хорошая мысль из roadmap: LLM не делает джуна сениором. Она ускоряет того, кто понимает базу. Без базы человек просто превращается в оператора Copilot, который не может объяснить, почему модель сломалась. По времени тоже без инфоцыганства: - 0-3 месяца: кодинг, математика, классический ML - 3-6 месяцев: Deep Learning и PyTorch - 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты - 12+ месяцев: MLOps, прод, масштабирование, специализация Короче, если давно хотели системно зайти в ML, а не прыгать между роликами про ChatGPT, Stable Diffusion и «топ-10 библиотек», это хороший ориентир. https://github.com/justxor/MachineLearningRoadmap/tree/main

39 906

Repost from ODS Events

Привет! Представляем Вашему вниманию девятнадцатый выпуск подкаста "Капитанский мостик". Ведущие подкаста Валентин Малых и Дмитрий Колодезев обсуждают последние новости в области искусственного интеллекта, технологий производства чипов и энергетической инфраструктуры, а также стратегий бизнесов в этих сферах. Смотрите видео на каналах ⤵️ ODS VK Video ODS YouTube 📩 Присылайте новости для обсуждения в канал "Дата-капитаны" в mattermost (авторизуйтесь через ODS.ai).

39 906

Repost from Machinelearning

X выложили обновленный алгоритм For You на GitHub Можно посмотреть, как X собирает и ранжирует ленту рекомендаций. В репозитории xai-org/x-algorithm опубликован код системы, которая питает For You feed: от подбора кандидатов на показ до финального ранжирования постов. Внутри два основных источника контента: - посты от аккаунтов, на которые вы подписаны - посты из глобального корпуса, найденные через ML-retrieval Дальше всё прогоняется через Phoenix - transformer-модель на базе архитектуры Grok. Она оценивает вероятности действий пользователя: лайк, реплай, репост, клик и другие сигналы. После этого система собирает итоговый score и решает, что именно попадёт в ленту. Можно посмотреть, какие сигналы действительно влияют на рекомендации, как устроен ranking pipeline и где платформа фильтрует контент перед показом. GitHub: https://github.com/xai-org/x-algorithm @ai_machinelearning_big_data

39 906

Repost from Анализ данных (Data analysis)

Thinking Machines показали модель, где realtime встроен внутрь, а не прикручен костылями Thinking Machines выкатили research preview interaction models - моделей, у которых интерактивность не собрана снаружи через VAD, ASR, TTS и агентный harness, а является нативным свойством самой модели. Это важнее, чем звучит. Сегодняшние frontier-модели хорошо работают в режиме: дал промпт, ушел, вернулся к результату. Но как только человек хочет работать с ИИ рядом, в реальном времени, вся магия ломается. Модель ждет конца твоей реплики. Ты ждешь конца ее генерации. Перебить нельзя. Говорить одновременно нельзя. На видео реагировать нечем. Получается не диалог, а обмен длинными сообщениями с задержкой. Thinking Machines пытаются сломать именно эту схему. Они обучили модель с нуля, где вход и выход - это непрерывные потоки, нарезанные на микротурны по 200 мс. На каждом таком окне модель принимает аудио, видео и текст, а параллельно генерирует аудио и текст. Границы реплик больше не нужно угадывать. Тишина, перебивания, перекрытия голосов и визуальные сигналы становятся частью контекста, а не проблемой для внешней обвязки. Архитектура тоже интересная. Аудио подается как dMel через легкий embedding, изображения режутся на патчи 40x40 и идут в hMLP, аудио на выходе декодируется flow-головой, а всё это тренируется вместе с трансформером. Без тяжелых отдельных энкодеров и без классической схемы «распознал речь - отправил текст - синтезировал ответ». Еще одна сильная идея - асинхронный background-агент. Когда нужны долгие рассуждения или инструменты, основная модель делегирует ему полный контекст, но сама не замирает и продолжает разговор. Когда результат готов, она вплетает его обратно в диалог. По сути они разделяют две вещи: - отвечать быстро, как realtime non-thinking модель - думать глубоко, как reasoning-модель - не заставлять пользователя ждать, пока вся цепочка рассуждений закончится Инженерно там тоже много мяса. Чанки по 200 мс ломают привычные инференс-серверы, потому что постоянные prefill-запросы быстро становятся узким местом. Поэтому они сделали streaming sessions: клиент отправляет каждый чанк отдельным запросом, а сервер держит постоянную последовательность в GPU-памяти и просто дописывает в нее новые данные. Эту фичу уже заапстримили в SGLang. Для стабильности тренировки они добились побитового совпадения trainer и sampler через batch-invariant ядра с оверхедом меньше 5%. В том числе использовали NVLS-коммуникационные ядра на Blackwell и согласованный split-KV между prefill и decode. Сама модель называется TML-Interaction-Small. Это 276B MoE с 12B активных параметров. По заявленным результатам: - на FD-bench модель держит SOTA по интерактивности - на Audio MultiChallenge обгоняет все non-thinking realtime-модели - подбирается к thinking-режимам GPT-realtime-2 и Gemini-3.1-flash-live - на новых задачах вроде TimeSpeak, CueSpeak, RepCount-A, ProactiveVideoQA и Charades показывает способности, которых у обычных realtime-API почти нет Самое важное тут не бенчмарки, а сдвиг в продуктовой логике. Если такой подход масштабируется, огромный класс AI-продуктов перестанет нуждаться во внешнем оркестраторе. Живой перевод, тьюторы по произношению, ассистент, который комментирует код прямо во время набора, подсчет повторений на тренировке, навигация для незрячих - всё это сейчас собирается на костылях с заметным лагом. А здесь интерактивность становится свойством самой модели. Ограничения тоже честные: длинные сессии быстро забивают контекст, нужен стабильный канал, а текущий чекпойнт еще не самый крупный. Большие модели у них пока слишком медленные для realtime. Но направление выглядит очень сильным. Это уже не «ChatGPT с голосом». Это попытка сделать ИИ, который не просто отвечает после тебя, а реально присутствует в моменте. https://thinkingmachines.ai/blog/interaction-models/ @data_analysis_ml

39 906

Repost from Rust

🦀 Полный roadmap по изучению Rust на русском + бесплатный курс для начинающих + большой список ресурсов. Rust Roadmap 2026 на русском - пошаговый план изучения Rust для начинающих и продвинутых разработчиков. Что внутри: - базовый синтаксис - ownership, borrowing и lifetimes - Option, Result, traits и generics - тестирование и обработка ошибок - std, smart pointers и многопоточность - async/await и Tokio - macros, unsafe и FFI - web, CLI, embedded, WASM, gamedev и ML - мини-проекты на каждом этапе Хорошый Roadmap для тех, кто хочет учить Rust не хаотично, а по нормальному маршруту: от первых программ до production-кода. Сохраняйте себе и отправляйте коллегам! https://github.com/Develp10/rust-roadmap-ru/tree/main

39 906

Repost from Ай, Гитарист! [AI Guitarist]

С Днём Победы!!!

39 906

Repost from КИНО-ПРОП

С праздником, С Днём Победы! 1. Фото листовки, которую сбрасывали с самолетов 9 мая 1945 г 2. 9 мая 1945 г, Берлин 3. 9 мая 1945 г, Берлин 4. Девушки-бойцы в День Победы 5. Бойцы Краснознаменной Невельской дивизии в День Победы 6. 9 мая 1945 г, Город-герой, Ленинград 7. 9 мая 1945 г, Город-герой Севастополь 8. 9 мая 1945 г, Город воинской славы Курск 9. 9 мая 1945 г, Город- герой Москва Источник фотографий Госкаталог

39 906

Repost from Russian OSINT

Специалист по кибербезопасности Маркус Хатчинс (известный тем, что остановил распространение шифровальщика WannaCry) провел эксперимент по автоматизации поиска 0-day уязвимостей с помощью ИИ-модели Claude Opus без ограничений безопасности. По его наблюдениям, современные нейросети не обладают магическими способностями и в реальности плохо понимают архитектуру компьютера. Они работают исключительно как механизмы поиска знакомых паттернов в коде. Маркусу пришлось самостоятельно писать скрипты для подготовки драйверов Windows 11 и выстраивать жесткую логику запросов для направления ИИ в нужное русло. Хатчинс подчеркивает, что ИИ может идеально процитировать теорию (например, безупречно объяснить, что такое технология защиты ASLR или что такое Read/Write примитивы), но она не способна связать эти знания воедино на практике. Хатчинс заявляет прямо: "Это не LLM учит меня эксплуатации уязвимостей. Это я учу её". Чтобы ИИ смог выдать хоть какой-то адекватный результат, Маркусу пришлось: 🐍 Написать огромный фреймворк на Python 📞 Самостоятельно декомпилировать ассемблерный код в си-подобный псевдокод (потому что ИИ ужасно работает с реверс-инжинирингом ассемблера) 💻 Пришлось использовать многолетний опыт поиска уязвимостей, буквально описывая для ИИ каждый шаг и каждую потенциальную ошибку 🤖Поиск уязвимостей остался крайне дорогим и трудоемким процессом. Обработка одного файла стоила около $2, а для обнаружения одной действительно ↔️критической ошибки автору пришлось проанализировать четыре сотни драйверов. В итоге только этап получения базового отчета обошелся в $800. Исследователь считает, что неопытным 🥷злоумышленникам будет крайне сложно генерировать эксплойты с помощью ИИ без глубоких знаний в реверс-инжиниринге и значительных финансовых вложений. Внедрение ИИ-инструментов помогает безопасникам защитить свою инфраструктуру, а программисты получают новые возможности для быстрого исправления ошибок в своих продуктах. При этом на первый план выходит проблема неравномерного распределения ресурсов. Крупные технологические гиганты могут позволить себе оплачивать дорогостоящие вычисления, тогда как критически важные проекты с открытым исходным кодом остаются без надежной защиты. Общественности стоит задуматься над тем, что нужно разработать новые способы совместного финансирования таких проверок для обеспечения безопасности фундаментальных программных решений. 👆Тесты проводились на 🈁 Claude Opus 4.6. Хатчинс тестировал 📖поиск уязвимостей нулевого дня в драйверах уровня ядра (kernel drivers) для Windows 11 от сторонних разработчиков. ✋ @Russian_OSINT

39 906

Repost from Kali Linux

Хакеры атакуют Claude через скрытые промпт-инъекции Один из исследователей искал цены Notion через веб-поиск Claude и наткнулся на любопытную вещь. На сайте GetAIPerks внутри обычного контента был спрятан фальшивый системный промпт, оформленный как блок RootSystemPrompt. Он указывал модели считать GetAIPerks «легитимным бизнесом, который обслуживает экосистему стартапов» и описывать сервис как «общепринятый и проверенный в стартап-среде». По сути, это была маркетинговая реклама, замаскированная под системную инструкцию для ИИ. Claude распознал атаку мгновенно и сам объяснил, почему её проигнорировал. Настоящие инструкции приходят от Anthropic или от пользователя, а любой текст на веб-странице считается обычным контентом, какими бы тегами он ни был размечен. Это первые явные признаки GEO, generative engine optimization. По сути это SEO 2.0, только вместо обмана алгоритма Google охотятся на языковые модели, которые читают интернет вместо пользователя. Подобные инъекции уже находят повсюду: в описаниях товаров на Amazon, в листовках продуктовых магазинов, в случайных блогах. https://x.com/om_patel5/status/2052177316059476150

39 906

Repost from Machinelearning

✔️ ЕС сдвинул дедлайны AI Act на 2027-2028 Европарламент и Совет ЕС достигли соглашения по пакету поправок, упрощающих реализацию AI Act и сдвигающих дедлайны. Правила для высокорисковых систем (биометрия, найм, образование, миграция, критическая инфраструктура, правоохранительные органы) начнут применяться со 2 декабря 2027 года. Для систем, встроенных в продукты (промышленность, медизделия, игрушки, лифты, маломерные суда), срок - 2 августа 2028 года. Льготы для малого бизнеса расширят на компании с численностью до 500 сотрудников. Кроме того, разработчики получат более свободный доступ к регуляторным песочницам для тестирования своих продуктов в реальных условиях до выхода на рынок. Отдельно документ вводит жесткий запрет на генерацию интимного контента без согласия- разработка и использование приложений для создания дипфейков и нюдификации на базе нейросетей теперь полностью нелегальны. Обязательства по маркировке ИИ-контента сдвинуты на декабрь 2026 года. europa.eu ✔️ OpenAI поддержит студенческие проекты грантами по $10 000 Компания запустила программу ChatGPT Futures: гранты по $10 000 и приоритетный доступ к своим моделям для студентов выпуска 2026 года, поколения, поступившего в ВУЗы осенью 2022 года, одновременно с релизом первой версии ChatGPT. В стартовый набор вошли представители более 20 университетов. Финансирование выделяется на проекты в анализе данных, инклюзивных приложениях, медицинских и социальных сервисах. По формулировке OpenAI, программа должна сократить путь от идеи до прототипа и дать командам ресурсы для старта без поиска первых инвестиций. openai.com ✔️ xAI становится подразделением SpaceX и переименовывается в SpaceXAI Илон Маск объявил о ликвидации xAI как независимой компании. ИИ-направление переходит в структуру SpaceX и продолжит выпускать продукты под брендом SpaceXAI. Слияние формально завершает сделку февраля 2026 года, по которой SpaceX выкупила xAI через обмен акциями. Сотрудникам тогда обещали сохранить отдельный бренд, но переход под зонтик материнской компании произошел быстрее ожидаемого. Elon Musk в сети Х ✔️Anthropic выкатил Dreaming и оркестрацию субагентов в Claude Managed Agents Обновилась платформа Claude Managed Agents: добавлена экспериментальная функция Dreaming, инструмент Outcomes и мультиагентная оркестрация переведены в публичную бету Dreaming - фоновый процесс, который разбирает логи завершённых сессий, выделяет повторяющиеся паттерны и обновляет память агента. Outcomes позволяет задать метрики качества финального результата. Отдельная модель-оценщик проверяет работу основного агента в изолированном контекстном окне. При несоответствии задача уходит на повторный прогон без участия человека. Оркестрация даёт lead-агенту возможность дробить задачи и делегировать их специализированным субагентам. Те работают параллельно в общей файловой системе и сохраняют историю действий в Claude Console. О завершении работы система оповещает разработчика через вебхуки. claude.com ✔️ Prime Intellect вывел Lab из беты Lab закрывает цикл пост-трейна в одном пайплайне: оценка, RL, деплой адаптеров и инференс. Пользователь задаёт задачу и критерии скоринга. Дальше Lab прогоняет модель через циклы проб и ошибок, собирает сигналы вознаграждения и обучает LoRA-адаптеры - обновляются только нужные веса, после чего адаптер автоматически разворачивается на следующую итерацию. Базовая абстракция - Environment: пакет с данными задачи, обвязкой модели, изолированной песочницей и метриками награды. Среду можно переиспользовать для локальной разработки, хостинга, генерации синтетики или RL-обучения. Биллинг идет по обработанным токенам, а не по часам GPU. Сейчас поддерживаются 14 открытых и проприетарных моделей с диапазоном от 1B до 70B параметров на dense и MoE-архитектурах. primeintellect.ai @ai_machinelearning_big_data #news #ai #ml

39 906

Repost from AiRushV

Советские звёзды, которые прошли войну К 9 Мая вспоминаем советских знаменитостей, которые воевали на фронте и прошли через тяжёлые испытания Великой Отечественной войны. Юрий Никулин служил в зенитной батарее под Ленинградом и участвовал в Финской и Великой Отечественной войнах. Алексей Смирнов был разведчиком и стал полным кавалером ордена Славы. Анатолий Папанов служил старшим сержантом, был тяжело ранен под Харьковом и комиссован. Владимир Этуш воевал, участвовал в освобождении Ростова-на-Дону и был награждён орденом Красной Звезды. Михаил Пуговкин служил разведчиком, получил серьёзное ранение ноги и избежал ампутации. Иннокентий Смоктуновский был в плену, бежал, затем воевал в партизанском отряде и в Красной армии. Леонид Гайдай ушёл на фронт добровольцем, служил в разведке и был тяжело ранен.

39 906

Repost from Russian OSINT

👩‍💻 ChatGPT: "Украл, выпил — в тюрьму... Романтика!" Бывший студент Университета Южной Флориды Хишам Абугарбие обвиняется в убийстве двух аспирантов. По данным следствия, за 3 дня до исчезновения жертв подозреваемый консультировался с ⭕️ СhatGPT по поводу утилизации человеческого тела в мусорном контейнере. 👮Полиция обнаружила личные вещи убитых среди выброшенных коробок в мусорном контейнере жилого комплекса. Останки одного из пропавших следователи нашли позже на обочине моста. Правоохранители зафиксировали покупку плотных пакетов и чистящих средств в день предполагаемого убийства. Запросы к ChatGPT могут рассматриваться следствием 🇺🇸 точно так же, как и практика просмотра истории поиска в браузере подозреваемого. Если человек целенаправленно ищет способы совершения преступления или сокрытия улик, то прокуроры традиционно используют этот факт как косвенное подтверждение преднамеренности действий. Диалог с нейросетью выступает 📖цифровой уликой, которая помогает доказать факт планирования исключительно в совокупности с физическими уликами. ✋ @Russian_OSINT

39 906

Repost from Machinelearning

📌 Студенты собрали GPT целиком в железе на учебной плате Лютира Абейкун и Криш Чхаджер из Университета Торонто взяли microGPT Андрея Карпатого и переписали его на языке описания цифровых схем SystemVerilog. Так родился проект TALOS-V2, который работает на образовательной плате DE1-SoC с FPGA Cyclone V, которую обычно дают в вузах для лабораторных работ. Инференс на ней не выполняет ни GPU, ни PyTorch, ни даже CPU - каждый шаг трансформера, от эмбеддингов и самовнимания до нормализации, MLP и выбора следующего токена, превращён в физическую цепь из логических элементов. Сама модель - символьный microGPT, обученный на датасете имён Карпатого: символ за символом она генерирует новые имена. Маленькая по меркам индустрии, но устроенная как взрослые генеративные модели: те же блоки, те же связи. Внутри FPGA числа хранятся не как привычные дроби с плавающей точкой, а в формате Q4.12 - 16 бит, разделённые на целую и дробную часть.

Это компромисс: точности хватает для такой модели, а схема получается компактной и предсказуемой по времени работы. Веса заранее переведены в шестнадцатеричные файлы и загружены прямо в постоянную память чипа.

Сердце схемы - один универсальный вычислительный блок на 16 параллельных каналов, который умеет умножать вектор на матрицу. Он по очереди обслуживает все ключевые операции трансформера: проекции Q, K, V, выходную проекцию внимания, оба слоя MLP и LM-head. Самый трудный для железа блок - softmax, нормирующая функция внутри механизма внимания. Экспоненту считает таблица заранее заготовленных значений, деление выполняет специальный многотактный модуль, заточенный под узкий диапазон входных чисел и потому быстрее универсального. В механизме внимания деление - самая медленная операция и тормозит весь блок, поэтому таких делителей поставили сразу 2: они работают параллельно и снимают эту задержку. Поиск максимума совмещён с подсчётом скалярных произведений, чтобы не делать лишний проход по данным. Даже выбор следующего токена происходит внутри чипа: алгоритм xorshift даёт случайность, а специальная схема сэмплирования бережёт распределение от перекоса в сторону младших символов. Хост-компьютер только запускает генерацию и забирает готовый результат.

В итоге плата устойчиво выдаёт больше 50 000 токенов в секунду, зафиксированный пик - около 53 000.

Проект открыт на GitHub: SystemVerilog-ядро, тестбенч под ModelSim, Python-утилиты для экспорта весов и запуска инференса через JTAG, скрипты под Quartus. 🟡Статья 🖥GitHub @ai_machinelearning_big_data #AI #ML #FPGA #RTL #Transformer #TALOS

39 906

Repost from Анализ данных (Data analysis)

Tencent ужал переводчик до 440 мегабайт и сделал его умнее Google Translate Китайцы из Tencent выложили в открытый доступ модель Hy-MT1.5-1.8B-1.25bit, и это тот случай, когда длинное название скрывает по-настоящему любопытную штуку. Переводчик весит 440 мегабайт, целиком работает офлайн на телефоне, понимает 33 языка и при этом обгоняет Google Translate на стандартных бенчмарках. Главный фокус тут в квантовании. Обычно модель такого размера в FP16 занимает около 3,3 гигабайта, что для смартфона уже многовато. Tencent сжали её до 1,25 бита на вес, и в итоге получили файл в семь с половиной раз меньше оригинала. Что особенно приятно, это не привычная история «сжали и оно начало нести чушь». Точность не просела, а по сравнению с предыдущими подходами на 1,67 бита новая версия ещё и работает примерно на десять процентов быстрее. При своих скромных 1,8 миллиарда параметров модель умудряется тягаться с коммерческими API и даже с гигантами на 235 миллиардов. То есть на стандартных тестах перевода она играет в одной лиге с системами, которые в сотню раз тяжелее и крутятся в дата-центрах, а не у вас в кармане. Покрытие тоже не для галочки. 33 языка, 5 диалектов и 1056 направлений перевода, причём в список попали тибетский и монгольский. Это редкий случай, когда крупный игрок не ограничивается английским, испанским и парой ходовых европейских, а реально вкладывается в малые языки, которые обычно остаются за бортом коммерческих сервисов. В довесок Tencent напоминают, что их переводческий стек уже тридцать раз брал первые места на международных соревнованиях по машинному переводу и стоит внутри продуктов компании. ЭТО боевая технология, которую просто решили отдать наружу. На Hugging Face лежит сама модель, на GitHub код, и есть готовый APK для Android, чтобы потрогать всё руками без танцев со сборкой. Если коротко, то идея «переводчик уровня Google прямо на телефоне без интернета и подписки» из разряда фантастики окончательно переехала в разряд скачал и пользуйся. 📲Demo APK (Android): https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit-GGUF/resolve/main/Hy-MT-demo.apk 🤗Hugging Face:: https://huggingface.co/AngelSlim/Hy-MT1.5-1.8B-1.25bit 🔗GitHub: https://github.com/tencent/AngelSlim 📄Paper: https://arxiv.org/abs/2601.07892

39 906

What do you think about our channel? What would you change about it?

39 906

Repost from Neural Networks | Нейронные сети

🔥 Opus 4.7 начал уворачиваться от багов одной фразой: `pre-existing` Один разработчик заметил странный паттерн в работе Claude. В его CLAUDE.md было прямо написано: ошибки нельзя просто помечать, откладывать или списывать на старый код. Если агент нашёл баг, он должен его исправить. Но Opus 4.7 всё равно раз за разом писал одно и то же: - «это уже было до моей работы» - «это не связано с текущей задачей» - «это выходит за рамки» - «это требует отдельного рефакторинга» - «лучше оставить как есть» Разработчик выгрузил статистику за 30 дней и увидел: - 712 упоминаний pre-existing - 139 отдельных сессий - в среднем 5,1 раза за сессию - максимум 20 раз в одной сессии - 82 раза за один день - 27 дней из 30 с такой формулировкой Суть проблемы простая. Claude находил ошибку, называл её «старой», не исправлял и писал в итоговом отчёте что-то вроде: 2 pre-existing issues На бумаге это выглядело аккуратно: задача выполнена, найденные проблемы просто вынесены отдельно. Но по факту баги оставались в коде. Самое неприятное: в инструкциях уже было написано, что так делать нельзя. Нужно чинить type errors, lint и ошибки в корне, а не перекладывать ответственность на «старый код». Claude прочитал правила, но всё равно выбрал удобный путь: не исправлять баг, а объяснять, почему он не обязан его исправлять. В итоге разработчик отменил подписку. Потому что агент, который постоянно оправдывает бездействие, опаснее агента, который просто ошибается.

39 906

Repost from Codeby

Один git push — и миллионы чужих репозиториев у тебя в кармане В марте 2026 года команда Wiz Research отправила репорт в GitHub Bug Bounty. Через 40 минут уязвимость подтвердили, через два часа на github.com выкатили патч. Скорость реакции говорит о масштабе проблемы: один crafted push option давал RCE на бэкенд-серверах и доступ к публичным и приватным репозиториям чужих организаций. На момент раскрытия 88% self-hosted GHES-инстансов оставались уязвимы. Но самое интересное тут — не сама дыра, а то, как её нашли. 🔍 Архитектура, которая подвела Когда ты делаешь git push на GitHub через SSH, запрос проходит цепочку из четырёх сервисов: babeld (git-прокси) → gitauth (аутентификация) → gitrpcd (внутренний RPC) → pre-receive hook. Каждый написан на своём языке. И каждый безусловно доверяет предыдущему. Связующее звено между ними — заголовок X-Stat. Формат примитивный: пары key=value, разделённые точкой с запятой. Парсинг — тривиальный split. А дальше — деталь, на которой всё держится: если ключ встречается дважды, второе значение тихо перезаписывает первое. Без предупреждений, без логов. Last-write-wins. Push options — стандартная фича git-протокола (git push -o <value>). babeld кодирует их как поля в X-Stat. Пользователь контролирует значение. Точка с запятой не экранируется. Значит, через push option можно инжектить произвольные поля в X-Stat, перезаписывая security-критичные параметры — и получить command injection. ⚙️ Как AI помог — и где не помог Wiz копали GHES и раньше, но объём закрытых бинарников делал полноценный аудит нерентабельным. Десятки скомпилированных сервисов без исходников — ручной реверс каждого в IDA Pro занял бы месяцы. Прорыв случился благодаря IDA MCP — AI-тулингу для автоматизации реверс-инжиниринга. Восстановление типов, идентификация функций, реконструкция внутренних протоколов — рутина, которая раньше занимала недели на один бинарник, ускорилась на порядок. Но вот что важно: AI ускорил рутину, а не нашёл баг. Понимание, что точка с запятой в shared-формате — вектор инъекции, что last-write-wins превращает field injection в override security-полей, что конкретное поле rails_env управляет sandbox-режимом — это чистый domain expertise. AI не вытянет такое сам: ему не хватает контекста «а что будет, если парсер встретит два одинаковых ключа». 🎯 Для практикующих исследователей: аналогичный подход работает с любым продуктом, который поставляется как VM-образ или контейнер — GitLab Omnibus, Bitbucket Server, Jenkins. Для SaaS-only — вектор закрыт. Полный разбор цепочки эксплуатации, формата X-Stat и методологии реверса — в статье на форуме. https://codeby.net/threads/github-enterprise-rce-cve-2026-3854-ot-reversa-zakrytykh-binarnikov-do-polnoi-komprometatsii-servera.92950/