Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
显示更多📈 Telegram 频道 Machinelearning 的分析概览
频道 Machinelearning (@ai_machinelearning_big_data) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 298 105 名订阅者,在 技术与应用 类别中位列第 323,并在 俄罗斯 地区排名第 1 260 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 298 105 名订阅者。
根据 11 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -7 224,过去 24 小时变化为 -206,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 7.69%。内容发布后 24 小时内通常能获得 5.95% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 22 918 次浏览,首日通常累积 17 745 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 176。
- 主题关注点: 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
凭借高频更新(最新数据采集于 12 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
Это компромисс: точности хватает для такой модели, а схема получается компактной и предсказуемой по времени работы. Веса заранее переведены в шестнадцатеричные файлы и загружены прямо в постоянную память чипа.Сердце схемы - один универсальный вычислительный блок на 16 параллельных каналов, который умеет умножать вектор на матрицу. Он по очереди обслуживает все ключевые операции трансформера: проекции Q, K, V, выходную проекцию внимания, оба слоя MLP и LM-head. Самый трудный для железа блок - softmax, нормирующая функция внутри механизма внимания. Экспоненту считает таблица заранее заготовленных значений, деление выполняет специальный многотактный модуль, заточенный под узкий диапазон входных чисел и потому быстрее универсального. В механизме внимания деление - самая медленная операция и тормозит весь блок, поэтому таких делителей поставили сразу 2: они работают параллельно и снимают эту задержку. Поиск максимума совмещён с подсчётом скалярных произведений, чтобы не делать лишний проход по данным. Даже выбор следующего токена происходит внутри чипа: алгоритм xorshift даёт случайность, а специальная схема сэмплирования бережёт распределение от перекоса в сторону младших символов. Хост-компьютер только запускает генерацию и забирает готовый результат.
В итоге плата устойчиво выдаёт больше 50 000 токенов в секунду, зафиксированный пик - около 53 000.Проект открыт на GitHub: SystemVerilog-ядро, тестбенч под ModelSim, Python-утилиты для экспорта весов и запуска инференса через JTAG, скрипты под Quartus. 🟡Статья 🖥GitHub @ai_machinelearning_big_data #AI #ML #FPGA #RTL #Transformer #TALOS
Кларк - один из основателей Anthropic и глава отдела политики компании. Ранее он занимал аналогичную должность в OpenAI и работал журналистом, специализировавшимся на теме ИИ.В качестве аргументов Джек приводит данные нескольких публичных бенчмарков, оговариваясь, что у каждого из них свои методологические ограничения и значимы именно совокупные тенденции. 🟢По метрикам METR, продолжительность задач, которые ИИ-системы способны выполнять автономно, выросла с 30 секунд в 2022 году (GPT-3.5) до 12 часов в начале 2026-го (Opus 4.6). Прогноз METR на конец этого года - около 100 часов. 🟢На SWE-Bench Claude 2 справлялся лишь с 2% задач, а свежайшая Claude Mythos Preview уже с 93,9%. 🟢Внутренний бенч Anthropic по оптимизации обучения малой языковой модели на CPU показывает, что за год ИИ-системы прошли путь от 2,9х до 52-кратного ускорения исходного кода.
Для сравнения, человеку на 4х ускорение, по данным Anthropic, требуется 4–8 часов работы.При этом Кларк делает несколько оговорок. Он не ожидает, что полностью автоматизированная разработка ИИ произойдёт в 2026 году. Первый прецедент схемы "модель сама обучает преемника" он допускает в течение года-двух и не на самых передовых моделях. Кларк также признаёт, что ИИ пока не способен генерировать радикально новые идеи и подходит в первую очередь для рутинной инженерной работы, составляющей, по его оценке, основную часть исследований в области. @ai_machinelearning_big_data
CocoIndex - специализированный опенсорсный инкрементальный ETL-движок (Extract, Transform, Load) для создания ИИ-систем. Он используется для автоматизации обработки данных и их мгновенной индексации в векторные базы или графы знаний. Инструмент любят за его способность обновлять информацию в реальном времени: как только исходные данные меняются, CocoIndex точечно пересчитывает только нужные части индекса, избавляя от необходимости полной и дорогостоящей переиндексации всей базы.🟡Главное изменение v1 - полный отказ от DSL Весь пайплайн теперь описывается обычными асинхронными функциями Python, которые вызывают друг друга. Движок продолжает отслеживать изменения и материализовать целевые состояния, но делает это за нативным Python-API, а не за отдельной системой типов.
Авторы вдохновлялись тезисом Джеффа Дина и Билла Далли с GTC 2026: агенты работают примерно в 50 раз быстрее человека, но опираются на инструменты, рассчитанные на человеческий темп. Ночные пересборки индексов в этой логике становятся проблемой - нужен движок, который синхронизирует производные данные с источником инкрементально, переобрабатывая только изменившиеся чанки и перезаписывая только изменившиеся строки.🟡Помимо отказа от DSL, релиз принёс ещё 3 изменения 🟢Во-первых, движок использует систему типов самого Python: PIL.Image, pyarrow.Table, torch.Tensor и любой класс из импортированной библиотеки можно передавать в функции напрямую, без обёрток и двусторонней конверсии. 🟢Во-вторых, Postgres больше не нужен - состояние движка хранится в одном локальном файле. Postgres остался полноценным таргетом, просто перестал быть обязательной зависимостью. 🟢В-третьих, источники и таргеты создаются во время выполнения: можно монтировать отдельный таргет на каждого тенанта, строить топологию по строкам конфигурационной таблицы или подключать Kafka-топик по фича-флагу. 🟡Ядро по-прежнему на Rust Вся горячая логика по детекции и применению изменений живёт там. На уровне Python декоратор подключает функцию к отслеживанию изменений, а отдельный флаг кеширует её результат по хешу аргументов и кода: правка хелпера инвалидирует только тех вызывающих, кто реально от него зависит. 🟡Контракт управляемых таргетов сохранился Разработчик декларирует, как должна выглядеть таблица, граф или директория, а CocoIndex сам выполняет create/alter/drop для контейнеров и insert/update/delete для содержимого, включая удаление осиротевших объектов при изменении схемы. Если перестать декларировать сущность, она исчезает из таргета. Контракт работает одинаково для Postgres, LanceDB, Neo4j, Kafka, S3 и обычных файлов на диске. Примеры пайплайнов, от эмбеддингов кода в LanceDB и обработки PDF до сборки графа знаний из разговоров, лежат в репозитории на GitHub. 📌Лицензирование: Apache 2.0 License. 🟡Документация 🖥 GitHub @ai_machinelearning_big_data #AI #ML #ETL #RAG #Agents #СocoIndex
В создании Nano Omni активно использовалось семейство Qwen разных поколений от 2.5 до 3.5 - как чисто языковые, так и VL и GPT-OSS-120B🟡Под капотом гибрид из Mamba2 и MoE Визуальный тракт построен на энкодере CRADIO v4-H, аудио - на Parakeet. Контекстное окно - до 256 тыс. токенов. Модель поддерживает ризонинг с СоТ, JSON-вывод, tool calling и пословные таймштампы для транскрипции. На вход принимаются видео длиной до 2-х минут, аудио длиной до часа, изображения и текст. Язык один - английский.
Со слов NVIDIA, при сопоставимой интерактивности модель выдаёт до 9х пропускной способности относительно других открытых omni-моделей.Самый показательный пример - на OSWorld (навигация по GUI): 47,4 против 11,1 у предыдущей Nemotron Nano VL V2. На OCRBenchV2 — 67,04, на Video MME — 72,2, на Daily Omni — 74,52. Опубликованы 3 варианта весов: BF16 (61,5 ГБ), FP8 (32,8 ГБ) и NVFP4 (20,9 ГБ, 4,98 бит). Визуальный и аудио-энкодеры вместе с MLP-проекторами в обоих случаях оставлены в BF16. На девяти не-ASR бенчмарках оба квантованных варианта в среднем теряют меньше 0,4 пункта относительно BF16 — NVFP4 вписывается в рабочие станции и edge-устройства практически без потерь качества. Инференс поддерживается на vLLM, TensorRT-LLM, TensorRT Edge-LLM, llama.cpp, Ollama и SGLang. Модель доступна на Hugging Face, OpenRouter, build.nvidia.com и в каталоге NGC как NIM-микросервис.
По данным NVIDIA, семейство Nemotron 3 за прошлый год скачали более 50 миллионов раз и Omni-вариант должен расширить линейку в мультимодальный и агентный контур.📌Лицензирование: NVIDIA Open Model License 🟡Статья 🟡Модель @ai_machinelearning_big_data #AI #ML #MMLM #NemotronNanoOmni #NVIDIA
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
