ch
Feedback
Data, Stories and Languages

Data, Stories and Languages

前往频道在 Telegram

Канал о ML/AI, изучении иностранных языков, книгах и жизни. Контакт с автором https://t.me/Erlemar Персональный сайт: https://andlukyane.com/ Рекламу не публикую Забустить канал можно тут: https://t.me/boost/datastorieslanguages

显示更多
3 242
订阅者
-224 小时
+257
+4630
吸引订阅者
六月 '26
六月 '26
+42
在0个频道中
五月 '26
+71
在2个频道中
Get PRO
四月 '26
+68
在1个频道中
Get PRO
三月 '26
+51
在2个频道中
Get PRO
二月 '26
+215
在5个频道中
Get PRO
一月 '26
+37
在1个频道中
Get PRO
十二月 '25
+36
在3个频道中
Get PRO
十一月 '25
+205
在5个频道中
Get PRO
十月 '25
+50
在3个频道中
Get PRO
九月 '25
+95
在11个频道中
Get PRO
八月 '25
+149
在6个频道中
Get PRO
七月 '25
+149
在2个频道中
Get PRO
六月 '25
+113
在3个频道中
Get PRO
五月 '25
+77
在4个频道中
Get PRO
四月 '25
+86
在5个频道中
Get PRO
三月 '25
+162
在3个频道中
Get PRO
二月 '25
+68
在1个频道中
Get PRO
一月 '25
+104
在0个频道中
Get PRO
十二月 '24
+346
在2个频道中
Get PRO
十一月 '24
+55
在1个频道中
Get PRO
十月 '24
+58
在1个频道中
Get PRO
九月 '24
+44
在2个频道中
Get PRO
八月 '24
+201
在6个频道中
Get PRO
七月 '24
+811
在1个频道中
Get PRO
六月 '24
+72
在9个频道中
Get PRO
五月 '24
+214
在5个频道中
Get PRO
四月 '24
+89
在4个频道中
Get PRO
三月 '24
+41
在1个频道中
Get PRO
二月 '24
+86
在2个频道中
Get PRO
一月 '24
+58
在0个频道中
Get PRO
十二月 '23
+379
在0个频道中
日期
订阅者增长
提及
频道
15 六月+2
14 六月0
13 六月+3
12 六月+16
11 六月0
10 六月+3
09 六月+7
08 六月+3
07 六月+4
06 六月+1
05 六月0
04 六月+1
03 六月0
02 六月+1
01 六月+1
频道帖子
Может ли бог создать камень который не сможет поднять или может ли агент провести речерч который он не может записать в файл? Есть один известный парадокс: если есть некто всемогущий - может ли он создать камень, который он сам не сможет поднять? Я нашёл неожиданный ответ на это при работе с агентами - и ответ "да". Я попросил claude code провести большой ресерч на одну тему, с использованием swarm of agents и dynamic workflow, а затем записать результат в markdown file. Речерс успешно завершился после часа работы, но вот при создании файла opus выдал ошибку 500. Я несколько раз просил его повторить - каждый раз ошибка. Причина оказалась в том, что файл получался слишком большой (42к символов) и пока агент писал его, получал ошибку по timeout :) Когда я попросил его записать результат в несколько файлов поменьше - всё получилось.

2
没有文字...
661
3
​​О мерах безопасности в Fable 5
1 082
4
​​Тестирование MiniMax M3 на новых задачах: рефакторинг репозитория, дебаг по скриншотам и рекомендации музыки Мне дали доступ к MiniMax M3 и предложили потестировать (пост спонсорский). Подключил его к Claude Code и прогнал на нескольких задачах, до которых давно не доходили руки. Имплементацию делал через M3, а ревью результатов с помощью Opus 4.8. Вначале немного о модели: M3 — первая open-weights модель, совмещающая сразу три вещи: топовый coding с агентностью, контекст 1M токенов и нативную мультимодальность (по заверению авторов). Главное нововведение под капотом — новый аттеншн MSA (MiniMax Sparse Attention). Забавно, что подход к аттеншну MiniMax менял уже дважды: в 01 и M1 была linear attention (lightning attention), в M2/M2.7 вернулись к full attention, а в M3 — block-sparse. MSA не аппроксимирует софтмакс, а дёшево выбирает топ-k блоков контекста и гоняет обычный аттеншн только по ним. Задача 1 — аудит и рефакторинг моей старой idle-игры, которую я год назад вайбкодил с Sonnet. M3 ~30 минут изучал репозиторий (~100 файлов, ~26k строк) и выдал отличный отчёт по багам (12 critical, ~20 high и далее), потом ~2.5 часа чинил их и нарастил тесты со 188 до 237. Но когда я попросил Opus отревьюить изменения, он нашёл две критичные регрессии и кучу недоделок. Задача 2 — два UI-бага, и вот тут пригодилась мультимодальность. Первый (фриз окна скиллов из-за протёкшего глобального CSS, накрывшего всё невидимым overlay) словами объяснить не выходило — модель неудачно гадала. После того как я ей скинул скриншот с открытым DevTools, модель пофиксила проблему за 15 минут. Второй баг (панель показывала будущие бонусы как текущие) модель тоже починила по скриншоту. Задача 3 — чисто для фана: попросил проанализировать мою историю прослушиваний в Spotify и порекомендовать новое (на выходе HTML-отчёт + CSV). Анализ в целом точный (хотя пара графиков откровенно странные), а из рекомендаций большинство норм, часть мимо, но нашлись и новые favorites — например, 中森明菜 (Akina Nakamori). Итог: M3 полезнее всего, когда даёшь ему конкретные артефакты — репозиторий, тесты, скриншоты, экспорт данных. Быстрый и дешёвый, можно прогнать несколько проходов. Но независимое ревью (лучше другой моделью) я бы не пропускал. Пост написан в партнёрстве с командой MiniMax. По промокоду 12% скидка на MiniMax-подписку. Мои посты: Personal blog Medium Linkedin #ai #llm #minimax
979
5
​​OpenCV 5 https://opencv.org/opencv-5/ Недавно вышла новая версия OpenCV, кажется эта новость потерялась за LLM хайпом. Обновили DNN Engine, улучшилась поддержка ONNX. Можно запускать vision-language модели прям из него. И полно других улучшений
906
6
​​Claude Fable 5 - Mythos level model Вышла "легендарная" модель от Anthropic https://www.anthropic.com/news/claude-fable-5-mythos-5 https://www.anthropic.com/claude/fable В 2 раза дороже Opus, но обещают, что умная. "Pricing for both models is $10 per million input tokens and $50 per million output tokens." Что печально: для подписок модель доступна только до 22 июня - потом только по API. Дорого :(
986
7
​​Book Review: 50 ML Projects To Understand LLMs Мне дали почитать книжку с 50 мини-проектами, где детально разбирается как работают LLM на примере GPT-2. Книга оказалась на удивление хорошей. К каждому проекту прилагается код-helper, который надо заполнить самому, и решение. Проекты структурированы в несколько частей: tokenization → embeddings → output logits → hidden states → attention → MLP. В книге много исследования данных, статистических проверок и анализа: permutation tests с обсуждением exchangeability, поправки FDR и Bonferroni, Cohen's d, контрольные baseline'ы (вроде ablation наименее настроенных нейронов) и manipulation checks. Тон автора веселый, некоторые проекты вообще заканчиваются ничем. Рекомендую почитать тем, кто хотел, но не успел детально разобраться в том, как работают LLM. Amazon Author's website Code Мои обзоры: Personal blog Medium #bookreview
1 635
8
Есть народная забава- достигать самым кринжовым способом формального статуса КГМ и потом писать об этом в линк. Вот пример: И
Есть народная забава- достигать самым кринжовым способом формального статуса КГМ и потом писать об этом в линк. Вот пример: Интересанты собрались в тг чат, где просят у друг друга апвоуты и набрасывают их по кругу, чтобы стать КГМ датасетов. Попутно еще пробиваются через объявления с криптоспамом. https://t.me/kaggle/50663
1 102
9
Bug: Codex usage limit not decreasing https://github.com/openai/codex/issues/20238 https://www.reddit.com/r/codex/comments/1tvx8nu/on_the_free_plan_a_glitch_meant_i_got_unlimited/ Оказывается, у некоторых юзеров кодекса был удивительный баг - usage показывает 100% и можно продолжать использовать. На реддите юзер поделился, что он успел так потратить 30млрд токенов. #ai
1 271
10
​​Anthropic делает ресет лимитов, ибо Opus 4.8 использовал слишком много агентов https://x.com/ClaudeDevs/status/2061501787769893055 Прикладываю скриншот с реддита
1 362
11
没有文字...
1 202
12
​​Gamma-World: Simplex Agent Encoding and Hub Attention for Multi-Agent World Models Большинство интерактивных video world models рассчитаны на одного агента: один пользователь, один поток действий, одно сгенерированное будущее. γ-World от NVIDIA берётся за более сложный кейс: независимо действующих агентов в одном общем мире, где сгенерированные виды всех участников должны оставаться согласованными и во времени, и между собой. Это важно для игр, робототехники, embodied AI и сред для обучения агентов. В основе — DiT-based latent video diffusion model с flow-matching, расширенная явной agent axis. Первая идея, Simplex Rotary Agent Encoding: вместо обучаемых ID-эмбеддингов под каждый слот агенты ставятся в вершины правильного симплекса в пространстве rotary-углов. Все пары оказываются равноудалёнными, кодирование становится permutation-symmetric и не зависит от порядка игроков, а архитектура не меняется при добавлении агента — поэтому модель, обученная на двух игроках, работает и на четырёх без дообучения. Вторая идея, Sparse Hub Attention: вместо квадратичного all-to-all attention между агентами вводятся обучаемые hub-токены, и информация течёт по маршруту agent → hub → agent, то есть линейно по числу агентов. Обучение трёхступенчатое: сначала сильный bidirectional teacher с полным контекстом, затем causal student на Diffusion Forcing, и наконец дистилляция в few-step генератор через Conditional Self-Forcing. На инференсе блоки генерируются авторегрессивно с KV-cache, что даёт реал-тайм стриминг на 24 FPS. По метриам мощно обгоняет конкурентов Имхо, самое крутое в статье - работа с exchangeability агентов; идея permutation-symmetric кодирования и hub-роутинга выглядит как рабочий рецепт для multi-agent миров. Paper Code Project Мои обзоры: Personal blog Medium Linkedin #paperreview
1 105
13
​​GPT-5.6 soon?
1 729
14
​​Le Chat is now Vibe Как можно было неплохое имя сменить на такое заезженное слово? https://mistral.ai/products/vibe/ https://mistral.ai/news/vibe-agent/
1 492
15
​​AI-driven участие в Kaggle соревновании Сейчас я провожу эксперимент: участие в текущем Kaggle соревновании с помощью AI-агентов. Я прекрасно понимаю, что впереди ещё 2/3 таймлайна, а основная борьба за позиции в лидерборде обычно идёт в последние недели. Но я нравится процесс. Я изучаю много нового и про сам домен, и про современные архитектуры нейросетей, и про организацию многошаговых, многосессионных экспериментов с AI-агентами (Claude Code с Opus 4.7, Codex с GPT-5.5, ChatGPT Pro). Очень интересно наблюдать, как разные агенты и LLM имеют разные паттерны мышления, предпочтения, сильные и слабые стороны. Забавно видеть, как они иногда повторяют типичные ошибки Kaggle (переобучение, leakage, хардкод значений), как гонятся за лёгкими победами (пытаются сместить фокус на блендинг), как могут лениться (недостаточно глубоко тестировать идеи и снова предлагать «ну давай просто поблендим»), и как сами начинают «подсаживаться» на Kaggle, радуясь даже небольшим улучшениям LB score. Интересно, насколько далеко можно зайти чисто на агентах #kaggle #ai
1 570
16
​​Google внедрил AI в строку поиска... Результаты удручают
1 677
17
MLOps Community joins The Linux Foundation to define the Agentic Stack https://mlops.community/blog/mlops-community-2-0 Я давно сижу в MLOps Community, там бывают интересные вещи. Теперь они присоединились к Linux Foundation, а значит у них будет больше поддержки
1 621
18
Тестирование MiniMax M2.7 через API для рефакторинга кода, написания заметок и участия в Kaggle соревнованиях Мне недавно дали API ключик от MiniMax M2.7 и предложили его потестировать. Я использовал его из Claude Code и потестировал на трёх реальных задачках. Те же задачи параллельно выполнял на Claude Opus 4.7 для сравнения. Задачи: участие в активном Kaggle-соревновании (ROGII Wellbore Geology Prediction), драфтинг и аудит ML-заметок в моём Obsidian-vault dswok.com, и обновление старого PyTorch-проекта pytorch_tempest. Меня интересовало насколько хорошо работает агент M2.7 при выдаче чётких инструкций. Результаты на всех трёх задачах получились схожие. M2.7 хорошо работает, когда constraints прописаны явно и можно верифицировать результаты. Проблемы возникают когда недостаточно детально пишешь промпты (Opus 4.7 тоже этим грешит). В Kaggle обе модели полезли использовать target в feature engineering и хардкодить тестовые айдишники, потому что в промпте не было слова про kernel-only режим. На аудите заметок M2.7 придумало несуществующие правила. Но если давать чёткие задачи, то M2.7 получается сильно выгоднее. Я попробовал посчитать, получилось: - ~91M токенов за пять дней Claude Code сессий - PAYG-цена: ~$8 для M2.7 против ~$80 для Opus 4.7 на тех же задачах - ~10x разница в стоимости, ~2x в скорости (субъективно, без бенчмарка) Рефакторинг pytorch-tempest сработал особенно хорошо: пошаговые инструкции ("switch black + flake8 to ruff", "update pre-commit config") сработали успешно, тесты ловили регрессии. Для open-ended ML-задач всё ещё необходимо вмешательство человека. Это не проблема M2.7 как таковой — Opus в том же режиме делает те же ошибки, только реже. Пост написан в партнёрстве с командой MiniMax. По промокоду 12% скидка на MiniMax-подписку. Мои посты: Personal blog Medium Linkedin #ai #llm #kaggle
1 554
19
​​Financial advice from ChatGPT be like
1 429
20
​​Pocket Bird is finally available for Obsidian https://community.obsidian.md/plugins/pocket-bird Может ли пиксельная интерактивная птичка быть полезной для приложения по ведению заметок? Стоит ли её установить? Обязательно! :)
1 406