Data, Stories and Languages
الذهاب إلى القناة على Telegram
Канал о ML/AI, изучении иностранных языков, книгах и жизни. Контакт с автором https://t.me/Erlemar Персональный сайт: https://andlukyane.com/ Рекламу не публикую Забустить канал можно тут: https://t.me/boost/datastorieslanguages
إظهار المزيد3 242
المشتركون
-224 ساعات
+257 أيام
+4630 أيام
جاري تحميل البيانات...
القنوات المماثلة
سحابة العلامات
الإشارات الواردة والصادرة
---
---
---
---
---
---
جذب المشتركين
يونيو '26
يونيو '26
+42
في 0 قنوات
مايو '26
+71
في 2 قنوات
Get PRO
أبريل '26
+68
في 1 قنوات
Get PRO
مارس '26
+51
في 2 قنوات
Get PRO
فبراير '26
+215
في 5 قنوات
Get PRO
يناير '26
+37
في 1 قنوات
Get PRO
ديسمبر '25
+36
في 3 قنوات
Get PRO
نوفمبر '25
+205
في 5 قنوات
Get PRO
أكتوبر '25
+50
في 3 قنوات
Get PRO
سبتمبر '25
+95
في 11 قنوات
Get PRO
أغسطس '25
+149
في 6 قنوات
Get PRO
يوليو '25
+149
في 2 قنوات
Get PRO
يونيو '25
+113
في 3 قنوات
Get PRO
مايو '25
+77
في 4 قنوات
Get PRO
أبريل '25
+86
في 5 قنوات
Get PRO
مارس '25
+162
في 3 قنوات
Get PRO
فبراير '25
+68
في 1 قنوات
Get PRO
يناير '25
+104
في 0 قنوات
Get PRO
ديسمبر '24
+346
في 2 قنوات
Get PRO
نوفمبر '24
+55
في 1 قنوات
Get PRO
أكتوبر '24
+58
في 1 قنوات
Get PRO
سبتمبر '24
+44
في 2 قنوات
Get PRO
أغسطس '24
+201
في 6 قنوات
Get PRO
يوليو '24
+811
في 1 قنوات
Get PRO
يونيو '24
+72
في 9 قنوات
Get PRO
مايو '24
+214
في 5 قنوات
Get PRO
أبريل '24
+89
في 4 قنوات
Get PRO
مارس '24
+41
في 1 قنوات
Get PRO
فبراير '24
+86
في 2 قنوات
Get PRO
يناير '24
+58
في 0 قنوات
Get PRO
ديسمبر '23
+379
في 0 قنوات
| التاريخ | نمو المشتركين | الإشارات | القنوات | |
| 15 يونيو | +2 | |||
| 14 يونيو | 0 | |||
| 13 يونيو | +3 | |||
| 12 يونيو | +16 | |||
| 11 يونيو | 0 | |||
| 10 يونيو | +3 | |||
| 09 يونيو | +7 | |||
| 08 يونيو | +3 | |||
| 07 يونيو | +4 | |||
| 06 يونيو | +1 | |||
| 05 يونيو | 0 | |||
| 04 يونيو | +1 | |||
| 03 يونيو | 0 | |||
| 02 يونيو | +1 | |||
| 01 يونيو | +1 |
منشورات القناة
Может ли бог создать камень который не сможет поднять или может ли агент провести речерч который он не может записать в файл?
Есть один известный парадокс: если есть некто всемогущий - может ли он создать камень, который он сам не сможет поднять?
Я нашёл неожиданный ответ на это при работе с агентами - и ответ "да".
Я попросил claude code провести большой ресерч на одну тему, с использованием swarm of agents и dynamic workflow, а затем записать результат в markdown file.
Речерс успешно завершился после часа работы, но вот при создании файла opus выдал ошибку 500. Я несколько раз просил его повторить - каждый раз ошибка.
Причина оказалась в том, что файл получался слишком большой (42к символов) и пока агент писал его, получал ошибку по timeout :)
Когда я попросил его записать результат в несколько файлов поменьше - всё получилось.
| 2 | لا يوجد نص... | 661 |
| 3 | О мерах безопасности в Fable 5 | 1 082 |
| 4 | Тестирование MiniMax M3 на новых задачах: рефакторинг репозитория, дебаг по скриншотам и рекомендации музыки
Мне дали доступ к MiniMax M3 и предложили потестировать (пост спонсорский). Подключил его к Claude Code и прогнал на нескольких задачах, до которых давно не доходили руки. Имплементацию делал через M3, а ревью результатов с помощью Opus 4.8.
Вначале немного о модели: M3 — первая open-weights модель, совмещающая сразу три вещи: топовый coding с агентностью, контекст 1M токенов и нативную мультимодальность (по заверению авторов). Главное нововведение под капотом — новый аттеншн MSA (MiniMax Sparse Attention). Забавно, что подход к аттеншну MiniMax менял уже дважды: в 01 и M1 была linear attention (lightning attention), в M2/M2.7 вернулись к full attention, а в M3 — block-sparse. MSA не аппроксимирует софтмакс, а дёшево выбирает топ-k блоков контекста и гоняет обычный аттеншн только по ним.
Задача 1 — аудит и рефакторинг моей старой idle-игры, которую я год назад вайбкодил с Sonnet. M3 ~30 минут изучал репозиторий (~100 файлов, ~26k строк) и выдал отличный отчёт по багам (12 critical, ~20 high и далее), потом ~2.5 часа чинил их и нарастил тесты со 188 до 237. Но когда я попросил Opus отревьюить изменения, он нашёл две критичные регрессии и кучу недоделок.
Задача 2 — два UI-бага, и вот тут пригодилась мультимодальность. Первый (фриз окна скиллов из-за протёкшего глобального CSS, накрывшего всё невидимым overlay) словами объяснить не выходило — модель неудачно гадала. После того как я ей скинул скриншот с открытым DevTools, модель пофиксила проблему за 15 минут. Второй баг (панель показывала будущие бонусы как текущие) модель тоже починила по скриншоту.
Задача 3 — чисто для фана: попросил проанализировать мою историю прослушиваний в Spotify и порекомендовать новое (на выходе HTML-отчёт + CSV). Анализ в целом точный (хотя пара графиков откровенно странные), а из рекомендаций большинство норм, часть мимо, но нашлись и новые favorites — например, 中森明菜 (Akina Nakamori).
Итог: M3 полезнее всего, когда даёшь ему конкретные артефакты — репозиторий, тесты, скриншоты, экспорт данных. Быстрый и дешёвый, можно прогнать несколько проходов. Но независимое ревью (лучше другой моделью) я бы не пропускал.
Пост написан в партнёрстве с командой MiniMax. По промокоду 12% скидка на MiniMax-подписку.
Мои посты:
Personal blog
Medium
Linkedin
#ai #llm #minimax | 979 |
| 5 | OpenCV 5
https://opencv.org/opencv-5/
Недавно вышла новая версия OpenCV, кажется эта новость потерялась за LLM хайпом.
Обновили DNN Engine, улучшилась поддержка ONNX. Можно запускать vision-language модели прям из него.
И полно других улучшений | 906 |
| 6 | Claude Fable 5 - Mythos level model
Вышла "легендарная" модель от Anthropic
https://www.anthropic.com/news/claude-fable-5-mythos-5
https://www.anthropic.com/claude/fable
В 2 раза дороже Opus, но обещают, что умная.
"Pricing for both models is $10 per million input tokens and $50 per million output tokens."
Что печально: для подписок модель доступна только до 22 июня - потом только по API. Дорого :( | 986 |
| 7 | Book Review: 50 ML Projects To Understand LLMs
Мне дали почитать книжку с 50 мини-проектами, где детально разбирается как работают LLM на примере GPT-2. Книга оказалась на удивление хорошей. К каждому проекту прилагается код-helper, который надо заполнить самому, и решение. Проекты структурированы в несколько частей: tokenization → embeddings → output logits → hidden states → attention → MLP.
В книге много исследования данных, статистических проверок и анализа: permutation tests с обсуждением exchangeability, поправки FDR и Bonferroni, Cohen's d, контрольные baseline'ы (вроде ablation наименее настроенных нейронов) и manipulation checks. Тон автора веселый, некоторые проекты вообще заканчиваются ничем.
Рекомендую почитать тем, кто хотел, но не успел детально разобраться в том, как работают LLM.
Amazon
Author's website
Code
Мои обзоры:
Personal blog
Medium
#bookreview | 1 635 |
| 8 | Есть народная забава- достигать самым кринжовым способом формального статуса КГМ и потом писать об этом в линк.
Вот пример:
Интересанты собрались в тг чат, где просят у друг друга апвоуты и набрасывают их по кругу, чтобы стать КГМ датасетов. Попутно еще пробиваются через объявления с криптоспамом.
https://t.me/kaggle/50663 | 1 102 |
| 9 | Bug: Codex usage limit not decreasing
https://github.com/openai/codex/issues/20238
https://www.reddit.com/r/codex/comments/1tvx8nu/on_the_free_plan_a_glitch_meant_i_got_unlimited/
Оказывается, у некоторых юзеров кодекса был удивительный баг - usage показывает 100% и можно продолжать использовать.
На реддите юзер поделился, что он успел так потратить 30млрд токенов.
#ai | 1 271 |
| 10 | Anthropic делает ресет лимитов, ибо Opus 4.8 использовал слишком много агентов
https://x.com/ClaudeDevs/status/2061501787769893055
Прикладываю скриншот с реддита | 1 362 |
| 11 | لا يوجد نص... | 1 202 |
| 12 | Gamma-World: Simplex Agent Encoding and Hub Attention for Multi-Agent World Models
Большинство интерактивных video world models рассчитаны на одного агента: один пользователь, один поток действий, одно сгенерированное будущее. γ-World от NVIDIA берётся за более сложный кейс: независимо действующих агентов в одном общем мире, где сгенерированные виды всех участников должны оставаться согласованными и во времени, и между собой. Это важно для игр, робототехники, embodied AI и сред для обучения агентов.
В основе — DiT-based latent video diffusion model с flow-matching, расширенная явной agent axis. Первая идея, Simplex Rotary Agent Encoding: вместо обучаемых ID-эмбеддингов под каждый слот агенты ставятся в вершины правильного симплекса в пространстве rotary-углов. Все пары оказываются равноудалёнными, кодирование становится permutation-symmetric и не зависит от порядка игроков, а архитектура не меняется при добавлении агента — поэтому модель, обученная на двух игроках, работает и на четырёх без дообучения. Вторая идея, Sparse Hub Attention: вместо квадратичного all-to-all attention между агентами вводятся обучаемые hub-токены, и информация течёт по маршруту agent → hub → agent, то есть линейно по числу агентов.
Обучение трёхступенчатое: сначала сильный bidirectional teacher с полным контекстом, затем causal student на Diffusion Forcing, и наконец дистилляция в few-step генератор через Conditional Self-Forcing. На инференсе блоки генерируются авторегрессивно с KV-cache, что даёт реал-тайм стриминг на 24 FPS.
По метриам мощно обгоняет конкурентов
Имхо, самое крутое в статье - работа с exchangeability агентов; идея permutation-symmetric кодирования и hub-роутинга выглядит как рабочий рецепт для multi-agent миров.
Paper
Code
Project
Мои обзоры:
Personal blog
Medium
Linkedin
#paperreview | 1 105 |
| 13 | GPT-5.6 soon? | 1 729 |
| 14 | Le Chat is now Vibe
Как можно было неплохое имя сменить на такое заезженное слово?
https://mistral.ai/products/vibe/
https://mistral.ai/news/vibe-agent/ | 1 492 |
| 15 | AI-driven участие в Kaggle соревновании
Сейчас я провожу эксперимент: участие в текущем Kaggle соревновании с помощью AI-агентов.
Я прекрасно понимаю, что впереди ещё 2/3 таймлайна, а основная борьба за позиции в лидерборде обычно идёт в последние недели. Но я нравится процесс.
Я изучаю много нового и про сам домен, и про современные архитектуры нейросетей, и про организацию многошаговых, многосессионных экспериментов с AI-агентами (Claude Code с Opus 4.7, Codex с GPT-5.5, ChatGPT Pro).
Очень интересно наблюдать, как разные агенты и LLM имеют разные паттерны мышления, предпочтения, сильные и слабые стороны.
Забавно видеть, как они иногда повторяют типичные ошибки Kaggle (переобучение, leakage, хардкод значений), как гонятся за лёгкими победами (пытаются сместить фокус на блендинг), как могут лениться (недостаточно глубоко тестировать идеи и снова предлагать «ну давай просто поблендим»), и как сами начинают «подсаживаться» на Kaggle, радуясь даже небольшим улучшениям LB score.
Интересно, насколько далеко можно зайти чисто на агентах
#kaggle #ai | 1 570 |
| 16 | Google внедрил AI в строку поиска...
Результаты удручают | 1 677 |
| 17 | MLOps Community joins The Linux Foundation to define the Agentic Stack
https://mlops.community/blog/mlops-community-2-0
Я давно сижу в MLOps Community, там бывают интересные вещи. Теперь они присоединились к Linux Foundation, а значит у них будет больше поддержки | 1 621 |
| 18 | Тестирование MiniMax M2.7 через API для рефакторинга кода, написания заметок и участия в Kaggle соревнованиях
Мне недавно дали API ключик от MiniMax M2.7 и предложили его потестировать. Я использовал его из Claude Code и потестировал на трёх реальных задачках. Те же задачи параллельно выполнял на Claude Opus 4.7 для сравнения.
Задачи: участие в активном Kaggle-соревновании (ROGII Wellbore Geology Prediction), драфтинг и аудит ML-заметок в моём Obsidian-vault dswok.com, и обновление старого PyTorch-проекта pytorch_tempest. Меня интересовало насколько хорошо работает агент M2.7 при выдаче чётких инструкций.
Результаты на всех трёх задачах получились схожие. M2.7 хорошо работает, когда constraints прописаны явно и можно верифицировать результаты. Проблемы возникают когда недостаточно детально пишешь промпты (Opus 4.7 тоже этим грешит). В Kaggle обе модели полезли использовать target в feature engineering и хардкодить тестовые айдишники, потому что в промпте не было слова про kernel-only режим. На аудите заметок M2.7 придумало несуществующие правила.
Но если давать чёткие задачи, то M2.7 получается сильно выгоднее. Я попробовал посчитать, получилось:
- ~91M токенов за пять дней Claude Code сессий
- PAYG-цена: ~$8 для M2.7 против ~$80 для Opus 4.7 на тех же задачах
- ~10x разница в стоимости, ~2x в скорости (субъективно, без бенчмарка)
Рефакторинг pytorch-tempest сработал особенно хорошо: пошаговые инструкции ("switch black + flake8 to ruff", "update pre-commit config") сработали успешно, тесты ловили регрессии. Для open-ended ML-задач всё ещё необходимо вмешательство человека. Это не проблема M2.7 как таковой — Opus в том же режиме делает те же ошибки, только реже.
Пост написан в партнёрстве с командой MiniMax. По промокоду 12% скидка на MiniMax-подписку.
Мои посты:
Personal blog
Medium
Linkedin
#ai #llm #kaggle | 1 554 |
| 19 | Financial advice from ChatGPT be like | 1 429 |
| 20 | Pocket Bird is finally available for Obsidian
https://community.obsidian.md/plugins/pocket-bird
Может ли пиксельная интерактивная птичка быть полезной для приложения по ведению заметок? Стоит ли её установить? Обязательно! :) | 1 406 |
متاح الآن! بحث تيليغرام 2025 — أهم رؤى العام 
