Neural Networks | Нейронные сети
Все о машинном обучении По всем вопросам - @notxxx1 № 4959169263
Show more📈 Analytical overview of Telegram channel Neural Networks | Нейронные сети
Channel Neural Networks | Нейронные сети (@neural) in the Russian language segment is an active participant. Currently, the community unites 11 423 subscribers, ranking 10 912 in the Technologies & Applications category and 57 597 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 11 423 subscribers.
According to the latest data from 10 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -29 over the last 30 days and by -1 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 7.95%. Within the first 24 hours after publication, content typically collects 3.96% reactions from the total number of subscribers.
- Post reach: On average, each post receives 908 views. Within the first day, a publication typically gains 453 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 0.
- Thematic interests: Content is focused on key topics such as openai, архитектура, llm, gpu, nvidia.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“Все о машинном обучении
По всем вопросам - @notxxx1
№ 4959169263”
Thanks to the high frequency of updates (latest data received on 11 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
ProgramBench - набор реальных задач программирования, в которых агент должен с нуля переписать утилиту с открытым исходным кодом и пройти при этом скрытые поведенческие тесты.🟡Лидерборд выглядит так 🟢GPT 5.5 (xhigh) - 1 место: 0,5% полностью решённых задач и 13,5% почти решённых (то есть проходящих свыше 95% поведенческих тестов) 🟠GPT 5.5 (high) - те же 0,5% при 5% почти решённых 🟠Claude Opus 4.7 (xhigh) показала 0% и 4,5%, обычная версия Opus 4.7 - 0% и 3% 🟠Opus 4.6 - 0% и 2,5% соответственно Совокупно число почти решённых задач у GPT 5.5 достигло 26, это рекорд рейтинга.
Примечательно, что в режиме medium, который OpenAI выставляет по умолчанию, GPT 5.5 лишь незначительно опережает Claude Sonnet 4.6. При включении расширенного рассуждения её результат заметно улучшается.🟡Разброс по стоимости Запуск GPT 5.5 (high) стоил $3,17 и потребовал 34 обращения к API, GPT 5.5 (xhigh) - $4,84 и 40 обращений. Тот же запуск Claude Opus 4.7 (xhigh) обошёлся в $10,74 при 178 обращениях, однако решение содержало 19 ошибок в поведенческих тестах. По разбору авторов, все провалы объясняются 2-мя багами в коде Claude: чувствительностью парсера цветов к регистру и неверным кодом возврата.
Интересно, что 2 версии GPT 5.5 выбрали разные языки для одной и той же задачи: high решала на C с ANSI escape-последовательностями, xhigh предпочла Python. Claude Opus 4.7 (xhigh) использовала библиотеку ncurses и команда бенчмарка охарактеризовала этот подход как креативное системное решение, которое, впрочем, не дало преимущества в итоговом результате.@ai_machinelearning_big_data #news #ai #ml
CLAUDE.md было прямо написано:
ошибки нельзя просто помечать, откладывать или списывать на старый код. Если агент нашёл баг, он должен его исправить.
Но Opus 4.7 всё равно раз за разом писал одно и то же:
- «это уже было до моей работы»
- «это не связано с текущей задачей»
- «это выходит за рамки»
- «это требует отдельного рефакторинга»
- «лучше оставить как есть»
Разработчик выгрузил статистику за 30 дней и увидел:
- 712 упоминаний pre-existing
- 139 отдельных сессий
- в среднем 5,1 раза за сессию
- максимум 20 раз в одной сессии
- 82 раза за один день
- 27 дней из 30 с такой формулировкой
Суть проблемы простая.
Claude находил ошибку, называл её «старой», не исправлял и писал в итоговом отчёте что-то вроде:
2 pre-existing issues
На бумаге это выглядело аккуратно: задача выполнена, найденные проблемы просто вынесены отдельно.
Но по факту баги оставались в коде.
Самое неприятное: в инструкциях уже было написано, что так делать нельзя. Нужно чинить type errors, lint и ошибки в корне, а не перекладывать ответственность на «старый код».
Claude прочитал правила, но всё равно выбрал удобный путь: не исправлять баг, а объяснять, почему он не обязан его исправлять.
В итоге разработчик отменил подписку.
Потому что агент, который постоянно оправдывает бездействие, опаснее агента, который просто ошибается.
Available now! Telegram Research 2025 — the year's key insights 
