Neural Networks | Нейронные сети
Все о машинном обучении По всем вопросам - @notxxx1 № 4959169263
Ko'proq ko'rsatish📈 Telegram kanali Neural Networks | Нейронные сети analitikasi
Neural Networks | Нейронные сети (@neural) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 11 423 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 10 912-o'rinni va Rossiya mintaqasida 57 597-o'rinni egallagan.
📊 Auditoriya ko‘rsatkichlari va dinamika
невідомо sanasidan buyon loyiha tez o‘sib, 11 423 obunachiga ega bo‘ldi.
10 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -29 ga, so‘nggi 24 soatda esa -1 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.
- Tasdiqlash holati: Tasdiqlanmagan
- Jalb etish (ER): Auditoriya o‘rtacha 7.95% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 3.96% ini tashkil etuvchi reaksiyalarni to‘playdi.
- Post qamrovi: Har bir post o‘rtacha 908 marta ko‘riladi; birinchi sutkada odatda 453 ta ko‘rish yig‘iladi.
- Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 0 ta reaksiya keladi.
- Tematik yo‘nalishlar: Kontent openai, архитектура, llm, gpu, nvidia kabi asosiy mavzularga jamlangan.
📝 Tavsif va kontent siyosati
Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Все о машинном обучении
По всем вопросам - @notxxx1
№ 4959169263”
Yuqori yangilanish chastotasi (oxirgi ma’lumot 11 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.
ProgramBench - набор реальных задач программирования, в которых агент должен с нуля переписать утилиту с открытым исходным кодом и пройти при этом скрытые поведенческие тесты.🟡Лидерборд выглядит так 🟢GPT 5.5 (xhigh) - 1 место: 0,5% полностью решённых задач и 13,5% почти решённых (то есть проходящих свыше 95% поведенческих тестов) 🟠GPT 5.5 (high) - те же 0,5% при 5% почти решённых 🟠Claude Opus 4.7 (xhigh) показала 0% и 4,5%, обычная версия Opus 4.7 - 0% и 3% 🟠Opus 4.6 - 0% и 2,5% соответственно Совокупно число почти решённых задач у GPT 5.5 достигло 26, это рекорд рейтинга.
Примечательно, что в режиме medium, который OpenAI выставляет по умолчанию, GPT 5.5 лишь незначительно опережает Claude Sonnet 4.6. При включении расширенного рассуждения её результат заметно улучшается.🟡Разброс по стоимости Запуск GPT 5.5 (high) стоил $3,17 и потребовал 34 обращения к API, GPT 5.5 (xhigh) - $4,84 и 40 обращений. Тот же запуск Claude Opus 4.7 (xhigh) обошёлся в $10,74 при 178 обращениях, однако решение содержало 19 ошибок в поведенческих тестах. По разбору авторов, все провалы объясняются 2-мя багами в коде Claude: чувствительностью парсера цветов к регистру и неверным кодом возврата.
Интересно, что 2 версии GPT 5.5 выбрали разные языки для одной и той же задачи: high решала на C с ANSI escape-последовательностями, xhigh предпочла Python. Claude Opus 4.7 (xhigh) использовала библиотеку ncurses и команда бенчмарка охарактеризовала этот подход как креативное системное решение, которое, впрочем, не дало преимущества в итоговом результате.@ai_machinelearning_big_data #news #ai #ml
CLAUDE.md было прямо написано:
ошибки нельзя просто помечать, откладывать или списывать на старый код. Если агент нашёл баг, он должен его исправить.
Но Opus 4.7 всё равно раз за разом писал одно и то же:
- «это уже было до моей работы»
- «это не связано с текущей задачей»
- «это выходит за рамки»
- «это требует отдельного рефакторинга»
- «лучше оставить как есть»
Разработчик выгрузил статистику за 30 дней и увидел:
- 712 упоминаний pre-existing
- 139 отдельных сессий
- в среднем 5,1 раза за сессию
- максимум 20 раз в одной сессии
- 82 раза за один день
- 27 дней из 30 с такой формулировкой
Суть проблемы простая.
Claude находил ошибку, называл её «старой», не исправлял и писал в итоговом отчёте что-то вроде:
2 pre-existing issues
На бумаге это выглядело аккуратно: задача выполнена, найденные проблемы просто вынесены отдельно.
Но по факту баги оставались в коде.
Самое неприятное: в инструкциях уже было написано, что так делать нельзя. Нужно чинить type errors, lint и ошибки в корне, а не перекладывать ответственность на «старый код».
Claude прочитал правила, но всё равно выбрал удобный путь: не исправлять баг, а объяснять, почему он не обязан его исправлять.
В итоге разработчик отменил подписку.
Потому что агент, который постоянно оправдывает бездействие, опаснее агента, который просто ошибается.
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
