Neural Networks | Нейронные сети
Все о машинном обучении По всем вопросам - @notxxx1 № 4959169263
Mostrar más📈 Análisis del canal de Telegram Neural Networks | Нейронные сети
El canal Neural Networks | Нейронные сети (@neural) en el segmento lingüístico de Ruso es un actor destacado. Actualmente la comunidad reúne a 11 423 suscriptores, ocupando la posición 10 912 en la categoría Tecnologías y Aplicaciones y el puesto 57 597 en la región Rusia.
📊 Métricas de audiencia y dinámica
Desde su creación el невідомо, el proyecto ha mostrado un crecimiento acelerado, reuniendo a 11 423 suscriptores.
Según los últimos datos del 10 junio, 2026, el canal mantiene una actividad estable. En los últimos 30 días la variación de miembros fue de -29, y en las últimas 24 horas de -1, conservando un alto alcance.
- Estado de verificación: No verificado
- Tasa de interacción (ER): El promedio de interacción de la audiencia es 7.95%. Durante las primeras 24 horas tras publicar, el contenido suele obtener 3.96% de reacciones respecto al total de suscriptores.
- Alcance de las publicaciones: Cada publicación recibe en promedio 908 visualizaciones. En el primer día suele acumular 453 visualizaciones.
- Reacciones e interacción: La audiencia responde de forma activa: el promedio de reacciones por publicación es 0.
- Intereses temáticos: El contenido se centra en temas clave como openai, архитектура, llm, gpu, nvidia.
📝 Descripción y política de contenido
El autor describe el recurso como un espacio para expresar opiniones subjetivas:
“Все о машинном обучении
По всем вопросам - @notxxx1
№ 4959169263”
Gracias a la alta frecuencia de actualizaciones (últimos datos recibidos el 11 junio, 2026), el canal mantiene la vigencia y un amplio alcance. La analítica demuestra que la audiencia interactúa activamente con el contenido, lo que lo convierte en un punto de referencia dentro de la categoría Tecnologías y Aplicaciones.
ProgramBench - набор реальных задач программирования, в которых агент должен с нуля переписать утилиту с открытым исходным кодом и пройти при этом скрытые поведенческие тесты.🟡Лидерборд выглядит так 🟢GPT 5.5 (xhigh) - 1 место: 0,5% полностью решённых задач и 13,5% почти решённых (то есть проходящих свыше 95% поведенческих тестов) 🟠GPT 5.5 (high) - те же 0,5% при 5% почти решённых 🟠Claude Opus 4.7 (xhigh) показала 0% и 4,5%, обычная версия Opus 4.7 - 0% и 3% 🟠Opus 4.6 - 0% и 2,5% соответственно Совокупно число почти решённых задач у GPT 5.5 достигло 26, это рекорд рейтинга.
Примечательно, что в режиме medium, который OpenAI выставляет по умолчанию, GPT 5.5 лишь незначительно опережает Claude Sonnet 4.6. При включении расширенного рассуждения её результат заметно улучшается.🟡Разброс по стоимости Запуск GPT 5.5 (high) стоил $3,17 и потребовал 34 обращения к API, GPT 5.5 (xhigh) - $4,84 и 40 обращений. Тот же запуск Claude Opus 4.7 (xhigh) обошёлся в $10,74 при 178 обращениях, однако решение содержало 19 ошибок в поведенческих тестах. По разбору авторов, все провалы объясняются 2-мя багами в коде Claude: чувствительностью парсера цветов к регистру и неверным кодом возврата.
Интересно, что 2 версии GPT 5.5 выбрали разные языки для одной и той же задачи: high решала на C с ANSI escape-последовательностями, xhigh предпочла Python. Claude Opus 4.7 (xhigh) использовала библиотеку ncurses и команда бенчмарка охарактеризовала этот подход как креативное системное решение, которое, впрочем, не дало преимущества в итоговом результате.@ai_machinelearning_big_data #news #ai #ml
CLAUDE.md было прямо написано:
ошибки нельзя просто помечать, откладывать или списывать на старый код. Если агент нашёл баг, он должен его исправить.
Но Opus 4.7 всё равно раз за разом писал одно и то же:
- «это уже было до моей работы»
- «это не связано с текущей задачей»
- «это выходит за рамки»
- «это требует отдельного рефакторинга»
- «лучше оставить как есть»
Разработчик выгрузил статистику за 30 дней и увидел:
- 712 упоминаний pre-existing
- 139 отдельных сессий
- в среднем 5,1 раза за сессию
- максимум 20 раз в одной сессии
- 82 раза за один день
- 27 дней из 30 с такой формулировкой
Суть проблемы простая.
Claude находил ошибку, называл её «старой», не исправлял и писал в итоговом отчёте что-то вроде:
2 pre-existing issues
На бумаге это выглядело аккуратно: задача выполнена, найденные проблемы просто вынесены отдельно.
Но по факту баги оставались в коде.
Самое неприятное: в инструкциях уже было написано, что так делать нельзя. Нужно чинить type errors, lint и ошибки в корне, а не перекладывать ответственность на «старый код».
Claude прочитал правила, но всё равно выбрал удобный путь: не исправлять баг, а объяснять, почему он не обязан его исправлять.
В итоге разработчик отменил подписку.
Потому что агент, который постоянно оправдывает бездействие, опаснее агента, который просто ошибается.
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
