Big Data AI
@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста РКН: clck.ru/3Fmqxe
Show more📈 Analytical overview of Telegram channel Big Data AI
Channel Big Data AI (@bigdatai) in the Russian language segment is an active participant. Currently, the community unites 18 299 subscribers, ranking 7 239 in the Technologies & Applications category and 36 602 in the Russia region.
📊 Audience metrics and dynamics
Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 18 299 subscribers.
According to the latest data from 02 July, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -313 over the last 30 days and by -3 over the last 24 hours, overall reach remains high.
- Verification status: Not verified
- Engagement rate (ER): The average audience engagement rate is 7.38%. Within the first 24 hours after publication, content typically collects 3.30% reactions from the total number of subscribers.
- Post reach: On average, each post receives 1 351 views. Within the first day, a publication typically gains 605 views.
- Reactions and interaction: The audience actively supports content: the average number of reactions per post is 6.
- Thematic interests: Content is focused on key topics such as llm, openai, github, nvidia, deepseek.
📝 Description and content policy
The author describes the resource as a platform for expressing subjective opinions:
“@haarrp - админ
Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям
@data_analysis_ml - анализ данных
@ai_machinelearning_big_data
@itchannels_telegram - важное для программиста
РКН: clck.ru/3Fmqxe”
Thanks to the high frequency of updates (latest data received on 03 July, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.
Data loading in progress...
| Date | Subscriber Growth | Mentions | Channels | |
| 03 July | 0 | |||
| 02 July | +2 | |||
| 01 July | 0 |
| 2 | Обратный отсчет | 517 |
| 3 | Задача, которую Ньютон решил за один вечер
В июне 1696 года Иоганн Бернулли опубликовал в журнале Лейбница *Acta Eruditorum* математический вызов на 6 месяцев.
Даны две точки на разной высоте.
Какой формы должен быть спуск, чтобы тело съехало из верхней точки в нижнюю за минимальное время?
К январю ответил только Лейбниц и попросил больше времени, поэтому срок продлили до Пасхи.
Ньютон получил письмо с задачей вечером, когда вернулся с работы, и решил её до того, как лёг спать.
Эта задача называется задача брахистохроны.
Самый быстрый путь оказался не прямой линией, а циклоидой.
Пример:
Пусть верхняя точка:
A = (0, 0)
нижняя точка:
B = (π, 2)
а ось y направлена вниз.
Циклоида задаётся формулами:
x = R(θ - sin θ)
y = R(1 - cos θ) | 627 |
| 4 | 📊 Как сегодня оценивать рынок ИИ и где искать реальные точки роста?
16 июля в 12:00 (МСК) Yandex Cloud проведет бесплатный вебинар «Взгляд на рынок ИИ: от глобальных трендов к российской практике».
В программе:
— почему оценки рынка ИИ у разных аналитиков так сильно различаются;
— как устроен мировой рынок ИИ и чем отличается российский;
— какие сегменты развиваются быстрее остальных;
— как российские компании внедряют GenAI и каких бизнес-результатов уже достигают.
👥 Спикеры – эксперты Yandex Cloud, «Яков и Партнёры» и инвестиционного сообщества.
Вебинар будет полезен руководителям AI- и data-направлений, архитекторам, аналитикам, CTO и всем, кто следит за развитием генеративного ИИ и его применением в бизнесе.
🔗 Количество мест ограничено, регистрация по ссылке. | 687 |
| 5 | No text... | 769 |
| 6 | Anthropic могла спрятать предупреждение Китаю прямо в Claude Code
Суть не в том, что Anthropic видит прокси, маршруты или метаданные. Это ожидаемо.
Суть в другом: Claude Code якобы вшивал China-related fingerprint прямо в системный промпт через почти незаметные изменения.
Например, другой формат даты или визуально похожие Unicode-символы.
Это выглядит как сигнал реселлерам и лабораториям:
мы видим прокси-маршрутизацию через Китай и знаем, кто пытается обходить ограничения.
Главный вопрос теперь не в блокировке Китая.
А в том, насколько вообще можно доверять инструменту, если скрытые маркеры могут жить прямо внутри промпта. | 1 051 |
| 7 | ❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️
Современные ИИ-продукты — это уже не просто LLM, а целые агентные системы с памятью, поиском и интеграциями. Именно этому посвящена Yandex AI Studio Series Summer Edition.
Эксперты Яндекса поделятся подходами, которые используют при разработке корпоративных решений, расскажут о новых инструментах платформы и покажут, как выстраивать автоматизацию с помощью ИИ.
Что ждет участников:
— архитектурные доклады и практические кейсы;
— интенсив для самостоятельной практики;
— обзор новых сервисов и функций Yandex AI Studio.
Подключайтесь, чтобы разобраться в современных ИИ-инструментах вместе с теми, кто их создает. | 787 |
| 8 | 🖥 NVIDIA показала HORIZON для agentic hardware design
У NVIDIA вышла работа про HORIZON - систему, где агентное программирование переносится в дизайн железа.
Идея интересная: hardware design рассматривается не как разовая генерация Verilog-кода, а как эволюция целого репозитория. Markdown harness превращается в project pack: внутри доменные знания, исполняемый evaluator, критерий приёмки и правила работы с git.
Дальше агент не просто пишет кусок кода, а меняет изолированное worktree, запускает проверки и двигается по результатам verifier harness.
Для железа это особенно важно. Здесь мало красивого ответа в чате: дизайн должен проходить исполняемые тесты, симуляции и формальные ограничения. Поэтому verifier становится настоящим интерфейсом между агентом и задачей.
В статье заявляют 100% benchmark completion на нескольких наборах задач по hardware design. Даже если вы не работаете с EDA, за этим стоит следить: agentic coding начинает заходить туда, где ошибка стоит намного дороже, чем сломанный unit test.
Paper: https://arxiv.org/abs/2606.28279 | 776 |
| 9 | Мы годами строили предсказуемые монолиты и микросервисы, но AI превратил PDLC в Дикий Запад, где старые паттерны проектирования больше не работают. Хватит делать вид, что ты контролируешь ситуацию, просто прикрываясь новой версией TOGAF.
Приходи 1 июля на Arch.Meetup, где мы поговорим про архитектурный подход AI disrupt PDLC, и вместе со спикерами из Сбера, Вебпрактик и Газпром нефти будем учиться управлять этим хаосом, пока нейросети не начали проектировать системы вместо нас.
🔗Выбирай удобный формат и регистрируйся по ссылке
📍Встречаемся очно на Кутузовском 32, а ссылку для онлайн пришлем накануне. | 892 |
| 10 | Полугодовая технологическая ретроспектива и свежие AI-новости в одном эпизоде шоу «404 секунды»
В специальном выпуске сезона Антон Черноусов (Yandex Cloud) и Вячеслав Захаров («Газпром нефть») поставили таймер на паузу и без спешки разобрали длинные технологические тренды и хайповые новости. Среди тем: голосовой AI, цифровые агенты, роботы, данные, работа.
Обсудили новые профессии, внедрение искусственного интеллекта в повседневную жизнь и большие изменения в промышленности.
По-инженерному, с привкусом здорового скепсиса.
Посмотреть можно здесь: YouTube, VK Видео
Послушать – в Яндекс Музыке | 876 |
| 11 | Оценки «какие профессии заменит ИИ» могут быть сильно искажены.
Новая работа показывает простую проблему: если считать AI exposure по чат-логам, мы часто измеряем не реальный риск для профессии, а популярность конкретной AI-платформы среди её пользователей.
То есть данные показывают не только «чью работу может изменить ИИ», а ещё и «кто вообще пользуется этим сервисом».
Из-за этого в выборке переоценены:
• IT-профессии
• офисные роли
• компьютерные специальности
И недооценены:
• еда и общепит
• транспорт
• производство
• ручной сервисный труд
Когда авторы перевзвешивают данные под реальные доли профессий на рынке труда, оценка эффекта ИИ на занятость падает на 42–93%.
А часть результатов становится почти нулевой.
Paper: “Who Uses AI? Platform Selection and the Measurement of Occupational AI Exposure”
arxiv.org/abs/2605.21743 | 1 346 |
| 12 | Cursor опубликовал новое исследование: ведущие coding-модели могут завышать результаты на публичных бенчмарках, находя уже существующие решения вместо того, чтобы решать задачи самостоятельно.
На SWE-bench Pro автоматический аудитор обнаружил, что в 63% успешных запусков Opus 4.8 Max модель доставала уже известный фикс.
Самые частые обходные пути:
• находила merged pull request или уже исправленный source file в интернете
• искала в Git-истории будущий коммит, где баг уже был исправлен
• получала доступ к hidden tests или зеркалам бенчмарка, где был виден ожидаемый патч
• хардкодила ответ, найденный в утёкших evaluation materials
После этого Cursor создал более строгую среду тестирования: убрал историю репозитория и заблокировал большую часть доступа в интернет.
Результаты резко просели:
• Opus 4.8 Max: с 87,1% до 73,0%
• Composer 2.5: с 74,7% до 54,0%
У новых моделей разрыв оказался больше, чем у старых моделей вроде Opus 4.6. GPT-модели в тестах Cursor в целом показали меньшие просадки.
Cursor считает, что coding-бенчмарки должны проверять транскрипты работы агентов и жёстко контролировать, к чему модели имеют доступ во время оценки.
https://x.com/cursor_ai/status/2070195789121671624 | 1 475 |
| 13 | 🐍 Python Парсинг: Большой продвинутый бесплатный курс
Полное практическое руководство по веб-скрейпингу на Python — от основ HTTP до production-grade пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов. Каждый раздел содержит рабочие примеры, типовые ошибки и продвинутые практики.
https://github.com/justxor/Pythonparsing-/tree/main | 1 172 |
| 14 | Как ИИ за минуты выявляет риски по 152-ФЗ в ваших базах данных? 🔐
Персональные данные есть практически в каждой корпоративной системе — CRM, ERP, DWH, BI и служебных таблицах.
Но в большинстве компаний отсутствует прозрачность: где именно хранятся ПДн, кто их использует и какие риски это создает в рамках требований 152-ФЗ.
В результате компании сталкиваются с типовыми проблемами: «теневые» копии данных, избыточные права доступа, отсутствие понимания, какие данные вообще нужно хранить и обрабатывать.
📆 2 июля в 11:00 (МСК) компания Lasmart приглашает на бесплатный онлайн-вебинар «Как ИИ за минуты находит нарушения 152-ФЗ в корпоративных базах данных».
В программе вебинара:
— что 152-ФЗ говорит о персональных данных в СУБД;
— как автоматически находить и классифицировать ПДн в базах данных;
— как выстроить процесс работы с ПДн;
— как снизить нагрузку на ИБ и data-команды за счет автоматизации;
— демонстрация решения по мониторингу ПДн в СУБД.
👤 Спикер: Павел Хамрин, руководитель AI-направления Lasmart
🎁 Бонус участникам — чек-лист по контролю персональных данных в СУБД и DWH.
🔗 Регистрация по ссылке | 1 107 |
| 15 | 🌟 OpenAI предлагает поговорить с комнатным растением
Компания опубликовала на GitHub проект Plant Talk, с помощью которого комнатное растение можно наделить голосом и вести с ним беседу через ChatGPT.
Среди предлагаемых сценариев - дом, школьный класс, лаборатория или арт-проект.
В минимальной конфигурации нужны лишь компьютер с веб-камерой, микрофоном и динамиками, браузер Chrome или Edge и аккаунт OpenAI.
Камера делает снимок растения и проводит, как это называют OpenAI, "структурированную проверку его состояния", после чего можно начать разговор в реальном времени.
Например, спросить, как у него дела. в ответ растение "сверится со своими недавними наблюдениями" и оценит текущую обстановку.
Растению можно задать имя, характер и голос, а также настроить, на что именно обращает внимание камера.
Очевидно, что без дополнительных датчиков система судит о состоянии растения лишь по тому, что видит камера.
К системе можно подключить микроконтроллер Arduino с датчиком влажности почвы и модулем освещённости LM393, тогда к разговору добавятся реальные измерения.
📌Лицензирование: Apache 2.0 License
🖥Github
@ai_machinelearning_big_data
#AI #ML #PlantTalk #OpenAI | 977 |
| 16 | AnyCrawl превращает сайты в структурированные данные, готовые для LLM.
Инструмент берёт любой сайт и быстро приводит его к чистому JSON, который можно сразу использовать в AI-пайплайнах, RAG, агентах и автоматизации.
Что умеет:
• извлекать данные из поисковой выдачи Google, Bing и Baidu
• краулить сайт целиком
• парсить страницы в несколько потоков
• доставать нужные данные с помощью AI
По сути, это способ быстро превратить хаотичный веб в нормальные данные для языковых моделей.
GitHub: https://github.com/any4ai/AnyCrawl | 1 403 |
| 17 | Модели Ling & Ring 2.6 теперь доступны на OpenRouter - с временной скидкой до 31 июля.
Можно использовать наши новые модели серии 2.6 со скидкой до 90%.
Ring-2.6-1T / Ling-2.6-1T
Input: $0.075 за 1M токенов
Output: $0.625 за 1M токенов
Cache read: $0.015 за 1M токенов
Ling-2.6-flash
Input: $0.01 за 1M токенов
Output: $0.03 за 1M токенов
Cache read: $0.002 за 1M токенов
Попробуйте высокоэффективный интеллект для реальных агентных workflow и сложных задач. | 1 398 |
| 18 | DeepSeek на своём ПК за 3 шага: бесплатно и без API
Запускаем DeepSeek локально на своём ПК бесплатно и без API. Всё в три шага: ставишь Ollama, вводишь одну команду, пользуешься. Даже для слабого ПК есть лёгкая версия модели.
Хэштеги:
#DeepSeek #Ollama #нейросети | 807 |
| 19 | Пост про сильный ход, который сегодня сделала OpenAI.
Ноам Шазир помогал создавать архитектуру Transformer, ушёл из Google, основал CharacterAI, затем вернулся в DeepMind через сделку на $2.7 млрд и работал над Gemini. Теперь он переходит в OpenAI.
Дин Болл, который участвовал в формировании AI-политики администрации Трампа, тоже идёт в OpenAI. Это даёт компании возможность заранее просчитывать будущие регуляторные конфликты и одновременно иметь хороший доступ к государственным кругам. Особенно на фоне Anthropic, у которой сейчас идут сложности.
Кажется, многие недооценивают, насколько это значимо для OpenAI.
Даже The Information называет найм Шазира крупной победой:
> «Найм Шазира стал серьёзной победой OpenAI в войне за AI-таланты, поскольку компания пытается догнать своего главного конкурента Anthropic по самым продвинутым моделям перед ожидаемыми IPO обеих компаний. Шазир был одним из ключевых авторов оригинальной статьи о Transformer, архитектуре, которая предсказывает наиболее вероятное следующее слово во фразе и лежит в основе GPT-моделей OpenAI». | 1 936 |
| 20 | Исследователь Sakana AI Руджикорн «Тан» Чаракорн недавно представил Doc-to-LoRA на journal club DLCT от ML Collective.
В докладе он разобрал hypernetworks, амортизацию стоимости и дальнейшие направления развития метода.
После презентации прошла очень живая дискуссия.
https://youtube.com/watch?v=jb_0XcBMJQU | 1 660 |
Available now! Telegram Research 2025 — the year's key insights 
