Big Data AI
@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста РКН: clck.ru/3Fmqxe
Ko'proq ko'rsatish📈 Telegram kanali Big Data AI analitikasi
Big Data AI (@bigdatai) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 18 299 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 7 239-o'rinni va Rossiya mintaqasida 36 602-o'rinni egallagan.
📊 Auditoriya ko‘rsatkichlari va dinamika
невідомо sanasidan buyon loyiha tez o‘sib, 18 299 obunachiga ega bo‘ldi.
02 Iyul, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -313 ga, so‘nggi 24 soatda esa -3 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.
- Tasdiqlash holati: Tasdiqlanmagan
- Jalb etish (ER): Auditoriya o‘rtacha 7.38% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 3.30% ini tashkil etuvchi reaksiyalarni to‘playdi.
- Post qamrovi: Har bir post o‘rtacha 1 351 marta ko‘riladi; birinchi sutkada odatda 605 ta ko‘rish yig‘iladi.
- Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 6 ta reaksiya keladi.
- Tematik yo‘nalishlar: Kontent llm, openai, github, nvidia, deepseek kabi asosiy mavzularga jamlangan.
📝 Tavsif va kontent siyosati
Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“@haarrp - админ
Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям
@data_analysis_ml - анализ данных
@ai_machinelearning_big_data
@itchannels_telegram - важное для программиста
РКН: clck.ru/3Fmqxe”
Yuqori yangilanish chastotasi (oxirgi ma’lumot 03 Iyul, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.
Ma'lumot yuklanmoqda...
| Sana | Obunachilarni jalb qilish | Esdaliklar | Kanallar | |
| 03 Iyul | 0 | |||
| 02 Iyul | +2 | |||
| 01 Iyul | 0 |
| 2 | Обратный отсчет | 517 |
| 3 | Задача, которую Ньютон решил за один вечер
В июне 1696 года Иоганн Бернулли опубликовал в журнале Лейбница *Acta Eruditorum* математический вызов на 6 месяцев.
Даны две точки на разной высоте.
Какой формы должен быть спуск, чтобы тело съехало из верхней точки в нижнюю за минимальное время?
К январю ответил только Лейбниц и попросил больше времени, поэтому срок продлили до Пасхи.
Ньютон получил письмо с задачей вечером, когда вернулся с работы, и решил её до того, как лёг спать.
Эта задача называется задача брахистохроны.
Самый быстрый путь оказался не прямой линией, а циклоидой.
Пример:
Пусть верхняя точка:
A = (0, 0)
нижняя точка:
B = (π, 2)
а ось y направлена вниз.
Циклоида задаётся формулами:
x = R(θ - sin θ)
y = R(1 - cos θ) | 627 |
| 4 | 📊 Как сегодня оценивать рынок ИИ и где искать реальные точки роста?
16 июля в 12:00 (МСК) Yandex Cloud проведет бесплатный вебинар «Взгляд на рынок ИИ: от глобальных трендов к российской практике».
В программе:
— почему оценки рынка ИИ у разных аналитиков так сильно различаются;
— как устроен мировой рынок ИИ и чем отличается российский;
— какие сегменты развиваются быстрее остальных;
— как российские компании внедряют GenAI и каких бизнес-результатов уже достигают.
👥 Спикеры – эксперты Yandex Cloud, «Яков и Партнёры» и инвестиционного сообщества.
Вебинар будет полезен руководителям AI- и data-направлений, архитекторам, аналитикам, CTO и всем, кто следит за развитием генеративного ИИ и его применением в бизнесе.
🔗 Количество мест ограничено, регистрация по ссылке. | 687 |
| 5 | Matn yo'q... | 769 |
| 6 | Anthropic могла спрятать предупреждение Китаю прямо в Claude Code
Суть не в том, что Anthropic видит прокси, маршруты или метаданные. Это ожидаемо.
Суть в другом: Claude Code якобы вшивал China-related fingerprint прямо в системный промпт через почти незаметные изменения.
Например, другой формат даты или визуально похожие Unicode-символы.
Это выглядит как сигнал реселлерам и лабораториям:
мы видим прокси-маршрутизацию через Китай и знаем, кто пытается обходить ограничения.
Главный вопрос теперь не в блокировке Китая.
А в том, насколько вообще можно доверять инструменту, если скрытые маркеры могут жить прямо внутри промпта. | 1 051 |
| 7 | ❤️❤️❤️❤️❤️❤️❤️❤️❤️❤️
Современные ИИ-продукты — это уже не просто LLM, а целые агентные системы с памятью, поиском и интеграциями. Именно этому посвящена Yandex AI Studio Series Summer Edition.
Эксперты Яндекса поделятся подходами, которые используют при разработке корпоративных решений, расскажут о новых инструментах платформы и покажут, как выстраивать автоматизацию с помощью ИИ.
Что ждет участников:
— архитектурные доклады и практические кейсы;
— интенсив для самостоятельной практики;
— обзор новых сервисов и функций Yandex AI Studio.
Подключайтесь, чтобы разобраться в современных ИИ-инструментах вместе с теми, кто их создает. | 787 |
| 8 | 🖥 NVIDIA показала HORIZON для agentic hardware design
У NVIDIA вышла работа про HORIZON - систему, где агентное программирование переносится в дизайн железа.
Идея интересная: hardware design рассматривается не как разовая генерация Verilog-кода, а как эволюция целого репозитория. Markdown harness превращается в project pack: внутри доменные знания, исполняемый evaluator, критерий приёмки и правила работы с git.
Дальше агент не просто пишет кусок кода, а меняет изолированное worktree, запускает проверки и двигается по результатам verifier harness.
Для железа это особенно важно. Здесь мало красивого ответа в чате: дизайн должен проходить исполняемые тесты, симуляции и формальные ограничения. Поэтому verifier становится настоящим интерфейсом между агентом и задачей.
В статье заявляют 100% benchmark completion на нескольких наборах задач по hardware design. Даже если вы не работаете с EDA, за этим стоит следить: agentic coding начинает заходить туда, где ошибка стоит намного дороже, чем сломанный unit test.
Paper: https://arxiv.org/abs/2606.28279 | 776 |
| 9 | Мы годами строили предсказуемые монолиты и микросервисы, но AI превратил PDLC в Дикий Запад, где старые паттерны проектирования больше не работают. Хватит делать вид, что ты контролируешь ситуацию, просто прикрываясь новой версией TOGAF.
Приходи 1 июля на Arch.Meetup, где мы поговорим про архитектурный подход AI disrupt PDLC, и вместе со спикерами из Сбера, Вебпрактик и Газпром нефти будем учиться управлять этим хаосом, пока нейросети не начали проектировать системы вместо нас.
🔗Выбирай удобный формат и регистрируйся по ссылке
📍Встречаемся очно на Кутузовском 32, а ссылку для онлайн пришлем накануне. | 892 |
| 10 | Полугодовая технологическая ретроспектива и свежие AI-новости в одном эпизоде шоу «404 секунды»
В специальном выпуске сезона Антон Черноусов (Yandex Cloud) и Вячеслав Захаров («Газпром нефть») поставили таймер на паузу и без спешки разобрали длинные технологические тренды и хайповые новости. Среди тем: голосовой AI, цифровые агенты, роботы, данные, работа.
Обсудили новые профессии, внедрение искусственного интеллекта в повседневную жизнь и большие изменения в промышленности.
По-инженерному, с привкусом здорового скепсиса.
Посмотреть можно здесь: YouTube, VK Видео
Послушать – в Яндекс Музыке | 876 |
| 11 | Оценки «какие профессии заменит ИИ» могут быть сильно искажены.
Новая работа показывает простую проблему: если считать AI exposure по чат-логам, мы часто измеряем не реальный риск для профессии, а популярность конкретной AI-платформы среди её пользователей.
То есть данные показывают не только «чью работу может изменить ИИ», а ещё и «кто вообще пользуется этим сервисом».
Из-за этого в выборке переоценены:
• IT-профессии
• офисные роли
• компьютерные специальности
И недооценены:
• еда и общепит
• транспорт
• производство
• ручной сервисный труд
Когда авторы перевзвешивают данные под реальные доли профессий на рынке труда, оценка эффекта ИИ на занятость падает на 42–93%.
А часть результатов становится почти нулевой.
Paper: “Who Uses AI? Platform Selection and the Measurement of Occupational AI Exposure”
arxiv.org/abs/2605.21743 | 1 346 |
| 12 | Cursor опубликовал новое исследование: ведущие coding-модели могут завышать результаты на публичных бенчмарках, находя уже существующие решения вместо того, чтобы решать задачи самостоятельно.
На SWE-bench Pro автоматический аудитор обнаружил, что в 63% успешных запусков Opus 4.8 Max модель доставала уже известный фикс.
Самые частые обходные пути:
• находила merged pull request или уже исправленный source file в интернете
• искала в Git-истории будущий коммит, где баг уже был исправлен
• получала доступ к hidden tests или зеркалам бенчмарка, где был виден ожидаемый патч
• хардкодила ответ, найденный в утёкших evaluation materials
После этого Cursor создал более строгую среду тестирования: убрал историю репозитория и заблокировал большую часть доступа в интернет.
Результаты резко просели:
• Opus 4.8 Max: с 87,1% до 73,0%
• Composer 2.5: с 74,7% до 54,0%
У новых моделей разрыв оказался больше, чем у старых моделей вроде Opus 4.6. GPT-модели в тестах Cursor в целом показали меньшие просадки.
Cursor считает, что coding-бенчмарки должны проверять транскрипты работы агентов и жёстко контролировать, к чему модели имеют доступ во время оценки.
https://x.com/cursor_ai/status/2070195789121671624 | 1 475 |
| 13 | 🐍 Python Парсинг: Большой продвинутый бесплатный курс
Полное практическое руководство по веб-скрейпингу на Python — от основ HTTP до production-grade пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов. Каждый раздел содержит рабочие примеры, типовые ошибки и продвинутые практики.
https://github.com/justxor/Pythonparsing-/tree/main | 1 172 |
| 14 | Как ИИ за минуты выявляет риски по 152-ФЗ в ваших базах данных? 🔐
Персональные данные есть практически в каждой корпоративной системе — CRM, ERP, DWH, BI и служебных таблицах.
Но в большинстве компаний отсутствует прозрачность: где именно хранятся ПДн, кто их использует и какие риски это создает в рамках требований 152-ФЗ.
В результате компании сталкиваются с типовыми проблемами: «теневые» копии данных, избыточные права доступа, отсутствие понимания, какие данные вообще нужно хранить и обрабатывать.
📆 2 июля в 11:00 (МСК) компания Lasmart приглашает на бесплатный онлайн-вебинар «Как ИИ за минуты находит нарушения 152-ФЗ в корпоративных базах данных».
В программе вебинара:
— что 152-ФЗ говорит о персональных данных в СУБД;
— как автоматически находить и классифицировать ПДн в базах данных;
— как выстроить процесс работы с ПДн;
— как снизить нагрузку на ИБ и data-команды за счет автоматизации;
— демонстрация решения по мониторингу ПДн в СУБД.
👤 Спикер: Павел Хамрин, руководитель AI-направления Lasmart
🎁 Бонус участникам — чек-лист по контролю персональных данных в СУБД и DWH.
🔗 Регистрация по ссылке | 1 107 |
| 15 | 🌟 OpenAI предлагает поговорить с комнатным растением
Компания опубликовала на GitHub проект Plant Talk, с помощью которого комнатное растение можно наделить голосом и вести с ним беседу через ChatGPT.
Среди предлагаемых сценариев - дом, школьный класс, лаборатория или арт-проект.
В минимальной конфигурации нужны лишь компьютер с веб-камерой, микрофоном и динамиками, браузер Chrome или Edge и аккаунт OpenAI.
Камера делает снимок растения и проводит, как это называют OpenAI, "структурированную проверку его состояния", после чего можно начать разговор в реальном времени.
Например, спросить, как у него дела. в ответ растение "сверится со своими недавними наблюдениями" и оценит текущую обстановку.
Растению можно задать имя, характер и голос, а также настроить, на что именно обращает внимание камера.
Очевидно, что без дополнительных датчиков система судит о состоянии растения лишь по тому, что видит камера.
К системе можно подключить микроконтроллер Arduino с датчиком влажности почвы и модулем освещённости LM393, тогда к разговору добавятся реальные измерения.
📌Лицензирование: Apache 2.0 License
🖥Github
@ai_machinelearning_big_data
#AI #ML #PlantTalk #OpenAI | 977 |
| 16 | AnyCrawl превращает сайты в структурированные данные, готовые для LLM.
Инструмент берёт любой сайт и быстро приводит его к чистому JSON, который можно сразу использовать в AI-пайплайнах, RAG, агентах и автоматизации.
Что умеет:
• извлекать данные из поисковой выдачи Google, Bing и Baidu
• краулить сайт целиком
• парсить страницы в несколько потоков
• доставать нужные данные с помощью AI
По сути, это способ быстро превратить хаотичный веб в нормальные данные для языковых моделей.
GitHub: https://github.com/any4ai/AnyCrawl | 1 403 |
| 17 | Модели Ling & Ring 2.6 теперь доступны на OpenRouter - с временной скидкой до 31 июля.
Можно использовать наши новые модели серии 2.6 со скидкой до 90%.
Ring-2.6-1T / Ling-2.6-1T
Input: $0.075 за 1M токенов
Output: $0.625 за 1M токенов
Cache read: $0.015 за 1M токенов
Ling-2.6-flash
Input: $0.01 за 1M токенов
Output: $0.03 за 1M токенов
Cache read: $0.002 за 1M токенов
Попробуйте высокоэффективный интеллект для реальных агентных workflow и сложных задач. | 1 398 |
| 18 | DeepSeek на своём ПК за 3 шага: бесплатно и без API
Запускаем DeepSeek локально на своём ПК бесплатно и без API. Всё в три шага: ставишь Ollama, вводишь одну команду, пользуешься. Даже для слабого ПК есть лёгкая версия модели.
Хэштеги:
#DeepSeek #Ollama #нейросети | 807 |
| 19 | Пост про сильный ход, который сегодня сделала OpenAI.
Ноам Шазир помогал создавать архитектуру Transformer, ушёл из Google, основал CharacterAI, затем вернулся в DeepMind через сделку на $2.7 млрд и работал над Gemini. Теперь он переходит в OpenAI.
Дин Болл, который участвовал в формировании AI-политики администрации Трампа, тоже идёт в OpenAI. Это даёт компании возможность заранее просчитывать будущие регуляторные конфликты и одновременно иметь хороший доступ к государственным кругам. Особенно на фоне Anthropic, у которой сейчас идут сложности.
Кажется, многие недооценивают, насколько это значимо для OpenAI.
Даже The Information называет найм Шазира крупной победой:
> «Найм Шазира стал серьёзной победой OpenAI в войне за AI-таланты, поскольку компания пытается догнать своего главного конкурента Anthropic по самым продвинутым моделям перед ожидаемыми IPO обеих компаний. Шазир был одним из ключевых авторов оригинальной статьи о Transformer, архитектуре, которая предсказывает наиболее вероятное следующее слово во фразе и лежит в основе GPT-моделей OpenAI». | 1 936 |
| 20 | Исследователь Sakana AI Руджикорн «Тан» Чаракорн недавно представил Doc-to-LoRA на journal club DLCT от ML Collective.
В докладе он разобрал hypernetworks, амортизацию стоимости и дальнейшие направления развития метода.
После презентации прошла очень живая дискуссия.
https://youtube.com/watch?v=jb_0XcBMJQU | 1 660 |
Endi mavjud! Telegram Tadqiqoti 2025 — yilning asosiy insaytlari 
