Анализ данных (Data analysis)

Kanalga Telegram’da o‘tish

Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp

Ko'proq ko'rsatish

Tarmoq:Machinelearning Rossiya12 568 Texnologiyalar & Aralashmalar2 674...

📈 Telegram kanali Анализ данных (Data analysis) analitikasi

Анализ данных (Data analysis) (@data_analysis_ml) Rus til segmentidagi kanali faol ishtirokchi. Hozirda hamjamiyat 50 161 obunachidan iborat bo'lib, Texnologiyalar & Aralashmalar toifasida 2 674-o'rinni va Rossiya mintaqasida 12 568-o'rinni egallagan.

📊 Auditoriya ko‘rsatkichlari va dinamika

невідомо sanasidan buyon loyiha tez o‘sib, 50 161 obunachiga ega bo‘ldi.

11 Iyun, 2026 dagi oxirgi ma’lumotlarga ko‘ra kanal barqaror faollikka ega. Oxirgi 30 kunda obunachilar soni -1 975 ga, so‘nggi 24 soatda esa -4 ga o‘zgardi va umumiy qamrov yuqori darajada qolmoqda.

Tasdiqlash holati: Tasdiqlanmagan
Jalb etish (ER): Auditoriya o‘rtacha 9.28% darajada jalb etiladi. Nashrdan keyingi dastlabki 24 soatda kontent odatda umumiy obunachilar sonining 5.80% ini tashkil etuvchi reaksiyalarni to‘playdi.
Post qamrovi: Har bir post o‘rtacha 4 656 marta ko‘riladi; birinchi sutkada odatda 2 912 ta ko‘rish yig‘iladi.
Reaksiyalar va o‘zaro ta’sir: Auditoriya faol: har bir postga o‘rtacha 32 ta reaksiya keladi.
Tematik yo‘nalishlar: Kontent llm, контекст, openai, архитектура, deepseek kabi asosiy mavzularga jamlangan.

📝 Tavsif va kontent siyosati

Muallif resursni shaxsiy fikrni ifoda etish maydoni sifatida ta’riflaydi:
“Data science, наука о данных. @haarrp - админ РКН: clck.ru/3FmyAp”

Yuqori yangilanish chastotasi (oxirgi ma’lumot 12 Iyun, 2026 da olingan) sababli kanal doimo dolzarb va katta qamrovli bo‘lib qoladi. Analitika auditoriya kontent bilan faol hamkorlik qilishini, uni Texnologiyalar & Aralashmalar toifasidagi muhim ta’sir nuqtasiga aylantirishini ko‘rsatadi.

50 161

Obunachilar

-424 soatlar

-227 kunlar

-1 97530 kunlar

4 656

Post ko'rishlar

~ 2 91224 soatlar

~ 3 40848 soatlar

9.28%

Muloqot nisbati

~ 5

Kuniga postlar

Ads index

beta

Postlar arxiv

50 155

Если в работе с BI вы хоть раз собирали инвентаризацию дашбордов «по скриншотам и таблицам», то знаете это ощущение: аналитика вроде бы про данные, а управление BI – про ручной труд. 10 марта 11:00 мск можно будет разобраться, как это автоматизировать, потому что Yandex Cloud проведёт вебинар «API в DataLens – все пути автоматизации». Если вы хоть раз пытались навести порядок в BI, то знаете эту боль. Дашборды растут, копируются, устаревают. А когда нужно понять, что где используется — начинается классика: скриншоты, Excel-таблицы, ручные проверки. Парадокс в том, что мы строим аналитику, чтобы автоматизировать бизнес, но управление самой BI-средой часто остаётся полностью ручным. Хорошая новость — это можно автоматизировать. 10 марта в 12:00 (мск) Yandex Cloud проведёт вебинар «API в DataLens — все пути автоматизации». На вебинаре разберут: - возможности Public API DataLens - как управлять дашбордами и объектами программно - как убрать рутину из администрирования BI - реальные сценарии автоматизации - кейс использования API-коннектора клиентом Будет особенно полезно, если вы хотя бы раз делали «инвентаризацию дашбордов вручную». Кому подойдёт: BI-аналитикам, дата-инженерам, разработчикам, системным архитекторам и руководителям аналитики. Участие бесплатное, требуется предварительная регистрация. Иногда следующий уровень аналитики — это автоматизация самой аналитики.

50 155

На это конец, можно идти домой

50 155

Отличный результат 😄

50 155

📌 Большинство AI-агентов на самом деле ничего не помнят. Каждый диалог для них — как первый: - нет памяти о прошлых разговорах - нет понимания связей между фактами - нет накопленного опыта И здесь многие делают ошибку. Они используют vector database — и считают, что это память. Проблема: Vector search находит похожие куски текста, но не понимает связи между ними. Документы остаются изолированными фрагментами. Агенту нужна не просто память. Ему нужна система знаний с отношениями. Именно это делает Cognee — 100% open-source инструмент для самообучающейся памяти. Что внутри: - Vector search + графовая база - Поиск по смыслу + связи между сущностями - Документы превращаются в knowledge graph Ключевые возможности: Composable pipelines Можно собирать свои пайплайны: chunking → embedding → entity extraction → обработка Weighted memory Чем чаще используется связь — тем она сильнее Память адаптируется под реальное использование Self-evolving memory Пайплайн memify: - усиливает полезные связи - удаляет устаревшие данные - оптимизируется по принципам RL Агент получает память, которая: - сохраняется - понимает связи - улучшается со временем https://github.com/topoteretes/cognee

50 155

🖥 Большинство парсеров умирают через 2 дня. Ты научишься делать те, которые работают в продакшене. Это не про BeautifulSoup ради галочки. Это про системы сбора данных, которые: • не падают из-за мелких изменений на сайте • собирают данные в разы быстрее • обновляют всё автоматически по расписанию • обходят ограничения и блокировки • выглядят как полноценный сервис, а не как хаос из файлов Ты начнёшь видеть сайты не как страницы, а как источники данных, к которым можно подключаться. В итоге ты сможешь: • забирать данные для своих проектов • автоматизировать чужую рутину • создавать инструменты для аналитики • брать коммерческие заказы на сбор данных Это навык, который напрямую превращается в деньги. Не «знаю Python», а «умею профессионально добывать данные из интернета». 🎁 Скидка 50% на Stepik действует 48 часов: https://stepik.org/a/269942/

50 155

📌 Anthropic добавила новую функцию памяти в Claude. Теперь можно перенести контекст и предпочтения из других AI-инструментов. Как это работает: 1. В другом AI генерируете специальный prompt с вашим контекстом 2. Копируете результат 3. Вставляете его в настройки памяти Claude После этого Claude: - запоминает ваши предпочтения - понимает ваш стиль работы - может сразу продолжать диалог без повторных объяснений Функция доступна во всех платных тарифах. Почему это важно: Контекст становится переносимым. Вы больше не привязаны к одному инструменту. Новый тренд в AI: Пользовательский контекст - это ваш личный слой поверх моделей. Модель можно сменить. Память - остаётся. claude.com/import-memory

50 155

⚡️ Дарио Амодеи дал первое интервью после того, как Пентагон фактически внес его компанию в чёрный список. Ему задали один вопрос: Что бы вы сейчас сказали президенту? Ответ был коротким: «Мы патриоты. Всё, что мы делали, — ради этой страны». Anthropic сотрудничала с государством: - их модели одними из первых допустили к секретным военным системам - компания помогала в задачах обороны Но затем Пентагон потребовал: - доступ к технологиям полностью автономного оружия - возможности массового наблюдения Anthropic отказалась — и провела красную линию. Ответ правительства: - давление через цепочки поставок - чрезвычайные полномочия - требование отказаться от продуктов компании на федеральном уровне Амодеи: «Не соглашаться с правительством — это и есть по-настоящему по-американски». Но самый показательный момент произошёл позже. По данным WSJ, во время недавних военных операций США против Ирана модель Claude всё равно использовалась. Центральное командование применяло её для: - разведывательных оценок - идентификации целей - моделирования боевых сценариев Формально это не нарушение — у госструктур есть 6 месяцев, чтобы отказаться от Claude. Но тайминг выглядит показательно: – Anthropic отказывается принимать условия Пентагона – В тот же день звучат призывы срочно прекратить использование Claude – И буквально через несколько часов модель используют в боевой операции Главный вывод: AI уже не просто технология. Это инфраструктура военных и геополитических решений. И сейчас происходит не только гонка моделей. Это борьба за контроль над тем, кто и на каких условиях будет использовать интеллект машин. https://www.wsj.com/livecoverage/iran-strikes-2026/card/u-s-strikes-in-middle-east-use-anthropic-hours-after-trump-ban-ozNO0iClZpfpL7K7ElJ2

50 155

⚡️Андрей Карпати поделился интересным экспериментом: он попробовал собрать **исследовательскую команду из AI-агентов. В setup: - 8 агентов (Claude + Codex) - у каждого свой GPU - каждый работает как отдельный исследователь - задачи ведутся через Git-ветки - коммуникация через файлы - всё запускается в tmux - как «офис» с окнами Фактически — попытка построить AI-research-организацию. Но главный вывод оказался неожиданным. Агенты: - плохо продумывают дизайн экспериментов - делают случайные или бессмысленные вариации - не строят сильные baseline - не контролируют compute и время - часто делают ложные выводы Пример: агент «обнаружил», что увеличение hidden size улучшает validation loss. Формально — да. Но модель просто стала больше и дольше обучалась. Никакой научной ценности. Инсайт: AI отлично реализует хорошо сформулированные идеи. Но пока плохо генерирует сильные исследовательские гипотезы. Самая важная мысль: Теперь мы программируем не модель — мы программируем организацию. Source code такой системы: - промпты - роли - процессы - инструменты - standup’ы - workflow Вопрос будущего звучит так: Насколько быстро ваша AI-организация может делать научный прогресс на новой задаче? Добро пожаловать в эпоху *Org Engineering*. https://x.com/karpathy/status/2027521323275325622

50 155

🔥 10 GitHub-репозиториев, которые реально прокачают тебя в AI 1. Generative AI for Beginners Полноценный курс от Microsoft: Jupyter-ноутбуки, практические задания и разработка GenAI-приложений. https://github.com/microsoft/generative-ai-for-beginners 2. LLMs from Scratch Пошаговая реализация GPT-подобной модели с нуля. Лучший способ понять, как работают LLM внутри. https://github.com/rasbt/LLMs-from-scratch 3. AI Agents for Beginners Практика по созданию агентных систем: инструменты, память, планирование, workflow. https://github.com/microsoft/ai-agents-for-beginners 4. ML for Beginners Классическая база по машинному обучению: 26 структурированных уроков. https://github.com/microsoft/ML-For-Beginners 5. OpenAI Cookbook Официальные примеры работы с API: production-паттерны, RAG, функции, реальные кейсы. https://github.com/openai/openai-cookbook 6. Python 100 Days Интенсив по Python с практикой каждый день. Отличная база для входа в AI. https://github.com/jackfrued/Python-100-Days 7. LLM App Templates Готовые RAG-шаблоны и production-решения для реальных LLM-приложений. https://github.com/pathwaycom/llm-app 8. Python Data Science Handbook Фундамент по NumPy, Pandas, визуализации и классическому ML. https://github.com/jakevdp/PythonDataScienceHandbook 9. Stable Diffusion Оригинальный код модели text-to-image - отличная база для изучения генеративного CV. https://github.com/CompVis/stable-diffusion 10. Segment Anything Модель от Meta для сегментации изображений - мощный инструмент для компьютерного зрения. https://github.com/facebookresearch/segment-anything #AI #MachineLearning #LLM #GitHub #Python #DataScience

50 155

Martian выпустили крупнейший бенчмарк для оценки AI-агентов, которые проверяют код и он полностью open-source. Главная проблема большинства AI-тестов - модели со временем просто запоминают ответы. Бенчмарк превращается в «экзамен с известными вопросами», а реальные возможности моделей остаются за кадром. Martian решили эту проблему архитектурно. Вместо одного теста они внедрили систему Dual-Layer Evaluation: - Offline-слой — честное сравнение моделей на статичных данных - Online-слой — анализ поведения инструментов в реальной работе разработчиков Если компания попытается «подогнать» модель под офлайн-тест, это сразу станет заметно — её результаты перестанут совпадать с реальным использованием в онлайн-слое. Фактически это первый самокорректирующийся бенчмарк, который нельзя накрутить маркетингом или обучением на тестовых данных. Что внутри: - Более 200 000 реальных изменений кода - Данные реального поведения разработчиков - Оценка качества AI-ревью в боевых условиях - Полная нейтральность — создатели не продают собственные coding-ассистенты Это первый измеритель качества AI-инструментов для разработки, который не деградирует со временем и отражает реальную пользу, а не лабораторные метрики. https://codereview.withmartian.com/

50 155

✔️ Google выпустили Nano Banana 2 - новую модель генерации изображений, ориентированную на реальное production-использование. Г Модель позволяет быстро генерировать и редактировать изображения, сохраняя уровень детализации, света и текстур, достаточный для коммерческих задач. Ключевые возможности: * точное следование сложным текстовым инструкциям * корректный текст внутри изображений * создание инфографики, диаграмм и визуального контента * сохранение внешнего вида персонажей и объектов между генерациями * поддержка разных форматов и разрешений Nano Banana 2 интегрирована в экосистему Google: * Gemini * AI Studio и Gemini API * Vertex AI * Search и Lens * рекламные инструменты Google Отдельное внимание уделено прозрачности - изображения автоматически получают цифровую маркировку SynthID и соответствуют стандарту C2PA. https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/

50 155

⚡️ Карпаты поделился наблюдением, которое хорошо описывает то, что сейчас происходит с разработкой. За последние пару месяцев программирование изменилось не постепенно, а резко. Раньше кодинг-агенты выглядели как интересный эксперимент - могли помочь с фрагментами кода, но не тянули реальные задачи. Сейчас ситуация другая: модели научились держать контекст, последовательно решать проблемы и доводить работу до конца. По сути, они получили главное качество инженера - упорство. Типичный сценарий сегодня выглядит так: ты ставишь задачу высокого уровня, агент подключается к серверу, настраивает окружение, устанавливает зависимости, поднимает сервисы, пишет код, тестирует, исправляет ошибки и возвращается с готовым результатом и отчётом. То, что раньше занимало выходные, теперь может решаться за десятки минут автономной работы. И это меняет сам подход к разработке. Раньше основной навык был - писать код. Теперь основной навык - формулировать задачи, декомпозировать их и управлять процессом. Новый рабочий процесс: * описываешь цель на естественном языке * запускаешь агента * наблюдаешь за прогрессом * проверяешь результат * корректируешь направление Ключевая компетенция смещается вверх по уровням абстракции: * архитектурное мышление * правильная декомпозиция * настройка инструментов и среды * оркестрация нескольких агентов * контроль качества Это ещё не магия. Агентам всё ещё нужны: * чёткие спецификации * понятные критерии успеха * тесты и верификация * человеческое суждение и вкус Лучше всего они работают там, где результат можно проверить автоматически. Но главное изменение уже произошло. Программирование постепенно превращается из «написания кода» в управление вычислительной системой, которая пишет код за тебя. И сейчас выигрывают не те, кто быстрее печатает, а те, кто умеет мыслить на уровне систем, задач и результатов. Если раньше ценился coding, то теперь растёт ценность agent-engineering. https://x.com/karpathy/status/2026731645169185220

50 155

🔥 Веса серии моделей Qwen 3.5 Medium в формате FP8 открыты и готовы к продакшену Теперь доступны FP8-версии моделей Qwen 3.5 - оптимизированные для высокой производительности и снижения затрат на инференс. Что это даёт: - более быстрый инференс - меньшее потребление памяти - оптимальный баланс скорости и качества - готовность к развёртыванию в продакшене Поддержка из коробки: - vLLM - SGLang FP8-точность позволяет значительно ускорить рабочие процессы без заметной потери качества — особенно полезно для высоконагруженных AI-сервисов. Скачать веса: Hugging Face: https://huggingface.co/collections/Qwen/qwen35 ModelScope: https://modelscope.cn/collections/Qwen/Qwen35

50 155

Liquid AI представила свою крупнейшую модель - LFM2-24B-A2B 🐘 - 24 млрд параметров всего - активны только 2,3 млрд на каждый токен - построена на гибридной, аппаратно-оптимизированной архитектуре LFM2 Модель сочетает быстрый и экономичный дизайн LFM2 с архитектурой Mixture of Experts (MoE), благодаря чему при работе задействуется лишь небольшая часть параметров. Результат: - высокая энергоэффективность - быстрая работа на edge-устройствах - предсказуемый лог-линейный рост качества - полный запуск в пределах 32 ГБ памяти С выходом этой версии линейка LFM2 теперь охватывает почти два порядка масштаба — от 350 млн до 24 млрд параметров, при этом каждое увеличение размера даёт стабильный рост качества на стандартных бенчмарках. Модель специально оптимизирована так, чтобы помещаться в 32 ГБ RAM — её можно запускать на потребительских ноутбуках и рабочих станциях. Стратегия масштабирования: - увеличить глубину сети (с 24 до 40 слоёв) - увеличить число экспертов (с 32 до 64 в каждом MoE-блоке) - сохранить компактный активный путь вычислений Итог — общее число параметров выросло в 3 раза, но вычислительная нагрузка осталась контролируемой. LFM2-24B-A2B выпущена как instruct-модель (без трасс reasoning) и показывает лог-линейный рост качества на задачах: GPQA Diamond, MMLU-Pro, IFEval, IFBench, GSM8K, MATH-500. Модель получила поддержку «с первого дня» в: - llama.cpp - vLLM - SGLang Доступны квантованные версии (GGUF), работающие на CPU и GPU. Например: - на CPU (Ryzen AI, Q4_K_M) — около 93 токенов/с при контексте 8K - высокий throughput и на GPU (H100) Главный вывод: архитектура LFM2 демонстрирует предсказуемое масштабирование без «потолка качества» у малых моделей. https://huggingface.co/LiquidAI/LFM2-24B-A2B-GGUF

50 155

⚡️ Это заявление из прогноза компании Anthropic о ближайшем будущем ИИ. Остался один год: «Мы считаем вполне вероятным, что уже в начале 2027 года наши системы ИИ смогут полностью автоматизировать или существенно ускорить работу крупных команд ведущих исследователей - в областях, где быстрый прогресс может создать угрозы международной безопасности и вызвать серьёзные изменения в глобальном балансе сил. Речь идёт о таких направлениях, как энергетика, робототехника, разработка вооружений и сам искусственный интеллект https://x.com/AnthropicAI/status/2026393792375411115

50 155

🌟 Это действительно серьёзный сигнал. Исследование MIT показало эффект, который они называют когнитивным долгом при активном использовании AI. Главные выводы: - Чем чаще вы полагаетесь на LLM, тем хуже работает самостоятельное мышление - Мозг перестаёт «тренироваться» - когнитивные навыки постепенно ослабевают - Возникает привычка сразу обращаться к AI вместо того, чтобы анализировать самому Механизм простой: Если не использовать когнитивные «мышцы» — они деградируют. AI снижает трение мышления, но вместе с этим может снижать глубину обработки информации. Риск не в самом AI, а в модели использования: - копировать ответы вместо понимания - просить решение вместо попытки подумать - делегировать анализ, логику и формулировки Правильный подход: AI — как усилитель мышления, а не замена. Лучшие практики: - сначала подумать самому → потом сверить с AI - просить объяснения, а не готовый ответ - использовать AI для идей, проверки и расширения, а не для «думать за меня» Тренд: AI повышает продуктивность, но при пассивном использовании может снижать когнитивную самостоятельность. В эпоху LLM главным навыком становится не просто использование AI, а сохранение способности думать без него. https://arxiv.org/abs/2506.08872

50 155

⚠️ Большинство ошибок в машинном обучении начинаются не с модели, а с окружения. Конфликты библиотек, «падающие» ноутбуки, хаос в зависимостях — знакомо? 🦾 На открытом вебинаре OTUS мы разберём, как с нуля выстроить стабильную и воспроизводимую среду для ML-разработки. Настроим Python, виртуальные окружения, Jupyter и VS Code, покажем рабочую структуру ML-проекта и подходы к управлению зависимостями. Вы увидите, как перейти от разрозненных ноутбуков к полноценной инженерной практике: аккуратный код, понятная структура, предсказуемые сборки. Это база, без которой невозможно расти в ML и Data Science. ➡️ Встречаемся 26 февраля в 18:00 МСК в преддверие старта курса «Специализация Machine Learning». Присоединяйтесь и заложите правильный фундамент для карьеры ML-инженера: https://tglink.io/fdf1843d38da49?erid=2W5zFJhF4wB Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576 Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

50 155

Ответ Маска убил 😂 - Как они смеют красть то, что Anthropic сама украла у программистов?