Математика Дата саентиста

Open in Telegram

@workakkk - админ @data_analysis_ml - ds https://gosuslugi.ru/snet/67b55bb01a1c5a6fb6ecc946

Network:Machinelearning Russia47 086 Technologies & Applications9 126...

📈 Analytical overview of Telegram channel Математика Дата саентиста

Channel Математика Дата саентиста (@data_math) in the Russian language segment is an active participant. Currently, the community unites 14 044 subscribers, ranking 9 126 in the Technologies & Applications category and 47 086 in the Russia region.

📊 Audience metrics and dynamics

Since its creation on невідомо, the project has demonstrated rapid growth, gathering an audience of 14 044 subscribers.

According to the latest data from 26 June, 2026, the channel demonstrates stable activity. Although there has been a change in the number of participants by -38 over the last 30 days and by -3 over the last 24 hours, overall reach remains high.

Verification status: Not verified
Engagement rate (ER): The average audience engagement rate is 15.80%. Within the first 24 hours after publication, content typically collects 6.22% reactions from the total number of subscribers.
Post reach: On average, each post receives 2 220 views. Within the first day, a publication typically gains 874 views.
Reactions and interaction: The audience actively supports content: the average number of reactions per post is 28.
Thematic interests: Content is focused on key topics such as llm, программирование, параметр, визуализация, stepik.

📝 Description and content policy

The author describes the resource as a platform for expressing subjective opinions:
“@workakkk - админ @data_analysis_ml - ds https://gosuslugi.ru/snet/67b55bb01a1c5a6fb6ecc946”

Thanks to the high frequency of updates (latest data received on 27 June, 2026), the channel maintains relevance and a high level of publication reach. Analytics show that the audience actively interacts with content, making it an important point of influence in the Technologies & Applications category.

14 044

Subscribers

-324 hours

-67 days

-3830 days

2 220

Post views

~ 87424 hours

~ 1 02548 hours

15.80%

Engagement rate

No data

Posts per day

Ads index

beta

Posts Archive

14 044

Repost from Machinelearning

📌Руководство по эффективному использованию промптов для LLM от разработчиков из GoogleDeepMind. Туториал ориентируется на нетехническую аудиторию, которая имеет опыт взаимодействия с большими языковыми моделями. В первой половине представлены ментальные конструкции природы посттренинга и промптов. Вторая половина содержит более конкретные предписания и высокоуровневую процедуру промпт-инжиниринга. Авторы, Varun Godbole и Ellie Pavlick подчеркивают, что поиск «идеальной» подсказки — это итеративный процесс, аналогичный настройке модели, который в лучшем случае является эмпирическим, а в худшем - алхимическим. ▶️ Содержание: 🟢Для кого предназначен этот документ? 🟢Зачем нужно это руководство? 🟢Background трейна: предварительная и последующая подготовка 🟢Рекомендации по промптам 🟢Рудиментарное "руководство по стилю" для промптов 🟢Процедура итерации новых системных инструкций 🟢Некоторые мысли о том, когда полезна LLM 🟢Дополнительные ресурсы 📌Лицензирование: Creative Commons Attribution 4.0 International Public License. 🖥GitHub @ai_machinelearning_big_data #AI #ML #LLM #Prompt #Github #Tutorial

14 044

🤖Вы слышали о ChatGPT, но не знаете, как он работает? А как языковые модели меняют мир, в котором мы живём? Если вы хотите разобраться в этом и узнать, как применять эти технологии в своих проектах, не пропустите наш бесплатный открытый урок 20 ноября в 18:00 мск! ⚡️На вебинаре: -погрузимся в историю развития языковых моделей от базовых концепций до современных LLM (Large Language Models), таких как ChatGPT. -Вы узнаете, какие методы и технологии стоят за этими интеллектуальными системами и как их можно использовать для решения задач Natural Language Processing (NLP). Спикер Мария Тихонова – PhD Computer Science, Senior Data Scientist в SberDevices и преподаватель ВШЭ. 👉Регистрация: https://vk.cc/cE9ykE?erid=LjN8KC2yg Встречаемся в преддверии старта курса «Natural Language Processing (NLP)». Все участники вебинара получат специальную цену на обучение! Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

14 044

⚡️ Математические формулы с помощью Python @data_math

14 044

🔥 Курс «Основы искусственного интеллекта» — Python, машинное обучение, глубокое обучение, наука о данных! 🕞 Продолжительность: 10:22:25 🔗 Ссылка: *клик* #курс #ai #datascience #deeplearning @data_math

14 044

🕓 Крутые часы для математика @data_math

14 044

Теория и практика: A/B-тестирование для успешной аналитики ⭐ Бесплатный вебинар 6 ноября в 19:00 мск Аналитик данных помогает бизнесу не ошибаться при принятии важных решений. А А/В-тесты - один из must-have инструментов, которые в этом помогают. Если вы хотите разобраться в основах проведения экспериментов и научиться правильно проводить А/В-тесты, ждём вас на бесплатном вебинаре. На реальных кейсах узнаем: — Что такое A/B-тестирование — Как выбрать гипотезу для тестирования — Как определить метрики успешности — Когда тест можно считать завершенным и др. 🚶 Переходите и регистрируйтесь на бесплатный вебинар.

14 044

⚡️ ЛУЧШЕЕ ДОКАЗАТЕЛЬСТВО теоремы Синусов 📌 источник @data_math

14 044

Repost from Machinelearning

🌟 Llama-3.1-Centaur-70B: модель симуляции поведения человека. Centaur - модель, которая способная предсказывать и симулировать поведение человека в любом психологическом эксперименте, который можно описать на естественном языке. Это первая модель, соответствующая большинству критериев Ньюэлла для универсальной теории познания, включая способность действовать как почти произвольная функция окружающей среды и работать в реальном времени. Centaur создана на основе Llama 3.1 70B и дообучена на наборе данных Psych-101, включающем данные 60 000 участников, давших суммарно 10 000 000 ответов в 160 психологических экспериментах. Psych-101 охватывает широкий спектр областей когнитивной науки: игровые автоматы, принятие решений, память, обучение с учителем, процессы принятия решений Маркова и др. Centaur дообучалась методом QLoRA: к каждому слою базовой Llama 3.1 70B были добавлены низкоранговые адаптеры, при этом параметры базовой модели остались неизменными. Обучение проводилось на всем наборе данных с использованием стандартной функции потерь кросс-энтропии. Потери маскировались для всех токенов, не соответствующих ответам людей, чтобы итоговая модель фокусировалась на моделировании поведения человека. В большинстве проведенных экспериментов Centaur превосходит как базовую модель Llama, так и специализированные когнитивные модели, разработанные для конкретных областей психологии. Кроме того, Centaur обобщает знания на "незнакомые" ситуации, которые не входили в датасет обучения: точно предсказывает поведение при измененных формулировках задач, структурах проблем и даже в совершенно новых областях. Важный результат экспериментального тестирования - соответствия внутренних представлений Centaur нейронной активности человека. Это открытие было подтверждено 2 исследованиями, в которых внутренние представления модели использовались для предсказания активности мозга. Centaur продемонстрировала улучшенную декодируемость по сравнению с Llama в задачах, связанных с чтением предложений и выполнением двухэтапных задач. ⚠️ Centaur обучена на наборе данных, в котором выбор человека выражается символами "<<" и ">>". Для оптимальной работы рекомендуется соответствующим образом настроить промпты. ⚠️ Модель запускается на 80 GB GPU. 📌Лицензирование: Llama 3.1 Community License. 📌Лицензирование датасета : Apache 2.0 License. 🟡Модель 🟡Техотчет 🟡Датасет @ai_machinelearning_big_data #AI #ML #LLM #Centaur

14 044

Как нужно укомплектовать команду ML для решения задачи? 🔹Расскажем на открытом уроке «Структура и построение ML команды» про композицию ML команды, различные роли в ней и их зоны ответственности ✅ Поговорим о том, зачем нужны ролы Data Scientist, Data Analyst, BI Analyst, ML Engineer, Data Engineer. Как организовать работу команды и взаимодействие внутри нее. Урок приурочен новому курсу «ML Team Lead» от Otus. 👉 Регистрация и подробности: https://otus.pw/Fbl8/?erid=LjN8KSdHR #реклама О рекламодателе

14 044

🛜 Находим пароль от Wi-fi из известного мема, с помощью Grok и Chatgpt. GPT решил задачу численно, а Grok понял, что интеграл можно разбить на 2 части: первая - интеграл от нечетной функции по [-a,a] (которая равна 0), а вторая - площадь круга! @data_math

14 044

Прокачивайте скилы на релевантных бизнес-задачах с помощью Яндекс Практикума. Наставники из Яндекса и других крупных компаний помогут со сложными темами, а ревьюеры дадут обратную связь. Как всё устроено: 1️⃣ Учитесь где и когда удобно Обучение разбито на спринты по несколько недель, а график позволяет совмещать учёбу с другими делами. 2️⃣ Практика с первого дня Учимся на примерах из работы и используем популярные рабочие инструменты. 3️⃣ Задачи из реальных сфер На курсе будут проекты из разных сфер бизнеса, чтобы вы набрались опыта и сразу же применяли новые знания. Прежде чем платить, любой курс можно попробовать и убедиться, что он вам подходит. Вот несколько наших курсов: ✅ Инженер данных ✅ Инженер машинного обучения ✅ SQL для работы с данными и аналитики ✅ SQL для разработки Получите скидку 20% после прохождения первой темы любого курса. Она бесплатная🔥

14 044

Repost from Анализ данных (Data analysis)

🔥 Видео от университета Стэнфорда о создании больших языковых моделей! 💡 Это видео — краткий обзор создания модели, подобной ChatGPT, охватывающий как предварительное обучение модели, так и последующее обучение (SFT/RLHF). В видео рассматриваются общие практики сбора данных, алгоритмы и методы оценки модели. 🕞 Продолжительность: 1:44:30 🔗 Ссылка: *клик* @data_analysis_ml

14 044

Обучаем IT-специалистов и берём в команду ⚡️ Лучшим участникам предложим оффер в Т1 — крупнейшую по выручке ИТ-компанию страны по версии RAEX и CNews Analytics 2023🔝. Зачем участвовать? 🔹 Уникальный рыночный опыт. Т1 одни из первых на рынке, кто внедряет технологии для управления данными. 🔹 Попасть в число лучших. Проекты Т1 ежегодно получают лучшие награды на ИТ-конкурсах: Global CIO, Национальная банковская премия и др. 🔹 Поддержка. Тебя ждёт команда опытных профессионалов, которые помогут расти и развиваться. Выбирай: 📁 аналитик платформы данных (DWH) 🖥 разработчик платформы данных (DWH) От тебя нужен только опыт работы от 6 месяцев в проектах разработки хранилищ данных и желание попасть в команду Т1. ⏰ Быстрое обучение: 1 месяц 📱 Гибкий формат: онлайн по вечерам (от 8 часов в неделю на вебинары и практику) Подавай заявку до 5 ноября! #реклама О рекламодателе

14 044

🖥 kalmangrad — это Python-библиотека для вычисления гладких производных произвольного порядка для временных рядов с нерегулярными интервалами. Она использует байесовскую фильтрацию, что делает её устойчивой к шумам по сравнению с классическими методами численного дифференцирования ⭐️ Библиотека полезна для оценки производных в таких областях, как обработка сигналов и системы управления, и поддерживает вычисление производных вплоть до заданного порядка 🖥 GitHub @data_math

14 044

🤙 Число Грэма на пальцах Как только ребенок (а это происходит где–то года в три–четыре) понимает, что все числа делятся на три группы "один, два и много", он тут же пытается выяснить: насколько много бывает много, чем много отличается от очень много, и может ли оказаться так много, что больше не бывает. Наверняка вы играли с родителями в интересную (для того возраста) игру, кто назовет самое большее число, и если предок был не глупее пятиклассника, то он всегда выигрывал, на каждый "миллион" отвечая "два миллиона", а на "миллиард" — "два миллиарда" или "миллиард плюс один". Уже к первому классу школы каждый знает — чисел бесконечное множество, они никогда не заканчиваются и самого большого числа не бывает. К любому миллиону триллионов миллиардов всегда можно сказать "плюс один" и остаться в выигрыше. А чуточку позже приходит (должно прийти!) понимание, что длинные строки цифр сами по себе ничего не значат. Все эти триллионы миллиардов только тогда имеют смысл, когда служат представлением какого–то количества предметов или же описывают некое явление. Выдумать длиннющее число, которое ничего из себя не представляет, кроме набора долгозвучащих цифр, нет никакого труда, их итак бесконечное количество. Наука, в какой–то образной мере, занимается тем, что выискивает в этой необозримой бездне совершенно конкретные комбинации цифр, присовокупляя к некому физическому явлению, например скорости света, числу Авогадро или постоянной Планка. Представьте, насколько огромными могут быть числа! Вот несколько примеров невероятно больших чисел: 10^51 — это количество атомов на Земле. 10^80 — примерно столько существует элементарных частиц во всей видимой Вселенной. 10^90 — примерно столько существует фотонов во всей видимой Вселенной. Это число превышает количество элементарных частиц почти в 10 миллиардов раз. 10^100 — это гугол. Хотя это число не имеет физического смысла, оно звучит красиво и кругло. В 1998 году компания, которая поставила перед собой шутливую цель проиндексировать гугол ссылок, назвалась Google. 10^122 — это количество протонов, необходимое для заполнения всей видимой Вселенной до предела. 10^185 — это объем видимой Вселенной в планковских объемах. Планковский объем — это куб размером 10^-35 метров, наименьший известный науке размер. Скорее всего, как и у Вселенной, существуют еще более мелкие объекты, но ученые пока не нашли для них внятных формул, ограничиваясь лишь предположениями. Но даже эти числа далеко не предел. Настоящие гиганты, такие как число Грэма, все еще ждут своего часа. ⭐️ Читать подробнее @data_math

14 044

Яндекс Игры пришли к нам с запросом:


SELECT * 
FROM subscribers 
WHERE channel_name = 'data_math'
AND technical_skills IN ('SQL', 'Airflow', 'MapReduce', 'DataLens') 
AND data_driven_approach = true 
AND analytical_mindset = true 
AND years_of_experience >= 2 
AND fit = true;

Ребята ищут аналитика в свою команду. Яндекс Игры посещают более 40 млн пользователей в месяц, поэтому можно проверять кучу гипотез на крупных выборках и экспериментировать. ВАЖНО. Проверенные гипотезы не пойдут «в стол», а будут помогать команде принимать взвешенные решения и влиять на развитие продукта. Если у тебя есть опыт работы с продуктами, аналитический склад ума и необходимые навыки, — это отличный шанс быстро вырасти и прокачаться на интересных задачах. Описание вакансии здесь, но лучше сразу пишите рекрутеру и договаривайтесь о собеседовании: @danny_md1

14 044

Linear Algebra Done Right 📓 Книга @data_math

14 044

Repost from Machinelearning

🌟 SegVLAD: метод визуального распознавания мест. SegVLAD - метод для решения задач визуального распознавания мест (VPR) в условиях значительных изменений ракурса. SegVLAD использует сегментацию изображений, разделяя их на значимые объекты ("вещи"). Вместо того, чтобы кодировать все изображение целиком, как это делают традиционные методы VPR, SegVLAD кодирует и ищет соответствия на уровне отдельных сегментов. Основа архитектуры SegVLAD - набор перекрывающихся подграфов сегментов SuperSegments. Подграфы создаются путем расширения окрестности каждого сегмента, учитывая информацию о соседних сегментах, полученную с помощью триангуляции Делоне. Для каждого SuperSegment вычисляется дескриптор с использованием метода VLAD (Vector of Locally Aggregated Descriptors). VLAD агрегирует локальные дескрипторы пикселей, полученные с помощью предварительно обученного DINOv2, который способен извлекать высокоуровневые признаки, инвариантные к различным условиям съемки. SegVLAD обучался на наборах данных, включающих как уличные, так и внутренние среды: Pitts30k, AmsterTime, Mapillary Street Level Sequences (MSLS), SF-XL, Revisted Oxford5K, Revisited Paris6k, Baidu Mall, 17Places, InsideOut и VPAir. Тесты SegVLAD показали, что метод превосходит современные VPR, особенно на датасетах с большими изменениями точки обзора. SegVLAD является универсальным и может быть использован с различными методами сегментации изображений и кодировщиками признаков. Проект программной реализации метода SegVLAD - Revisit Anything. ▶️Локальный запуск с набором данных 17 places из датасета AnyLock (~ 32GB) и моделями SAM+DINO: ⚠️ Перед запуском подготовьте данные датасета согласно структуре и укажите путь к данным в place_rec_global_config.py/

# Шаг1 - выбор метода (DINO/SAM):
python place_rec_SAM_DINO.py --dataset <> --method DINO/SAM

# Шаг2 - генерация VLAD cluster center (опционально):
python vlad_c_centers_pt_gen.py --dataset <>

# Шаг 3 - извлечение PCA:
place_rec_global_any_dataset_pca_extraction.py --dataset <> --experiment <> --vocab-vlad <domain/map>

# Шаг 4 - запуск SegVLAD: 
place_rec_main.py --dataset <> --experiment <> --vocab-vlad <domain/map> --save_results <True/False>

📌Лицензирование : BSD-3-Clause license. 🟡Страница проекта 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI #ML #SAM #DINO #VPR #SegVLAD

14 044

Какая ошибка при использовании метрик – самая опасная ? Когда мы «молимся» на одни показатели, но игнорируем другие: те, которые не укладываются в нашу картину успеха. Такой перекос опасен для компании: будут страдать и сотрудники, и результаты их работы. Хотите узнать, как пользоваться метриками, чтобы улучшать процессы, а не просто давить на команду? Приходите на открытый вебинар «Метрики для оценки работы и производительности команды» Будет интересно: менеджерам в IT, scrum-мастерам, agile-тренерам, руководителям и тимлидам в отделах разработки. Вы научитесь: - усовершенствовать оценку производительности команд - оптимизировать процессы разработки - внедрять и развивать метрики в agile и scrum-командах - соблюдать баланс метрик - повышать производительность не в ущерб качеству Спикер: Ирина Метансина – проект-менеджер, agile-практик, бизнес-аналитик с 10-летним опытом в проектном управлении. 17 октября, 19:00 МСК, Бесплатно Какая ошибка при использовании метрик – самая опасная ? Когда мы «молимся» на одни показатели, но игнорируем другие: те, которые не укладываются в нашу картину успеха. Такой перекос опасен для компании: будут страдать и сотрудники, и результаты их работы. Хотите узнать, как пользоваться метриками, чтобы улучшать процессы, а не просто давить на команду? Приходите на открытый вебинар «Метрики для оценки работы и производительности команды» Будет интересно: менеджерам в IT, scrum-мастерам, agile-тренерам, руководителям и тимлидам в отделах разработки. Вы научитесь: - усовершенствовать оценку производительности команд - оптимизировать процессы разработки - внедрять и развивать метрики в agile и scrum-командах - соблюдать баланс метрик - повышать производительность не в ущерб качеству Спикер: Ирина Метансина – проект-менеджер, agile-практик, бизнес-аналитик с 10-летним опытом в проектном управлении. 17 октября, 19:00 МСК, Бесплатно Записаться на событие - https://otus.pw/uWUM/?erid=LjN8K5QX6 Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.

14 044

👩‍💻 tensor.h — представляет собой минималистичную библиотеку для работы с тензорами на языке C. Основной задачей является выполнение математических операций с многомерными массивами без сложных зависимостей. Те́нзор (от лат. tensus, «напряжённый») — объект линейной алгебры, линейно преобразующий элементы одного линейного пространства в элементы другого. Частными случаями тензоров являются скаляры, векторы, билинейные формы и т. п. 💡 В README содержится подробное руководство, где описаны примеры использования и базовые операции с тензорами, что облегчает начальную настройку и работу с библиотекой. Это делает её удобной для численных вычислений и задач машинного обучения. ▪️Github @data_math