People Analytics
رفتن به کانال در Telegram
People analytics is a data-driven approach to managing people at work || Канал про HR-аналитику: оценка персонала, психометрика, использование R для анализа и визуализации HR-данных. Связь с автором канала: Юрий (@psych2016) Рекламу НЕ размещаю.
نمایش بیشتر2 009
مشترکین
اطلاعاتی وجود ندارد24 ساعت
-27 روز
-830 روز
آرشیو پست ها
2 009
🤖 Вкалывают роботы
Компания Figure AI запустила прямую трансляцию, в которой демонстрируется работа гуманоидных роботов в реальном времени. Это по-настоящему завораживающее зрелище! Роботы самостоятельно сортируют посылки на конвейере: берут коробки, переворачивают их и направляют дальше по линии. И всё полностью без участия человека. 😮
#FigureAI #БудущееУжеЗдесь #ИскусственныйИнтеллект #AI#FutureIsNow #РоботыНаРаботе
2 009
Repost from Weekly Charts
🔍 Сколько лет люди остаются на одной работе по разным профессиям?
Интересная визуализация от Нейтана Яу на основе данных Current Population Survey (2018–2024) в США. Респондентов спрашивали: «Сколько лет вы работаете на текущей работе?». Самая высокая медианная продолжительность: у руководителей пожарных и полицейских подразделений. Самая низкая: у водителей такси и операторов транспортных средств.
На первом графике показан медианный стаж с разбросом между 25-м и 75-м процентилями (или межквартильный размах IQR) для каждой профессии. Например, у веб-разработчиков медиана 4 года 11 месяцев, но 25-й перцентиль = 3 года 4 мес., а 75-й = 7 лет 7 мес., у почтовых служащих самый широкий разброс: кто-то работает десятилетиями, а кто-то уходит быстро.
На втором графике сравнивается медиана против IQR, что позволяет выделяет четыре квадранта (общих типа профессий): 1) высокая текучесть, 3) высокая текучесть, но с долей долго работающих, 3) смешанные от коротких до длительных сроков работы, 4) длительная занятость с небольшим разбросом.
Визуализация сделана как force-directed scatterplot: точки слегка «отталкиваются», как если бы между ними действовали физические силы. Такой приём часто используется для решения проблемы оверплоттинга (наложения точек друг на друга).
#R #D3_js #примеры_визуализаций #референсы
2 009
🙋♂️ О тестах предварительного отсева кандидатов
В профессиональной диагностике важно разделять инструменты, которые помогают найти «лучших», и те, что призваны отсеять «непригодных». Тесты предварительного отсева не обязаны иметь высокую корреляцию с эффективностью работы специалиста. Их главная задача — отсеять тех, кто точно не готов к профессиональной деятельности из-за отсутствия базовых профессиональных знаний. На примере теста КВАЛИМИН-26/50 в статье «О валидности и эффективности тестов предварительного отсева кандидатов» А. Г. Шмелев рассматривает случай асимметричного вывода — об отсутствии пригодности в случае низкого балла по тесту отсева. Тогда как высокий балл по тесту КВАЛИМИН всё равно потребует проведения дополнительных, более специализированных и более дорогостоящих оценочных процедур (работа под супервизией, собеседование с комиссией, решение кейсов в письменном и устном виде и т. п.).
Теоретический экзамен — необходимый инструмент (без него нельзя допускать к практике), но недостаточный (высокий балл сам по себе не гарантирует мастерства). Логика проста: высокий балл по теории не делает вас автоматически хорошим психологом, но низкий балл определённо делает вас профессионально непригодным на данный момент.
По аналогии с тестом на знание требований техники безопасности: низкий балл по тесту позволяет с большей вероятностью прогнозировать повышенный риск опасного поведения, обусловленного незнанием. Поэтому работник с низкими баллами по тесту не должен получить допуск к определённым видам работ. Вместе с тем высокий балл не является гарантией соблюдения сотрудником требований техники безопасности. Обычно повышенный риск травматизма и аварийности (то есть склонность к нарушению требований ТБ) характерен как для новичков, так и для работников с большим стажем работы или с определёнными личностными особенностями, однако это тема для другого поста.
#психометрика #тесты #валидность #практическая_тестология
2 009
Repost from Weekly Charts
Во второй главе читатель осваивает основы работы с данными на языке R: типы и структуры данных, базовые операции, обработку таблиц, работу с датами и строками, а также концепцию «опрятных» (tidy) данных. Дополнительно рассматриваются загрузка данных из внешних источников, веб-скрейпинг и сохранение результатов анализа.
Третья глава вводит в системы управления базами данных и принципы реляционной модели. Рассматриваются возможности PostgreSQL и язык SQL – от базовых операций до более продвинутых техник, включая оконные функции и оптимизацию запросов.
Четвёртая глава посвящена визуализации данных. Читатель знакомится с принципами грамматики графики и популярным пакетом для визуализации данных ggplot2, осваивает как базовые типы графиков, так и более сложные визуализации (тепловые карты, диаграммы Санкей, корреляционные матрицы). Дополнительно описаны R-пакеты в рамках grammar of graphics.
Пятая и шестая главы формируют прочную статистическую базу. Сначала вводятся ключевые понятия – выборки, гипотезы, доверительные интервалы и p-значения, рассматриваются конкретные методы анализа: от χ²-тестов и критерия Фишера до анализа времени до события и оценки диагностических тестов, включая вопросы выбора методов и поправки на множественные сравнения. Завершается глава вопросами планирования исследований (расчет размера выборки, рандомизация) и разведочного анализа данных.
Седьмая глава посвящена машинному обучению и большим данным. Рассматривается математика для машинного обучения. В ней даётся практическое введение в ключевые алгоритмы – регрессии, деревья решений, случайный лес, бустинг и нейронные сети, а также рассматриваются подходы к построению ML-пайплайнов и методы обучения без учителя.
Восьмая глава выходит за рамки анализа как такового и показывает, как организовать полноценный исследовательский процесс: от контроля версий (Git) до создания динамических отчётов и дашбордов (Quarto) и интерактивных приложений (Shiny), организации сбора данных. Содержание данной главы оформлено в виде скачиваемых файлов в формате PDF на сайте книги.
Девятая глава завершает книгу обзором биомедицинских датасетов. Материал служит базой для самостоятельной работы и воспроизведения примеров из книги. Наборы данных доступны для скачивания в интернет-репозитории.
📕 В итоге книга представляет собой целостное и практико-ориентированное руководство, которое не просто знакомит с инструментами анализа данных, а формирует системное мышление исследователя. Она особенно полезна тем, кто хочет перейти от фрагментарного использования методов к выстроенному, воспроизводимому и доказательному анализу данных – как в медицине, так и за её пределами.
Приобрести книжку можно, например, тут.
🔗 Ссылка на репозиторий: github.com/ds-book/code
📦 Датасеты: https://ds-book.ru/docs/datasets/
#R #ggplot2 #RStats #datascience #аналитика_данных #книги #машинное_обучение #ИИ
2 009
Repost from Weekly Charts
📕 Обзор книги «Наука о данных и искусственный интеллект в медицине»
В современную эпоху биомедицинские исследования сталкиваются с беспрецедентным ростом объемов информации. Объём доступных данных стремительно увеличился: их стало проще собирать, хранить и обрабатывать. Однако сами по себе данные не дают знания – ключевым становится умение их анализировать. Наука о данных (Data Science) превращается в фундамент доказательной медицины, позволяя не просто описывать явления, но и строить прогностические модели, выявлять скрытые закономерности и обеспечивать высокую точность выводов. Умение работать с данными сегодня является критически важным навыком для исследователей, стремящихся к объективности и воспроизводимости своих результатов. При этом на первый план выходит не только техника, но и культура работы с данными: умение формулировать задачи, интерпретировать результаты и выстраивать прозрачный аналитический процесс. Речь идет о формировании особого мышления и грамотности работы с данными, без которых невозможно эффективно использовать их потенциал.
Практическое руководство «Наука о данных и искусственный интеллект в медицине» от коллектива авторов даёт читателям комплексное и прикладное представление о возможностях Data Science в медицине, охватывая все важные информационно-технологические и исследовательские аспекты – от принципов планирования и дизайна биомедицинских исследований до анализа и визуализации данных, включая машинное обучение и работу с реальными биомедицинскими датасетами. Материал изложен доступно, но без упрощения содержания, что позволяет исследователю уверенно применять описанные подходы в своей предметной области.
Авторы делают акцент на практической значимости излагаемого материала, когда каждая глава содержит не только теоретические основы, но и многочисленные примеры (практические пошаговые действия и объяснение кода на R), рекомендации по использованию тех или иных методов анализа данных (алгоритмы их выбора).
Методология книги настолько универсальна, что её можно использовать как «учебник по доказательному подходу» в любой сфере: 1) HR-аналитикам (например, описываемый в ней анализ выживаемости для оценки «срока жизни» сотрудника в компании и выявления драйверов текучести персонала), 2) психологам-исследователям (применять описываемые методы для анализа данных тестирования), 3) дата-журналистам (сделать предобработку данных, привести к «опрятному» виду, работать с «грязными» данными из разных источников и превращать их в интересные расследования).
Важной составляющей книги являются сопутствующие датасеты. Это не абстрактные примеры, а реальные наборы биомедицинских данных. Наличие этих файлов позволяет читателю практиковаться «в боевых условиях», отрабатывая навыки очистки, визуализации и моделирования на конкретных кейсах, которые легко переносятся в рабочую практику врача, аналитика или исследователя. В онлайн-репозитории книги вы можете ознакомиться и скачать все скрипты (примеры кода на языке R), которые рассматриваются в печатном издании.
Это не книга по программированию на языке R (хотя авторы делают ставку на язык R, и это главное преимущество книги), а руководство по переходу на новый уровень мышления, поскольку учит культуре работы с данными, где во главе угла стоят точность, прозрачность, воспроизводимость и доказательность. Книга для тех, кто хочет перестать бояться данных и научиться уверенно работать с ними: от постановки задачи до интерпретации результатов и их представления.
Структура книги выстроена последовательно и отражает реальное содержание и процесс работы с данными.
Первая глава посвящена особенностям медицинских исследований и закладывает основу доказательной медицины. Рассматриваются дизайн исследований, рандомизация, ослепление, типовые схемы, а также клинические исследования, их фазы, нормативные аспекты и возможные систематические ошибки. Отдельное внимание уделено систематическим обзорам и метаанализу.
2 009
Repost from Weekly Charts
Пришла отличная книжка, обзором на которую хочу поделиться с читателями канала 👇
2 009
🎉 Журнал Psychometrika теперь в открытом доступе!
С 2025 года все статьи старейшего и ведущего журнала Psychometrika Психометрического общества доступны бесплатно. Этот рецензируемый журнал посвящён развитию психологии как количественной науки: здесь публикуются инновационные статистические методы, математические модели и теоретические разработки для анализа данных в психологии, образовании и социальных науках.
🔗 Читайте свежие публикации: https://www.cambridge.org/core/journals/psychometrika
#QuantitativePsychology #Psychometrics #Psychometrika #психометрика #анализ_данных
2 009
Repost from Weekly Charts
Команда Исследований Яндекса повторили исследование OpenAI о том, как люди используют ИИ-ассистентов, и обнаружили, что 1,3% запросов к Алисе AI (для сравнения:1,9% к ChatGPT) касаются рефлексии и отношений. Кажется, что это малая доля от всех запросов, но за ней стоят реальные люди в уязвимом состоянии. Использовать ИИ как психолога -- это плохая идея. Почему? 1) Все ИИ лицемеры, подхалимы и подлизы -- их такими создают, чтобы соглашаться с пользователем ради удержания внимания, даже если мысли деструктивны. 2) ИИ не умеет в клинические суждения (например, они не могут отличать временную грусть от глубокой депрессии). 3) ИИ могут проявлять предвзятость к людям в трудной жизненной ситуации, с зависимостями или психическими расстройствами. 4) они могут формировать у пользователей эмоциональную зависимость от общения с собой 5) ИИ не несут ответственности за вред.
Короче, это мои мысли по ходу ознакомления с исследованием Яндекса. Бегом читать (смотреть) -- классный пример сторителлинга 👇
#дата_сторителлинг #примеры_визуализаций #референсы
2 009
🧭 UK Skills Explorer
Новый интерактивный ресурс UK Skills Explorer от Skills Classification, который помогает исследовать связь между навыками, знаниями, способностями (KSA) и профессиями.
🔍 Что можно делать:
Поиск по базе. Введите название профессии, навыка или квалификации для получения структурированной информации
Умные фильтры. Сортируйте результаты по категориям: Skills, Knowledge, Occupations, Core Skills, Qualifications.
Карьерная навигация. Узнайте, какие компетенции нужны для интересующей вас роли, и как они соотносятся с квалификациями.
Для кого это актуально:
✅ HR-специалистам и рекрутерам для точного описания требований к позициям.
✅ Карьерным консультантам, чтобы помогать клиентам строить траектории профессионального развития и карьеры.
✅ Соискателям и студентам для понимания, какие навыки прокачивать под целевую профессию.
✅ L&D-командам для проектирования программ обучения на основе стандартизированной таксономии.
💡 Сайт ориентирован на рынок труда Великобритании, но сама структура KSA-компонентов универсальна. Проект находится в публичной бета-версии (2026), поэтому возможны доработки, но функционал уже рабочий и полезный.
🔗 Исследовать сейчас: UK Skills Explorer
#SkillsClassification #KSA #CareerDevelopment #HRTech
2 009
🕸 Циркограммы как инструмент когнитивной графики
Традиционно в психометрике доминировала концепция простой структуры (Луис Леон Тёрстоун, 1947), при которой каждый пункт или шкала имеет значимую нагрузку только на один фактор. Однако ещё в 1954 году Луис Гуттман предложил альтернативную модель — циркумплекс (как круговую модель корреляций в матрице) для описания сложных психологических областей, где переменные не группируются по отдельным осям, а образуют непрерывное кольцо взаимосвязей.
Хочу обратить внимание подписчиков канала на статью А.Г. Шмелева "Двухфакторные циркограммы как инструмент когнитивной графики в компьютерной психодиагностике", в которой circumplex model (циркумплексная модель) называется "циркограммой" (или "циркуляторной моделью" в ранних работах). Автор фокусируется на визуализации этой модели как инструмента когнитивной графики. Его "циркограммы" (8- или 12-секторные) выступают как практический способ представить сложную двухфакторную структуру личности в наглядной форме, где каждый сектор является уникальной комбинация двух основных факторов. Это позволяет легко сравнивать профили, полученные из разных источников (самооценка, оценка родителей и т.д.). Мне кажется, хорошее название "циркоГРАММА" как разновидность "диаГРАММЫ".
#психометрика #ТЕЗАЛ #личность #личностные_факторы #циркумплекс #циркограмма
2 009
🧠 Типология Myers-Briggs в сериале Fallout
В 8-й серии 2-го сезона сериала Fallout (финал сезона) раскрывается, что корпорация Vault-Tec использовала тест Майерс-Бриггс для отбора "идеального" работника. Спойлеры (!): Речь идет о конгрессвумен Дайан Уэлч (Diane Welch), где Хэнк Маклейн говорит о ней: "Congresswoman Diane Welch, from Glendale. ISTP on the old Myers-Briggs, which is still the gold standard for personnel. Ideal personality to scale". Хэнк объясняет Люси, что этот тип личности является "золотым стандартом" для персонала компании Vault-Tec, так как такие люди "благонамеренны, милы и не представляют угрозы". Поэтому Хэнк Маклейн использовал её сознание в главном компьютере для копирования в чипы контроля разума (чипы интерфейса мозг-компьютер), которые он же и улучшил (см. фото).
PS: что в типологии MB следует считать "натяжками" и не подтверждается данными современной науки.
#пятничное #типологии #MBTI #personality #отбор_персонала #масскульт
2 009
Repost from Компьютерная психодиагностика и психосемантика
Итак, коллеги, группа набрана и в понедельник 19 января начнутся занятия на нашем дистанционном курсе-практикуме КТЗ-26.
Еще есть возможность "вскочить на подножку уходящего поезда". Ведь в январе каждый участник в своем темпе будет проходить цикл из 5 вводных лекций, а сами разговорные вебинары и практические занятия (конструирование учебного теста) начнутся только в феврале.
Вот прямая ссылка на страницу, где возможна оплата участия и регистрация:
https://ht-line.ru/ktz-w
Эту информацию я позволяю себе здесь публиковать, понимая, что скорее всего она заинтересует вовсе не самих маститых специалистов (которых среди подписчиков данного канала, как я знаю, большинство), а ваших учеников и молодых коллег. Передайте им, пожалуйста, эту информацию - тем, кого это может заинтересовать. Мы открываем доступ к этим занятиям вовсе не перманентно, а только раз в сезон, или даже раз в год, как это получилось в 2025 году.
2 009
📕 Второе издание Handbook of Regression Modeling in People Analytics
Кит МакНалти анонсировал второе издание Handbook of Regression Modeling in People Analytics ("Руководство по регрессионному моделированию в People Analytics"). Первое издание рекомендовал ранее, во втором издании добавлено 5 новых глав, содержит множество улучшений и доработок. Печатная версия второго издания выйдет позже в этом году. А пока можно смело читать онлайн-версию.
#analytics #datascience #statistics #peopleanalytics #R
اکنون در دسترس! پژوهش تلگرام ۲۰۲۵ — مهمترین بینشهای سال 
