- Регистрация
- 14.05.16
- Сообщения
- 11.398
- Реакции
- 501
- Репутация
- 0
Здравствуйте, читатели. Я хочу вам представить небольшое исследование, которые провели мы с моим другом полтора года назад, но в виду некоторых обстоятельств оформление затянулось до сего момента. Вопрос, который мы хотели рассмотреть, это можно ли построить такой классификатор, который помог бы молодым людям с выбором профессии.
TL;DR Провели опрос трех психологических тестов: Большая пятерка, эмоциональный интеллект, тест на профессию. Задали вопрос кем работают, нравится ли работа. Провели небольшой EDA. На базе тестов построили несколько классификаторов и лучший сравнили с тестом на профессию, ответы которого учитывались с нюансом. Датасет выложили в открытом доступе.
Введение
Началась эта история с размышлений о том, что грустно нынче от того, что много людей не знают, чему бы они хотели посвятить свою жизнь. Мне крупно повезло, поскольку для меня особо остро эта проблема никогда не стояла, она как-то сама разрешалась, но среди меня очень много людей, от которых я слышал о том, что они не понимают, чем заниматься, чтобы реализовать себя. Как мне видится, такие люди попадают в ловушку: поступают в университет, по принципу “куда возьмут”, если еще поступят, конечно. Отсиживают там пять лет, сдавая экзамены кое-как, со всякими сомнительными убеждениями, типа что им знания и специальность должны в рот затолкать, и под конец хорошо если диплом сами напишут. На выходе имеем человека, который в лучшем случае, безразличен к своей специальности, который ничего в ней не понимает. А где же здесь тут ловушка? Перечислю несколько, которые я сам наблюдал:
Я убежден, что каждому человеку можно помочь найти то, что ему будет по душе и избавить его от этого мучительного вопроса, на который ошибочный ответ может стоить весьма дорого. Как это не банально, нужно просто найти такую деятельность, которая соответствует способностям человека. Если человеку дается какая-то деятельность, он в разумное время получает результат, а значит удовольствие. Со временем, он будет тратить больше времени на эту деятельность, становясь профессионалом, соответственно, быстро и качественно выполнять задачи общества. Получается, в интересах самого же общества заботиться о том, чтобы люди находили "свою" деятельность.
И вот однажды, рассуждая обо всем этом, мне пришла идея: давайте мы спросим людей, которые имеют работу, нравится ли им эта работа, кем они работают и попробуем составить их психологический портрет, а работы мы поделим на разные классы по каким-нибудь признакам.
Дальше, с помощью магии машинного обучения попробуем сделать классификатор, который будет предсказывать по психологическому портрету наиболее вероятную область.
Спойлер
Вообще, сначала я хотел классификатор именно профессий, но, начав опрос, быстро понял, что пока это нереально.
Сбор данных
Для того, чтобы реализовать мою идею, нужны были данные. Довольно быстро мы с другом придумали создать опрос в Google.Формах, но вот где его размещать — большой вопрос. Нам нужны были места, аудитория которых — рабочие люди. И это вело к некоторым проблемам:
Кроме этого, у нас получился довольно большой опросник. Встречались люди, которые так и писали, мол, слишком длинно, не буду проходить. Был еще вариант использования специальных площадок для опросов, но почему-то к ним доверия у меня нет, да и денег особо не было.
В итоге, мы остановились на нескольких ресурсах: группы в ВК, в которых предположительно состоят рабочие люди, как пример, банковские группы, российская имиджборда Двач, Woman.ru и др. В итоге, на всех ресурсах, кроме Двача, мы были либо забанены, либо просто не получили разрешения. Поэтому, пришлось работать с тем, что есть.
За неделю нам удалось собрать 263 ответа. Удивительно, но количество шутников было минимум. Они легко определялись по ответу в графе о поле — мы оставили возможность указать свое мнение. Еще некоторые считали долгом отписаться в треде о том, что намеренно "все испортили", поэтому мы определяли таких по времени прохождения теста и времени их поста в треде. Некоторые, кстати, шуткой только в этой графе о поле и ограничились, давая вполне нормальные ответы дальше. Под конец недели, наши треды начали банить, но нам повезло — видимо это была смена особо злого модератора, все обошлось одним днем.
Структура опросника
В начале опроса спрашивали возраст, нравится профессия или нет, с уточнением, что не по зарплате, соц. пакету, печенькам, а сама она, сама профессия, как вид деятельности, и период времени в годах, сколько человек на ней работает. К сожалению, мы не могли дать гарантии, что нас правильно поймут, читая вопрос о том, что нравится профессия или нет и в итоге, казусы случались. Я прошу читателей тоже остановиться и понять, что мы имели в виду. Далее, для того, чтобы составить психологический портрет, было предложено пройти три теста: тест большой пятерки, тест на эмоциональный интеллект и тест на профессию. В заключение, мы спрашивали вопрос “Если вам не нравится Ваша профессия, то кем бы Вы хотели работать?” с вариантами “Мне нравится моя профессия”, полем, чтобы ответить, какую именно профессию, а также интересный ответ “Я хотел бы вообще не работать”. Последним вопросом был “Кем вы еще работали от года и больше?” с полем для ответа и вариантом “У меня не было других работ”. Весь опросник содержит 111 вопросов.
По началу, мы хотели еще дать тест на IQ, но поняли, что тест тогда не пройдет никто, в силу описания категории рабочих людей. Плюс сам тест на IQ будет давать очень большие погрешности: результаты зависят от состояния головы — стрессы и усталость могут сильно на них повлиять.
Теперь расскажу немного о каждом тесте.
Тест Большой пятерки
Психологи очень долго не могут прийти к согласию о понятии личности. Существуют разные подходы и теории об ее изучении, базирующиеся на этих различных понятиях. Одна из идей состоит в том, что человеческая личность — это композит нескольких составляющих, называемых факторами. На протяжении долгого времени ученые выделяли разные факторы и создавали разные тесты для их измерения. Например, одним из таких тестов является MMPI, который был разработан в 30х годах прошлого века. Однако на сегодня, как мне показалось при исследовании темы, одним из правдоподобных и перспективных тестов является тест Большой пятерки, который, в прочем, тоже был разработан довольно давно – в 60х годах.
Итак, этот тест призван характеризовать личность человека. В данной модели предполагается, что личность человека можно разделить на пять низко коррелированных факторов. Перевода на вики я не нашел, поэтому, если кто знает, как будет правильно, напишите, пожалуйста.
Мы использовали один из найденных в Интернете вариант на 50 вопросов по 10 на каждый фактор. Он был на английском, и мы его перевели на русский язык, что, вообще говоря, не совсем корректно, поскольку утверждения составляются с учётом психолингвистической особенностью языка.
Тест на эмоциональный интеллект или EQ-тест
Эмоциональный интеллект отражает (насколько это возможно) способность человека распознавать эмоции у себя и других, способность к самоконтролю, а также, понимать мотивацию и намерения других, что существенно влияет на его возможность строить эффективные коммуникации с другими людьми. Это понятие появилось вследствие того факта, что, в общем, интеллект — это не только уровень IQ. Есть книжка Дэниела Гоулмана Emotional Intelligence, в которой он описывает историю развития теории, описал современное состояние теории и предложил свою модель. Она также состоит из пяти осей
Тест состоит из 25 вопросов, по пять на каждый фактор.
Спойлер
Внезапно, выяснилось, что мы забыли добавить один вопрос, поэтому результат для одного фактора будет отличаться.
Тест на профессию
Этот тест разработан Е. А. Климовым. В основе этого теста лежит разделение типов личностей на 5 психотипов, которые соответствуют роду деятельность. В принципе, этот тест пытается сделать ровно то, что хочу и я. Думаю, у некоторых читателей возник вопрос: зачем изобретать велосипед, когда есть этот тест? Вот как раз, одна из целей этого исследования, выяснить, будет ли этот тест точнее получившегося классификатора. Кроме того, один из минусов теста, является то, что в нем можно набрать равное количество баллов в нескольких психотипах, что, конечно, лучше, чем ничего, но хотелось бы однозначности. Классификатор же, как раз будет выдавать только одну наиболее вероятную подходящую область или можно посмотреть и весь список, ранжированный по вероятностям.
Мы будем использовать психотипы из теста, как целевую метку для классификатора, вот их список с примерами профессий.
Собранные ответы респондентов в графе про профессию, мы вручную распределили по этим категориям. Мы старались сделать без ошибок, но некоторые профессии далеко не очевидно куда относить, как например, военный. Были также, ответы, в которых также было написано IT. Но IT большое, поэтому такие ответы отмечались, как неизвестные. Так что про чистоту целевой переменной еще можно спорить.
Тест состоит из 30 вопросов по 6 вопросов на каждую область.
Практика
Постановка задачи и EDA
Итак, теперь стоит окончательно сформулировать задачу полностью. Давайте посмотрим на наши данные. Мы начнем с распределений возраста, пола, целевой переменной и времени занятости.
Видим, что максимум распределения приходится на возраст 20-25 лет, что соответствует людям, которые только встают на свой профессиональный путь. Удивительно много оказалось людей, которым около 30 лет. Видим, также, что подавляющее большинство опрошенных — это мужчины. В малых количествах присутствуют шутники. По времени занятости, видно, что большинство работает на своей работе не менее года, однако другие варианты тоже не отстают. Картина, в целом, соответствует возрасту опрошенных. Кстати, для чего мы спрашивали это? Мы сделали предположение по чисто субъективному опыту, что за время не менее года, любая эйфория от принятия на работу должна пройти (или наоборот — человек может понять, что не так уж и плохо он устроился) и человек сможет твердо сказать нравится ли ему профессия или нет. Что касается целевой переменной, то мы ее закодировали для более удобного использования. Код такой
1 — Человек-природа
2 — Человек-техника
3 — Человек-знаковая система
4 — Человек-худ. образ
5 — Человек-человек
6 — Невозможно определить профессию
Как можно видеть, в данных сильный дисбаланс в сторону техников и знаковиков (так мы будем называть людей в профессиях Человек-Знаковая система), и почти отсутствуют представители профессий, связанных с природой. Мы решили разрабатывать классификатор только для техников и знаковиков, в силу хоть какой-то представительности и не такого резкого дисбаланса.
Классификатор будет бинарным: будет классифицировать принадлежность человека к знаковикам или техникам.
Спойлер
Конечно, в реальности, этот классификатор работать не будет, потому что у нас есть еще три варианта, как минимум. Тестировать мы будем на отложенной выборке из людей техников и знаковиков.
Несколько слов по поводу теста на профессии. Как мы отмечали выше, он может дать несколько психотипов в результате, что очень здорово усложняет и его интерпретацию для нас. Мы сделали три варианта подсчета результатов:
Мы для простоты возьмем только жесткий вариант. Честно, мы не стали долго думать, как можно интерпретировать результаты мягкого или совместного варианта — кажется просто некорректным сравнивать результат классификатора, который максимально вероятный и она такой один, с мягким результатом теста, который, получается, дает равновероятную оценку для нескольких психотипов.
В итоге, вот два вопроса, на которые мы постараемся ответить:
Давайте посмотрим на еще кое-какие интересные моменты. Взглянем на круговую диаграмму столбца об опыте предыдущей работы и “Если вам не нравится Ваша профессия, то кем бы Вы хотели работать?”
Ожидаемо, что для больше чем половины респондентов не имели другого опыта, в виду того, что основную массу опрошенных составляют люди в возрасте 20-25 лет. Интересно, что почти половина, респондентов ответила, что им нравится их текущая профессия, почти треть ответила, что не хотели бы работать и лишь только 15 процентов не знают, кем бы они хотели работать.
Стоит отменить, что те, кто не хотят работать — очень интересны. Главная гипотеза, которую мы выдвигаем, что человек просто не на своем месте. Конечно, может он просто устал. Есть даже такие, кто отметили, что им нравится профессия, но они предпочли бы не работать.
Также, количество респондентов, которым нравится текущее место и которые не работали раньше: 83, а количество респондентов, которым нравится текущее место, но которые работали раньше: 41. Всего респондентов, которые ответили, что им нравится текущее место работы — 124. Получается, что большинство опрошенных выбрали любимую (или полюбившуюся, или они думают, что любят) профессию с первого раза. Вопрос, который стоит поставить, будет ли так всегда.
Мы посчитали все тоже самое, но с окнами в 20-25 лет и больше 25. Получилось, вот что
TL;DR Провели опрос трех психологических тестов: Большая пятерка, эмоциональный интеллект, тест на профессию. Задали вопрос кем работают, нравится ли работа. Провели небольшой EDA. На базе тестов построили несколько классификаторов и лучший сравнили с тестом на профессию, ответы которого учитывались с нюансом. Датасет выложили в открытом доступе.
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
-
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
-
You must be registered for see links
-
-
You must be registered for see links
Введение
Началась эта история с размышлений о том, что грустно нынче от того, что много людей не знают, чему бы они хотели посвятить свою жизнь. Мне крупно повезло, поскольку для меня особо остро эта проблема никогда не стояла, она как-то сама разрешалась, но среди меня очень много людей, от которых я слышал о том, что они не понимают, чем заниматься, чтобы реализовать себя. Как мне видится, такие люди попадают в ловушку: поступают в университет, по принципу “куда возьмут”, если еще поступят, конечно. Отсиживают там пять лет, сдавая экзамены кое-как, со всякими сомнительными убеждениями, типа что им знания и специальность должны в рот затолкать, и под конец хорошо если диплом сами напишут. На выходе имеем человека, который в лучшем случае, безразличен к своей специальности, который ничего в ней не понимает. А где же здесь тут ловушка? Перечислю несколько, которые я сам наблюдал:
- в 18 лет вполне возможно не знать, чем ты хочешь заниматься, особенно, когда у самого ветер в голове, да и часто подсказать-то вокруг некому. Зато все знают, что без образования — никуда, а парням еще и в армию.
- поступив в универ, тебя затягивает студенческая жизнь, одной гранью из которой является отсрочка от полноценной самостоятельной жизни, давая время на тусовки, пьянки и игры. Человек, выбрав для себя такую грань только к последним курсам очнется и поймет, что вообще-то скоро работать надо.
- даже если человек осознал, что ему не нравится специальность, ему сложно что-то сделать. Во-первых, куда девать курсы, которые он уже прошел, особенно, если хочешь пойти из программистов в дизайнеры, условно. Во-вторых, что скажут родители. В-третьих, специально для парней, сгорит отсрочка. А ведь еще после пар наступает пункт два. И в-четвертых, а если ошибешься с вновь выбранной специальностью?
Я убежден, что каждому человеку можно помочь найти то, что ему будет по душе и избавить его от этого мучительного вопроса, на который ошибочный ответ может стоить весьма дорого. Как это не банально, нужно просто найти такую деятельность, которая соответствует способностям человека. Если человеку дается какая-то деятельность, он в разумное время получает результат, а значит удовольствие. Со временем, он будет тратить больше времени на эту деятельность, становясь профессионалом, соответственно, быстро и качественно выполнять задачи общества. Получается, в интересах самого же общества заботиться о том, чтобы люди находили "свою" деятельность.
И вот однажды, рассуждая обо всем этом, мне пришла идея: давайте мы спросим людей, которые имеют работу, нравится ли им эта работа, кем они работают и попробуем составить их психологический портрет, а работы мы поделим на разные классы по каким-нибудь признакам.
Дальше, с помощью магии машинного обучения попробуем сделать классификатор, который будет предсказывать по психологическому портрету наиболее вероятную область.
Спойлер
Вообще, сначала я хотел классификатор именно профессий, но, начав опрос, быстро понял, что пока это нереально.
Сбор данных
Для того, чтобы реализовать мою идею, нужны были данные. Довольно быстро мы с другом придумали создать опрос в Google.Формах, но вот где его размещать — большой вопрос. Нам нужны были места, аудитория которых — рабочие люди. И это вело к некоторым проблемам:
- в рабочее время, люди работают, а не отвечают на опросники;
- в нерабочее время, люди либо идут на работу, либо, уже уставшие, приходят домой и им снова не до опросников;
- вряд ли много ресурсов с большой аудиторией согласятся на бесплатное размещение опросника от каких-то там студентов.
Кроме этого, у нас получился довольно большой опросник. Встречались люди, которые так и писали, мол, слишком длинно, не буду проходить. Был еще вариант использования специальных площадок для опросов, но почему-то к ним доверия у меня нет, да и денег особо не было.
В итоге, мы остановились на нескольких ресурсах: группы в ВК, в которых предположительно состоят рабочие люди, как пример, банковские группы, российская имиджборда Двач, Woman.ru и др. В итоге, на всех ресурсах, кроме Двача, мы были либо забанены, либо просто не получили разрешения. Поэтому, пришлось работать с тем, что есть.
За неделю нам удалось собрать 263 ответа. Удивительно, но количество шутников было минимум. Они легко определялись по ответу в графе о поле — мы оставили возможность указать свое мнение. Еще некоторые считали долгом отписаться в треде о том, что намеренно "все испортили", поэтому мы определяли таких по времени прохождения теста и времени их поста в треде. Некоторые, кстати, шуткой только в этой графе о поле и ограничились, давая вполне нормальные ответы дальше. Под конец недели, наши треды начали банить, но нам повезло — видимо это была смена особо злого модератора, все обошлось одним днем.
Структура опросника
В начале опроса спрашивали возраст, нравится профессия или нет, с уточнением, что не по зарплате, соц. пакету, печенькам, а сама она, сама профессия, как вид деятельности, и период времени в годах, сколько человек на ней работает. К сожалению, мы не могли дать гарантии, что нас правильно поймут, читая вопрос о том, что нравится профессия или нет и в итоге, казусы случались. Я прошу читателей тоже остановиться и понять, что мы имели в виду. Далее, для того, чтобы составить психологический портрет, было предложено пройти три теста: тест большой пятерки, тест на эмоциональный интеллект и тест на профессию. В заключение, мы спрашивали вопрос “Если вам не нравится Ваша профессия, то кем бы Вы хотели работать?” с вариантами “Мне нравится моя профессия”, полем, чтобы ответить, какую именно профессию, а также интересный ответ “Я хотел бы вообще не работать”. Последним вопросом был “Кем вы еще работали от года и больше?” с полем для ответа и вариантом “У меня не было других работ”. Весь опросник содержит 111 вопросов.
По началу, мы хотели еще дать тест на IQ, но поняли, что тест тогда не пройдет никто, в силу описания категории рабочих людей. Плюс сам тест на IQ будет давать очень большие погрешности: результаты зависят от состояния головы — стрессы и усталость могут сильно на них повлиять.
Теперь расскажу немного о каждом тесте.
Тест Большой пятерки
Психологи очень долго не могут прийти к согласию о понятии личности. Существуют разные подходы и теории об ее изучении, базирующиеся на этих различных понятиях. Одна из идей состоит в том, что человеческая личность — это композит нескольких составляющих, называемых факторами. На протяжении долгого времени ученые выделяли разные факторы и создавали разные тесты для их измерения. Например, одним из таких тестов является MMPI, который был разработан в 30х годах прошлого века. Однако на сегодня, как мне показалось при исследовании темы, одним из правдоподобных и перспективных тестов является тест Большой пятерки, который, в прочем, тоже был разработан довольно давно – в 60х годах.
Итак, этот тест призван характеризовать личность человека. В данной модели предполагается, что личность человека можно разделить на пять низко коррелированных факторов. Перевода на вики я не нашел, поэтому, если кто знает, как будет правильно, напишите, пожалуйста.
- Экстраверсия (Extroversion)- черта характера, показывающая, где ищется источник энергии — внутри индивидуума или в сообществе.
- Доброжелательность (Agreeableness)- показатель того, насколько человек готов изменить свое поведение, чтобы угодить другим.
- Добросовестность, сознательность (Conscientiousness) — способность быть честным в выполнении деятельности.
- Невротизм (Neuroticism) — показатель эмоциональности.
- Открытость опыту (Openness to Expirience) — показатель того, насколько человек открыт новому опыту, а также предрасположенности к интеллектуальным занятиям.
Мы использовали один из найденных в Интернете вариант на 50 вопросов по 10 на каждый фактор. Он был на английском, и мы его перевели на русский язык, что, вообще говоря, не совсем корректно, поскольку утверждения составляются с учётом психолингвистической особенностью языка.
Тест на эмоциональный интеллект или EQ-тест
Эмоциональный интеллект отражает (насколько это возможно) способность человека распознавать эмоции у себя и других, способность к самоконтролю, а также, понимать мотивацию и намерения других, что существенно влияет на его возможность строить эффективные коммуникации с другими людьми. Это понятие появилось вследствие того факта, что, в общем, интеллект — это не только уровень IQ. Есть книжка Дэниела Гоулмана Emotional Intelligence, в которой он описывает историю развития теории, описал современное состояние теории и предложил свою модель. Она также состоит из пяти осей
- Самопознание (Self-Awareness) — способность понимать свои эмоции и свою мотивацию при принятии решений, определять свои слабые и сильные стороны, а также свои цели и жизненные ценности.
- Саморегуляция (Self-Management) — способность контролировать свои эмоции.
- Мотивация (Motivation) — способность стремиться к достижению цели ради факта ее достижения.
- Эмпатия (Empathy) — способность учитывать чувства других людей при принятии решений, а также способность сопереживать другим людям.
- Социальные навыки (Relationship Management) — способность выстраивать отношения с людьми, манипулировать людьми, подталкивать их в желаемом направлении.
Тест состоит из 25 вопросов, по пять на каждый фактор.
Спойлер
Внезапно, выяснилось, что мы забыли добавить один вопрос, поэтому результат для одного фактора будет отличаться.
Тест на профессию
Этот тест разработан Е. А. Климовым. В основе этого теста лежит разделение типов личностей на 5 психотипов, которые соответствуют роду деятельность. В принципе, этот тест пытается сделать ровно то, что хочу и я. Думаю, у некоторых читателей возник вопрос: зачем изобретать велосипед, когда есть этот тест? Вот как раз, одна из целей этого исследования, выяснить, будет ли этот тест точнее получившегося классификатора. Кроме того, один из минусов теста, является то, что в нем можно набрать равное количество баллов в нескольких психотипах, что, конечно, лучше, чем ничего, но хотелось бы однозначности. Классификатор же, как раз будет выдавать только одну наиболее вероятную подходящую область или можно посмотреть и весь список, ранжированный по вероятностям.
Мы будем использовать психотипы из теста, как целевую метку для классификатора, вот их список с примерами профессий.
- Человек-природа — микробиолог, геолог, овощевод, зоотехник, ветеринар, эколог, агрохимик, лесовод.
- Человек-техника — газосварщик, монтажник, токарь, инженер, конструктор, слесарь, водитель, механик, машинист, технолог.
- Человек-знаковая система — переводчик, программист, бухгалтер, экономист, специалист по маркетингу, геодезист, телефонист, налоговый инспектор, чертежник, аналитик.
- Человек-искусство — журналист, художник, модельер, закройщик, ювелир, дизайнер, архитектор, парикмахер, актер.
- Человек-человек — врач, медсестра, официант, юрист, следователь, агент по рекламе, экспедитор, инспектор ГИБДД.
Собранные ответы респондентов в графе про профессию, мы вручную распределили по этим категориям. Мы старались сделать без ошибок, но некоторые профессии далеко не очевидно куда относить, как например, военный. Были также, ответы, в которых также было написано IT. Но IT большое, поэтому такие ответы отмечались, как неизвестные. Так что про чистоту целевой переменной еще можно спорить.
Тест состоит из 30 вопросов по 6 вопросов на каждую область.
Практика
Постановка задачи и EDA
Итак, теперь стоит окончательно сформулировать задачу полностью. Давайте посмотрим на наши данные. Мы начнем с распределений возраста, пола, целевой переменной и времени занятости.
Видим, что максимум распределения приходится на возраст 20-25 лет, что соответствует людям, которые только встают на свой профессиональный путь. Удивительно много оказалось людей, которым около 30 лет. Видим, также, что подавляющее большинство опрошенных — это мужчины. В малых количествах присутствуют шутники. По времени занятости, видно, что большинство работает на своей работе не менее года, однако другие варианты тоже не отстают. Картина, в целом, соответствует возрасту опрошенных. Кстати, для чего мы спрашивали это? Мы сделали предположение по чисто субъективному опыту, что за время не менее года, любая эйфория от принятия на работу должна пройти (или наоборот — человек может понять, что не так уж и плохо он устроился) и человек сможет твердо сказать нравится ли ему профессия или нет. Что касается целевой переменной, то мы ее закодировали для более удобного использования. Код такой
1 — Человек-природа
2 — Человек-техника
3 — Человек-знаковая система
4 — Человек-худ. образ
5 — Человек-человек
6 — Невозможно определить профессию
Как можно видеть, в данных сильный дисбаланс в сторону техников и знаковиков (так мы будем называть людей в профессиях Человек-Знаковая система), и почти отсутствуют представители профессий, связанных с природой. Мы решили разрабатывать классификатор только для техников и знаковиков, в силу хоть какой-то представительности и не такого резкого дисбаланса.
Классификатор будет бинарным: будет классифицировать принадлежность человека к знаковикам или техникам.
Спойлер
Конечно, в реальности, этот классификатор работать не будет, потому что у нас есть еще три варианта, как минимум. Тестировать мы будем на отложенной выборке из людей техников и знаковиков.
Несколько слов по поводу теста на профессии. Как мы отмечали выше, он может дать несколько психотипов в результате, что очень здорово усложняет и его интерпретацию для нас. Мы сделали три варианта подсчета результатов:
- Жесткий вариант — считает только те, где есть только один максимальный прототип. Если несколько, то помечается ошибочным. Т.е. на стадии подсчета результатов, эта пометка будет влиять на результат, как неправильный. Это важный момент.
- Мягкий вариант — считает только те, где есть только несколько прототипов. Если один, то помечается ошибочным.
- Совместный вариант — считает предыдущие два без каких-либо пометок.
Мы для простоты возьмем только жесткий вариант. Честно, мы не стали долго думать, как можно интерпретировать результаты мягкого или совместного варианта — кажется просто некорректным сравнивать результат классификатора, который максимально вероятный и она такой один, с мягким результатом теста, который, получается, дает равновероятную оценку для нескольких психотипов.
В итоге, вот два вопроса, на которые мы постараемся ответить:
- На сколько точно жесткие результаты теста на профессию совпадают с текущей профессией, при условии, что текущая профессия нравится (для знаковиков и техников).
- На сколько точно результаты классификатора совпадают с текущей профессией, при условии, что текущая профессия (техника или знаковика) нравится.
Давайте посмотрим на еще кое-какие интересные моменты. Взглянем на круговую диаграмму столбца об опыте предыдущей работы и “Если вам не нравится Ваша профессия, то кем бы Вы хотели работать?”
Ожидаемо, что для больше чем половины респондентов не имели другого опыта, в виду того, что основную массу опрошенных составляют люди в возрасте 20-25 лет. Интересно, что почти половина, респондентов ответила, что им нравится их текущая профессия, почти треть ответила, что не хотели бы работать и лишь только 15 процентов не знают, кем бы они хотели работать.
Стоит отменить, что те, кто не хотят работать — очень интересны. Главная гипотеза, которую мы выдвигаем, что человек просто не на своем месте. Конечно, может он просто устал. Есть даже такие, кто отметили, что им нравится профессия, но они предпочли бы не работать.
Также, количество респондентов, которым нравится текущее место и которые не работали раньше: 83, а количество респондентов, которым нравится текущее место, но которые работали раньше: 41. Всего респондентов, которые ответили, что им нравится текущее место работы — 124. Получается, что большинство опрошенных выбрали любимую (или полюбившуюся, или они думают, что любят) профессию с первого раза. Вопрос, который стоит поставить, будет ли так всегда.
Мы посчитали все тоже самое, но с окнами в 20-25 лет и больше 25. Получилось, вот что
Нравится текущая, 20-25 лет | Нравится текущая, >25 лет |
---|