luckyea77 (luckyea77) wrote,
luckyea77
luckyea77

Человек — это набор из пяти чисел: Игорь Волжанин, DataSine — о психотипировании с помощью big data



Желание человека знать о себе как можно больше играет на руку современной психологии — многочисленная информация, которую люди генерируют в социальных сетях, используется для психотипирования. Бизнес, в свою очередь, на основе этих больших данных персонализирует подход к клиентам. «Хайтек» встретился на конференции «Big Data, Meet Big Brother!», организованной Sistema_VC, с Игорем Волжаниным, CEO компании DataSine. Он рассказал о том, как компания выступает посредником между бизнесом и клиентом, об этике сбора данных и о том, почему психология людей позволила Cambridge Analytica украсть данные пользователей Facebook.

Игорь Волжанин — основатель компании DataSine, которая занимается психологическим профилированием клиентов для банков и других бизнесов. С помощью данных DataSine определяет психотип человека и делает коммуникацию бизнеса с ним более успешной. Компания была основана в 2015 году, когда Волжанин переехал в Лондон писать докторскую диссертацию по психологии. Инвестор DataSine — венчурный фонд Sistema_VC (основной инвестор — АФК «Система»).

«Человек кликает на баннер, а мы определяем его психотип»

— Чем занимается DataSine?

— Помощью с персонализацией общения бизнеса с клиентом. У этого процесса две составляющие. Первая — профилирование клиента на основе данных, которые уже есть у бизнеса. В основном раньше мы работали с финансовыми учреждениями, поэтому это были транзакционные данные клиента — как человек тратит деньги, где, сколько. За счет этого строился психологический портрет человека. И второе — это платформа, позволяющая менять e-mail, телефонные скрипты и СМС под психотип человека. Брать письмо и менять цвета, картинки, слова — чтобы сделать его более доступным и интересным для определенного психотипа.

— Раньше вы работали с банками, а сейчас?

— Мы пытаемся выйти на новые рынки. Из-за прежней ограниченности с транзакционными данными в качестве исходных у нас был узкий круг компаний, с которыми мы работали. Теперь мы создали новый метод профилирования и больше уже не нуждаемся в транзакционных данных. И мы можем профилировать клиентов практически для всех — от огромных корпораций до стартапов, у которых нет подобных данных.

— Какие данные можно использовать вместо транзакционных?

— Сейчас мы можем провести скоринг любого контента — письма или баннера, и определить по тому, кто кликнул, его психотип. И если даже у клиента нет исторических данных по email-кампаниям или баннерам, то мы создаем свои. Грубо говоря, берется баннер и делается две версии, для интровертов и экстравертов. И показываются эти баннеры — один день вы видите один баннер, второй день — второй баннер. В зависимости от того, на какой из двух баннеров кликает пользователь, мы можем определить его психотип.



Этическая грань автоматического профилирования

— Какие теории используете для определения психотипов?

— В психологии (если мы говорим о психотипировании) сегодня используется один фреймворк. Это Big Five, его еще называют OCEAN. Если я как ученый исследую человека, то даю ему опросник Big Five. Самая новая версия этого опросника сделана учеными из США и переведена уже на 15–20 разных языков. Он используется практически везде. В нем от 20 до 150 вопросов, стандартный вариант — 60 вопросов. Пройти его можно приблизительно за десять минут. По результатам вы получаете психотип, вектор из пяти чисел. То есть вы, я — это набор из пяти чисел. Открытость, экстраверсия/интроверсия, доброжелательность, добросовестность, нейротизм. И по каждому параметру вы можете быть от 1 до 100. Вы можете быть полностью интровертом или экстравертом. Или где-то посередине. В большинстве случаев человек находится посередине по трем-четырем категориям, но одна категория, как правило, очень сильно выражена.

— Как используете данные вместо опросников?

— До 2013 года практически единственным способом получить психотип человека оставались опросники. Но за 5 лет появились новые методы — первым было использование социальных сетей. Исследователь Михал Косинский попросил людей в Facebook заполнить анкету из 50 вопросов и поделиться своим профайлом. И люди это сделали. Он собрал достаточно большой набор данных — наверное, уже больше миллиона людей. За счет этого он сделал вывод: с определенной погрешностью можно определить психотип человека, используя лайки. И с этого времени началось психотипирование с использованием big data.

Мы используем транзакционные данные — то есть смотрим, как человек тратит деньги, где, сколько он тратит, как часто. Некоторые из этих людей заполнили анкеты — и мы сопоставляем это с их данными. Так мы можем профилировать любого клиента банка.

— Вы говорите про обозначение человека в качестве кода, что звучит довольно пугающе. Но в психологии это используется довольно давно. Что об этом думаете: насколько приписывание человеку кода этично, нормально, полезно?

— Мы сейчас переживаем из-за многих вещей, связанных с big data. Например, оценка кредитоспособности в банке. Но если разобраться, модель кредитного скоринга существует 50–60 лет и используется по всему миру. И там тоже используют личные данные, и это считается нормальным. А сейчас, когда начинают использовать Facebook или что-то другое, вдруг становится страшно. Или даже те же модели, но уже более точные.



Если мы скажем, что психология началась с Вундта, то психотипирование пошло сначала с Фрейда, а потом с Юнга. Слова «интроверт» и «экстраверт» появились именно из его работ. Поэтому это уже давно делается. А Косинский, Cambridge Analytica и все остальные построили эти дата-сеты, потому что люди любят заполнять анкеты и узнавать про себя какую-то информацию. И это нормально. То есть с точки зрения «объяснить человека», кто он и что он, — мы это давно делаем, и тут проблем нет.

Но когда дело доходит до автоматического профилирования, здесь начинается некая этическая грань. Потому что в некоторых случаях человек может этого не знать. И это неправильно. Сейчас в Европе — с введением GDPR и всем остальным — клиент должен знать, что происходит с его данными. То есть не просто где бизнес хранит ваши данные, а что именно с ними происходит. И более того, вы должны дать согласие на то, что это будет происходить. Когда мы создаем аналитику, то предупреждаем — в случае необходимости бизнес должен показать клиенту все данные. И в зависимости от того, будет ли клиенту или бизнесу от этого комфортно, мы либо делаем свою работу, либо нет.

«Раньше данные выбрасывали, а теперь это — ценность»

— Но вы начинали до введения GDPR. Что-то изменилось в работе с введением стандарта?

— Лично в нашей — ничего, потому что мы делаем всю работу, связанную с профайлингом клиентов банка на месте, без привлечения посторонних данных. GDPR — очень интересная штука, потому что с точки зрения сбора и хранения данных в регламенте нет ничего нового. Это существовало уже 10–20 лет назад. Просто сейчас это как-то выплеснулось. Плюс увеличились штрафы и за счет этого появился ажиотаж. И 20 лет назад банки обязаны были своих клиентов предупредить об использовании данных. Многие банки — почти все банки в Европе — имели огромные файлы в 20–30 страниц, которые клиент читал и подписывал.

— Только никто это никогда не читает.

— Да, я тоже никогда не читаю пользовательское соглашение iTunes и кликаю «Да». Это проблема нашего общества, что эти Terms & Conditions нам недоступны. Их очень тяжело сделать доступными, даже если бы это кто-то хотел сделать.

Я не люблю аргумент «Ты сказал „да“, подписал, значит все». Но я обычно читаю контракты. Даже когда прихожу в гостиницу и там дают бумажку подписать. Я сижу и читаю ее. Потому что были прецеденты в моей жизни, когда это действительно сыграло свою роль. Не все это делают, но я бы советовал это делать, особенно когда вы, например, идете в банк открывать счет. Потому что там действительно расписано, что будет происходить с вашими данными.



Но банкам очень тяжело объяснить каждый вариант использования данных подробно, чтобы это не заняло 100–200 страниц. Объяснять клиенту, что эту цифру мы используем в этой модели, эту — в той, тоже нереально. Должен быть какой-то баланс.

— Как вы относитесь к предоставлению своих данных корпорациям? Некоторые категорически против, другие говорят, что их жизнь становится от этого только удобнее.

— Здесь можно философствовать часами. Вот на конференции «Big Data, Meet Big Brother!» правильно сказали, что очень мало людей готовы платить за почту даже $10 в месяц, чтобы какой-то провайдер ничего про них не знал, а просто предоставлял e-mail. Людям нравится Gmail, людям нравится Facebook, это бесплатно, они проводят там много времени. Поэтому, как говорили раньше, «если продукт бесплатный, значит продукт — это вы». Это одна сторона. Вторая — что такое предоставление данных и насколько вы действительно предоставляете данные. Когда вы заполняете свою анкету и говорите имя, фамилию, адрес, номер телефона, это должно быть сохранно. И оно им и является: мало компаний будут так просто продавать ваши имя, фамилию и адрес. Этого практически не происходит. Остаются данные, которые вы генерируете. Тут уже возникает вопрос: мы генерируем очень много данных, но кому они принадлежат?

Мы работали с компанией в Португалии, которая занимается процессингом всех транзакций в стране. То есть они делают так, чтобы банки могли между собой общаться. И 30 лет назад никто не хотел у себя хранить эти данные. Это дорого и неинтересно, это проблемы. И в контракте они пытались всячески отказаться от данных. 30 лет спустя процессинг осуществляется по Apple Pay, Visa, Mastercard, и сама компания уже практически не нужна. А данные, генерируемые этой системой, вдруг оказались самыми ценными. И они теперь пытаются понять, как же вернуть то, что они 30 лет назад хотели выкинуть. И кому это вообще принадлежит — банку, клиенту?

Совершенно непонятно, кому принадлежат данные, которые мы генерируем, и кому они должны принадлежать. Мир не строился на том, что это важно. Наоборот, раньше все выбрасывалось как можно быстрее. По закону мы должны хранить все 90 дней — на 91-й это все удаляем. А теперь храним данные десять лет, потому что это ценно.

Очень тяжело сказать, кому принадлежат данные, которые вы генерируете. То, что в отправленном вами сообщении, — это ваше. Я не уверен, что все генерируемые данные принадлежат человеку, который их генерирует, или даже системе, их сохраняющей. Этот вопрос, наверное, самый интересный.

«Тест, который невозможно сделать в лаборатории»

— Про ценность данных: люди недавно поняли, какая у них цена на самом деле. Вы думаете, это эпоха, которая пройдет, или данные скоро станут нашей новой валютой?

— Заменит ли big data что-то еще? Я не знаю. Мне кажется, это останется и войдет в норму. Мы будем понимать, что у меня есть машина, дом и сейф с моими данными. Или есть данные, которые мои, и я могу их продавать — точно так же, как машину.

С другой стороны, кому это интересно, нужно, зачем кто-то будет покупать ваши данные? Есть ли действительно ценность тому, что я делал вчера? Если мы не найдем этой ценности и поймем, что есть другие способы анализировать человека и предлагать ему продукт, — тогда это все уйдет. Сейчас весь мир пытается понять, как использовать данные и какая у них ценность.



— Вы сейчас используете психологические модели, которые создавались еще до эпохи данных. Доступ к данным как-то изменит количество психотипов, психологию как науку?

— Если брать просто дата-сеты, machine learning, то психология вообще не нужна. Что дает big data психологии? Это подтверждение или опровержение теорий, возможность экспериментировать на большем количестве людей. Если в университете проводить какой-то эксперимент, получим 50 человек, которые придут. А если мы можем профилировать базу данных, допустим, Сбербанка, — это 80 млн клиентов. Это тест, который невозможно сделать в лаборатории.

Мы сотрудничаем с профессором из Колумбийского университета Сандрой Мэтц и обсуждаем с ней вещи на грани психологической фантастики. То, что мы можем сделать, работая с клиентом, она никогда сделать не сможет. 300 или 500 тыс. человек — таких масштабов просто нет в психологии как науке. Но полученные данные приведут к очень интересным прорывам в самой психологии. Если вы меня спросите, останутся ли интроверты и экстраверты как категория через 100 лет, — да, потому что это полезная категоризация человека, и она позволяет понять что-то большее, чем данные.

— Как вы думаете, на что еще смогут влиять психологические профили в будущем? Будут ли у людей с разными психотипами разные возможности? Могут ли быть психологические рейтинги?

— Это связано с вопросом, можно ли изменить психотип человека. Например, вы родились интровертом, а через 50 лет интровертам вдруг запретят пользоваться скоростными поездами. Так сложилось: не нужно им это делать, или они себя плохо ведут, когда садятся в скоростные поезда. У меня ребенок родился интровертом, можно ли из него сделать экстраверта? Это большие дебаты, которые происходят в психологии на протяжении всей истории науки. Nature vs nurture (биогенетизм против социогенетизма — «Хайтек»).

Социогенетизм или биогенетизм — это продолжительные дебаты между сторонниками роли воспитания и природных факторов при формировании личности человека. Дискуссии продолжались вплоть до конца 1970-х годов, но с появлением новых методик в психогенетике многие из гипотез просто отпали, а разногласия между сторонниками социо- и биогенетизма перешли из острой конфронтации в мягкую полемики.

Сторонники социогенетизма убеждены: большинство способностей и личностных характеристик человека не являются врожденными. Они формируются под воздействием окружения. В противоположность социогенетизму сторонники биогенетизма сводят черты характера человека к его врожденным особенностям.


Сегодня иногда считают, что ДНК влияет на психологию, а иногда еще и воспитание. В соотношении примерно 50/50 — 50% в вас заложено природой, 50% — окружающей средой. Допустим, в будущем кредитование полностью привязано к психотипу человека. Тогда получается, что вы начинаете пенализировать человека за то, кем он родился. Не первый раз в нашей истории. И тут начинаются вещи, которые человек не в силах изменить. Поэтому я бы к этому очень осторожно относился, я бы этого не делал.

— В дебатах nature vs nurture спорят об изначальном формировании человека. Может ли человек меняться дальше?

— С одной стороны, считается, что после 25 лет ваша личность сформирована и стабильна. Если бы она была нестабильной, система бы не работала. Если сегодня вы интроверт, а завтра экстраверт, — значит опросник плохой. Поэтому с точки зрения психологии мы хотим, чтобы личность была стабильной. Что мы видим — это то, что в течение жизни человека у людей есть тенденция становиться более консервативными и более интровертными. Если взять отрывок в 40 лет — так и происходит, но медленно. На пятилетних отрезках все более стабильно, а на протяжении 40 лет это видно.



Может ли человек измениться? Я считаю, что да. Я менялся несколько раз в жизни — и после 25 лет, создание компании на меня сильно повлияло. Но интроверт или экстраверт — я все-таки остался таким же. Я все равно люблю общаться с людьми, заниматься какими-то публичными делами, и я это любил до компании и буду любить после нее. Наше поведение, реакции могут меняться, но то, кто вы есть, — остается, это что-то более глубокое. Если вы экстраверт, вы будете им, даже если сидите дома и играете в видеоигры, как последний интроверт.

Люди могут идти против себя, идти против своей природы, заниматься вещами, которые им неестественны, по совершенно разным причинам. Не потому, что они — экстраверт или интроверт, а потому что так сложились жизнь и обстоятельства. Поэтому психотип — это только часть человека.

Tags: интервью, психотип, технологии
Subscribe

Posts from This Journal “психотип” Tag

  • Психологический тип

    Психологическая типология (от греч. týpos — отпечаток, форма, образец) — система соподчиненных понятий (классов объектов) какой-либо области…

promo luckyea77 june 21, 2015 20:04 27
Buy for 10 tokens
В этой записи я буду давать ссылки на посты с лекциями и уроками в этом блоге: Учебные материалы и тесты: Дистанционное образование Правила дорожного движения 11 ресурсов для бесплатного образования Сайты для обучения программированию Игры, в которых нужно писать код: Grid Garden, Elevator…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 1 comment