Pull to refresh

Comments 34

В процессе чтения не покидало ощущение несовершенной модели.
стаж от 2 лет, тем самым отметая неопытных молодых водителей

Сейчас многие молодые люди (особенно в Европе) получают права сразу по достижению необходимого возраста, а водить начинают гораздо позже.
в интервал с 8ой по 11 секунду скорость автомобиля резко увеличилась с 20км/ч до 40км/ч, а в интервал с 15ой по 18ую секунды скорость резко упала с 60км/ч до 30км/ч

Похоже на обычную езду от светофора до светофора. За 3 секунды ускориться с 20км/ч до 40км/ч — это слишком лихо?
видно, что пользователи моложе 26 лет чаще других являются виновниками ДТП

Я упустил или вы где-то указали кто чаще берет в аренду автомобили? Или может молодежь просто чаще арендует и, соответственно, чаще являются участниками ДТП?
1. Так оно и есть. Модель описанная в этой статье несовершенна. В статье описывается что сейчас используют. В следующей статье я планирую описать более совершенный метод определения стиля вождения, который был разработан Bright Box.
2. С возрастом водителей все достаточно сложно, нет возможности определить точный стаж вождения, т.к. есть возможность получить права и не водить вообще.
Не прослеживается скачка в количестве поездок более молодых пользователей. В среднем пользователи совершают одинаковое количество поездок.
3. По светофорам: в зависимости от параметров модели ускорения и торможения перед светофорами могут определяться как резкие или нет. Здесь есть момент, сами по себе резкие ускорения и торможения не являются признаком плохого вождения, а вот их количество — да.
Ясно. Спасибо за ответ.
Еще интересует момент со страховкой:
почему вашу компанию волнует дтп как таковое, если есть страховка? Это больше должно волновать страховую.
Как здесь обстоит взаимодействие со страховой?
Смотрите, наша компания не является оператором каршеринга, ДТП волнует наших клиентов, которые как раз таковыми являются.
Даже при полном покрытии ремонта автомобиля страховой остается момент с простоем авто и убытками, которые этим вызваны.
А страховые кстати уже предлагают поставить такие же приблуды в обычные тачки и страховать на основе такого же скоринга. Что дичь полная на мой вшгляд, особенно с такой кривой статой.
Не просто дичь, а чернозеркалье какое-то.
Скидку обещают маленькую, а проблемы большие. Тем более у них безопасно быстро наращивающая скорость машина — это ужас-ужас, а лезущий в соседний ряд не то что не смотря кто едет, а даже вообще без поворотника, вынуждая ряд оттормаживаться (типичное поведение каршеринговых козявок, которые появились на улице) — это нормально.
Примерно так. Нам надо застраховать по КАСКО 1000 автомобилей. При этом застраховать недорого и иметь возможность получить возмещение. Для этого есть ряд инструментов, самый известный — франшиза. Часть ущерба берет на себя страхователь. Менее известный инструмент — лимит. Лимит на количество обращений в год, на общую сумму возмещения по всем автомобилям. Ну скажем так, из 1000 автомобилей где каждый застрахован на миллион, но при этом общая выплата не более 10 миллионов в год и не более 50 обращений.

Не и еще момент. Для компании которая имеет 1000 автомобилей, банально нет смысла страховать их по рискам ДТП и хищение. Лучше эту половину денег (а в среднем страховая компания получает примерно вдвое больше чем выплачивает) положить в карман и расширять на это бизнес, чем отдать страховщику. А страховать лучше массовые риски, которые внезапно и непрогнозируемо могут затронить весь автопарк — ущерб от стихийного бедствия, от народных волнений и тому подобного.

На самом деле все еще интереснее, никто в здравом уме не покупает разом 1000 машин, их берут в лизинг, и часто, именно лизинговая компания определяет условия страхования (сюрприз — в своей дочке-страховой).
> Это больше должно волновать страховую.

Волнение страховой выражаются ростом цен страховки, а это убытки.
Есть некоторые соображения. Во первых хоть молодеж и опаснее водит в среднем, но важно подсадить ее на сервис. Ведь иначе они купят свое авто и прощай клиентская база. Сколько за закладку лояльной клиентской базы это готовы доплатить каршеринги?

Во вторых да, в городе больше аварий и больше разгонов-торможений. И для построения модели вождения конкретного водителя требуется некотрое число поездок. При этом, у водителей которые пользуются сервисом нечасто и ненадолго, будет много резких торможений и разгонов, они не привыкли к машине. А те кто пользуется часто и долго, уже наработали свою статистику аварийности, нет ли смысла просто поощрять их безаварийную езду, скажем часами и милями? А с виновниками ДТП, напротив, проводить работу на тему безаварийного вождения.
1. Т.е. если я со светофора за 10-12 секунд набираю 60 км/ч — это резкое ускорение?! Ну или я такая 60 км/ч, вдруг мигает зелёный (3 секунды), загорается жёлтый (3 секунды), ну ещё 6 секунд я подкатываю к стоп-линии уже при горящем красном. Или что тоже самое тормозной путь с 60 км/ч получается целых 95 метров. И это резкое торможение?!

2. А вообще очень слабая статистическая работа (по крайней мере описана в статье). С вашими-то данными… Графики непонятные, где они друг на друга наложены.
1. В зависимости от параметров модели это может как быть резким ускорением так и нет. Само по себе резкое ускорение или торможение не является признаком плохого стиля вождения, плохой стиль вождения в этой модели — большое количество резких ускорений и торможений на единицу дистанции.
2. В этой статье обзор того, что используется сейчас на рынке. Наша модель будет описана в следующей статье. Там вы сможете оценить проведенную работу.
То есть те кто ездит в пиковое время будут иметь худшую репутацию, по сравнению с теми кто ездит во внепиковое. Не проще ли сразу учесть это в тарифах?

Кстати, а вы вообще делали такую выборку? Больше ли ДТП при высокой загрузке дорог или при низкой?
Слабовато, очень слабовато. Особенно в той части где агресивным вождением считают разгон и торможение (как выше подметили не такие уж и резкие), и ни слова про маневрирование.
В следующей статье будет описана модель Bright Box, где как раз будет учтено маневрирование.
> Помимо этих параметров, и для получения более точных результатов, могут быть использованы — социальный статус,

Что такое социальный статус? Размер дохода? Как вы его определите?

> активность в социальных сетях

А как вы найдете аккаунт пользователя? Отчество там не указывают, а по имени и фамилии много совпадений. Да и не уверен, что это законно, парсить такую информацию из соцсетей, недавно суд одной компании это запретил.

> информация с камеры в салоне автомобиля

Нафиг такой торшеринг. Камера хотя бы большая и хорошо заметная?
Что такое социальный статус? Размер дохода? Как вы его определите?

Мы это не определяем, эту часть делают операторы каршеринга.

Нафиг такой торшеринг. Камера хотя бы большая и хорошо заметная?

Камеры в салоне премиум автомобилей в каршеринге уже ни для кого не секрет.
Камеры в салоне премиум автомобилей в каршеринге уже ни для кого не секрет.

Уже не только в премиуме, недавно встретил в банальной октавии.
Один раз мне один каршеринг выдал уведомление об опасной езде. Такое ощущение что мерили по тахометру. Это был настолько старый smart fortwo, который только бывает и чтобы он хоть как-то ехал там что газ что тормоз надо выдавливать процентов на 80, плавность езды никакая. Кажется потом они эту систему подкрутили и больше не уведомляют, хотя могу газ притопить с 0 до 60.
Скорее всего они поменяли интервал времени для вычисления резкого ускорения и торможения.
График 1 поверг меня в шок. Людей, его нарисовавших, надо отлучить не только от статистики, но и от арифметики. Хотите расскажу, как он получился?

Горе статистик:
«Так, что тут у нас, ага данные по возрасту, число целых лет. Замечательно! Но лучше-ка я разобью эту гистограмму не на 10 столбцов на каждые 10 лет — как-то слишком часто получается — а сделаю лучше 8 столбцов на 10 лет возраста. Это 1,25 года на столбец — отлично. Эксель, пересчитай.»

Эксель:
«Так, столбец (30–31,25] — сюда тех, кому строго больше 30 и меньше-равно 31,25. А поскольку исходные данные у меня по целому числу лет, то в столбец попали только те, кому 31.
Дальше столбец (31,25–32,5] — сюда попали, кому целых 32;
столбец (32,5–33,75] — кому 33
столбец (33,75–35,0] — кому 34 и кому 35

Поэтому каждый четвёртый столбец, мы видим, примерное вдвое выше чем соседние. Вот скажите честно, авторы, вам глаз ничего не режет?! График 5 тоже доставляет. Видна рука мастера. Промежуточные низенькие пики говорят, что приём оказался настолько удачен, что его применяли более одного раза.

Больше вопросов к «исследованию» не имею.
Спасибо за комментарий, но данные на входе — дата рождения, соответственно возраст определяется не в целом виде. Соответственно, получаем, что если на гистограмме мы увидим всплеск на 33,75-35,0 то это будут действительно люди с возрастом от 33,75 до 35,0. Помимо этого графики использовались только для наглядности, возможно они получились не везде удачными, в дальнейшем постараемся больше уделить им внимания.
Помимо этого графики использовались только для наглядности

Соглашусь, безграмотность удалось показать весьма наглядно.

Всплески в 2 раза каждые 4 года вызывают много вопросов. Откуда?
Бум рождаемости каждые 4 года? Выбор вашего сервиса по гороскопу китайскому зодиаку пользователя? (было бы прикольно, если бы стихии в нём повторялись каждые 4 года, но нет) Скидки для людей определённого возраста? Увеличение выдачи прав каждые 4 года?
Я не нашёл никакого объяснения всплескам.


Вы не могли бы перестроить гистограммы с интервалом 10 столбцов на 10 лет?
Дополнительно, хотелось бы посмотреть на распределение вероятности ДТП в зависимости от возраста (по X — возраст, по Y — соотношение "число ДТП/число пользователей" для этого возраста).

Прекрасный комментарий! Я не заметил, да и о явлении таком не задумывался никогда. Теперь буду обращать внимание :)
Такие выбросы при данных о десятках тысячах человек статистически нереальны! Я до этого тоже о таком явлении не задумывалась, но пришлось искать объяснение таким феноменальным пикам. Думаю, моя версия правдоподобна.
И как ваша теория работает на возрасте с десятыми длями? скажем 31.2?
Послушайте, налицо неумение работать с данными, у вас там почти все графики похожи на расчёски. Почему они получились такими — это уже детали. Вам оно виднее, зачем меня об этом спрашивать.

Один граф сказал: «Все грамотные исследования похожи друг на друга, каждое неграмотное неграмотно по-своему».

UPD.: График 5 показывает, что ваша ошибка не только в отображении данных. Сложный спектр пиков показывает, что неправильно квантованные данные «пошли в дело» и участвуют в расчётах.

Меня больше удивляет не ошибки, а то, что они для вас не очевидны, и вас ничего не смущает в графиках!
Вам совершенно верно указали на ошибку в выборе дельты или частоты выборки. Не видя данных или расчетов, тяжело сказать, где именно ошибка. Вот вам пример с долями:

Считаем возраст в долях в зависимости от месяца. Тогда дельта равна 1/12 = 0.8(3). Достаточно округлить число до 0.83, забыв про период, и вот уже 6*0.83 < 0.5 и 12*0.83 < 1. Дальше хуже. Где-то грубо округлили, где-то взяли другой интервал, перемножили данные и конечный результат «поплыл». А может быть, вы несколько баз данных с разной точностью используете…

Хорошо бы еще оси на графиках подписать и названия над диаграммами убрать. Вы их все равно обозначаете снизу.
И эти люди запрещают нам «резко тормозить»?
Не пользовался каршерингом — а что дает этот скоринг? Там разная цена для разных водителей или некоторым просто будет отказано без объяснения причин? Там нет публичной оферты?
Поправьте пожалуйста «максимально оптимальной», очень режет глаза. Оптимальная модель она одна, их не может быть несколько.
Оптимальная модель она одна, их не может быть несколько.

Строго говоря, может быть несколько разных моделей, но одинаково высоко оцениваемых. Но вы правы в том, что "максимально оптимальной" говорить нельзя.


Но.
Кажется, значение слова "оптимальный" уже уплыло от "самый лучший" к просто "хороший". Субъективно, во втором значении оно уже встречается в разы чаще ("самый оптимальный", брр...). Скоро надо будет обновлять статьи в толковых словарях.

Скажем так, с современным применением слова согласен. Но если совсем залезть глубоко к этимологии, то его прародитель латинское optimum, optimus — дословно «наилучшее» и «наилучший» соответственно. И максимально наилучший — это… Даже не знаю как описать.
Sign up to leave a comment.