Как стать автором
Обновить

Комментарии 12

А что если провести кластеризацию по большему количеству параметров? CHAID, например? Тема очень интересная, главная проблема — причесать данные.
Хорошая идея.
НЛО прилетело и опубликовало эту надпись здесь
Поправил графики, хорошая идея с долларами.
НЛО прилетело и опубликовало эту надпись здесь
Благодарю, что поделились трудом!
НЛО прилетело и опубликовало эту надпись здесь
Что-то замусоренные данные какие-то. Вы их проверяли на выбросы?
Ткнул в знакомый район и вижу вот это:
yandex.ru/maps/213/moscow/?ll=37.536036%2C55.632596&mode=usermaps&source=constructorLink&um=constructor%3A946f59fe9e3b499ac4875de025885430da59ede34ce46228415f5ba23cda8ea7&z=17

Здесь 4-комнатная квартира в 500м от м.Коньково восемь лет (!) никак не могла продаться за 3,3 млн. руб…

UPD: поправил ссылку
Почему восемь лет? Судя по данным — 2 года.
Судя по площади — 27,5 м2 — и по указанию номера комнаты — это комната в квартире.
Да, согласен, не восемь лет, а восемь раз выставлялась на торги за 2 года.
Но меня смущает цифра «4» в в кружке на карте — я полагаю, что эта сделка была распознана как четырехкомнатная квартира.
Да, всё правильно — это комната в четырёхкомнатной квартире. (комнаты можно удалить из карты немного дописав report.py, в файле statistics.ipynb есть код, который это делает)
Добавил графики с долларами, исправил ошибки. (Удалил комнаты, когда строил графики, но забыл про доли)
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Изменить настройки темы

Истории