Comments 13
С почином вас! Сбер-style, конечно, но оно, видимо, простительно.
Понимаете, разного рода статистика в известной мере противоположна идеологии открытых данных. Статистика — ответы на уже заданные вопросы, в то время как «открытость» данных подразумевает в том числе свободу задавания вопросов.
Интереснее всего были бы сырые транзакционные данные, по необходимости обезличенные. Близко к этому, если брать более-менее смежную предметную область: https://landregistry.data.gov.uk.
Но вы не public sector, о чем и пишете: конкуренты, всё такое. В общем, вопрос о business open data сложный; хорошо, что есть какие-то попытки ответов!
Абсолютно согласен с тем, что вопрос «Открытых данных» не паблик сектора очень сложен, но действительно очень хочется дать инструмент для рынка, который будет всегда открытом доступе, и с помощью него люди смогли бы реально наблюдать за изменениями на рынке недвижимости и в секторе ипотеки в частности.
По поводу raw data конечно подумаем, но ничего не обещаю:)
Как и free software/open source, концепция открытых данных предполагает как минимум те самые четыре свободы использования. Публичная статистика с возможностью получения файлов таблиц существует давно, и она может быть даже без Интернета, хоть на дискетах. Концепция открытых данных предполагает нечто большее, чем просто публикацию статистики. Напоминаю, что это машиночитаемый вид и чёткие условия использования (свободная лицензия), аналогичные тем, что используются в FLOSS и свободном контенте.
Если юридически возможно «руками» извлекать данные хоть из сканов в jpg/png и дальше легально и коммерчески их использовать, то машиночитаемый формат даже не так важен, как свободная лицензия. Даже если ваш сайт перестанет существовать, без получения дополнительного разрешения от правообладателя у других людей будет юридическая возможность создавать машиночитаемые данные из сканов при условии целесообразности и окупаемости. Свободная лицензия важнее, потому что именно чётко прописанные юридические условия — фундамент концепции открытых данных. У вас же явно указан запрет: «Использование любых материалов с сайта разрешено только в неизменном виде с обязательной ссылкой на источник: opendata.domclick.ru». Напоминаю, что возможность внесения изменений и использования такого производного произведения даже в коммерческих целях (лучше явно это прописать) необходимы для статуса свободной лицензии.
Таким образом, ваш проект:
1. Сейчас не является открытыми данными в общепринятом смысле этого понятия.
2. Может вводить в заблуждение относительно лицензионных условий распространения вашей информации, так как проекту дано хайповое название «открытые данные». Вероятно, ничто не может вам препятствовать называть данные открытыми, но ведь и программу Microsoft по раскрытию кода спецслужбам можно попробовать назвать «open source», а свободное программное обеспечение можно нарочно перевести как бесплатное, но в сообществе FLOSS, свободного контента и открытых данные всё-таки есть чёткие критерии.
Два вопроса:
1. Как сочетается «Открытые данные» с футером в виде «Использование любых материалов с сайта разрешено только в неизменном виде с обязательной ссылкой на источник»? Что значит неизменный вид? Можно ли создавать производные от ваших данных?
2. Имеет ли смысл «размывать» исторические данные, например годичной давности? Они скорее всего уже не актуальны для конкурентов и в то же время актуальны для исследователей.
— Это говорит о том, что при анализе и выводах, нужно указать источник откуда вы взяли данные и сослаться на продукт:)
//Можно ли создавать производные от ваших данных?
— Конечно
//Имеет ли смысл «размывать» исторические данные, например годичной давности?
— Могу предположить, что под «размывать», Вы имеете ввиду «интервалы»:
— -Я всегда за открытый и честный диалог. Если для вашего исследования нужны будут реальные данные, не скрытые интервалами — напишите мне, пожалуйста.
— — К сожалению, даже в раскрытие ретро данных есть потенциальные опасности, но это уже совсем другая история…
Раз уж Вы отвечаете за коммуникации с клиентами, поясните, почему получение справки такой длительный и сложный процесс?
Российский рынок недвижимости давно мечтает об открытых данных, которые дали бы толчок к развитию нашего PropTech — в Штатах на них много что строится, а у нас даже определение цены квартиры зачастую строится на максимальном значении фантазий соседей, с поправкой на ветер и собственные фантазии)
Но несмотря на долю рынка Сбера — это же срез только данных сделок Сбера, как я понимаю, и их сложно экстраполировать на весь рынок, пока Росреестр не делится данными. Или уже начал с вами делиться?)
Сим-сим, откройся! — Как мы запустили проект «Открытые данные»