Open data
Comments 59
+19
Ощущение, что у них есть какой-то специалист, который только и делает, что запутывает формулировки, превращая простые мысли в нечитаемый текст, который ещё и трактовать можно по разному. Бесит.
+40
Эти специалисты называются «юристами» и выпускаются в огромных количествах сотнями ВУЗов.
+2
Ага, а работают они на лоббистов различных крупных компаний.
+4
API не так важно, лучше что бы был Bulk Load, API можно и самом прикрутить. Важна актуальность и точность данных, а так же простота доступа к ним.
+5
Ключевой момент в последнем пункте имхо «качественное описание раскрываемых данных», ибо можно вывалить кучу актуальных данных, но не сказать что какие циферки обозначают и в каких единицах.
+3
Это ооочень хороший закон даже в такой формулировке — это большой шаг к открытым данным.
Что касается запутанности изложения, то в этом нет ничего удивительного. Это не потому, что там сидят нехорошие люди, которые выносят всем мозг, а потому, что нужно предусмотреть все возможные ньюансы, иначе закон получится либо слишком общим, либо в нем будет слишком много лазеек для неисполнения или «разворачивания дышла в нужную сторону». На самом деле все логично строится, почти как в программировании, когда вы написали простой и ясный код, а потом пару сотен исправлений спустя он превратился в кашу.
//граммар фикс
0
В программировании как раз таки обычно все происходит наоборот: сначала быстро пишется говнокод, который затем путем рефакторинга приводится к виду, в котором его не стыдно передать другим.
+1
Главным минусом — терминологическая слабость
Ну как обычно, что уж там…
0
Еще и «публикация в сети Интернет» — размытая формулировка. Технически, если оно будет лежать на никому не известном фтп, с названием файлов в виде их SHA-хеша и запретом листинга, оно всё равно будет опубликовано в сети.
+3
Порядок публикации будет определяться постановлением Правительства.
+5
Ну да, публикация в газете «Вечерний сантехник» тоже вроде как, публикация в СМИ…
+17
— Но послушайте, вы же нашли уведомление, правда?
— Да, — ядовито сказал Артур. — Я его нашел. Оно было выставлено на всеобщее обозрение на дне запертого шкафчика, засунутого в неработающий сортир. На двери была вывеска «Осторожно, леопард». (с) Douglas Noël Adams

Простите, не удержался…
-8
Я не вижу проблемы в том. что доступ к части данных может быть доступен только по авторизации через портал госуслуг.
Гражданин РФ получит этот доступ. Наверняка есть часть данных экономического характера, которую лучше не показывать иностранцам.
Считаете иначе? Давайте обсудим
+2
Насколько я понимаю, речь идет про RAW-данные, которые могут быть автоматически получены и обработаны.
Я не против прохождения нормальной авторизации для этого приложением для обработки или создания ключа для доступа через госуслуги, с помощью которого данные могут быть выгружены автоматически и потом точно так же будут актуализироваться, без лишних телодвижений.
Идея у вас хорошая, но она может быть понята «в лоб» и данные будут выкладывать на какую-нибудь «официальную государственную файлопомойку» с капчей на скачивание и каким-нибудь ограничением на сессию в 5 минут, это будет не true-way.
0
Про капчу и 5 минут согласен, от такого надо избавляться.
+8
Считаю иначе. Если информация потенциально доступна 143 миллионам человек, то какой смысл ограничивать к ней доступ? Как обычно, получим систему, которая не способна помешать «злоумышленникам», но мешает обычным пользователям.
-5
Пожалуй единственный здравый аргумент.
И смысл такого ограничения будет только если при доступе будут заставлять подписывать некое NDA. Чтобы потом иметь возможность применить юридические санкции против иностранцев, или граждан сливших информацию. Этакая гостайна light edition. Very light edition
+2
> Наверняка есть часть данных экономического характера, которую лучше не показывать иностранцам.

Наверняка все с точностью до наоборот: есть часть данных экономического характера, которые лучше не показывать гражданам своей страны, чтобы не спровоцировать их на необдуманные действия по отношению к власть имущим =)
+1
Если не захотят показывать, то не покажут в любом случае.
0
Единственное оправдание такому, по-моему,, возможность выгружать данные касающиеся только тебя. Вот только непонятно, относится ли к ним термин «открытые данные».
+3
Это хорошо что процесс идёт и что-то делается, но пока что качество даже уже существующих открытых данных оставляет желать лучшего. Такое ощущение что выкладывают их для отчётности, а не для людей (хотя почему ощущение, пожалуй, так и есть). Вот, например, геоданные от data.mos.ru, в таком виде что комментарии излишне, хорошо что на GIS-Lab есть люди, приводящие их в божеский вид. Хотя и это не всегда помогает, на данный момент многие наборы данных, ранее имевшие геопривязку, ее потеряли и находятся в таком ‹‹состоянии›› аж с 21 мая. То есть люди скачивают данные с официального сайта и получают мусор. Выручает, опять же, GIS-Lab своими архивными версиями. И это в Москве, а как обстоят дела на просторах нашей необъятной Родины можно только догадываться…
-1
Должен ли закон включать требования по свободе и бесплатности доступа к открытым данным?
Считаю вопрос некорректным. Свобода и бесплатность — разные вещи. Не вижу ничего предосудительного, если часть данных будет распространяться платно.
+2
Открытые данные бесплатны по своему определению. Платные данные в свободном доступе — это другая история. Предосудительного тут немало — главное, это создает барьер в доступе к информации. Хотя я и готов признать что ряд таких данных действительно есть.
0
Здесь как раз встаёт вопрос упомянутый автором — разночтения определения открытых данных в законе и общепризнанного (то, что указали вы).
-1
Ну а еще барьером на пути к свободным данным можно назвать необходимость иметь компьютер с интернетом, чтобы их получить. Я бы проголосовал за свободный доступ к данным, но не стал бы требовать их обязательной полной бесплатности.
+2
«Открытые данные» — по определению должны быть бесплатными. Если они не бесплатны, то это одна из форм государственных данных, но не открытых.
-1
Не знаю, на мой взгляд, открытые данные, по определению, должны быть открытыми, а не бесплатными. Открытость означает, что они а) существуют, б) доступны всем, кто их хочет.

Основными потребителями этих данных являются предприятия, которые так или иначе используют их в своей деятельности. Риэлторы могут корректировать цены на недвижимость в зависимости от экологических показателей в районе, консалтинговые компании могут корректировать разрабатываемые стратегии на основе анализа статистики по отраслям, страховые компании могут оптимизировать свои модели на основе выявленных глобальных и локальных трендов — всё это принесет прибыль этим компаниям, так почему же им не заплатить за пользование этой информацией?

Основная ведь проблема не в том, что эта информация недоступна, а в том, что ее нету.
+5
Опять зачем-то отстаиваем интересы крупного бизнеса, а не частных пользователей.

Вот вспомните выборы год-полтора назад — там любой желающий мог свободно скачать данные (на самом деле спарсить, но не в этом суть). В итоге появилась куча аналитики от энтузиастов-одиночек и чуть больше, чем ничего, от крупных исследовательских центров.

По сути, вы предлагаете закрыть доступ обычным людям и оставить доступ только тем, кто будет делать на них деньги. Ибо остальные не смогут себе позволить доступ к информации.

«Риэлторы могут корректировать цены на недвижимость в зависимости от экологических показателей» — прекрасный пример; все риэлторы будут знать, что в каком-то районе шкалят все показатели, но ни один вам не расскажет, потому что иначе понесёт убытки. Уверены, что хотите именно этого?
0
Я не отстаиваю ничьих интересов. Я говорю, что открытость и бесплатность — разные, не очень связанные вещи. В России запрещено владение оружием и разрешено владение хлебом, но вы же не требуете хлеба бесплатно в магазине.
0
Мне понравилась аналогия. Можно воспользоваться если что? Хотя, конечно, лживая. В России разрешено владение оружием, но нужно соответствовать некоторым требованиям.
0
Да, конечно, можно.

Ну, и к «не открытой» информации у кого-то, соответствующего некоторым требованиям, все же есть доступ.
+2
> а) существуют
> б) доступны всем, кто их хочет.

Т.е. по вашему куча вордовских файлов на публичном ftp — это открытые данные. И существуют и всем доступны.

Комментарии излишни.
0
И это действительно открыты. Просто не надо подменять открытость автоматизируемостью. И ведь в законе прямо написано «допускающем автоматизированную обработку без предварительных изменений человеком в целях повторного ее использования». И открытые, и автоматизируемые.
+2
У вас проблемы с терминологией. И цитату из закона вы неверно привели.

"в формате, допускающем автоматизированную обработку без предварительных изменений человеком"

Из определения явно следует, что формат не может допускать, а должен допускать таковую обработку.

Вордовский формат таковым не является.
+2
Формулировка — сущий бред. Любые данные, которые есть в компьютере могут быть обработаны. Любой формат данных допускает обработку. Обработка не возможна, если к данным нет доступа. Даже можно выложить зашифрованные данные и обрабатывай их сколько влезет. Надо определить каждый термин — каждое слово в этом предложении, чтобы хоть что-то понять.
0
Соглашусь, что в таком виде формулировка допускает множественное толкование. Даже так — практически любое. Возможно эти термины и определяются в другой части законопроекта, я не читал, утверждать не буду.

В законе таких недомолвок быть не должно, но когда в IT-сфере люди обсуждают машиночитаемые данные, то подразумевают явно не любой набор данных. Совершенно очевидно, что любые сохраненные машиной данные можно ею же и прочесть, если есть к ним доступ. Но обычно подразумевают нечто вроде этого: ru.wikipedia.org/wiki/%D0%9C%D0%B0%D1%88%D0%B8%D0%BD%D0%BE%D1%87%D0%B8%D1%82%D0%B0%D0%B5%D0%BC%D0%BE%D1%81%D1%82%D1%8C
+1
Нет, если лицензия запрещает их использовать кроме как для чтения или, тем более, преобразовывать. Это аналог надписи на странице сайта «все права принадлежат ООО „Рога и копыта“. Любое использования без явного согласия ООО „Рога и копыта“ не допускается и будет преследоваться по закону». Данные доступные, бесплатные, но ни фига не свободные.
0
Ну, мы говорим в контексте закона об открытых данных, все же.
0
В этом контексте может быть запрещено распространение результатов их обработки.
0
Не должны. Открытые данные в моем понимании означают, что если я их получил (платно или бесплатно — не суть), то имею право их использовать как угодно, в том числе распространять (опять же платно или бесплатно — не важно).
0
Вы ничего не путаете?
Музей — открытое учреждение, пусть даже туда надо купить билет (который доступен каждому).
Тюрьма — закрытое учреждение, доступ туда регламентируется не билетами, а совершенно другими механизмами.

И как уже отметили ниже "«Открытые данные» — по определению должны быть бесплатными" — это некорректная фраза.
Открытость по определению — это противоположность закрытости (у вас доме входная дверь закрыта, а дверь на кухню открыта), платность тут вообще не при чём.
0
А кто и как будет устанавливать стоимость доступа?
Не получится ли, что если какие–то данные (типа расчёта транспортных потоков после “реконструкции” Ленинского) будут грозить чиновникам неприятностями, то у них будет выставлена цена в 100500 миллионов рублей, то есть по факту они не будут обнародованы?
0
Ну, «кто» и «как», а также «какие данные», очевидно, должно регламентироваться этим законом. Хотелось бы, чтобы так не получилось.
0
Вы всё же не ответили на мой вопрос, извините.
Я спрашивал «Кто в вашем представлении должен выставлять цены, чем при этом должен руководствоваться?» А Вы ответили «Это должно быть в законе регламентировано.» Разумеется должно. Но что именно в этом законе должно быть написано?
0
Это не тот вопрос, на который можно вот так ответить между делом. Надо сначала понять, кто вообще публикует эти данные — каждая организация (министерства, муниципалитеты, полиция и прочие) отдельно, или этим централизованно занимается, например, Росстат. Если второй вариант, то он и решает, что идёт бесплатно, а что за деньги и за какие. Возможно, в законе должны быть некие ограничения сверху, например, не более 50к Р за набор данных.

Если каждая организация сама публикует, то всё гораздо сложнее, с какой стороны ни посмотри.
+1
Извиняюсь, но любопытно, например за какие данные вы готовы платить или какие данные по вашему мнению должны распространяться платно?
0
Какие-то специфичные экономические/индустриальные данные, особенно отраслевые вполне могут быть платными. И, конечно, должна быть бесплатная учебная подписка для ВУЗов.
+3
Все государственные машиночитаемые данные должны быть бесплатны, так как их создание целиком и полностью оплачивается налогоплательщиками, т.е. их создание уже оплачено. Почему за них нужно платить второй раз, мне не понятно.
0
Хотя бы затем, чтобы всем налогоплательщикам не оплачивать конвертацию из «человекочитаемого» формата в машиночитаемый, а только тем, кому нужны машиночитаемые. Естественно речь только о тех данных, которые изначально в человекочитаемом формате и требуют конвертации.
0
Вас не смущает необходимость платить за проезд в государственном автобусе? Вы же налоги заплатили!
0
Конечно смущает, поэтому нам и надо данные, чтобы проверить куда пошли налоги.
0
В таком случае это уже НЕ открытые данные, а просто машиночитаемые.
0
Нет, это открытые данные, потому что они открыты. Где в слове «открытый» спряталась бесплатность?
UFO landed and left these words here
+1
Потому как так оно и будет в реальной жизни. Хотим качества — сбавим скорость раскрытия, хотим много данных — получим много мусора.
0
Я думаю все должны понимать что данных на серверах в министерствах уже много. Все эти данные есть, все они собираются отовсюду, все они в форматах, в которых их можно разобрать, понять и простить.

Вот наглядный пример того, что можно делать с данными: Лекция о глобальной коррупции в банковской системе. Не надо бояться, что данные будут в ворде или в жпеге. Существует множество групп разработчиков всякого бесплатного ПО — будут группы обработчиков данных. Все обезличенные незасекреченные данные с завтрашнего дня можно выложить в общий доступ на фтп, люди разбирутся, попутно проверят корректность обработки информации министерствами на разных стадиях (чтобы там ничего не пропадало). При этот шаг не будет никому ничего стоить. Технической сложности нет. Определить список имеющихся данных у министерств можно по их ежедневным запросам (все перед ними отчитываются).
0
Во втором опросе не хватает возможности выбрать несколько вариантов (или все сразу).
Only those users with full accounts are able to leave comments.  , please.