Comments 26
По поводу последнего вопроса «Что важнее всего в будущем открытых данных?» и одной из опций ответа «API вместо файлов».
Считаю, что и API важен, и машиночитаемые файлы тоже важны.
Также важно иметь возможность скачать, случай конечно редкий когда данные занимают гигабайты, но можно сидеть еще и валидировать что у тебя все до конца докачалось, а не обрыв или таймаут.
Кризис отличное время для открытых данных.

В условиях ограниченных ресурсов необходимо выделять финансирование на основании анализа открытых данных.
Не опубликовал статистику — денег не получил. А если в данных нашли подтасовки — большой штраф, ограничение финансирования и отставка с тюремным сроком.

ИМХО, только при таком подходе у открытых данных будет реальный шанс.
Учитывая что статистику у нас публикует в основном Росстат — то я могу только поддержать идею со штрафами и тюремными сроками.
Не верно выразился. Разумеется имелись ввиду открытые данные. Не опубликовал их — не получил финансирования.
Открытые данные — это не такие, которые элита вываливает народу, как свиньям похлёбку.

Открытые данные не должны быть read-only для сообщества.
Открытые данные должны, как минимум, наполняться совместно (например, как википедия).
А лучше, если и инженерная часть будет подконтрольна народу (как в плане кода, так и в плане инфраструктуры).

Если это законодательная база, то люди должны заняться законотворчеством.
Если это справочник контрагентов, то компании должны иметь возможность добавлять себя.
Если это геоинформационная система, то каждый может добавить свой дом, улицу и т.д.
Если это закупки гос. органов, то граждане должны иметь возможность влиять на закупки.
Если это список налоговых поступлений (размечтался!), то возможность как минимум комментировать каждую проводку.

Пока же «открытые данные» находятся в режиме read-only, мы получаем пассивное население — такое же как перед телевизором, когда информация может идти только в одну сторону. Народ становится инфантильным, безответственным и дегенеративным.

Интересно получается: с одной стороны власти нам с улыбкой заявляют об открытости, а с другой — на всех уровнях завинчивают гайки, любыми способами подавляя попытки граждан к самоорганизации.

Вот я и задаюсь вопросом: случайно ли гос. органы создают системы «ниппель» («туда дуй, обратно — %уй»), или «легитимные» информационные системы должны держать людей пассивными by design?
Граждане не выходят на улицы с лозунгами «Откройте данные» или «Откройте код». А государство у нас реагирует только на массовые проявления общественного запроса на изменения.
Мой пардон, конечно, но… А как вы себе представляете не read-only открытую статистику по демографии или преступности? 0_о Тоже хотите принять активное участие в её искажении?
То есть вопрос в том как из потребителей сделать производителей? Имхо открытые данные это знание, факты, на основе которых можно принимать решение. Решением может быть как добавить свой дом в систему если такая возможность есть, так и что-то сделать чтобы такая возможность появилась при ее отсутсвие. Да даже отсутсвие данных это та же информация и в данным контексте может стоять решение как что-то сделать чтобы получить данные, не убившись об стену безразличия и непонимания.

По поводу самих данных стоит учесть, что как и любые факты ими могут пытаться манипулировать, поэтому есть принципы открытых данных, в википедии лушче добавлять ссылку на источник, а в open street map — truth on the ground.
В другое время хорошим вариантом финансовой поддержки открытых данных была бы монетизация через платный API для доступа к наиболее актуальным данным. А сами данные в виде машиночитаемых файлов могли бы появляться в открытом виде, например раз в квартал…
В нынешних реалиях дай бог чтобы не закрыли то, что уже доступно…
У платности API есть обратная сторона — очень трудно потом всё вернуть к открытым данным. Сейчас уклон к платным API есть в Великобритании и общественность уже критикует такой подход.
Дык, я ж говорю, сами данные публиковать в файлах, с некоторым временным лагом… Для исследовательских и мониторинговых целей небольшой временной лаг не принципиален. А кому нужно для дела, небольшую сумму для подписки всегда найдут…
Малые сроки задержки превращаются в большие, автоматически, для повышения конверсии в платных подписчиков. Фу такими быть. Это же государственные открытые данные — мы за них УЖЕ ЗАПЛАТИЛИ.
C чего вдруг автоматически? Государство не должна волновать конверсия платных подписчиков… Нормальное государство… И куда-кому конкретно вы за них заплатили? В статье совершенно конкретно говорится, что люди/организации выкладывают исключительно за свой счет. Ни копейки сверх обычного они за это не получают.
Мне кажется вы не поняли комментарий, поэтому напишу еще раз.

1. Государство оплачивает создание тех или иных данных за счет бюджета, который формируется в конечном счете из наших денег (и не надо вот этих гнилых разговоров про нефтегаз), поэтому, для общества было бы неплохо получить доступ к этим данным — тк общество выиграет, если этот актив поступит в общественное достояние.

2. У тех кто «сидит на данных» есть жгучий интерес (не только коммерческий) к их монополизации, контроля и получения за счет эксклюзивного доступа к ним различных «бонусов».

3. Как только появляются платные услуги в этой цепочке — так сразу для одних компаний они становятся более платными/менее платными чем для других. По принципу — что охраняем, то и имеем.

4. В итоге, вместо прозрачности, эффективности и прочего возрастания общественного блага, получаем очередное информационное ****хранилище с «попилами», «откатами» и прочей «чернухой».

5. Поэтому, государство/государственные органы должны публиковать открытые данные таким образом, что бы обеспечить максимально равные условия доступа к ним для ВСЕХ заинтересованных лиц.

Мне кажется это такое уже очень общее место, азы.
Иван, я уже далеко не один год слежу, как ты занимаешься вопросом открытых данных. Можно сказать, просто «снимаю шляпу» перед такой настойчивостью, достойную всякого уважения.

Можешь ли по истечении длительного времени сказать, какие виды данных действительно были полезны людям?

Со своей стороны могу назвать:
— адресная информация (однозначно нужна постоянно!)
— земельный реестр (нужна регулярно)
— информация по контрагентам (пользуюсь время от времени)
— информация по особо охраняемым территориям (разрозненно)
— госзакупки (пользуются знакомые)
— иногда хотелось бы демографию или что-то подобное.

p.s.
Весь бред типа «мы и так уже за все заплатили» предалгаю скипать молча.
Самые полезные данные оказались данные по контрагентам и по организациям. Там есть очень быстрая конверсия в коммерческую выгоду для всех сервисов которые добавляют себе новые источники.

Всё что касается геоданных очень востребованно, но идет тяжело.

Закупки используются повсеместно. Активно используется информация по торгам на имущество (torgi.gov.ru).

Плюс есть очень большой общественный запрос на доступность криминальной и образовательной статистики. Но там пока прогресс невелик.
Подскажите, пожалуйста, какие варианты есть для получения макроэкономических и демографических статистических данных в хоть каком-то адекватном формате?

Меня просто убивает необходимость собирать это руками из всяких сборников Росстата типа «Россия в цифрах» или «Регионы России». Там и объёмы данных-то совсем смешные (многие показатели изменяются помесячно или вообще поквартально, так что с 1995 года вся социально-экономическая статистика может поместиться на одном листе Excel), но как-то со способами получения всего этого в пригодном для анализа виде очень тяжело.

Может я чего-то не знаю?
Макроэкономические показатели есть на сайте Всемирного банка — data.worldbank.org
Региональные доступны через ЕМИСС — www.fedstat.ru

Они все не так детальны как хотелось бы, но дают возможность работать сразу со структурированными машиночитаемыми данными.
Спасибо! Всемирный банк — это не совсем то (мне не нужна статистика, приведённая по ППС), а ЕМИСС вроде не всё есть, но кое-что облегчить наверное сможет.

К слову, можете сказать, насколько внимательно в подобных системах занимаются обновлением данных?
Например, если посмотреть те же «Россия в цифрах», то там в последующих изданиях часто обновляют статистику за предшествующие периоды. В итоге, при ручной выборке, я иду от самого нового издания к самому старому и останавливаюсь, когда получается набрать полный временной ряд.
Не можете сказать, в автоматизированные системы кто-то вносит коррекцию после загрузки первоначальных данных?

И ещё один вопрос: насколько тот же ЕМИСС может считаться официальным источником?
Речь как о нормативно-правовом, так и о научно-этическом аспектах.
ЕМИСС это официальный источник. Её оператором является Минкомсвязь России, а наполняет её Росстат.

Вносят ли коррекцию в системы, во многие вносят, другие наоборот дают данные «как есть». Зависит от каждой системы по отдельности. В системы по регистрации закупок и контрактов — не вносят, в статистику наверняка вносят.
В чем проблема с зарубежными грантами — сложно понять… Зарегистрировались по закону и получайте гранты. Вы же не мохнатой политикой занимаетесь :) Тихий пиар Кудрина и всё почти совсем плохо порадовало… Ну да ладно, тут вроде не место для политики.

Тема эта огромная и сложная. Я оставлю ссылку на работу Минэкономразвития России: data.gov.ru
Можете дополнять.
Ссылку на работу Минэкономразвития сознательно я не привожу, потому что пока что Минэкономразвития ничего хорошего не сделало. Об этом я несколько раз писал ранее здесь же на хабре.
Минэконом не сделало? Тогда вы точно «в теме»… :)
Как то у нас получается, что ни кто — ничего не делает, а всё государство сплошь на грантах держится. LOL полный.
Вы бы поделились хоть какими то результатами творчества вашей команды, «спонсируемой» Кудриным, а то обсуждать других сапожников каждый горазд…
Да чего уж там хвастаться результатами, у нас всё на виду и на сайте и в профиле на хабре.

А Вы, я вижу, всерьёз интересуетесь открытыми данными. Расскажите о себе, кто, откуда, может быть что-то интересное делаете, а мы не знаем. Всегда очень интересно какой есть прогресс по стране.
Only those users with full accounts are able to leave comments. Log in, please.
Information
Founded

28 April 2012

Location

Россия

Employees

2–10 employees

Registered

17 October 2013