Comments 46
Расскажите с какими трудностями пришлось столкнуться при работе на данным проектом? Во сколько вылилась разработка в человеко-часах и почему?
Расскажу о своем опыте. Одна из засад — данные на сайте могут измениться задним числом, поэтому этот момент нужно мониторить. На сайте много JS, местами работающего криво, данные на сайте порой выгружаются не все. Есть мнение, что это связанно с переходом на новый вариант сайта (на старом информация была более полной).
Делал парсер с нуля на PHP который собирал все тендеры с сайта, разбирал на отдельные характеристики данные и пихал их в базу. Веб морда Yii создана на стандартном интерфейсе генерируемым gii, соответственно сортировка/поиск по характеристикам есть. Трудозатраты: 10 часов.
Расскажу о своем опыте. Одна из засад — данные на сайте могут измениться задним числом, поэтому этот момент нужно мониторить. На сайте много JS, местами работающего криво, данные на сайте порой выгружаются не все. Есть мнение, что это связанно с переходом на новый вариант сайта (на старом информация была более полной).
Делал парсер с нуля на PHP который собирал все тендеры с сайта, разбирал на отдельные характеристики данные и пихал их в базу. Веб морда Yii создана на стандартном интерфейсе генерируемым gii, соответственно сортировка/поиск по характеристикам есть. Трудозатраты: 10 часов.
0
В человекочасах — это команда из 4-х человек и около 4-х месяцев.
Там огромная открытая база на FTP сервере и несколько сотен гигабайт переработано и база в десятки гигабайт получилась в итоге.
Плюс у нас ключевое условие — это готовность к высоким нагрузкам. Мы предполагаем довольно интенсивное использование открытого API и сразу делали систему под это.
Там огромная открытая база на FTP сервере и несколько сотен гигабайт переработано и база в десятки гигабайт получилась в итоге.
Плюс у нас ключевое условие — это готовность к высоким нагрузкам. Мы предполагаем довольно интенсивное использование открытого API и сразу делали систему под это.
+1
А БД какую используете? MongoDB?
+2
А это ftp публичное? Если да, то на сколько расходятся данные в нем и тем, что показывается на сайте госзакупок?
0
del
0
Симпатичный сайт.
Предложу еще номинацию для конкурса — «Анализ данных» — сделайте выгрузку БД в csv на какую-нить дату и кто накопает там самую оригинальную информацию :)
Предложу еще номинацию для конкурса — «Анализ данных» — сделайте выгрузку БД в csv на какую-нить дату и кто накопает там самую оригинальную информацию :)
+1
А насколько актуальной в дальнейшем может быть ваша база данных?
При грамотной организации API и актуальности это может быть интересно еще и как сервис для подрядчиков.
При грамотной организации API и актуальности это может быть интересно еще и как сервис для подрядчиков.
+2
Вопрос оставлю тут, пожалуй.
Что бы отправить android-приложение (приветствуются OpenSource) — что нужно высылать? Выложенную версию на Google Play? APK-файл? Исходники на GitHub (соберёте уже сами)? Файл то к форме не приложить.
Ну просто любопытства ради. А почему именно 2 места призовых, а не 3 (в каждой номинации)?
Что бы отправить android-приложение (приветствуются OpenSource) — что нужно высылать? Выложенную версию на Google Play? APK-файл? Исходники на GitHub (соберёте уже сами)? Файл то к форме не приложить.
Ну просто любопытства ради. А почему именно 2 места призовых, а не 3 (в каждой номинации)?
+1
А на сайте только 94-ФЗ, без 223тьего?
0
Как забавно, буквально пару месяцев назад поднимал кластер MongoDB и выгружал скриптами эти данные с целью посмотреть, что там и как. Но одному конечно с этим справиться было бы очень тяжело.
Если интересно, вот код:
github.com/roveo/zakupki
Если интересно, вот код:
github.com/roveo/zakupki
0
Отличный проект. Похоже по духу на open gov, а есть ли какая-либо поддержка от федералов?
0
Можно ли у вас смотреть статистику в по всяким разрезам, например, по отраслям?
+1
Мы сделали акцент на API так чтобы такую статистику мог бы подсчитать кто угодно. Функциональные возможности собственно сайта мы тоже развиваем, но так чтобы не в ущерб другим возможностям. По отраслям мы думаем над тем что можно было бы добавить — у нас пока есть коды бюджетной классификации, бюджеты и коды ОКДП, но отраслевую нарезку они дают лишь отчасти.
0
Кстати, не боитесь что вас гос-во за публикацию таких данных завалит (ddos)? Ну или просто заблокирует
0
С какой кстати? Вы также просто можете запросить те же данные на сайте zakupki.gov.ru.
0
Всё что мы делаем это «переупаковываем» и так открытую информацию и даём к ней удобный доступ. Не вижу причин нас блокировать кому бы то ни было.
0
А как часто обновляетесь? Данные из реестра по контрактам например от 09.01.2014 г. отсутствует, когда можно будет их запросить?
0
проблема автоматического анализа в том, что название контрактов не всегда отображает реальные работы: так, например, обычные стеклопакеты обзывают системой вентиляции и климатического контроля (реальный пример) :)
или в названии контракта указана стройка (потому что деньги выделялись на стройку), а внутри — яхта :)
реальные вещи пишут в ТЗ, а единого формата для документации, увы, нет.
или в названии контракта указана стройка (потому что деньги выделялись на стройку), а внутри — яхта :)
реальные вещи пишут в ТЗ, а единого формата для документации, увы, нет.
+1
планируется ли в дальнейшем API сделать платным?
0
Скажите, а вы загружаете саму конкурсную документацию (например, технические задания)?
Можно ли теоретически осуществить полнотекстовый поиск не только по описаниям контрактов, но и по их содержанию?
Какой приблизительно общий объем документации?
Можно ли теоретически осуществить полнотекстовый поиск не только по описаниям контрактов, но и по их содержанию?
Какой приблизительно общий объем документации?
0
Ребят, а в целом, какой размер занимают все данные с фтп zakupki.gov?
0
Я так понял что там только уже заключенные контракты? А есть информация по открытым аукционам и если нет то планируется ли?
0
Информация по открытым процедурам закупок есть у многих коммерческих операторов. Таких как zakupki360.ru или ist-budget.ru или trade.su — мы не сможем и не планируем конкурировать с ними. У нас общественный проект — если мы и начнем добавлять открытые процедуры то только для общественного контроля и насколько осилим. Сейчас даже по контрактам у нас много что недоделано.
Но в планах есть.
Но в планах есть.
0
Sign up to leave a comment.
Госзатраты: мониторинг госрасходов, API и соревнование для разработчиков