Как стать автором
Обновить
40
0
Антон Соболев @antonsobolev

Разработчик C++.

Отправить сообщение

Ничего не понял. Добротный проект, результат выглядит классно. Парень подробно и обстоятельно все описал. Кто все эти люди, кто ему минусов накидали?
Мне не кажется, что проект способен принести адекватную отдачу, но это ж не технический аспект.

Вы правда полагаете, что серийные номера и микродоработки решают проблему егаис и чз маркировки?

Хороший обзор. Но для полноты стоило бы упомянуть нюансы little-endian vs big-endian.

Мы разделяем код и текст в большом проекте openpapyrus много лет (c++). Должен признать проблема очень тяжелая и технически и организационно. Текст и код разделяются руками — автоматического разделения нет, хотя и планируем реализовать хотя бы частичное.
https://github.com/papyrussolution/OpenPapyrus/tree/master/Src/Rsrc/Str
Основной файл ppstr2.txt при сборке проекта парсится, формирует идентификацию, код получает строки по специальным идентификаторам частью целочисленным, частью символьным.

Openpapyrus — исходные коды, атол, вики принт, пирит, штрих фр, чесзнак, егаис, меркурий, все оборудование и вообще все за даром кроме живых консультаций.

А у меня с первого раза в mysql принять получилось. Я, правда, волшебником импорта пользовался (начал раньше, чем ответ от вас получил). Не может быть дело в изначальных параметрах создаваемой таблицы? (я не большой спец в mysql).
Мы прогнали проверку текста и не нашли инвалидных utf-8 символов. Не могли бы вы скинуть скрипт, которым забираете в MySQL данные? Мы у себя прогоним его и исправим выявленные дефекты. Вам, естественно, сообщим.
И вам спасибо за ссылку. Если нам удастся взять из той базы полезные данные, мы их выложим там же и в открытом доступе будет больше хороших данных. Ну и благодарим за то, что прижали наше самомнение — мы были уверены, что выложили самый большой объем — ошиблись.
Весьма забавно. Дело в том, что текст действительно переведен с помощью google translate. Но вот, наряду с другими мелочами, «as gratitude» было вручную вставлено вместо предложенного google'ом «as a thank you».
Так это вы сами себе ответили. Производитель зарегистрирован, а данных о товаре нет. То есть накладки не будет, а вот информацию о том, что это за товар вы не получите. Я не к тому, что gs1 плохой, а к тому, что 1000 цветов лучше, чем 1.
Этот код принадлежит очень приличному производителю. Поищите его в google — он более чем актуален (по крайней мере де-факто).
Тема регистрации штрихкодов у разных организаций относительно недавно обсуждалась на хабре. Мне к этому нечего добавить. В этой идентификации важен не столько официальный регистратор, сколько фактическое принятие операторами рынка.
GS1 — только EAN.
И ean'ы не все (4041485044338 например — вполне популярный товар).
Весь список вы скорее всего не получите, соответственно, к примеру, сложный анализ большой выборки наименований провести будет не просто (или невозможно).
Можно продолжить.
Но самое главное, мы просто дарим справочник тем, кому он нужен. Кому — нет, тот ничего не теряет.
Это почти невозможно. Вероятно, есть проблема с теми наименованиями, в которых встречаются упомянутые вами проблемы с utf-8. Мы в функцию формирования данных добавим валидацию и корректировку таких символов.
Упс! Опять спасибо — 127 символов.
В оригинальной базе данных производитель есть для ряда позиций, но там такая путаница и столько дубликатов, что пока решили не публиковать их в открытом доступе. Из соображения, что отсутствие данных лучше, чем плохие данные.
Спасибо. Мы постараемся включить их в базу как можно скорее и опубликовать в общем списке.
У нас тоже есть api (http://www.uhtt.ru/dispatcher/ws/iface?wsdl) и тоже платный (1 копейка за одну товарную позицию). И им даже пользуются, однако это не приносит каких-либо значительных денег. Даже если бы мы увеличили расценки кратно — все равно. Возможно, мы не достаточно хорошо работали над вопросом.
Нет не делали. Знаем, что такой подход существует и работает. В действительности, этот справочник лежит несколько в стороне от нашей основной деятельности, а скрейпинг требует дополнительный ресурсов на реализацию — просто руки не дошли.
Спасибо за замечание — мы поправим это.
Планируем, но пока только стратегически. То есть, совершенно ясно, что на Linux надо портироваться, но по-факту даже не приступили еще.

Информация

В рейтинге
Не участвует
Откуда
Петрозаводск, Карелия, Россия
Дата рождения
Зарегистрирован
Активность