Как стать автором
Обновить

Комментарии 17

По-моему, единственный способ бороться — писать подсказки прямо рядом с полями, чтобы далеко не ходить. Типа «Не пишите здесь все характеристики, а укажите только модель, например Nokia N95).

Хотя бы часть неправильных заполнений будет устранена.

Ну а для правки за совсем уж дятлами нужно, чтобы кто-то этот каталог просматривал и правил.
Парсер надо писать, целящегося на ключевые слова.
Не так много клиентов так пишут, и пишут похоже.
выпадающие списки с уже готовыми вариантами
Добавляется компания, какой может быть список?
Или когда они сами, генерят прайсы.

Самый очевидный способ, это модерация.
> Но 2 пользователя из 3-х, в поле название будут писать (пример: Завод малярного инструмента)
не понял… так чего писать то будут?

Вообще тут помогут только понятные интерфейс с подсказками и постмодерация.
Пример: ООО Рога и копыта

С заводом может, я и погорячился.
Но когда пишут (Ремонт картир и офисов). А в описание пишут Компания «СтройПромГрад»
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь
Но в названии они все же не поленились написать «ремонт квартир и офисов», а название конторы поленились?
НЛО прилетело и опубликовало эту надпись здесь
внезапные запятые по всему тексту, включая заголовок, повергают в ступор.
как заставить хабраюзеров «вводить нормальную информацию»?
по примеру 2:
никак, прайсы выгружают из систем, типа 1С, где все товары записаны в виде Nokia N95-black 8GB GSM 850/900/1800/1900/HSDPA. Лучше делайте по аналогии с яндекс.маркетом — они сами подбирают описания для товара и подставляют описания.

а так да, подсказки рядом с полями.
Спасибо за совет
В моей практике пользователи различниых систем своевременно вводили достоверную, правильную информацию лишь в том случае если им это было выгодно. Если выгода прямая — в 100% случаях, если косвенно — то по грубым прикидкам в 50%.

Хотя если ввести правильно — удобнее чем неправильно, пользователь поленится вносить ошибки.
Я (правда для другого случая) написал функцию, которая выясняет соотношение между неалфавитными символами и алфавитными:

protected function _detectTextClearence($text) {
$text = preg_replace('$[^a-z0-9]$im', '', $text);
$textLen = strlen($text);
$symbolText = str_replace(range(0, 9), '', $text);
$symbolTextLen = strlen($symbolText);
return ($symbolTextLen > 0)?($textLen — $symbolTextLen) / $symbolTextLen:0;
}

При соотношении больше 0,1 считаю, что текст невалиден (то есть содержит слишком много мусора).

Ну, можно наверное скорректировать ее для себя, да и на JS переписать — ничего сложного.
Проэкт — мало читаете.

Я бы разрешил пользователям писать именно так, как они и пишут, — очевидно же, это сценарий работы для них самый удобный.

Проблема только в автоматическом распознавании введённой информации.

Можно назначить метку каждому параметру, например: модель: Nokia N95 цвет: чёрный. Это облегчит распознавание, но редкий пользователь будет их вводить. Для ответственных можно сделать умную строку ввода, где после каждого набора порции текста выводился бы список меток, которые ещё не были указаны. Эта же строка поможет для ручной правки неструктурированных порций текста, где для выделенной порции текста выводится тот же список для назначения из доступных меток.

Ну или можно просто собрать примеры неструктурированных текстов и написать парсер на основе механизма обратного вывода фактов или обучить нейронную сеть их распознаванию.
> Я бы разрешил пользователям писать именно так, как они и пишут, — очевидно же, это сценарий работы для них самый удобный.

Позвольте с Вами не согласиться.
Мне кажется, они просто хотят как можно больше выделиться. Чтобы на них обратили внимание.
Когда вводят (пример: Мы ЗаНиМаЕмСя ПрОдАжЕй КоРаБлИкоВ нА ДиСт. УпРаВлЕн....)
То я не думаю, что им так вводить удобно.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации