Pull to refresh

Comments 24

Еще с сотню паролей сбрутил. Благодарю за линк на словари)
UFO just landed and posted this here
+1 (оффтоп: + без кармы :))
А под виндой я буду ставить себе cygwin из-за этих хитросплетений. Уж извольте, была поставлена задача, были выбраны удобные инструменты, и цель топика показать не как это делалось, а дать исходные данные и в частном случае базу существительных. Ну зато теперь я знаю что у Вас богатый опыт unix-like решения задач, я Вас поздравляю.
А ничего что для всех решений существуют оптимальные пути решения?
Или Вы также за говнокод, например? :)
UFO just landed and posted this here
Да мне проще написать этот код в течение 5 минут и за полминуты добавить insert в mysql. Да мне так проще. Да я на винде.
UFO just landed and posted this here
Если нужны словари имён существительных, прилагательных и глаголов во всех формах, то это однозначно в Викисловарь. Качаем mediawiki, дамп викисловаря; часик установки, импорта, настройки и у нас свой словарь, где у кучи слов таблица со всеми формами. И начинаем парсить.
Почему же тогда скажите Министерство образования нигде не указывает в рекомендациях Викисловарь? Я лично не очень доверяю ему когда дело касается десяток тысяч слов.
~60k существительных, ~15k прилагательных, ~14k глаголов. С таблицами форм. Плевал я на рекомендации, я принимаю решения сам.
Викисловарь делался, насколько я знаю, именно через парсинг словаря Зализняка. Большинство статей там не руками писали.
А они много современного рекомендуют?
Министерство образования не истина в первой инстанции. Или для Вас это тоже новость? :)
Любой школоло способен сделать данные действия. В чем смысл писать такие топики на хабре?
Смысл дать толчок тем, у кого похожие задачи. Смысл в делении опытом, разве не для этого у нас хабр? Я потратил пару часов на поиски, другой их сэкономит. Я хотел поделиться полезной информацией, исходными данными и в данном случае готовым словарём существительных из ДОСТОВЕРНОГО источника. Что я делаю не так?
Поиски чего, простите? www.google.ru/search?q=%D1%81%D0%BA%D0%B0%D1%87%D0%B0%D1%82%D1%8C+%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D1%80%D1%8C+%D0%97%D0%B0%D0%BB%D0%B8%D0%B7%D0%BD%D1%8F%D0%BA%D0%B0
+ «Вавилонская башня» известна любому человеку который собирается хоть чуть-чуть погрузиться в морфологию…

Пару часов на поиски? Уже с этого момента «что-то не так».

В чем ценность Вашего говнотопика?

p.s. Минусуйте, но не забывайте писать/думать зачем и за что.
Во-первых, я не сразу знал что существует словарь Зализняка, пришлось сначала придти к выводу что мне нужен именно он.
Во-вторых, не нашел на хабре топика с близкой тематикой.
В-третьих, я написал в личный блог, не нравится — проходите мимо.
В-четвертых, от Ваших комментариев попахивает бОльшим говном, чем от моего кода.
Хотел связаться с Зализняком как-то, вышел на его секретаря. Выводы по итогам переписки: все пользуются словарями неправомочно, никто с Зализняком не договаривался, это несправедливо, но ничего они делать не будут, т.к. слишком далеко все зашло (у нас почти вся компьютерная морфология в России на словаре Зализняка).
Апдейт 11 лет спустя :) Ситуация со «Грамматическом словарем» Зализняка прояснилась. С разрешения правообладателя материалы 6-го издания словаря выложены в открытый доступ:

gramdict.ru
github.com/gramdict/zalizniak-2010

Правообладатель разрешает пользоваться словарем бесплатно в некоммерческих целях, иначе вам следует приобрести коммерческую лицензию, заключив с правообладателем лицензионный договор. Контакты по ссылкам выше.
А скажите DBF файл удалось открыть чем-нибудь? А то я с башни скачал, а там дбф паролем залочен.

И если честно скачав в текстовом фарианте не совсем понял структуру текстового файла, что все это «аберрационный 9 п 1*а» значит.
DBF файл пытался открыть плагином из TotalCommander BaseView. Открывает с крякозябрами :( Дальше с DBF не разбирался, ибо удобней с текстовиком было.

По поводу структуры — это описание слова по классификации Зализняка. Немного описания можно найти здесь
Подробное описание структуры словаря и значения различных символов и помет теперь можно найти на официальном сайте словаря: gramdict.ru/contents
Sign up to leave a comment.

Articles