Pull to refresh

Comments 15

Вообще, юзаю несколько тулзов.

Самый удобыный для меня — python + numpy/scipy/sckit-learn. Nltk для работы с текстом. Это чтобы воткнуться в проблему. Но для продакшна лучше конкретную тулзу подобрать, типа liblinear/libsvm.
Да, пожалуй, следовало разделить опрос на продакшен и прототипирование. Хотя, в наше время мощных, дешевых железок и дорогих программистов, прототипы всё чаще запускаются прямо в прод :)
Может быть. Но по моему опыту, прототипы в продакшне не держатся. К примеру, я недавно использовал много nltk кода в прототипе. В продакшне пришлось все выкинуть — начиная от таггера, заканчивая кодом расчета tfidf'ов. Кое-что там реализовано откровенно неправильно. Т.е. правильно для демок и академических нужд, но не идет для продакшна. То же самое было с numpy.
Последний вариант зря добавили=) обычно он все портит)
Так по крайней мере не искажаются основные результаты. А вообще удручает количество индивидуумов, у которых руки чешутся.
Раньше пользовался матлабом для разработки модели, а потом уже переносил алгоритмы на С. Сейчас сменил матлаб на Octave, но конечный продукт все равно на сях.
Надо было добавить пункт «Другое». Пользовал в своё время NI DIAdem и LabVIEW c DataFinder тулкитом.
Использую Salford Predictive Miner (http://salford-systems.com/) — в основном TreeNet engine, хотя CART удобен для того, что бы анализировать значимость предикторов, выбирать производные предикторы и тд.
Сбор данных и их обработку — Python.

Сейчас из-за ML-class начал разбираться с Matlab — встроенные быстрые матричные операции там действительно потрясают, да и в принципе визуализации удобнее чем подключать что-то к Python.
Моё «пользование» носило исследовательский характер, но в своё время понравилось SQL Server + SQL Server Data Mining Addin for Office + MS Office (Excel).
хм, а почему нельзя выбрать несколько? я юзаю python, R, matlab, иногда weka
Видимо долго еще «пыщь-пыщь» будет самым надежным и эффективным инструментом, потому что наши разработчики — самые неравнодушные разработчики в мире. Просто так мимо пыщь-пыщь не пройдут)
В свое время использовал python.
Да, нахождение пункта «Пыщпыщ, я просто мимо проходил и хочу посмотреть результаты» сводит на нет представление данных.
Sign up to leave a comment.

Articles