Pull to refresh

Comments 8

Интересная тема, но узкая тематика — даже спросить толком нечего.
отличная статья! очень хороший пример практического применения… спасибо большое, от нее буду отталкиваться в своих изысканиях по кластеризации и по forecast анализу…
Хорошая статья!
В виде ipython notebook оформить не планируете?
Я думал над этим, но решил все-таки сделать оформление как в предыдущих статьях. Если интересует ipython notebook файл можно взять у меня на github'e: TKCBankPredict.ipynb
Если еще помните, как делали (понимаю, поздно спрашиваю), как вы били исходное множество на две части — обучающую и тестовую, в какой пропорции? И еще вопрос — по идее в тестовую выборку должны попасть именно клиенты, т.е. бить надо по идентификатору клиента, потому что у одного может быть много ответов из кредитных бюро, вы так делали? Если да, то итоговую оценку по клиенту нужно как-то приводить из нескольких оценок к одной?
как вы били исходное множество на две части — обучающую и тестовую, в какой пропорции?
Вот же в коде:
TRNtrain, TRNtest, TARtrain, TARtest = train_test_split(train, target, test_size=0.3, random_state=0)
Да, собственно говоря, что и требовалось доказать. Чувак решал совершенно другую задачу.
И таки да, метода загрузки train нет в коде. Но я думаю, что он просто взял и загрузил из файла. А там не клиенты а записи по клиентам. Спасибо, что напомнили, сколько лет, сколько зим.
>> И таки да, метода загрузки train нет в коде.
точнее есть, но сути это не менят.
Sign up to leave a comment.

Articles

Change theme settings