Pull to refresh
14
0
Дмитрий Бабаев @ratatosk

‎Data Science and ML Practitioner

Send message

На завершающем этапе применяется идея бустинга. Решающие деревья формируют комитет для голосования. На основании коллективного мнения создается наиболее правдоподобный ответ. Главное достоинство бустинга – это возможность при объединении множества «плохих» алгоритмов (результат которых лишь немного лучше случайного) получить сколь угодно «хороший» итоговый результат.

Возможно речь все-таки не о бустинге а о бэггинге?

Довольно забавно, что в вашем комментарии можно заменить слово китаец, на слово русский, и, он останется, во многом, верным. Тем не менее, мы находимся там где мы сейчас.

Люди, работающие с R, должны знать статистику, а люди, знающие статистику, должны знать, что то, чем вы занимаетесь в этой статье называется систематической ошибкой отбора.

Вы отобрали примеры, когда R лучше Python, проигнорировав случаи где все наоборот, и, никак не учли актуальность ваших примеров.

Приведу только один пример, который для меня является решающим в выборе R vs Python. 99% нейросетевого коммюнити использует Python, и, работая с R, исследователь оказывается в изоляции, не может использовать код из свежих (и не очень свежих) статей, и, имеет огромные проблемы при взаимодействии с коллегами.

У меня у нескольких коллег из Сбера заблочили

Так как код выложен под лицензией Apache патенты никак не ограничивают.

Contributors provide an express grant of patent rights. См. раздел 3. Grant of Patent License. в лицензии Apache.

Описанное в статье очень похоже на идеи математической вселенной Тегмарка https://en.wikipedia.org/wiki/Our_Mathematical_Universe

В том, что надо в долларах а не в рублях смотреть: https://www.irn.ru/gd/s-2000-goda-v-dollarah/

Возможно, будет интересно посмотреть нашу статью, про эмбеддинги последовательностей событий, где каждое событие состоит из категриальных и численных полей: https://arxiv.org/abs/2002.08232.

Есть еще PyJNIus (https://github.com/kivy/pyjnius) он работает через JNI, он удобнее и быстрее чем Py4J

В чем смысл сравнивать количество умерших от гриппа в 2016 году и смертей от COVID? Явно же заболевших гриппом было сильно больше.

Так отрасль на подъеме, людей не хватвет, поэтому начинающему легко попасть на относительно неплохую стартовую зарплату. Правильно ли я понимаю, что вы хотите, чтобы отрасль была на спаде и программисты дрались друг с другом за рабочие места?

В многомировой интерпретации множество миров где кот мертв естественным образом получаются вследствие того, что при очередном делении на два мира тот мир, где кот остался жив может еще раз поделиться на два мира жив/мертв. Получается, что с течением времени растет количество миров, где кот мертв, а мир, где кот жив остается один.

А в чем смысл шифровать DNS, кроме как, защиты от подмены ответа? Провайдер же все равно знает IP соединения и, может по нему восстановить основную часть домена для более-менее крупных сайтов?

Рекуррентные нейросети полны по Тьюрингу, вот, например, подробности: https://stats.stackexchange.com/questions/220907/meaning-and-proof-of-rnn-can-approximate-any-algorithm.

Английский вариант этой книги доступен бесплатно от автора: https://jakevdp.github.io/PythonDataScienceHandbook/

А причем здесь математика? Или она упомянута только из-за слова "Гаусс" в названии?

А как мы в последнем примере получили 2-х мерные вектора если выход последнего слоя сети — 128?

Кстати power.prop.test из R для одностороннего теста почему то стабильно предлагает в 2 раза большее количество экспериментов на группу чем метод, описанный здесь. Например, для примера из статьи:


power.prop.test(
    p1 = 0.001,
    p2 = 0.0011,
    sig.level = 0.01,
    power = 0.99,
    alternative = "one.sided")

     Two-sample comparison of proportions power calculation 

              n = 4541213
             p1 = 0.001
             p2 = 0.0011
      sig.level = 0.01
          power = 0.99
    alternative = one.sided

NOTE: n is number in *each* group
1

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Registered
Activity

Specialization

Data Scientist, ML Engineer