Комментарии
14
Вопрос от человека, изучающего Data Science на курсере. Что почистили, чтобы объем датасета упал с 4.4тб до 3гб? Можно в виде алгоритма?
Мы выделили фичи, которые хотим исследовать. Например, посчитали количество ячеек кода в каждом ноутбуке, выделили импорты, вычислили количество графиков. В итоге получили файлы с фичами, а сами .ipynb файлы исключили из датасета
Почёму бы не перевести как блокнот?
Это в русском языке куда ближе к исходному смыслу и уж точно не так режет глаза.
Получили много таких комментариев, учтем на будущее, спасибо! Исходили из того что в гугле по запросу «Jupyter ноутбук» больше поисковых запросов, чем «Jupyter блокнот». Поэтому решили, что «ноутбук» чаще употребляется и использовали такой перевод.
все таки судить о популярности R и Julia по Jupyter не стоит — у R есть офигенный RStudio, а у Julia хоть и нет ультимативной альтернативы, но и юпитер не самое популярное решение как мне кажется. И только питонисты страдают в юпитере
Это да.
Использовать Jupyter ноутбуки когда есть RStudio — это будет странный выбор
"мы скачали ноутбуки".
Этот перевод сломался, несите новый
Получили много таких комментариев, на будущее учтем. Спасибо!
А чем вы парсили ноутбуки, если не секрет?
Если мне не изменяет память это просто json файлы
Пара замечаний:
- Картинки нечитаемые. Надо бы уже на svg переходить.
- Сделан неявный вывод о том, что все Jupyter ноутбуки — это Data Science и весь Data Science в ноутбуках. Оба утверждения не совсем корректны.
В остальном, хорошее исследование.
Спасибо за фидбэк!
Сделан неявный вывод о том, что все Jupyter ноутбуки — это Data Science и весь Data Science в ноутбуках. Оба утверждения не совсем корректны.С этим согласны
ждем скидку
Прикольное исследование)
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.
Мы скачали 10 миллионов Jupyter-ноутбуков с Github — и вот что мы выяснили