Информация

Дата основания
Местоположение
Россия
Сайт
jetbrains.com
Численность
1 001–5 000 человек
Дата регистрации

Блог на Хабре

Обновить
Комментарии 14
Вопрос от человека, изучающего Data Science на курсере. Что почистили, чтобы объем датасета упал с 4.4тб до 3гб? Можно в виде алгоритма?
Мы выделили фичи, которые хотим исследовать. Например, посчитали количество ячеек кода в каждом ноутбуке, выделили импорты, вычислили количество графиков. В итоге получили файлы с фичами, а сами .ipynb файлы исключили из датасета

Почёму бы не перевести как блокнот?
Это в русском языке куда ближе к исходному смыслу и уж точно не так режет глаза.

Получили много таких комментариев, учтем на будущее, спасибо! Исходили из того что в гугле по запросу «Jupyter ноутбук» больше поисковых запросов, чем «Jupyter блокнот». Поэтому решили, что «ноутбук» чаще употребляется и использовали такой перевод.

все таки судить о популярности R и Julia по Jupyter не стоит — у R есть офигенный RStudio, а у Julia хоть и нет ультимативной альтернативы, но и юпитер не самое популярное решение как мне кажется. И только питонисты страдают в юпитере

Это да.
Использовать Jupyter ноутбуки когда есть RStudio — это будет странный выбор

"мы скачали ноутбуки".


Этот перевод сломался, несите новый

Получили много таких комментариев, на будущее учтем. Спасибо!
А чем вы парсили ноутбуки, если не секрет?

Если мне не изменяет память это просто json файлы

Пара замечаний:


  • Картинки нечитаемые. Надо бы уже на svg переходить.
  • Сделан неявный вывод о том, что все Jupyter ноутбуки — это Data Science и весь Data Science в ноутбуках. Оба утверждения не совсем корректны.

В остальном, хорошее исследование.

Спасибо за фидбэк!
Сделан неявный вывод о том, что все Jupyter ноутбуки — это Data Science и весь Data Science в ноутбуках. Оба утверждения не совсем корректны.
С этим согласны
Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.