Pull to refresh

Comments 2

Первый! :)
Отличная статья! Было бы круто, если бы на основе данного решения (или какого-то другого) были более частные и технические заметки с описанием подводных камней и способов их решения применительно к используемым средствам и инструментам. Ну т.е. нормализация форматов времени, русификация, кодировка. Это обычно то, с чем сталкиваются начинающие гугло-кодеры. Информации о каких-то базовых решениях на том же R масса, но она на 99% на английском языке и у них, соответственно, вопрос локализации не стоит. А в реальной жизни с этим сталкиваться приходится постоянно и времени на это уходит целая тьма. Ну и не только на это.

Про приключения с датами Илья кажется уже писал в своих прошлых циклах, а с кодировкой для "Ё" и "Ч" — да, на text mining задачах в R можно найти грабельки.

Sign up to leave a comment.

Articles