Как стать автором
Обновить

На чем тестировать алгоритмы распознавания и обработки документов, удостоверяющих личность?

Время на прочтение6 мин
Количество просмотров5.4K
Всего голосов 8: ↑7 и ↓1+6
Комментарии6

Комментарии 6

Ресёрчер, ис ит поссибле фор Ю ту чейндж 'датасет' на наше «набор данных»? Так-то фэнкс за артикл, но вай 'датасет'?
Бикоз оф заимствовать общепринятые названия из других языков — это нормально.
Вы же не говорите сегодня «заплечная сумка», вы говорите «рюкзак». Не «самодвижущаяся повозка», а автомобиль. «Телефон», а не «средство для передачи звука на расстояние». Примеров тьма.
Язык живет и развивается, если же он не развивается — он мертв.
Дык, зачем заимствовать, когда есть свой вариант (набор данных)?)
По той же причине, почему в английском языке это слово пишется слитно. Слово «dataset» само по себе недавно возникло (формально говоря, правильно «data set»), но все больше и больше публикаций употребляют именно слитное начертание. Причина — слово «dataset» сейчас значит не просто абстрактный набор данных, а структурированный набор аннотированных (т.е. с разметкой) данных, как правило опубликованный в открытом доступе, объединенный какой-то одной тематикой, и предназначенный для обучения, тестирования и объективного сравнения алгоритмов.

По этой же причине абстрактное «набор данных» в русском языке уже не очень хорошо отражает семантику того, что имеется ввиду. Почему бы и не «датасет».
Прочтите хотя бы одну профессионально переведённую книгу по ML и Data Science, не надо фантазировать и уподобляться стаду, которое один раз услышало — и понеслось…
— Вот, кстати, один из примеров — сегодняшний обзор книги по машинному обучению: ссылка.
Просто просмотрите.
Я так понял, что регулярное употребление таких слов, как «кейс»/«юзкейс», «семпл», «локация», «дестинация», «датасет», «валидный» — это развитие языка. Тогда он не будет мёртвым.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий