В современной компьютерной лингвистике биграммы, или в общем случае n-граммы, являются важным статистическим инструментом. В статье мы расскажем с какими трудностями можно столкнуться при расчёте биграмм на большом корпусе текстов и приведём алгоритм, который можно использовать на любом домашнем компьютере.
Сергей Бубнов @svboobnov
погромист-кнопкодав
Information
- Rating
- Does not participate
- Location
- Калуга, Калужская обл., Россия
- Date of birth
- Registered
- Activity