ИИ научился определять национальность по почерку
Сергей Сурепин
12 июля 2018, 17:12
Международная группа учёных создала систему Cloud of Line Distribution (COLD), которая сканирует рукописный текст на английском языке и определяет, откуда родом его автор, сообщает FC. Разработчики считают, что технология пригодится при расследовании преступлений.
Учёные собрали образцы текстов на английском, написанных 100 жителями Малайзии, Ирана, Китая, Индии и Бангладеша. Массив данных составил 500 строк текста, после чего COLD разбил строчки по буквам и проанализировал наклон текста. Алгоритм определил принадлежность автора текста к той или иной стране лучше существующего метода, а для некоторых стран даже увеличил точность определения более чем в 2 раза.
- Алгоритм работает на основе шаблонов. Когда китайцы используют латинский алфавит, буквы у них получаются более прямыми, потому что иероглифы китайской письменности формируются из прямых черточек. А в почерке у жителей Индии и Бангладеша больше изогнутых линий, потому что в буквах их родного алфавита больше округлых форм.
- Учёные считают, что новый метод может пригодиться для расследования преступлений. Полиция всё чаще использует для этого биометрические данные. Определение национальности человека по почерку может встать в один ряд с другими технологиями, например, программами для распознавания лиц.
- Учёные пока не дали ответа на вопрос по поводу конфиденциальности и гражданских прав, которые применение этой и подобных технологий может нарушить. Из-за ошибок анализа в преступлении могут обвинить невиновного человека.