Специалисты научились вычислять анонимных пользователей в интернете
14-01-2013, 11:30В рамках хакерской конференции 29C3 Chaos Communication Congress в Гамбурге была представлена техника для определения личности анонимных пользователей, оставляющих комментарии на форумах или аналогичных сервисах. Эффективность разработки Сади Афроз и Эйлин Калискан Ислам достигает 80%.
Система использует законы лингвистики и анализирует содержание текста, определяя служебные слова; также в методике применяется такой подход к анализу текста, как стилометрия — каждый человек использует одинаковые конструкции в научных работах и, например, общаясь в чате и на форуме, что и позволяет идентифицировать анонимного пользователя интернета.
По словам разработчиков, техника позволит успешно раскрывать личности владельцев ботнетов, авторов вирусов и иного вредоносного программного обеспечения. Для отладки системы были просканированы тематические форумы и сообщения десятков тысяч авторов. Правда, для эффективного анализа ей требуется как минимум 5 тыс. слов, написанных одним человеком (по словам авторов, 6,5 тыс. является «золотой серединой»). Отмечается, что «деанонимизатор» работает только с английским языком, однако даже переводные тексты поддаются анализу.