Придуман фильтр «тупых» комментариев

Придуман фильтр Создана программа, убирающая
идиотские комментарии из конференций и блогов. Команда
разработчиков долго трудилась над «фильтром тупости», который бы
работал как спам-фильтр и удалял «идиотские комментарии». Группа
программистов из американского города Альбукерке под руководством
Гэбриэла Ортиса (Gabriel Ortiz) готовит свободно распространяемую
бесплатную версию программы с открытым кодом. По сути, это ПО
будет состоять из двух частей — фильтра, устанавливаемого на
веб-сервер и программы, которая будет реализована в виде плагина
к браузеру Firefox. Выход ПО ожидается в конце этого года. Как же
это работает? Если на сервере установлен фильтр, то он будет
анализировать содержание каждого комментария перед его
публикацией. Если фильтр «обнаружит», что комментарий невнятен,
то пользователю будет выдано примерно следующее сообщение:
«Данный комментарий в той или иной мере бессодержателен.
Попробуйте его переформулировать». Фильтр отслеживает такие
популярные в интернете выражения как «LOL!!!», «OMG!!!» и тому
подобные. Речь, конечно же, о выражениях, используемых в
англоязычном интернете. Ортис отмечает, что одной из проблем при
разработке программы было придумать, как фильтровать иронию.
Поскольку компьютеры немного похожи на американцев: они не могут
выделить высказывания иронического или саркастического характера.
А это представляется большой проблемой, так как «умные» посты
зачастую полны иронии. Люди, не обделенные интеллектом, очень
часто допускают в своих постах «опечатки» иронического свойства,
например для американских форумов и блогов характерна замена blog
на bog (болото), Open Source — на Open Sauce (Открытый соус), и
только действительно тупые люди не поймут иронии и намеков.
Однако Ортис, который изучал лингвистику на последнем курсе
университета, отметил, что в «идиотских» комментариях часто
используются подряд идущие согласные (например — amazinggggg!), в
то время как в постах саркастического свойства — повторяющиеся
гласные (например — Yeaaaaaah). Одним из «критериев оценки»,
используемом в фильтре Ортиса, являются стандартные правила
грамматики английского языка. Например, если в одном из слов в
посте сделана ошибка, оно написано неправильно, а остальная часть
сообщения грамматически верна — то фильтр «пропустит» такой пост.
Если же оставшаяся часть сообщения бессодержательна — то фильтр
ее отсеет. — пишет itua.info со
ссылкой на cyberstyle.ru.

Добавить комментарий