С помощью можно определить тематику любой заданной страницы. Данный продукт будет интересен тем, кто хочет выдавать релевантную рекламу, новости или иной контент в зависимости от тематики страницы.

Данная технология уже около 4 лет используется «Бегуном». Алгоритм также применяется в Новотеке и антиспам фильтре Касперского.

Как работает

Для внешней системы работа модуля «Семантическое зеркало» выглядит так: модулю передается адрес страницы, в ответ он возвращает набор вероятных тем (с весами) и список ключевых терминов (также с весами).

Получив адрес страницы, модуль «Семантического зеркала» анализирует текст страницы, взвешивает частоты слов и семантические связи между словами, выделяет из текста страницы самые важные термины (слова и словосочетания) и по ним определяет набор нескольких наиболее вероятных тем страницы.

Система контекстной рекламы может по своему усмотрению использовать выдачу модуля «Семантического зеркала» в двух режимах — показывать объявления либо в соответствии с набором тем, либо напрямую по списку выделенных терминов.

Темы определяются по очень подробному и детальному рубрикатору на 2500 рубрик, где к каждой рубрике приписано несколько десятков или сотен ключевых терминов с семантическими весами. Темы в рубрикаторе подобраны специально под потребности интернет-пользователей.

Для простого и быстрого внедрения «Семантическое зеркало» имеется и более общий короткий рубрикатор на 60 основных («верхних») тем.

Технология, естественно, платная. Но есть бесплатная с ограничением в 128 обращений в сутки с одного IP.