Теперь мы гораздо лучше находим главный контент на сайтах

Уважаемые пользователи!

В последние месяцы мы работали над совершенствованием важного модуля нашей системы - поиска основного контента на страницах ваших сайтов.

Поиск основного контента - это когда наш алгоритм пытается понять, где находится навигация, где подвал, а где основной контент. Выделить основной контент - сложная задача, ведь на странице могут быть анонсы статей и новостей, тоже представляющие собой важный, но не главный контент.

Дополнительно осложняет задачу разница в разметке. Все сайты по-разному подходят к оформлению контента, иногда изобретая уникальные способы, о которых мир даже не слышал!

Новый алгоритм

Мы изучали последние публикации на тему анализа разметки страниц сайта и выделения основного контента. В последние годы в этом направлении замечен значительный прогресс.

Основной прогресс достигнут компаниями, которые специализируются на выделении контента страниц для их прочтения голосом. В таких системах важно четко разделять навигация и основное содержание страницы.

Мы использовали идеи, опубликованные в исследованиях, и улучшили наш алгоритм с их помощью.

Наш улучшенный алгоритм должен находить основной контент гораздо правильнее.

Отзывы об ошибках

Мы будем очень благодарны за отзывы о работе нашего нового алгоритма.

Пожалуйста, отправляйте ваши сообщения через форму обратной связи.