Уважаемые пользователи!
В последние месяцы мы работали над совершенствованием важного модуля нашей системы - поиска основного контента на страницах ваших сайтов.
Поиск основного контента - это когда наш алгоритм пытается понять, где находится навигация, где подвал, а где основной контент. Выделить основной контент - сложная задача, ведь на странице могут быть анонсы статей и новостей, тоже представляющие собой важный, но не главный контент.
Дополнительно осложняет задачу разница в разметке. Все сайты по-разному подходят к оформлению контента, иногда изобретая уникальные способы, о которых мир даже не слышал!
Мы изучали последние публикации на тему анализа разметки страниц сайта и выделения основного контента. В последние годы в этом направлении замечен значительный прогресс.
Основной прогресс достигнут компаниями, которые специализируются на выделении контента страниц для их прочтения голосом. В таких системах важно четко разделять навигация и основное содержание страницы.
Мы использовали идеи, опубликованные в исследованиях, и улучшили наш алгоритм с их помощью.
Наш улучшенный алгоритм должен находить основной контент гораздо правильнее.
Мы будем очень благодарны за отзывы о работе нашего нового алгоритма.
Пожалуйста, отправляйте ваши сообщения через форму обратной связи.