Основная задача ранжирования

27 марта 2018

SEO продвижение сайтов в АлматыЗадача ранжирования состоит в упорядочении документов коллекции по убыванию степени их соответствия запросу, т.е. более релевантные (адекватные) документы должны занимать более высокие позиции в выдаче. Для решения этой, основной задачи поиска, большинство поисковых систем используют «функции релевантности» (способ получить числовую оценку соответствия документа запросу). Другими словами, поисковая программа вычисляет значение релевантности документа в контексте запроса и сортирует коллекцию согласно данному числу.

Как правило, релевантность является функцией от набора переменных (их ещё называют факторами). В качестве факторов выступают различные числовые характеристики, которые должны помогать различать релевантные документы и нерелевантные. Для многих поисковых систем результирующая функция релевантности является простой комбинацией небольшого множества (от 5-15 штук) факторов. Некоторые более комплексные факторы используются сами в качестве самостоятельных функций ранжирования.

Подход крупнейших поисковых систем Yandex и Google использует значительно большее количество факторов — ранжирование коллекции (тестовых) основано на более чем 150 компонентах.
Большинство из факторов представляют собой простые числовые характеристики документа или запроса. Ключевым моментом в построении ранжирования является способ комбинации факторов, т.е. вид функции релевантности. Для получения функции ранжирования используются методы машинного обучения. Такой подход позволяет достаточно легко добавлять новые ранжирующие факторы, тем самым развивая и улучшая поисковую систему.

SEO продвижение сайтов в Алматы