Подход к реализации алгоритма оценки уровня релевантности. DRAFT v.1

Автор: К.Карпенко

1A (0,5 либо 0) - является ли запрашиваемое слово ключевым
- частотный коэффициэнт вхождения слова в текстовое содержание страницы

1С = ( 100 - количество_вхождений ) / количество_вхождений

- уровень pageQuality (см. "Подход к индексации")
3G - дата последнего обновления ресурса

3G = ( текущая_дата - дата_обновления ) / ( 3600 * 24 * 360 ) )

1F - уровень иЦ ресурса

Вычисление уровня релевантности:

R = ( ( 1A + 1C ) * 2E * 1F ) / ( 3G ^ 2 )

Для большего уровня рандомизации:

R = R * ( rand ( 1, 15)/100)

Формула вычисления индекса цитирования ресурса:

t = sqrt ( fact ( strlen ( count ) ) * ( count ^ 2 ) / ( 2 * count ) )

Пример расчёта релевантности ресурса с некоторыми случайными значениями:

1А = 0,5
1С = 20 / ( 100 - 20) = 4
2E = 0.8253
3G = 0.537
1F = sqrt ( ( 5000 ^ 2) / fact(4)*(5000*2)) = 10
R = ( ( 0,5 + 4 ) * 0.8253 * 10 ) / fact( ( (0.537)^2) ) = 40,614709

Далее для большей рандомизации уровня релевантности производится умножение на число, которое находится в промежутке от 0,991 до 0,999:

R = R * ( ( rand ( 1 , 9 ) / 1000 ) + 0,99 )
R = 40,614709 * ( 0,004 + 0,99 ) = 40,371020746

Оставить комментарий

You must be авторизироватся для добавления комментария.