Как я могу заставить MediaWiki игнорировать просмотры страниц из Google Search Appliance?

Счетчик просмотров страниц на каждой странице MediaWiki кажется отличным способом определить популярные страницы, над которыми стоит приложить больше усилий. поддерживать актуальность и полезность, но я столкнулся с проблемой.

Мы используем Google Search Appliance для индексации нашей установки MediaWiki. У меня проблема в том, что GSA увеличивает счетчик просмотров страницы каждый раз, когда сканирует страницу. Это полностью доминирует над статистикой, подавляя просмотры реальных пользователей.

Я знаю, как сбросить счетчики страниц, чтобы начать заново. Но есть ли способ настроить MediaWiki на игнорирование запросов страниц от GSA для целей подсчета просмотров страниц?


person ire_and_curses    schedule 19.01.2010    source источник


Ответы (2)


это можно сделать, добавив условие в Article.php:

includes / Article.php: 2861: function viewUpdates ():

if( !$wgDisableCounters && !$wgUser->isAllowed('bot') && $this->getID() ) {

добавлять:

&& strpos($_SERVER['HTTP_USER_AGENT'], 'gsa-crawler') === false

где gsa-crawler является частью gsa UA по умолчанию ...

другой способ - настроить проверку подлинности с помощью форм в GSA и выполнить вход в wikimedia в качестве пользователя в группе ботов.

person jspcal    schedule 19.01.2010
comment
Прекрасно работает! Обратите внимание, что вам не нужно напрямую взламывать код - я добавил это дополнительное условие в LocalSettings.php, чтобы его можно было поддерживать при обновлении версии. - person ire_and_curses; 20.01.2010

Мы с большим успехом добавили этот фрагмент в LocalSettings.php:

if (strpos($_SERVER['HTTP_USER_AGENT'], 'gsa-crawler') !== FALSE) {
  $wgDisableCounters = TRUE;
}

Спасибо!

person grugnog    schedule 19.01.2010