МЕТОД ПІДВИЩЕННЯ ЕФЕКТИВНОСТІ ВИДАЧІ РЕЗУЛЬТАТУ ПОШУКУ В ІНФОРМАЦІЙНОМУ СЕРЕДОВИЩІ
Ключові слова:
пошук, ранжування, PageRank, посилання, сайт, інформаціяАнотація
У статті проведено аналіз ранжування сторінок у сучасних інформаційних пошукових системах. Розглянуто одну з основних складових ранжування – критерій PageRank. За останні роки розвитку інформаційних технологій він істотно вплинув на створення списку авторитетності сторінок. Завдання цьоого критерію полягає у визначенні так званої «ваги» сторінки, яка вираховується за відповідною формулою: пріоритетним є врахування зв'язків між сторінками – їхніх посилань. Чим більше посилань є на сторінку, тим більша її «вага» і вище вона стоїть у видачі результатів пошукової системи. Саме ці зв'язки є головною складовою формули обрахунку, вони поділяються на внутрішні та зовнішні. Проблема виникає з внутрішніми зв'язками, тому що вони дають посилання одне на одного, створюючи при цьому цикл посилань, що штучно збільшує «вагу» сайту з кожним кроком перевірки. Для вирішення проблем циклічності та штучного збільшення авторитетності пропонується визначення альтернативного показника TruePageRank, який відрізняється такими особливостями: посилання, які виходять з певної сторінки, не враховуються; в процесі обчислення TruePageRank вихідна структура зв'язків між сторінками перетворюється в антициклічний граф, в якому посилання, що утворюють циклічні зв'язки, не враховуються і увага приділяється прямим посиланням. При цьому об'єктивне значення авторитетності не втрачається, тому що знімається лише штучне збільшення значення. Для нового критерію потрібні ті самі значення, тобто не потрібно шукати нову інформацію.
TruePageRank – ще один з методів обробки вихідних даних, що дозволяє отримати альтернативний показник авторитетності сторінки, який досить об'єктивно відображає її інформаційну цінність.