Новий формат збереженої копії сторінок в Яндексі

У жовтні 2019-го року Яндекс тихою сапою, без жодних анонсів та оголошень, замінив формат збереженої копії сторінки. Натиснувши на посилання «Збережена копія» в сніппеті, ми потрапляємо на домен yandexwebcache.net, який раніше не використовувався для зберігання збережених копій.

Власне, цей домен був зареєстрований зовсім недавно, в серпні 2019-го року:

Дизайн шапки сторінки збереженої копії зі службової інформації змінився:

Хороша новина – посилання на текстову копію стала робочою в відміну від старого формату сохраненки. Вона доступна по посиланню «Повний текст», URL сторінки текстової версії збереженої копії URL відрізняється від повної версії наявністю get-параметр mode=text:

Але є і дуже неприємна особливість нового формату збереженої копії – повністю зникла підсвічування ключових слів запиту як у повній версії, так і в текстовій:

На щастя, підсвічування ключових слів все-таки можна побачити, застосувавши нескладний лайфхак. Виявляється, з введенням нового формату збереженої копії, Яндекс поки ще не видалив можливість користуватися старим форматом. Для доступу до сохраненкам в старому форматі нам потрібно замінити URL сохраненки ім’я домену https://yandexwebcache.net/ на https://hghltd.yandex.net/

При цьому потрібно мати на увазі, що при завантаженні повній версії збереженої копії Яндекс може прибирати з її URL в командному рядку браузера get-параметр sign (принаймні, це відбувається для збереженої копії досліджуваної нами головної сторінки Яндекса). Якщо таке відбувається, то URL повній версії сохраненки потрібно скопіювати не з командного рядка браузера, а посилання на неї з фрагменту на сторінці видачі або зі сторінки текстової збереженої копії, у яких цей параметр присутній. Далі замінюємо в скопированном URL домен і отримуємо повну версію збереженої копії в старому форматі з підсвічуванням ключових слів:

Для отримання текстової версії збереженої копії в старому форматі з підсвічуванням, треба до сконструйованому нами URL повній версії сохраненки додати get-параметр &cht=1, т. к. посилання «Подивитися текстову копію», як я вже згадував вище, тут працює некоректно:

При цьому треба мати на увазі той факт, що час життя поточного значення get-параметри sign в URL збережених версій як нового, так і старого формату обмежена. І якщо ми починаємо при спробі завантажити отримувати 404-ю помилку, то необхідно оновити сторінку з результатами пошуку і витягти з фрагменту посилання на збережену копію з новим значенням get-параметри sign, яке буде робочим деякий час. Так, наприклад, за час написання цієї статті, робоче значення get-параметри sign в URL збережених копій розглянутого прикладу змінювалося кілька разів, що можна помітити на скріншотах.

Читайте також  Фактори ранжирування в Яндексі і Google в 2019 році

Хотілося б сподіватися, що співробітники Яндекса відновлять підсвічування ключових слів запиту в новому форматі сохраненки. А поки доведеться робити ось такі танці з бубнами з поверненням до старого формату для продуктивного аналізу збережених копій сторінок. При цьому проблема можливої невідповідності показываемой версії збереженої копії сторінок і тієї, що знаходиться в індексі і використовується для ранжування, про яку я писав раніше, на жаль, все ще залишається актуальною.

Степан Лютий

Обожнюю технології в сучасному світі. Хоча частенько і замислююся над тим, як далеко вони нас заведуть. Не те, щоб я прям і знаюся на ядрах, пікселях, коллайдерах і інших парсеках. Просто приходжу в захват від того, що може в творчому пориві вигадати людський розум.

Вам також сподобається...

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *