Перечень алгоритмов поисковой системы Яндекс в хронологическом порядке
Поисковая система Яндекс появилась в 1997 году, с тех пор изменилось много алгоритмов ранжирования и даже подходы для оценки релевантности документов. Алгоритмы совершенствовались, усиливалась борьба со спамом, разрабатывались и внедрялись новые фильтры. Данная статья демонстрирует развитие алгоритмов ранжирования ПС Яндекс в хронологическом порядке за последние 10 лет, а также изменения, которые были реализованы при запуске новых программ.
NN |
ДАТА ЗАПУСКА |
НАЗВАНИЕ АЛГОРИТМА И ОСНОВНЫЕ ИЗМЕНЕНИЯ |
1 |
июль 2007 |
«Версия 7» ознаменовалась новой формулой ранжирования, а роботы стали использовать больше факторов для оценки релевантности страниц. |
2 | декабрь 2007, январь 2008 |
«Версия 8» и «Восьмерка SP1». Огромное преимущество в ранжировании получили авторитетные ресурсы, алгоритмы стали фильтровать «прогоны», которые вебмастера использовали для наращивания ссылочных факторов. |
3 |
май и июль 2008 |
Магадан. Добавлена опция Fast Rank, что отвечает за быстрый подбор претендентов. Алгоритм получил расширенную базу синонимов и аббревиатур, а также расширение параметров классификации документов. Магадан версия 2.0 стал требовательным к уникальности контента, внедрены новые классификаторы для документов и пользовательских запросов. |
4 |
сентябрь 2008 |
Находка. Данный алгоритм стал учитывать в поисковом запросе стоп-слова, изменился подход к машинному обучению, появился словарь специальной терминологии. |
5 |
с апреля по сентябрь 2009 |
Арзамас / Анадырь принимает во внимание регион пользователя, удалена омонимия. Арзамас 1.1 получил новую региональную формулу для определенных городов, кроме Екатеринбурга, Санкт-Петербурга и Москвы. В Арзамас 1.2 введен обновленный классификатор запросов с учетом геозависимости. Арзамас+16 получил независимые формулы для 16 регионов России, Арзамас 1.5 стал обладателем общей новой формулы для геонезависимых запросов. А самая последняя версия алгоритма Арзамас 1.5 SP1 получила более совершенную региональную формулу для геозависимых запросов. |
6 |
ноябрь 2009 |
Снежинск ознаменовался запуском технологии машинного обучения MatrixNet, значительно увеличилось количество факторов ранжирования, интегрированы 19 формул для крупнейших регионов России, существенные изменения коснулись и выдачи. |
7 |
декабрь 2009, март 2010 |
Конаково. Это название алгоритма не является официальным, позднее он станет известным под именем «Обнинск». Основным изменением стали персональные формулы для 1250 городов по всей России. Конаково версия 1.1 и (Снежинск 1.1) получили обновленные формулы для геонезависимых запросов. |
8 |
сентябрь 2010 |
Обнинск получил полностью измененные формулы, рекордную производительность, расширилось и количество факторов ранжирования для геонезависимых запросов. |
9 |
декабрь 2010 |
Краснодар стал обладателем технологии «Спектр» и ознаменовался увеличением разнообразия выдачи, произошло разложение запроса пользователя на его потребности. Кроме того, расширена локализация выдачи по геозависимым запросам, 1250 городов России получили независимые формулы. |
10 |
август 2011 |
Рейкьявик учитывает языковые предпочтения пользователя, стал первым шагом на пути к персонализации выдачи. |
11 |
декабрь 2012 |
Калининград характеризуется более существенной персонализацией выдачи: пользователю предлагаются подсказки, учитываются его долгосрочные интересы, увеличивается релевантность его «приоритетных» сайтов. |
12 | май 2013 |
Дублин продолжает совершенствовать персонализацию выдачи: учитывает сиюминутные интересы пользователей, подстраивает результаты выдачи под интересы пользователя непосредственно в момент поисковой индексации. |
13 |
март 2014 |
Лондон* отменяет учет ссылок и других ссылочных факторов в ранжировании для ряда коммерческих запросов в Московском регионе. |
14 |
июнь 2014 |
Париж* получил обновленный дизайн сервисов и выдачи, появились интерактивные ответы, хотя успешным данный эксперимент не оказался и в скором времени был закрыт. |
15 | апрель 2015 |
Рим* призван предоставлять пользователю «Объектный ответ». Реализуется это с помощью специальной карточки, которая размещается справа от результатов выдачи и несет общую информацию о конкретном предмете. Способствует этому богатейшая база Яндекс, которая насчитывает более десятка миллионов объектов поиска. |
16 |
май 2015 |
Минусинск выявляет сайты, которые перенасыщены СЕО-ссылками и понижает их в рейтинге. Ключевой особенностью алгоритма является массовое снятие оптимизированных ссылок, а в дальнейшем – восстановления значимости ссылочных факторов для ранжирования сайта по всем запросам для Московского региона. |
17 | сентябрь 2015 |
Москва* «Многорукие Бандиты Яндекса». Новый подход к релевантности документов: рандомизированным образом корректируются позиции ряда документов, что имеют оценку «Rel+». Цель - сбор дополнительной поведенческой информации для Московского региона. Немного позже данный алгоритм получил распространение и в остальных регионах России. |
18 |
февраль 2016 |
Владивосток. Принимает во внимание адаптированность ресурса для просмотра с переносных устройств. Адаптированные проекты получают прибавку в рейтинге мобильной выдачи. |
19 |
ноябрь 2016 |
Палех оценивает соответствие семантического вектора поисковому запросу. Его задача – определить близость вектора по отношению к Title документов, что прошли индексацию; искусственная нейронная сеть определяет соответствие запроса документу. Внедрение алгоритма призвано повысить качество поиска для низкочастотных запросов и запросов, что сформированы естественным языком. |
20 |
март 2017 |
Баден-Баден выявляет переоптимизированные тексты, которые раньше попадали под санкции текстовых пост-фильтров. Алгоритм оценивает ряд факторов, что позволяют выявить спам и понизить «спамные» сайты или страницы в результатах выдачи. |
21 |
август 2017 |
Королёв является более совершенной версией алгоритма Палех и так же отвечает за ранжирование сайта. Он понимает смысл запроса и сопоставляет его с ответами, которые предложены на странице. Главным отличием данного алгоритма от своего предшественника является масштабность анализа. Если Палех оценивал только заголовок Title, то Королев оценивает полностью весь документ. |
Алгоритмы, отмеченные «*» - не являются официальными. Они подобраны автором для соблюдения хронологической последовательности появления алгоритмов.
Яндекс против спама
За годы существования Яндекс развивал не только алгоритмы ранжирования, но и усиливал борьбу с обманными техниками продвижения ресурсов. Предлагаем ознакомиться со сводной таблицей алгоритмов, которые сегодня борются со спамом в ПС Яндекс.
Качество контента |
Ссылочная составляющая |
Поведенческая информация |
1. «Переспам» — фильтр, который понижает рейтинг документа в поисковой выдаче. 2. «Переоптимизация» — понижает общий показатель релевантности всего документа. По усмотрению асессоров, которые разрабатывают антиспам алгоритмы, данный фильтр может быть применён вручную ко всему сайту. 3. «Текстовый антиспам» — дисконтирует показатель релевантности документа по запросу, в результате рейтинг сайта падает на 50 позиций и более. 4. «Баден-Баден» — запросозависимый фильтр. Он призван понижать рейтинг страниц с чрезмерной оптимизацией. Алгоритм учитывает полностью все текстовое содержимое документа. |
5. «Ссылочный взрыв» — возлагает санкции на проекты, которые неестественно быстро наращивают ссылочную массу. В немилость также попадают и площадки-доноры, они отмечаются как неблагонадежные и в дальнейшем могут попасть под фильтры. 6. «Ссылочный спам / Пессимизация» — это санкции, которые применяются к сайтам, что манипулируют входящей ссылочной массой. 7. «Внутренний/Внешний Непот» — фильтр, который исключает одну или ряд ссылок из ранжирования. Данный алгоритм опасен для ресурсов, которые содержат избыточную внутреннюю перелинковку. 8. «Минусинск» — снижает рейтинг ресурса по всем поисковым запросам. Основная причина - превышение числа или доли СЕО-ссылок в профиле. |
9. «Накрутка ПФ» — фильтр, который накладывает санкции на сайты за искусственное наращивание кликовых поведенческих факторов путем мотивированного трафика или имитацией действий пользователя в поисковой системе. При этом сайт может оставаться в лидерах ТОП-10 по витальным запросам.
10. «Clickjacking» — уменьшает ранжирование сайтов, которые публикуют невидимые элементы на своих страницах. В результате таких манипуляций пользователь взаимодействует с элементами, о существовании которых даже не подозревает, а владельцы сайтов обманным путем получают номера телефонов пользователей и прочую информацию. |
Групповая связанность сайтов |
За рекламную составляющую |
За "взрослое содержимое" |
11. «Аффилированность» — объединяет для выдачи проекты таким образом, чтобы предложить пользователю только один из сайтов, входящих в группу-аффилиатов, а остальные – скрыть из выдачи. 12. «Одинаковые сниппеты» — объединяет для выдачи ресурсы, у которых совпадает содержание сниппета. |
13. «Назойливая реклама» — негативно влияет на ранжирование сайтов, которые используют назойливую рекламу: popunder, clickunder, pop-up и аналоги. 14. «Обманная и избыточная реклама»— снижает рейтинг сайтов, которые используют для продвижения избыточную рекламу или публикации обманного содержания. К ним относят: всплывающие окна, уведомления и проекты с большим количеством рекламы. 15. «Обман мобильных пользователей» — уменьшает общий трафик проектов, которые предлагают мобильным пользователям агрессивные виды рекламы: подписку, кликандер, скачивание и т.д. А также ресурсы, что применяют для посетителей с мобильных устройств автоматические редиректы. |
16. «Adult-фильтр» —
убирает из выдачи ресурсы, которые отвечают «не взрослым» запросам. Сайт будет отображаться в результатах выдачи, если будет снята фильтрация в настройках ПС или останется в рейтинге по запросам с явным «взрослым» содержимым. Данный алгоритм может накладывать санкции как на отдельные страницы, так и на весь проект в целом. |
Качество контента |
Ссылочная составляющая |
Поведенческая составляющая |
общее качество наполнения |
за направленность ресурса |
за обман поисковой системы |
16. «АГС» представляет собой различные версии фильтра, которые получили нумерацию «17», «30», «40» и т.д. Они ограничивают ранжирование и индексацию проектов, которые созданы не для пользователей, а содержат чрезмерно много исходящих ссылок.
|
17. «Партнёрки» — урезает рейтинг партнерских проектов, которые не имеют персональной ценности для пользователя. 18. «Псевдосайты» — понижает позиции сайтов, которые по различным параметрам не несут никакой ценности для пользователя. |
19. «Бан» — абсолютное исключение всего сайта из индекса. Данный фильтр является самым опасным и используется в крайних случаях. Он распространяется на сайты, что содержат чрезмерный поисковый спам, например:
|