DATAWORD - наблюдения оптимизатора - https://dataword.info

Google, как поисковая система

Опубликовано августа 5, 2007 @ 8:39 pm в разделе Поисковые системы | 4 Comments

Поисковая система GoogleПрежде всего стоит отметить, что это поисковая система мирового уровня. Я не зря говорю, что мирового. Исходя из множества различных факторов, по которым мы можем судить о приоритетности этой поисковой системы над другими, данная система не просто является лидером мирового поиска, она ещё на голову обошла своих конкурентов, получив право диктовать условия сферы поиска информации своим конкурентам.

Поражает стремительность развития этой поисковой системы, которая входит в одноимённую компанию, стоимость которой превышает 30 миллиардов долларов. С 1998 года началось активное развитие этой поисковой системы, которое продолжается до сегодняшнего дня.

Сегодня эта поисковая система имеет самую большую базу проиндексированных документов и наивысшую скорость индексации новых сайтов и переиндексации тех сайтов, которые уже есть в индексе. Google обладает уникальными инструментами ранжирования информации при запросе, а также эффективными алгоритмами оценки информационного содержания.
Google - поисковая система Мира, имеет большое количество локальных служб, вся деятельность которых основывается на обслуживании каких-либо конкретных стран и языковых территорий.

Основные отличительные черты:

Очень важная черта: Google не отворачивается от творцов сайта или веб-мастеров, предлагая оным хорошо продуманный интерфейс, благодаря которому они могут эффективно взаимодействовать с этой поисковой системой, имея в своём составе помимо справочной информации различные инструменты для оценки позиционирования сайтов в этой поисковой системе, причём, совершенно бесплатно.

Поисковая система не умеет читать текст на изображениях, поэтому нужно тщательно прописывать параметры alt в тегах изображения (Один из факторов работы робота-сканера изображений Googlebot-Image).

Поисковая система также умеет индексировать текст внутри документов Shockwave Flash. Помимо этого индексируются документы: PDF, RTF, DOC, XLS (документы Excel), PPT (презентации PowerPoint).
Роботы поисковой системы ходят только по ссылкам в параметрах HREF и SRC.

Следует отметить, что есть возможность управлять поведением поисковой системы через метатеги страницы, однако не все из них поддерживаются. Например, фактически нет смысла использовать метатег keywords, т. к. релевантное соотношение ключевых слов в любом случае формируется исходя из ключевой плотности контента страницы.

Однако метатег Description иногда участвует в наполнении сниппетов сайтов (или описаний в результатах поиска у найденных сайтов), но если этот метатег соответствует содержимому самой страницы и поисковому запросу.

Присутствует возможность управления гибкой индексацией содержимого страницы (для этого служит тег метатег Robots), а также переходом по ссылкам на странице. Например, можно запретить передачу поискового веса ссылки (её значимости) при помощи параметра rel=”nofollow”, который присваивается тегу <a>.

Релевантность выдачи в этой поисковой системе также иногда определяется
названием домена или документа,  при этом количество слешей в
адресе сайта не учитывается

Как правило, для Рунета можно увеличить релевантность  поисковых запросов,
набранных латинскими символами.

Если ваш сайт есть в каталоге DMOZ, то Google будет выводить сниппет, составленный для вашего сайта в этом каталоге, конечно, если этот сниппет (описание)  будет релевантен поисковому запросу.

Действует принцип внутренней ссылочной силы. Внутренними страницами
можно продвинуть по некоторым поисковым запросам главную или другие страницы
сайта.

Для того чтобы избежать возможных разногласий или вы просто не хотите видеть
описание, составленное одним из редакторов, выводилось в сниппете для вашего
сайта, то просто запретите это при помощи метатега.

<META NAME="Googlebot" CONTENT="NOODP">
Также присутствуют «хронические» для любой поисковой системы проблемы с индексацией динамических страниц, содержащих большое количество параметров и документов на фреймовой основе.
Разработчики советуют проверить наличие у сервера http-параметра If-Modified-Since, чтобы избежать дополнительных нагрузок на сервер со стороны этой поисковой системы.

Операторы расширенного поиска в Google, полезные для веб-мастера:

site:sait.ru - проиндексированные страницы вашего сайта
link:sait.ru -  входящие внешние ссылки на главную страницу вашего сайта
cache:sait.ru - проиндексированная копия вашего сайта, позволяет узнать,
какой давности страницы вашего сайта используются в поиске
info:sait.ru - информация о вашем сайте в целом
related:sait.ru - страницы других сайтов, похожие на страницы вашего сайта

Классификация роботов Google:

Googlebot – основной индексирующий робот поисковой системы Google, работающий на платформе Linux и написанный на языке программирования C++.
При обращении к серверу имеет http-заголовок: Googlebot/2.X (http://www.googlebot.com/bot.html).

Также есть ещё несколько поисковых роботов-«пауков» у этой поисковой системы.
Например, Googlebot-Image индексирует только текст в параметре alt тега изображений и окружающий изображения текст или Mediapartners-Google, который индексирует страницы на предмет наличия на них рекламы Adsense.

Googlebot-Mobile предназначен для поиска страниц, адаптированных для мобильных устройств (телефоны, смартфоны, коммуникаторы). Это страницы на языках WML, HTML. Для этих устройств формируется отдельный поиск по мобильным сайтам.

На что следует обратить внимание при раскрутке?

В первую очередь обращайте внимание на открытые возможности проверки уровня внешней оптимизации самой поисковой системы.

1) PR (PageRank) – уровень страницы или, другими словами, некая логическая возможность нахождения пользователя на странице. По сути дела, этот алгоритм меняет свои значения при увеличении кол-ва ссылок с разных сайтов и внутренних страниц этого же сайта, ссылающихся на какую-то конкретную страницу сайта и изменении количества ссылок на той страницу, на которую ссылаются другие.

Например, возьмём главную страницу: чем меньше ссылок на главной странице и чем больше ссылок, которые указывают на эту страницу, тем выше её PR и тем выше её возможности быть выше в результатах поиска. PR в основном увеличивается внешними ссылками, чем выше PR ссылающихся страниц, тем выше может быть PR у страницы-акцептора. PR для страниц своего сайта можно узнать в панели Google Toolbar, скачать которую можно на сайте Google.

2) Наличие в каталоге Dmoz.org
Поскольку каталог поисковой системы Google состоит фактически полностью из каталога Dmoz.org, то система относится к нему с особым уважением. Этот каталог отличается особо жёстким модерированием ресурсов, отвечая за качество добавляемых сайтов, Google считает сайты, которые добавлены в этот каталог, действительно авторитетными и полезными, следственно, у сайтов, находящихся в нём, есть больше шансов быть выше по какому-либо запросу в этой поисковой системе.

3) Количество индексированных страниц сайта
Чем их выше, тем лучше оптимизирован ваш сайт для этой поисковой системы. Очень полезно создать карту сайта, где прописать ссылки на все страницы вашего сайта

4) Частота индексации страниц
Чем чаще это происходит, тем лучше вы оптимизировали ваш сайт и работаете над ним. Обязательно обратите внимание на заголовок If-Modified-Since. Он должен быть обязательно. На скорость обновления информации может повлиять и файл sitemap.xml

5) Наличие файла sitemap.xml
Это особым образом созданный файл XML, цель которого указать адрес страницы и его приоритет индексации. Сгенерированный таким образом файл отсылается поисковой системе, что позволяет качественно проиндексировать новые страницы сайта.

6) Возраст домена
Чем раньше был зарегистрирован домен, тем лучше поисковая система относится
к достоверности публикуемой на сайте информации, который принадлежит данному
домену.

Как управлять индексацией?

1) Через файл robots.txt в корне сайта:
Создаём специальный текстовый файл, в котором запрещаем индексацию некоторых разделов сайта.
2) Через метатеги:
Непосредственно в самом документе указываем о возможности/невозможности индексации страницы или переходе по ссылкам. Для этой цели используется метатег Robots.

Использование этих методов поможет понять поисковой системе
ваши предпочтения при индексации ваших сайтов.


Статья напечана с сайта DATAWORD - наблюдения оптимизатора: https://dataword.info

Адрес статьи: https://dataword.info/google-kak-poiskovaya-sistema.php