Броузеры. Поиск.

Броузер – программа доступа к WWW

Со времени создания HTML в 1991 году язык претерпел серьезные изменения, его возможности существенно расширились. Развитием стандарта HTML занимается W3Консорциум - http://www.w3c.com.

Различные версии HTML в разной степени поддерживаются различными броузерами - программами доступа к WWW.

HTML обратно совместим, т.е., например, правильный документ на HTML 2.0 также является правильным документом в HTML 3.0.

Номера версии броузера показывает номер последней поддерживаемой им спецификацией HTML (эмпирическая закономерность + совместное развитие, может в любой момент нарушиться).

Самые популярные броузеры в Сети - Netscape Navigator и Microsoft Internet Explorer. Первый является свободным ПО (с открытым исхоныи кодом), второй - бесплатно распространяется в двоичном коде.

Текущая версия HTML - 4.0. Текущие версии броузеров Netscape и Explorer - 4.5 и 4.02 соответственно.

Рассмотрим подробнее Netscape Naivgator версии 4.5:

  • Адресная строка (location).
  • Навигация: вперед (forward) – назад (back), стоп (stop), обновить (reload).
  • Поиск по загруженному документу средствами броузера (Ctrl+F, Edit->Find in Page...).
  • Закладки (bookmarks) - одноименное меню.
  • Настройка proxy-сервера (Edit->Preferences->Advanced->Proxies).
  • Сохранение/открытие документа (производится через меню File).
  • Показать исходный текст просматримаевого HTML-документа (Ctrl+U, View->Page Source)
  • При работе с WWW через медленный канал выключить загрузку картинок (Edit->Prefernces->Advanced->Automatically load images)

    Специфика Российской Сети. Кодировки

    CP - Code Page, кодовая страница

    КОИ - Код общего использования. КОИ8 (8 бит) - UNIX.

    CP-1251 - MS Windows - кроме Windows NT и Windows 98.

    CP866, MS-DOS - также известна как Альтернативная (ALT)

    ISO-8859-5 - первой была стандартизована. Никем никогда не применялась.

    Основные кодировки русской сети - КОИ8 и Win1251. Выбор той или иной кодировки - вопрос религиозного исповедания. Основной почтовый трафик - КОИ8. Большая половина WWW - CP-1251.

    В Netscape Navigator кодировка динамически меняется в меню View->Encoding.

    Пример: работа с сервером издательства Инфоарт.

    Поисковые сервера и их типы

    Индексы и каталоги. Поиск по ключевым словам/секциям. Последнее время интенсивно интегрируются.

    В двух словах о стратегии поиска. Сужение-расширение критериев.

    Разбор страницы ответа поискового сервера на примере запроса к Altavista.

    Список основных англоязычных поисковых серверов:

  • http://altavista.digital.com
  • http://www.yahoo.com
  • http://www.hotbot.com
  • http://www.infoseek.com
  • http://www.northernlight.com

  • http://ftpsearch.ntnu.no - поиск по ftp-серверам c web-интерфейсом. Яркий пример удачной интеграции различных служб Сети на основе Web.

    Список основных русскоязычных поисковых серверов:

  • http://www.rambler.ru
  • http://www.yandex.ru
  • http://www.aport.ru
  • http://www.au.ru - каталог
  • http://www.ru - каталог

    Специализированные каталоги. Пример: Агрорус