Со времени создания HTML в 1991 году язык претерпел серьезные изменения, его возможности существенно расширились. Развитием стандарта HTML занимается W3Консорциум - http://www.w3c.com.
Различные версии HTML в разной степени поддерживаются различными броузерами - программами доступа к WWW.
HTML обратно совместим, т.е., например, правильный документ на HTML 2.0 также является правильным документом в HTML 3.0.
Номера версии броузера показывает номер последней поддерживаемой им спецификацией HTML (эмпирическая закономерность + совместное развитие, может в любой момент нарушиться).
Самые популярные броузеры в Сети - Netscape Navigator и Microsoft Internet Explorer. Первый является свободным ПО (с открытым исхоныи кодом), второй - бесплатно распространяется в двоичном коде.
Текущая версия HTML - 4.0. Текущие версии броузеров Netscape и Explorer - 4.5 и 4.02 соответственно.
CP - Code Page, кодовая страница
КОИ - Код общего использования. КОИ8 (8 бит) - UNIX.
CP-1251 - MS Windows - кроме Windows NT и Windows 98.
CP866, MS-DOS - также известна как Альтернативная (ALT)
ISO-8859-5 - первой была стандартизована. Никем никогда не применялась.
Основные кодировки русской сети - КОИ8 и Win1251. Выбор той или иной кодировки - вопрос религиозного исповедания. Основной почтовый трафик - КОИ8. Большая половина WWW - CP-1251.
В Netscape Navigator кодировка динамически меняется в меню View->Encoding.
Пример: работа с сервером издательства Инфоарт.
Индексы и каталоги. Поиск по ключевым словам/секциям. Последнее время интенсивно интегрируются.
В двух словах о стратегии поиска. Сужение-расширение критериев.
Разбор страницы ответа поискового сервера на примере запроса к Altavista.
Специализированные каталоги. Пример: Агрорус
Поисковые сервера и их типы
Список основных англоязычных поисковых серверов:
Список основных русскоязычных поисковых серверов: