
1.1.2 WWW概述
1.WWW简介
WWW是环球信息网的缩写(亦作Web、WWW、W3,英文全称为World Wide Web),中文译名为“万维网”或“环球网”等,常简称为Web。万维网依托于Internet,是Internet提供的一项网络信息服务。
万维网从运行结构上分为Web客户端和Web服务器程序。Web客户端(浏览器)可以访问浏览Web服务器上的资源。Web是一个由许多互相链接的超文本组成的系统,通过互联网访问,在这个系统中,每个有用的事物,称为“资源”,并且由一个全局的“统一资源定位符”(Uniform Resource Identifier,URI)标识,这些资源通过超文本传输协议(Hypertext Transfer Protocol,HTTP)来传送给客户端用户,而后者通过单击链接来获取资源。
万维网的发明者蒂姆·伯纳斯·李在1994年10月于麻省理工学院(MIT)计算机科学实验室成立了万维网联盟(World Wide Web Consortium,简称W3C),又称W3C理事会,主要负责万维网标准和规则的制定。
2.超文本传输协议(HTTP)
HTTP是Hypertext Transfer Protocol的缩写,即超文本传输协议。顾名思义,HTTP提供了访问超文本信息的功能,是Web浏览器和Web服务器之间的应用层通信协议。HTTP是分布式的、通用的、面向对象的协议。通过扩展命令,它还可以用于类似的任务,如域名服务或分布式面向对象系统。万维网使用HTTP传输各种超文本页面和数据。
HTTP会话过程包括4个步骤:
①建立连接:客户端的浏览器向服务器端发出建立连接的请求,服务器端给出响应就可以建立连接了。
②发送请求:客户端按照协议的要求通过连接向服务器端发送自己的请求内容。
③给出应答:服务器按照客户端的要求给出应答,把结果(HTML文件)返回给客户端。
④关闭连接:客户端接到应答后关闭连接。
HTTP是基于TCP/IP的协议,它不仅保证正确传输超文本文档,还确定传输文档中的哪一部分,以及哪部分内容首先显示等。
3.统一资源定位符(URL)
统一资源定位符(Uniform Resource Locator,URL)是一个负责给万维网资源进行准确定位的系统,有时又称“统一资源标识符”。每个Web资源都必须有唯一的URL,它包含的信息指出资源的位置以及浏览器应该怎么处理它。它最初是由蒂姆·伯纳斯·李发明用来作为万维网的地址,现在已经被万维网联盟编制为互联网标准RFC1738。
基本的URL应该包含模式(或称协议)、服务器名称(或IP地址)、路径和文件名等信息,基本结构如图1-1所示。

图1-1 URL的基本结构
(1)第一部分
模式/协议(scheme):它告诉浏览器如何处理将要打开的文件。最常用的模式是超文本传输协议(HTTP),其他协议如下:
https:用安全套接字传送的超文本传输协议。
ftp:文件传输协议。
mailto:电子邮件地址。
file:当地计算机或网上分享的文件。
news:Usenet新闻组。
gopher:Gopher协议。
telnet:Telnet协议。
(2)第二部分
文件所在服务器的名称或IP地址,后面是到达这个文件的路径和文件本身的名称。服务器的名称或IP地址后面有时还跟一个冒号和一个端口号(如:8080)。路径部分包含等级结构的路径定义,一般来说,不同部分之间以斜线(/)分隔,有时候,URL以斜杠“/”结尾,而没有给出文件名,在这种情况下,URL引用路径中最后一个目录中的默认文档(如index.html或default.htm)。
如对于http://www.pku.edu.cn/about/bdjj.jsp这个URL来说,http://表明了协议类型是HTTP,www.pku.edu.cn是服务器名称(也称域名),about/bdjj.jsp指明了路径/文件名。客户端用户通过这个URL可以准确找到相关的文件资源。
4.超文本标记语言(HTML)
HTML的英文全称为Hypertext Markup Language,即超文本标记语言,是万维网资源呈现给客户端用户的一种表现方式。“超文本”就是指除了文字外,页面还可以包含图片、链接,以及音乐、程序等非文字元素。超文本标记语言是标准通用标记语言(SGML)下的一个应用,也是一种规范,一种标准。它通过标记符号来标记要显示在网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容(如:文字如何处理、布局如何安排、图片如何显示等)。浏览器按顺序执行网页文件,然后根据标记符解释和显示其标记的内容,对书写错误的标记将不指出其错误,也不停止其解释执行过程,编制者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,对于不同的浏览器,对同一标记符可能会有不完全相同的解释,因而可能会有不同的显示效果。
超文本标记语言文档制作不是很复杂,但功能强大,支持不同数据格式的文件嵌入,这也是万维网(WWW)盛行的原因之一,其主要特点如下所述:
①简易性:超文本标记语言版本升级采用超集方式,从而更加灵活方便。
②可扩展性:超文本标记语言的广泛应用带来了加强功能、增加标记符等要求,超文本标记语言采取子类元素的方式,为系统扩展带来保证。
③平台无关性:超文本标记语言可以使用在广泛的平台上,这也是万维网盛行的另一个原因。
④通用性:HTML是网络的通用语言,是一种简单、通用的标记语言。它允许网页制作人建立文本与图片相结合的复杂页面,这些页面可以被网上任何其他人浏览到,无论使用的是什么类型的计算机或浏览器。