www是world wide web (环球信息网)的缩写,也可以简称为web,中文名字为“万维网”。其创建者伯纳斯•李,在他1991年8月6日创建的第一个网址中解释了万维网的工作原理等内容。他也因此被《时代》杂志评价为二十世纪最重要的100位人物之一。
www(world wide web),是一张附着在internet上的覆盖全球的信息"蜘蛛网",镶嵌着无数以超文本形式存在的信息,其中有璀璨的明珠,当然也有腐臭的垃圾。有人叫它全球网,有人叫它万维网,或者就简称为web(全国科学技术名词审定委员会建议,www的中译名为"万维网")。www是当前internet上最受欢迎、最为流行、最新的信息检索服务系统。它把internet上现有资源统统连接起来,使用户能在internet上已经建立了www服务器的所有站点提供超文本媒体资源文档。这是因为,www能把各种类型的信息(静止图像、文本声音和音像)无义无缝的集成起来。www不仅提供了图形界面的快速信息查找,还可以通过同样的图形界面(gui)与internet的其他服务器对接。
由于www为全世界的人们提供查找和共享信息的手段,所以也可以把它看作是世界上各种组织机构、科研机关、大学、公司厂商热衷于研究开发的信息集合。它基于internet的查询。信息分布和管理系统,是人们进行交互的多媒体通信动态格式。它的正式提法是:"一种广域超媒体信息检索原始规约,目的是访问巨量的文档"。www已经实现的部分是,给计算机网络上的用户提供一种兼容的手段,以简单的方式去访问各种媒体。它是第一个真正的全球性超媒体网络,改变了人们观察和创建信息的方法。因而,整个世界迅速掀起了研究开发使用www的巨大热潮。
www诞生于internet之中,后来成为internet的一部分,而今天,www几乎成了internet的代名词。通过它,加入其中的每个人能够在瞬间抵达世界的各个角落,只要将一根电话线插入你的pc(它可能是你随身携带的笔记本电脑加上一部移动电话),此时全球的信息就在你的指尖!
www并不是实际存在于世界的哪一个地方,事实上,www的使用者每天都赋予它新的含义。internet社会的公民们(包括机构和个人),把他们需要公之于众的各类信息以主页(homepage)的形式嵌入www,主页中除了文本外还包括图形、声音和其他媒体形式;而内容则从各类招聘广告到电子版圣经,可以说包罗万象,无所不有。主页是在web上出版的主要形是一些html文本(html即hyper text markup language,超文本标识语言)。
20世纪40年代以来人们就梦想能拥有一个世界性的信息库。在这个数据库中数据不仅能被全球的人们存取,而且应该能轻松地链接其它地方的信息,以便用户可以方便快捷地获得重要的信息。它引发了第五次信息革命。
随着科学技术的迅猛发展,人们的这个梦想已经变成了现实。目前正在使用的最流行的系统叫"环球信息网www"(world wide web)。它的正式定义是"www is a wide-area hypermedia information retrieval initiative to give universal access to large universe of documents."简而言之,www是一个以internet为基础的计算机网络,它允许用户在一台计算机通过internet存取另一台计算机上的信息。从技术角度上说,环球信息网是internet上那些支持www协议和超文本传输协议http(hyper text transport protocol)的客户机与服务器的集合,透过它可以存取世界各地的超媒体文件,内容包括文字、图形、声音、动画、资料库、以及各式各样的软件。
理论上说来,环球信息网包括整个两亿人以上的internet世界,它包含所有的web站点、gopher信息站、ftp档案库、telnet公共存取帐号、news新闻讨论区以及wais资料库。所以环球信息网可以说是当今全世界最大的电子资料世界,已经可以把world wide web当成是internet 的同义词了。事实上,一般我们日常所说的"上internet",其实指的就是连上world wide web 。www是world wide web (环球信息网)的缩写,也可以简称为web,中文名字为“万维网”。
环球信息网之所以称之为信息网,完全是因为它的资源可以互相连接的缘故,全世界目前大概有数万个web站,每个web 站都可以透过超链结(hyper link)与其它web 站连接,任何人都可以设计自己的home page,放上web 站,然后在你的home page 上面产生链结,与其他人的home page 连接,或是连到其他的web 站;别人也一样可以连到你的home page ,或是你的web 站,整个信息网就这样编织了起来,形成一个巨大的环球信息网。本章将简要介绍一下环球信息网的一些概念:客户机、服务器、协议等。在本章中我们还将了解到环球信息网的历史与发展。
客户机与服务器
客户机、服务器和协议虽然都是很简单的概念,但描述它们比理解它们更难。
客户机是一个需要某些东西的程序,而服务器则是提供某些东西的程序。一个客户机可以向许多不同的服务器请求。一个服务器也可以向多个不同的客户机提供服务。通常情况下,一个客户机启动与某个服务器的对话。服务器通常是等待客户机请求的一个自动程序。客户机通常是作为某个用户请求或类似于用户的每个程序提出的请求而运行的。协议是客户机请求服务器和服务器如何应答请求的各种方法的定义。www客户机又可称为浏览器。
通常的环球信息网上的客户机主要包括:lynx、mosaic、netscape等。通常的服务器来自于cern、ncsa、netscape。让我们来看一下web中客户机与服务器的具体任务。
在web中,客户机的任务是:
1.帮助你制作一个请求(通常在单击某个链接点时启动)。
2.将你的请求发送给某个服务器。
3.通过对直接图象适当解码,呈交html文档和传递各种文件给相应的"观察器"(viewer),把请求所得的结果报告给你。
一个观察器是一个可被www客户机调用而呈现特定类型文件的程序。当一个声音文件被你的www客户机查阅并下载时,它只能用某些程序(例如windows下的"媒体播放器")来"观察"。
通常www客户机不仅限于向web服务器发出请求,还可以向其他服务器(例如gopher、ftp、news、mail)发出请求。
一个web服务器的任务是:
1.接受请求
2.请求的合法性检查,包括安全性屏蔽。
3.针对请求获取并制作数据,包括java脚本和程序、cgi脚本和程序、为文件设置适当的mime类型来对数据进行前期处理和后期处理。
4.把信息发送给提出请求的客户机。
web拥有一个被称为"无状态"的协议。这是因为服务器在发送给客户机应答信息后便遗忘了此次交互。在"有状态"的协议中客户机与服务器要记住许多关于彼此和它们的各种请求与应答信息。
web是一个易于实现的协议。因为无状态的协议是很轻松的,它没有多少必需的核心代码和资源。此种协议的另一吸引人的特性是可以方便地从一个服务器转向另一个服务器(在客户机端)或者从一个客户机转到另一客户机(服务器端),而无需过多的清理和跟踪。这种快速转移的能力对于超文本而言是非常理想的。(本章后面有一节介绍超文本的定义)
internet和伴随它产生的一切是一个分布极为广泛的网络。它们支持的标准的或者至少是具有互操作性的协议,允许这种互操作性跨越学术界、商业界乃至于国界。也就是说,internet、tcp/ip协议、http协议以及www不属于任何人所有。不同国家的学校和公司可独立地建立客户机和服务器,而它们在web上一起协同工作。这种实现方法有一个极大的好处,那就是其拓展的空间即便不是完全开放的,也是相当开放的。
www的起源
1945年8月份vannevar bush在 atlantic monthly杂志上发表了一篇题为"正如我们所想到的"的文章,从那时起,关于文档信息的电子化链接的念头就一直萦绕在计算机工作者、信息科学家们的脑海中。
作家们远在bush的文章之前就已预料到这种"链接"。文章的脚注难道不就是用原始的纸笔与其他作品"超链接"吗?难道作家引用和借鉴别人的作品的方法不是更进一步的"超链接"吗?例如,鲁迅的""和茅盾的""两篇作品也是在纸张环境中使用超文本的例子。这说明类似超文本的使用需求已经流行很长时间了。
然而正是bush才把此种想法与电子技术联系在一起。bush预见到因战争需要发展起来的新技术将会被广泛应用,并会改变我们的思维方式。总之,bush关于我们如何组织和使用信息的基本思想已经成为今天我们所看到的www和超文本。
超文本(hypertext)这个术语是ted nelson于1965年首创的,它通常是指不局限于线性方式的文本。也就是说,超文本文档的部分甚至全部也许都是线性的,但也可能都是非线性的。超文本通过链接或引用其它文本的方式突破了线性方式的局限性。超文本是超媒体的一个子集。超媒体是指这样一种媒体(文本、图片、声音、视频录象等),它与其它媒体以非线性方式链接而成。
超文本最早是由鼠标器的发明者douglas engelbart和ted nelson付诸实现的。他们俩的超文本实现工作受到60年代的技术和复杂的设计基础的极大限制。两个人的项目想象成分多于可行的成分。1967年nelson他把实现分布式超文本的计划命名为xanadu。xanadu这个项目是用于处理所有的版权和帐务问题的,按他的说法,xanadu有足够的健壮性,可用于把全世界的出版物统统联网。虽然其结果是失败的,但它为超文本和www的发展奠定了坚实的基础。
html的产生和www的发行
1989年3月,在欧洲粒子物理研究所,即cern,tim berners-lee提出一项计划,目的是使科学家们能很容易地翻阅同行们的文章。此项计划的后期目标是使科学家们能在服务器上创建新的文档。为了支持此计划,tim创建了一种新的语言来传输和呈现超文本文档。这种语言就是超文本标注语言html(hyper text markup language)。它使标准通用标注语言sgml(standard generalized markup language)的一个子集。sgml早已被证明是开放式的语言。
用于操纵html和其他www文档的协议被称为超文本传输协议http (hypertext transfer protocol)(有关http协议的内容将在第二章加以介绍)。遵照internet的习惯,几乎所有协议的名称都以tp结尾。而相应的服务器则被称为超文本传输协议守护进程httpd(hypertext transfer protocol daemon)。
http使用了统一资源定位器url(uniform resource locator)这一概念。简单地说,url就是文档在环球信息网上的"地址"。url用于标识ineternet或者与internet相连的主机上的任何可用的数据对象。url中的u常常被认为表示"统一",实际上在许多重要文档中也是这样引用的。
在url概念背后有一个基本思想,那就是:提供一定信息条件下,你应能在internet上的任何一台机器上访问任何可用的公共数据。这些一定的信息由以下的url基本部分组成:
·所使用的访问协议
·数据所在的机器
·请求数据的数据源端口
·通向数据的路径
·包含了所需数据的文件的名称 url的标准格式如下:
protocol://machineaddress:port/path/filename
例如,想要访问南京理工大学的web站点,其url为:
http://www.njust.edu.cn
1992年7月,www在cern内部得到了广泛的应用。从此以后www得到了热情的接受,在internet上开始有所影响。到1993年1月,全世界已有50个为人所知的www服务器,各种浏览器软件开始发行。同年2月,伊利诺斯大学urbana-champaign分校的国家超级计算机中心ncsa(national center for supercomputing applications)发行了一个新的浏览器软件。从此,www已初具规模。
ncsa的mosaic到netscape看浏览器的发展
www曾经存在的问题之一就是没有用于通用计算机和操作系统上的可靠的浏览器。mosaic的问世解决了这个问题。由joe hardin领导的ncsa系统开发组开始了一项计划,其目标是建立一个很有用的www浏览器,不仅能处理tim berners-lee所描述的www,而且能支持其他的访问协议。这个客户程序被称作mosaic,于1993年2月发布。
许多计算机专家提出了许多新建议,使得html和www得到了飞速的发展。ncsa小组详细地研究了mime(multipurpose internet mail extension)类型的使用,以便识别一些媒体的格式,尤其是声音、图片、动画等。使用mime类型似乎是理所当然的一步,因为通用internet邮件扩充服务mime早已被作为能定义和编码大多数数据类型的目标。mime类型有新的优势,体现在可扩充性和已被证明的实用性上。更妙的是大量用于操作mime的程序代码早已编写出来,随时可用于新的程序——www客户机和服务器程序。
在html中加入了"img"标记之后,mosaic成了真正的多媒体浏览器。超文本页面骤然变得亲切友好了许多。展现得不在仅是科学家和学者们所用的枯燥的学术研究信息,当今世界的各种信息都能以多媒体的方式生动地展现在人们的面前。web从此已经成熟,这也正是internet期望已久的。
www与面向网络的编程语言java
简单地说,java是一个由sun公司开发而成的新一代编程语言。java的目标是为满足在一个充满各式各样不同种机器、不同种操作平台的网络环境中开以软件。这也正是为什么不论你使用的是哪一种www浏览器,哪一种计算机,哪一种操作系统,只要www浏览器上面注明了"支持java",你就可以看到生动的起始页的原因。
利用java编程语言,你可以在你的起始页中加入各式各样的动态效果,你可以放上一段动画,可以在起始页上建立霓虹灯式的看板,让你的名字在上面不停地转动。如果你愿意,就像一般的窗口程序一样,你还可以放上菜单和按钮,以及滚动条。只要使用java,没有什么你做不到的。
为什么java可以做到这些传统起始页上做不到的动态演示呢?没有别的原因,在加入java的支持后,你的起始页已不再只是一个冷冰冰的"文件",而是配合java程序的一个活生生的程序实体。正因为这一点,在你使用netscape navigator或者microsoft internet explorer观看各地起始页时,你所用的www浏览器不但要负责将html格式的文件以正确的格式显示出来,同时也必须负责在你所使用的机器上,执行伴随而来的java程序。
事实上,对这样一种伴随起始页而来的java程序,我们取了一种特别的名称,叫applet,我们可以把它想像成是一个个小巧可爱的程序。java除了开发附在起始页上的小应用程序外,也具备有开以大型应用程序(application)的能力,并且同样可以跨越不同种类的机器、不同种类的操作平台的限制,在各地执行。
定义
www 英文名:World Wide Web
万维网(亦作“网络”、“www”、“3W”,英文“Web”或“World Wide Web”),是一个资料空间。在这个空间中:一样有用的事物,称为一样“资源”;并且由一个全域“统一资源标识符”(URL)标识。这些资源通过超文本传输协议(Hypertext Transfer Protocol)传送给使用者,而后者通过点击链接来获得资源。从另一个观点来看,万维网是一个透过网络存取的互连超文件(interlinked hypertext document)系统。万维网联盟(World Wide Web Consortium,简称W3C),又称W3C理事会。1994年10月在拥有“世界理工大学之最”称号的麻省理工学院(MIT)计算机科学实验室成立。建立者是万维网的发明者蒂姆·伯纳斯·李。
万维网常被当成因特网的同义词,不过其实万维网是靠着因特网运行的一项服务。
200px-First_Web_Server.jpg 最早的网络构想可以追溯到遥远的1980年蒂姆·伯纳斯-李构建的ENQUIRE项目。这是一个类似维基百科的超文本在线编辑数据库。尽管这与我们现在使用的万维网大不相同,但是它们有许多相同的核心思想,甚至还包括一些伯纳斯-李的万维网之后的下一个项目语义网中的构想。
1989年3月,伯纳斯-李撰写了《关于信息化管理的建议》一文,文中提及 ENQUIRE 并且描述了一个更加精巧的管理模型。1990年11月12日他和罗伯特·卡里奥(Robert Cailliau)合作提出了一个更加正式的关于万维网的建议。。在1990年11月13日他在一台NeXT工作站上写了第一个网页以实现他文中的想法。
在那年的圣诞假期,伯纳斯-李制作了要一个网络工作所必须的所有工具:第一个万维网浏览器(同时也是编辑器)和第一个网页服务器。
1991年8月6日,他在alt.hypertext新闻组上贴了万维网项目简介的文章。这一天也标志着因特网上万维网公共服务的首次亮相。
万维网中至关重要的概念超文本起源于1960年代的几个从前的项目。譬如泰德·尼尔森(Ted Nelson)的仙那都项目(Project Xanadu)和道格拉斯·英格巴特(Douglas Engelbart)的NLS。而这两个项目的灵感都是来源于万尼瓦尔·布什在其1945年的论文《和我们想得一样》中为微缩胶片设计的“记忆延伸”(memex)系统。
蒂姆·伯纳斯-李的另一个才华横溢的突破是将超文本嫁接到因特网上。在他的书《编织网络》中,他解释说他曾一再向这两种技术的使用者们建议它们的结合是可行的,但是却没有任何人响应他的建议,他最后只好自己解决了这个计划。他发明了一个全球网络资源唯一认证的系统:统一资源标识符。
万维网和其他超文本系统有很多不同之处:
* 万维网上需要单项连接而不是双向连接,这使得任何人可以在资源拥有者不作任何行动情况下链接该资源。和早期的网络系统相比,这一点对于减少实现网络服务器和网络浏览器的困难至关重要,但它的副作用是产生了坏链的慢性问题。
* 万维网不像某些应用软件如HyperCard,它不是私有的,这使得服务器和客户端能够独立地发展和扩展,而不受许可限制。
1993年4月30日,欧洲核子研究组织宣布万维网对任何人免费开放,并不收取任何费用。两个月之后Gopher宣布不再免费,造成大量用户从Gopher转向万维网。万维网联盟(World Wide Web Consortium,简称W3C),又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。建立者是万维网的发明者蒂姆·伯纳斯-李。
世纪40年代以来人们就梦想能拥有一个世界性的信息库。在这个数据库中数据不仅能被全球的人们存取,而且应该能轻松地链接其它地方的信息,以便用户可以方便快捷地获得重要的信息。它引发了第五次信息革命。
随着科学技术的迅猛发展,人们的这个梦想已经变成了现实。目前正在使用的最流行的系统叫"环球信息网www"(World Wide Web)。它的正式定义是"www is a wide-area hypermedia information retrieval initiative to give universal access to large universe of documents."简而言之,www是一个以Internet为基础的计算机网络,它允许用户在一台计算机通过Internet存取另一台计算机上的信息。从技术角度上说,环球信息网是Internet上那些支持www协议和超文本传输协议HTTP(Hyper Text Transport Protocol)的客户机与服务器的集合,透过它可以存取世界各地的超媒体文件,内容包括文字、图形、声音、动画、资料库、以及各式各样的软件。
理论上说来,环球信息网包括整个两亿人以上的Internet世界,它包含所有的Web站点、Gopher信息站、FTP档案库、Telnet公共存取帐号、News新闻讨论区以及Wais资料库。所以环球信息网可以说是当今全世界最大的电子资料世界,已经可以把World Wide Web当成是Internet 的同义词了。事实上,一般我们日常所说的"上Internet",其实指的就是连上World Wide Web 。www是World Wide Web (环球信息网)的缩写,也可以简称为Web,中文名字为“万维网”。