首页 理论教育 网络教学资源类型及搜索引擎

网络教学资源类型及搜索引擎

时间:2022-03-10 理论教育 版权反馈
【摘要】:网络教学资源类型可从多个角度对其进行分类。而在因特网上,资源浩如烟海,教学资源的分类既要考虑到资源的技术表现特征,同时也要考虑到搜索引擎的支持。VP8则尚未明确专利收费问题。目前各种搜索引擎都尚未支持动画文件的搜索。全文索引也是现今互联网上最主要的搜索引擎。图片搜索的精确性也反映了搜索引擎的技术水平。Google作为全球最大的搜索引擎,在搜索技术上更强一些。

7.2.1 网络教学资源类型及索引

1.教学资源类型

网络教学资源类型可从多个角度对其进行分类。如根据网络结构的特征可将其分为存贮于校园网内的学校内部资源和存贮于互联网的远程教学资源;根据教学资源的媒体属性可分为文本、图形图像、动画、声音、视频等类型。我国曾经颁布过教育资源建设规范,将教学资源分为媒体素材、试题库、课件与网络课件、案例、文献资料、常见问题解答、资源目录索引、网络课程等(见图7‐7)。这种分类法有一定的区域重叠,例如案例有可能是一段视频资料,而视频资料又属于媒体素材,只有明确了资源的具体属性才能正确分类。因此这种分类比较适合用在校内网教学资源库或专业建设的教学资源网等具有详细和明确属性标注的信息资源中。

受各种因素影响,国内公共教学资源库的建设并不成功,在大多数情况下,学科教师还是从因特网上获得需要的资源。而在因特网上,资源浩如烟海,教学资源的分类既要考虑到资源的技术表现特征,同时也要考虑到搜索引擎的支持。

大体上,根据教学资源在网络上的媒体属性不同,可分为文本、图形图像、声音、视频、动画、课件/程序和资源文件这几类。

img206

图7‐7 教育资源建设技术规范基本结构

文本除了指网页上的文字内容外,还包括网页上的超文本,即带有超链接属性的文字和一些网页上的控制代码,其赋予了文本信息指向的特殊属性,为教学信息的组织、教学过程的安排控制提供了有力的支持。

图形图像主要指各类嵌在网页中的图片,互联网上能直接在网页中显示的标准图片格式有三种:GIF、JPG和PNG。有些图片,如矢量图片WMF,只能被部分浏览器正确显示。GIF采用的是无损压缩,因此图片中的文字边缘可以比较细致,并对颜色数量较少的图片压缩率较高,但对照片类颜色丰富的图像,则图片尺寸急剧增加,此时用JPG格式图片压缩率较好。GIF和PNG图片都支持透明图层,但GIF只包含完全透明或不透明两种状态,而PNG含有一个8位的Alpha通道,因此支持256等级的透明。

视频和音频格式是目前种类较多的文件格式。到目前为止还没有统一的编码标准。按HTML 4.0版本建立的网页,视音频都是通过浏览器的插件来播放的,使得网页的设计和优化变得复杂。国际互联网组织(W3C)力图改进这一问题,在新的HTML 5.0标准中加入了Video和Audio元素(http://dev.w3.org/html5specOverview.tml#the-video-element),只要浏览器支持相应的视频和音频解码,HTML 5.0的浏览器就可以直接播放,免除了安装插件引起的种种麻烦。例如,IE9.0支持H264文件,只要在HTML 5.0网页中加入<video src=″movie.mp4″ poster=″movie.jpg″ controls>,在IE9中,就能直接控制播放视频文件movie.mp4。

表7‐1列举的是常用浏览器对视频编码格式的支持情况。

表7‐1 显示浏览器对几种常用视频格式的支持

img207

目前以上3种视频格式都未被确定为HTML 5.0的视频编码标准。其中H264是较为广泛使用的视频格式,包括高清蓝光碟以及索尼、松下的民用摄像机都使用这种视频编码格式记录视频,但是它要收取专利费从而影响其推广。而Ogg虽是开源产品,但使用者还不多。VP8则尚未明确专利收费问题。如果能对HTML5.0下视频统一编码标准,将极大地方便网页多媒体的设计与制作。

动画是用连续的图片构成的运动图形图像,网页中的动画目前主要有两种存在形式。一种是GIF格式动画,另一种是Flash文件,后缀名是SWF,也是目前用得最多的动画文件。GIF动画文件是由多张图片连接而成,优点是不需要插件支持,对计算机性能要求比较低,缺点是文件压缩率较低,因此文件尺寸相对大些。而SWF文件正好相反,文件压缩率较高,因此尺寸较小,但播放时需要占用较多的计算机CPU资源。另外,SWF很多文件同时还应用于网站的交互控制。目前各种搜索引擎都尚未支持动画文件的搜索。

课件/程序包括下载执行的文件和可在网页中运行的代码。有一些课件需安装插件后才能直接在网页上运行。如Flash课件需安装Adobe Flash Player。而Java编制的课件需安装JRE(Java Runtime Environment)。

资源文件是指直接以文件形式存在的供浏览者下载的各种网上信息。常用的如“.pdf”、“.doc”和.ppt等文件。在安装了相应显示插件的浏览器上可以直接打开浏览或播放。

2.搜索引擎

(1)搜索引擎分类

互联网上信息如浩瀚海洋,为了能快速地从中找到所需资源,可以借助特定的搜索工具——搜索引擎。搜索引擎基本工作包括两部分:一是将互联网上的资源预先“抓取”存在自己的数据库中;二是将这些资源进行组织处理,建立目录和索引。这样用户可以在其中快速地寻找到所需的内容。

搜索引擎根据不同的搜索原理可分为全文索引、图片搜索、目录索引以及元搜索引擎等。

全文索引是搜索引擎从互联网提取各个网站的全文信息(以网页文字为主)后,建立起来的存有网页内容的数据库。用户输入查询关键字后,能检索与用户查询条件相匹配的记录,并按一定的排列顺序返回结果。全文索引也是现今互联网上最主要的搜索引擎。

图片搜索是通过图片所在网页的相关信息或图片的文件名,将相关的图片作为搜索结果直接显示给用户,特点是直观、快速。利用图片搜索技术能方便地获取所需的图片资源。由于基于图片内容的识别技术还不是很成熟,因此现有的图片搜索还需要通过网页的相关文字来帮助确定图片内容。图片搜索的精确性也反映了搜索引擎的技术水平。

目录索引实际上并不是一种搜索引擎,而是主要依赖于人工操作。通常是网站建设者向门户网站提交自己的网站,门户网站的目录编辑人员会亲自浏览网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。由于互联网规模的扩大,这种人工方法效率较低,因此逐渐被弃用。

元搜索引擎(meta search engines)本身并没有搜索网页的能力,它在接受任务后,同时在多个搜索引擎上搜索,并将结果按一定顺序排序后返回给用户。

现有国内主要搜索引擎有Google(谷歌)、百度、必应和搜狗等。这些搜索引擎都是全文索引,同时都实现了图片、视频和音乐搜索功能。Google作为全球最大的搜索引擎,在搜索技术上更强一些。而必应借助微软的技术背景,其技术在近年来也突飞猛进。实际教学中,曾让美术师范专业学生用相同的关键字用三种引擎分别搜索国画专业图片,大多数同学认为Google更加精确一些。例如,某国画方向同学以“披麻皴图片”作关键字比较Google与另一种国内搜索进行对比图片搜索后,评论到:

我觉得Google更精确,它前十张作品都是披麻皴的国画书画作品。某国内搜索引擎第二张图片就不是作品,而是实物。Google前十张都是满足搜索需求的,而另一种引擎前十张中只有六张满足需求,并且其中有重复的图片,实际上是五张有用。

此外,这些搜索引擎还提供了一些常用的资讯搜索业务,如地图地名搜索、新闻搜索,等等。

(2)搜索引擎的搜索排名策略

由于因特网资源不计其数,在某个检索中,排在后面的网站很难被用户所点击。因此,了解搜索引擎的排名规则有助于提高网站搜索返回排名的设计。

各搜索引擎的排名机制不尽相同,以Google为例,2011年的排名公式为Google分数=(相关关键词分数×0.3)+(域名权重×0.25)+(外链分数×0.25)+(用户数据×0.1)+(人工加分)-(自动或人工降分)(http://secretmlmskills.com/?p=1520)。由此可见,网页的关键字匹配与排名的影响因素最大。其他因素包括域名注册时间的长短、外链的相关度、连接的速度等。这些因素普通的网站制作者可能无法控制,我们主要从优化网页内部结构来提高优化关键字。

关键字匹配是指考虑网页中的关键字与用户搜索时输入的关键字的重合度,主要指标是文本中关键字的密度、网页标题、网页H标签与关键字的重合度等。一些网站由此采用一些技巧,如多次在子目录中重复出现关键字,来提高关键字的出现率。例如,某中学课件网站,在网页的每个子目录中,用“中学语文课件”、“中学英语课件”、“中学数学课件”等标题来提高“中学课件”这一关键字的出现频率。其他优化策略还包括将网页的标题设置的详细具体以提高关键字的匹配度等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈