首页 百科知识 如何设置索引加快检索速度

如何设置索引加快检索速度

时间:2022-04-10 百科知识 版权反馈
【摘要】:第四节 美国《化学文摘》一、概况美国《化学文摘》创刊于1907年。多年来,CA已经成为世界上检索化学、化工及相关学科文献最重要的检索工具,是“打开世界化学、化工文献宝库的钥匙”。(二)信息含量大CA的年报道文献量超过50万条,已收录的化学化工文献量占全世界该类总文献量的98%,摘录的文献超过2 000万篇。

第四节 美国《化学文摘》

一、概况

美国《化学文摘》(Chemical Abstracts,CA)创刊于1907年。该刊先后由美国化学学会(The American Chemical Society)及下设的化学文摘服务社(Chemical Abstracts Service,CAS)编辑出版。从1967年第66卷起为周刊,每年2卷,每卷26期。从1996年起,CAS推出了光盘版,使检索的方法和效率有了突飞猛进的提高。The American Chemical Society和FIZ Karlsruhe(德国卡尔斯鲁厄)能源、物理、数学专业信息中心、JI-CST(日本科学技术情报中心)合作,共同建立了一个国际性的科技信息联机检索系统———STN,即可从卡尔斯鲁厄、哥伦布市和东京的任一独立主机系统,进入其他2个主机系统进行检索。2006年起,启用能连接全文的SciFinder Scholar数据库,更使该种文献的检索达到了一个完美的境地。

多年来,CA已经成为世界上检索化学、化工及相关学科文献最重要的检索工具,是“打开世界化学、化工文献宝库的钥匙”。CA具有以下特点:

(一)收录范围广

CA收录化学、化工技术方面的文献,也收录医学、生物学及相关学科文献。CA的文献来源于世界上150多个国家和地区50多种文字出版的18 000多种期刊,32个国家和2个国际专利组织的专利文献,以及专著、会议录、技术报告、学位论文、档案资料、图书等类型的科技文献资料。

(二)信息含量大

CA的年报道文献量超过50万条,已收录的化学化工文献量占全世界该类总文献量的98%,摘录的文献超过2 000万篇。其中约10万条是与医学和生物学有关的文献,每月提供与医学和生物学有关的文献不少于8 000条。

(三)出版迅速、载体多样

一般用英文发表的文献3个月左右就可在CA上看到。CA还提供缩微版、光盘版、网络版以及能链接全文的SciFinder Scholar数据库,使CA的出版更加迅速,载体更加丰富。

(四)索引完备、途径齐全

CA共有10多种索引,如普通主题索引、化学物质索引、关键词索引、索引指南、资料来源索引、著者索引、分子式索引、环形化合物系统索引和杂原子索引、化学物质登记号索引和化学物质登记号手册、专利号索引和专利对照索引,为满足各种特殊的检索要求,提供了各具特色的检索途径。

二、印刷版

CA由文摘和索引两部分构成。期索引附在每期文摘之后,卷索引、累积索引以及索引指南单独出版。

(一)概况

CA的文摘按类目编排。自1967年66卷起分为5部分80个类目,“文摘类目表”(Abstract Sections)位于每期第1页。1997年126卷前,单期刊载A、B 2部分(1~34类),双期刊载C、D、E 3部分(35~80类),1997年之后每期均刊载80类,即A、B、C、D、E 5部分。以下用英文字母和数字表示所属A~E部分和1~80期号。

A.Biochemistry Sections(生物化学部分,1~20类)

A 1.Mammalian Hormones(哺乳动物激素)

A 3.Biochemical Genetics(生化遗传学)

A 4.Toxicology(毒理学)

A 5.Agrochemical Bioregulators(农业化学生物调节剂)

A 6.General Biochemistry(普通生物化学

A 7.Enzymes(酶)

A 8.Radiation Biochemistry(辐射生物化学)

A 9.Biochemical Methods(生化方法)

A 10.Microbial,Algal,and Fungal Biochemistry(微生物、藻类和真菌生物化学)

A 11.Plant Biochemistry(植物生物化学)

A 12.Non-mammalian Biochemistry(非哺乳动物生物化学)

A 13.Mammalian Biochemistry(哺乳动物生物化学)

A 14.Mammalian Pathological Biochemistry(哺乳动物病理生物化学)

A 15.Immunochemistry(免疫化学)

A 16.Fermentation and Bio-industrial Chemistry(发酵与生物工业化学)

A 17.Food and Feed Chemistry(食品与饲料化学)

A 18.Animal Nutrition(动物营养)

A 19.Fertilizers,Soils,and Plant Nutrition(肥料、土壤和植物营养)

A 20.History,Education,and Documentation(历史、教育与文献编集)

B.Organic Chemistry Sections(有机化学部分,21~34类)

B 21.General Organic Chemistry(普通有机化学)

B 22.Physical Organic Chemistry(物理有机化学)

B 23.Aliphatic Compounds(脂肪族化合物)

B 24.Alicyclic Compounds(脂环族化合物)

B 25.Benzene,Its Derivatives,and Condensed Benzenoid Compounds(苯、苯衍生物与稠苯化合物)

B 26.Bio-molecules and Their Synthetic Analogs(生物分子及其合成类似物)

B 27.Heterocyclic Compounds(One Hetero Atom)(单杂原子杂环化合物)

B 28.Heterocyclic Compounds(More Than One Hetero Atom)(多杂原子杂环化合物)

B 29.Organometallic and Organometalloidal Compounds(有机金属与有机准金属化合物)

B 30.Terpenes and Terpenoids(萜烯与类萜烯类)

B 31.Alkaloids(生物碱)

B 32.Steroids(甾族化合物)

B 33.Carbohydrate(碳水化合物)

B 34.Amino Acids,Peptides,and Proteins(氨基酸、多肽与蛋白质

C.Macromolecular Chemistry Sections(高分子化学部分,35~46类)

C 35.Chemistry of Synthetic High Polymers(合成高聚物化学)

C 36.Physical Properties of Synthetic High Polymers(合成高聚物的物理性质)

C 37.Plastics Manufacture and Processing(塑料制造与加工)

C 38.Plastics Fabrication and Users(塑料制品与用途)

C 39.Synthetic Elastomers and Natural Rubber(合成弹性体与天然橡胶

C 40.Textiles and Fibers(纺织品和纤维)

C 41.Dyes,Organic Pigments,Fluorescent Brighteners,and Photographic Sensitizers(染料、有机颜料、荧光增亮剂和光敏剂)

C 42.Coatings,Inks,and Related Products(涂料、墨水和有关产品)

C 43.Cellulose,Lignin,Paper,and Other Wood Products(纤维素、木质素、纸张及其他木材产品)

C 44.Industrial Carbohydrates(工业碳水化合物)

C 45.Industrial Organic Chemicals,Leather,Fats,and Waxes(工业有机化学制品、皮革、脂肪与蜡)

C 46.Surface-Active Agents and Detergents(表面活性剂与去垢剂)

D.Applied Chemistry and Chemical Engineering Sections(应用化学与化学工程部分,47~64类)

D 47.Apparatus and Plant Equipment(仪器与工厂设备)

D 48.Unit Operations and Processes(单元操作与过程)

D 49.Industrial Inorganic Chemicals(工业无机化学)

D 50.Propellants and Explosives(推进剂与炸药)

D 51.Fossil Fuels,Derivatives,and Related Products(矿物燃料、衍生物及其有关产品)

D 52.Electrochemical,Radiational,and Thermal Energy Technology(电化学、辐射与热能技术)

D 53.Mineralogical and Geological Chemistry(矿物化学与地质化学)

D 54.Extractive Metallurgy(萃取冶金学)

D 55.Ferrous Metals and Alloys(黑色金属与合金)

D 56.Nonferrous Metals and Alloys(有色金属与合金)

D 58.Cement,Concrete,and Related Building Materials(水泥、混凝土与有关建筑材料)

D 59.Air Pollution and Industrial Hygiene(空气污染与工业卫生)

D 60.Waste Treatment and Disposal(废物治理与排放)

D 61.Water(水)

D 62.Essential Oils and Cosmetics(香精油与化妆品)

D 63.Pharmaceuticals(药物)

D 64.Pharmaceutical Analysis(药物分析)

E.Physical,Inorganic,and Analytical Chemistry Sections(物理化学、无机化学和分析化学,65~80类)

E 65.General Physical Chemistry(普通物理化学)

E 66.Surface Chemistry and Colloids(表面化学与胶体)

E 67.Catalysis,Reaction Kinetics,and Inorganic Reaction Mechanisms(催化、反应动力学与无机反应机理)

E 68.Phase Equilibriums,Chemical Equilibriums,and Solutions(相位平衡、化学平衡与溶液)

E 69.Thermodynamics,Thermo-chemistry,and Thermal Properties(热力学、热化学与热特性)

E 70.Nuclear Phenomena(核现象)

E 71.Nuclear Technology(核技术)

E 72.Electrochemistry(电化学)

E 73.Optical,Electron,and Mass Spectroscopy and Other Related Properties(光谱、电子能谱、质谱及其他有关性质)

E 74.Radiation Chemistry,Photochemistry,and Photographic and other Reprographic Processes(辐射化学、光化学、照相与其他复制技术过程)

E 75.Crystallography and Liquid Crystals(结晶学与液晶)

E 76.Electric Phenomena(电现象)

E 77.Magnetic Phenomena(磁现象)

E 78.Inorganic Chemicals and Reactions(无机化学品及反应)

E 79.Inorganic Analytical Chemistry(无机分析化学)

E 80.Organic Analytical Chemistry(有机分析化学)

各期文摘内容的编排顺序依次为:①期刊论文、会议录和资料汇编、技术报告、学位论文等,每类综述性文献集中排列在该类最前面;②新书及视听资料通报;③专利文献;④参见。

2.检索途径

(1)普通主题索引(General Subject Index) 主要收录范围包括未收入Chemical Substance Index中的大类物质和概念性主题。具体包括:化学物质大类名称、结构或成分尚不清楚的化学物质、岩石、物理化学概念和现象、化学反应、化学工程和设备、生物化学和生物学主题、动植物的俗名和学名。

生物医学有关的主题主要有:生化物质及药品的大类名称(如抗生素类、激素类、肿瘤抑制剂等),人体和动物的器官、组织、细胞等名称,各种疾病名称,细菌、真菌、病毒等病原体名称,诊断和治疗等医学名词,与化学有关的医用材料和仪器名称,环境卫生、食品卫生、毒理学及其他健康危害方面的主题名称,动、植物名称等。副标题(普通副主题7个,化学功能基副主题16个,以及与组织、器官组配的5个)。

其基本格式:主标题,(副标题)说明语文摘号。属于卷索引。

(2)化学物质索引(Chemical Substance Index) 主要收录范围:所有化学元素、化合物以及它们的衍生物(确定和未确定的),各种金属的合金,各种矿物,各种化合物的混合物和聚合物,各种抗生素、酶、激素、肽、蛋白质以及多糖体等,基本粒子(包括某些分类名称)等。

注意:特定的化学物质必须是唯一的,并满足3个条件,即元素组成明确、分子价键清楚、立体化学结构确定。只采用化学结构为依据的命名法,1972年以前主题索引中采用的商品名、俗名和习惯名等均被废除了。目前已有1000多万种化学物质。

其基本格式:主标题[登记号],(普通副主题或化学功能基副主题)。属于卷索引。

(3)关键词索引(Keyword Index) 是按关键词的字顺排列起来的用以检索文献主题内容的检索途径。当一条索引中的一个关键词用做标目词时,其他关键词作为说明语,并接排相应的文摘号,词间无语法关系。属于期索引。

(4)索引指南(Index Guide) 索引指南是指导检索者如何选择、使用Subject Index(76卷之前)、General Subject Index和Chemical Substance Index等不同类型的检索入口。索引指南是按主题词字顺排列起来的,对主题词进行说明、规范,对查阅CA时出现的各种问题给予统一指导,它不直接提供文摘号。索引指南是使用GS和CS的工具,其作用相当于主题词表。

索引指南从1968年第69卷起每隔一两年出版一次。索引指南分为按字顺排列的主表和附录两部分。主表包括索引主题注释、分子结构图、各种参照等。附录包括附录I(普通主题词等级表)、附录II(CA各索引的组织和使用)、附录III(普通主题词的选择)、附录IV(化学物质索引名称)。

主要功能:①帮助用户确定CA所用正式名称(用“See”);②帮助用户扩大检索途径,防止漏检(用“See also”);③帮助用户更好地理解标题定义,包括标题释义和同形异义词注释;④帮助用户确定应使用《普通主题索引》还是《化学物质索引》,凡主题词后边有登记号的词应使用《化学物质索引》,否则用前者。

(5)资料来源索引(CAS Source Index) 是帮助检索者获取原始文献的工具。所谓的“资料来源”,是指CA收录文献所刊载的原始出版物,目前已达20000多种。资料来源索引供查刊名缩写、全称、刊名代号、语种、刊期、出版单位、刊物历史变更、世界各大图书馆(美国290个馆、其他28个国家中的各个馆)代码及馆藏情况等。

资料来源索引是一种累积本,1970年起每五年出版一次,报道自1907年至最近一期出版前一年CA收录出版物的情况。对CA最新收录、更名、删除的刊物信息,CAS通过“CAS资料来源索引季刊”(CASSI Quarterly)予以报道。

(6)著者索引(Author Index) 将每篇文献的著者、合著者、发明人、专利权人等按字顺,姓在前用全称,名在后用缩写排列起来。著者索引有两种形式,一是期索引,无论是否第一著者,均把著者姓名和文摘号联系在一起,但看不到文摘标题;二是卷索引,仅在第一著者的条目下列出原始文献的标题和文摘号,而在合著者的条目下,采用“See”(参见)的形式,指引读者参见第一著者,卷索引还包含了团体著者的内容。

由于该刊的著者索引收录了多种国家的文字,故在著者姓名拼写和转译方面有特殊的规定,如中文,通常遵循汉语拼音规则转译,而香港、台湾和新加坡人士,则采用“Wade-Giles System”(韦德—贾尔斯拼写法);日文姓名采用“Hepburn System”(赫伯恩拼写法);俄罗斯著者依据“Russian-English”(俄—英字母对译表)转译。

(7)分子式索引(Molecular Index) 以分子式作为检索标目,能有效地检索特定化学物质数据。主要用途:①适于分子结构复杂、分子量大、异构体少的特殊化合物,可得文摘号;②查找化学物质索引中没有的、尚未正式命名的新化合物。分子式采用Hill System(希尔规则)规范后的分子式。基本原则如下:有机物先排C、H原子,之后按字母顺序排;同一有机物分子内某一原子多次出现,则原子个数相加后放于第一个做脚标;无机物分子按英文字母顺序排列。

注意事项:①一般环间无公共原子的化合物不作为环系物看待;②2个环以上的化合物,计算原子数时,环间公共原子应重复计算;③当多环系在环数大小相等时,先排含碳最少的环。

(8)环形化合物系统索引(Index of Ring System)与杂原子索引(Hetero Atom in Context Index) 此两种索引是Molecular Index的扩展形式。主要是增加新的入口,让检索者能更加准确地检索到所需的特定文献。但Hetero Atom in Context Index仅在66~75卷之间存在过(其中,72卷无此种索引)。而Index of Ring System(环形化合物系统索引)同样仅在于66~120卷,其中也有多卷无此种索引。因该类化合物超过91000个,进而出版了《Ring System Handbook》(《环形化合物系统手册》),以致Index of Ring System、Hetero Atom in Context Index(环形化合物系统索引和杂原子索引)均不复存在了。

(9)化学物质登记号手册(CAS Registry Number Handbook) CAS对CA报道的化学结构明确并已命名的化学物质赋予一个固定的号码,即CAS登记号(CAS Registry Number)。一种化合物可能有多种名称,但登记号只有一个。有了这种登记号,便于化合物的识别、检索和数据管理。最初名为化学物质登记号索引(Registry Number In-dex),但仅从71卷延续至75卷就停刊了,改为出版化学物质登记号手册(CAS Registry Number Handbook),登记号手册的主要用途是:从化学物质登记号检索化学物质名称,检索化合物分子式,便于确认化合物,显然,物质登记号是使用化学物质索引和分子式索引的辅助工具。

(10)专利索引(Patent Index) 从1981年第94卷起设置,将原来的Numerical Pa-tent Index(专利号索引)与Patent Concordance Index(专利对照索引)合并为Patent In-dex(专利索引)。该索引是按专利国别代码字顺排列,同一国家之中再按专利号的大小顺序排列。

专利索引的作用:①通过专利族可了解某项专利的保护范围,从而判断其重要性;②在难以获得某专利说明书时,可通过CA文摘了解该专利的大致内容;③通过等同专利可以选择自己熟悉的语种进行阅读;④通过相关专利可以掌握该项专利的技术全貌。

三、CA on CD-ROM

(一)概况(光盘版)

Chemical Abstracts on CD-ROM(化学文摘光盘数据库,简称CA on CD)。在Windows 98版以上的环境都可运行CA on CD。该数据库内容对应于印刷版的Chemi-cal Abstracts,每月更新文摘和索引。CA数据库只能检索文摘,可根据文献来源进一步获取原文。

(二)数据库结构

CA on CD的文献记录的通常构成如下所示。由于CA on CD的文献类型有期刊、专利和会议论文等,各条记录的字段数会有所不同。

化学文摘光盘数据库字段:

CA Accession Number        CA卷期及文摘号

CAS Registry Number        化学物质登记号

Title                标题

Abstract              文摘

Author Names            著者姓名

Company Name            公司名称

Corporate Source          团体出处

Publication Year          出版年

Date                 日期

Publisher              出版者

Volume                卷

Issue                期

Pagination              页码

CODEN                 国际刊名代码

ISSN                 国际标准连续出版物编号

Language               语种

CA SectionCA             分类代码和类名

Patent Families            同族专利

Patent Information          专利情报

Patent Assignee            专利受让人

Inventor                发明人

Application Information        申请专利信息

Priority Information          优先权信息

CA SectionCA              分类代码和类名

Document Type              文献类型

Keywords                关键词

Index Entries              索引款目

Chemical Names             化学物质系统名称

Molecular Formula            分子式

3.检索途径

CA光盘的检索途径有4条共18个检索入口:即著者、专利号、分子式、GS标题、文摘号、CS索引标题、关键词、CAS登记号、CS说明语词、GS说明语词、标题词、著者单位或专利权受让者、刊名、语种、出版年、文献类型、CA类目号、记录更新年。如图4-4-1所示。

图4-4-1 CA检索界面

(1)菜单式检索(Index Browse) Index Browse是一种根据菜单检索文献的方法,它是通过浏览方式寻找特定字段的检索。通常用此方法检索特定对象的文献,如个人作者、团体作者、专利号、CAS登记号、CA文摘号等最为方便。

如检索华东理工大学教师发表的文献,因该大学曾多次改名,就需将不同的名称,即同一学校的不同拼写方式同时选中。检索结果如图4-4-2所示。

(2)词检索(Word Search) 这是CA中最常用的检索方法。只要选择检索字段,采用恰当的逻辑运算符,命令框输入准确的检索词,并选择检索词的邻近关系后,就可直接检索了。如图4-4-3所示。

(3)化学物质名检索(Substance Hierarchy) 在CA数据库中,有许多文献涉及具体的化学物质名称,由于化学结构比较复杂,且化学命名多样化,同一物质可以有不同的名称,用Word Search方式检索,不能准确把握检索词,而用化学物质名称检索方式则可以避免检索词不规范所造成的漏检。但是只能根据化学物质名及有关的副标题检索,然后列出文献标题,没有进一步的说明语,不能像Word Search检索方式一样自由组配。如图4-4-4所示。

双击检中的化学物质名称,显示该物质的所有文献标题,需要逐条浏览。如图4-4-5所示。

(4)分子式检索(Formula Hierarchy) 分子式检索与化学物质名称检索方式类似,它也只能检索到化学物质名及有关的副标题,没有进一步的说明,也不能自由组配,一般情况下,也很少使用。分子式检索中的分子式排列方式也是依据Hill System的规则排列,显示分子排列式。如图4-4-6所示。

3.禁用字(Stopword)

图4-4-2 机构检索结果

图4-4-3 Word Search检索界面

下面为在文献中使用过于频繁且无实质意义的字,在CA on CD检索中被禁止使用:

(1)数字 0、1、2、3、4、5、6、7、8、9、10……

(2)冠词 a、an、the……

(3)系动词 be、become、by、have……

(4)介词 as、beyond、for、from、of、to……

(5)代词 it、these、this、which……

(6)其他 relation(使用频率极高的名词)

四、SciFinder/Scholar

1.概况

图4-4-4 化学物质名检索界面

图4-4-5 检索结果界面

SciFinder Scholar(CA网络版)在充分吸收原书本式CA精华的基础上,利用现代机检技术,进一步提高了化学化工文献的可检性和速检性,更整合了Medline医学数据库、欧洲和美国等50多家专利机构的全文专利资料以及化学文摘1907年至今的所有内容。它涵盖的学科包括应用化学、化学工程、普通化学、物理、生物学、生命科学、医学、聚合体学、材料学、地质学、食品科学和农学等诸多领域。它可以透过网络直接查看“化学文摘”1907年以来的所有期刊文献和专利摘要;以及8000多万的化学物质记录和CAS注册号。

SciFinder Scholar收录的内容为5大类80小类:

(1)生物化学 遗传学、免疫学、药理学、毒理学、发酵。

(2)有机化学

图4-4-6 分子式检索界面

(3)材料化学(高分子) 聚合物、塑料、纺织、橡胶、黏合剂等。

(4)应用化学和化学工程 加工、工业化学、金属/合金、陶瓷、环境科学等。

(5)物理化学、无机化学和分析化学

2.检索途径

主要有3种检索途径,即Explore检索、Locate检索和Browse检索。如图4-4-7所示。

图4-4-7 CAS检索界面

(1)Explore检索 对于不确定的信息,通常采用Explore检索,有3种入口。如图4-4-8所示。

①文献检索:Literature by Research topic,Author name,Company name/organiza-tion。

②物质检索:Substance by Chemical structure,Molecular formula。

图4-4-8 Explore检索界面

③反应检索:Reactions by Reaction structure。

在检索时,SFS职能检索系统会自动考虑、分辨同义词、单程/复数、同一词的不同拼写形式、索引、缩写、截词等。

用组织机构名去限定,可以获得来自中国的参考文献

SciFinder Scholar物质结构检索的特点是:对世界上最大、最全、最新、最快同时也是最权威的物质数据库进行检索,由此获得直观的检索效果,对物质结构进行Substructure(亚结构)和Similarity(相似结构)的检索,可以拓宽对物质世界的理解,并能对获得的检索结果进行再检索和分析,以便容易地得到统计的数据。

SciFinder Scholar含有世界上最大的文摘数据库CAplus+Medline。

CAplus:从1907年至今,在一个多世纪以来的2700多万条记录(1900年以前的上万条记录),包括了1940种核心杂志的内容,覆盖了超过9500种以上的期刊、50种以上的语言、50多个国家的专利,记录每天更新超过3000条。

Medline:1953年至今,超过14500000记录,来自4300多种期刊,每周更新4次。

(2)Locate检索 对于确定信息的检索,通常采用Locate检索。

(3)Browse检索 可以浏览超过1970种的核心期刊文献。

SciFinder Scholar的主要特点是为科学研究者服务的数据库检索工具,界面友好,可在Registry数据库中提供多种分析和检索手段对物质进行认定和对CAS RN号码结构图形进行检索,尤其是Substructure(SSN)模块使Registry、CASREACT、CAplus等3个数据库相互联系,形成了一个有效的检索资源和保障体系。

(王者乐)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈