首页 理论教育 现代矩阵观念与矩阵代数

现代矩阵观念与矩阵代数

时间:2022-02-12 理论教育 版权反馈
【摘要】:发展出现代矩阵观念的功臣有两个人:凯莱和西尔维斯特。时刻准备完全放弃律师职业,从事自己所喜爱的数学研究的凯莱终于等来一个机会。1863年,剑桥大学新设立了一个萨德勒纯粹数学教授席位,由于出色的数学工作,凯莱被任命为首位萨德勒数学教授。与大多数数学家不同,凯莱是一个有着广泛兴趣,并懂得热爱生活、享受生活的人。

发展出现代矩阵观念的功臣有两个人:凯莱和西尔维斯特。他们都是英国人,两人不但在数学研究上密切合作,而且有着深挚长久的友情。

我们先来介绍一下凯莱。

凯莱(1821~1895)出生在一个英国家庭,他的父亲是一位在俄国从事贸易的英国商人,因此凯莱的童年主要在俄国度过。1829年,凯莱被送到伦敦一所小规模的私立学校念书。他的数学天才——尤其是在数值计算方面具有的惊人技巧——开始得以显现。14岁时,他进入伦敦皇家学院学习,他的老师们也很快认识到了他不同寻常的数学才能。对此十分欣赏的老师们鼓励他发展其数学能力。最初,凯莱的父亲从商人的眼光出发强烈反对,但最终被校长说服了,同意凯莱学习数学。17岁时,凯莱进入著名的剑桥大学三一学院就读,他在数学上的成绩是如此突出,以致大学主考官给他的评价是“超越第一”。1842年,21岁的凯莱以剑桥大学数学荣誉学位考试一等第一名的成绩毕业,同年在更困难的史密斯奖考试中也名列第一。

凯莱

1842年10月,凯莱被选为三一学院的研究员和助教,在他那个时代乃至整个19世纪,他是获得这种殊荣的人中最年轻的一位。他的工作很轻松,于是他在三年任期的大部分时间内得以从事自己感兴趣的研究。在广泛阅读高斯、拉格朗日等数学大师的著作后,他开始进行有创造性的数学工作。结果在25岁以前,他已经发表了24篇数学论文

三年后由于剑桥大学要求凯莱出任圣职,于是他不得不离开剑桥大学进入了法律界。1849年,凯莱获得律师资格,然后耐着性子做了14年的律师“苦役”,主要处理与财产转让有关的法律事务。由于工作出色,他作为一位名声与日俱增的大律师过着富裕的生活。然而,就是在这段时间里,他仍然挤出了许多时间从事数学研究,并发表了近300篇数学论文,其中许多工作现在看来仍然是第一流的和具有开创性的。

时刻准备完全放弃律师职业,从事自己所喜爱的数学研究的凯莱终于等来一个机会。1863年,剑桥大学新设立了一个萨德勒纯粹数学教授席位,由于出色的数学工作,凯莱被任命为首位萨德勒数学教授。尽管收入减少了,但他对得到这一职位仍非常满足,因为他终于可以专注于数学研究,把全部精力投入到数学中了。凯莱曾说这是他人生最幸福的事。

凯莱担任这一教授席位的一个职责是授课,但他的讲课未能吸引多少学生,部分原因是由于他常常讲他最新的研究。但对这一教授席位的另一职责“要促进这门学科的发展”他则非常好地完成了。在担任这一教席直到去世的30多年里,他高质量、高产地奉献出一个又一个重要的数学成果。直至去世前的那一周,长期患病的痛苦也不能使他停止其创造性的研究。结果,这位多产的数学家从1841年20岁开始发表第一篇数学论文到去世,除著有《椭圆函数专论》一书外,还发表了涉及众多数学分支、影响十分深远的数学学术论文966篇,1889~1898年编辑出版的《凯莱数学论文集》排满整整四开本13大卷,每卷多达600余页!凯莱的数学作品数量与柯西不相上下,都可能是仅次于最多产数学家欧拉的人。

由于杰出的学术成就,凯莱获得了大量的荣誉,其中包括1859年当选为皇家学会会员,获得英国皇家学会的皇室勋章,1881年获得英国皇家学会的柯普雷勋章。1883年,凯莱被任命为英国科学促进协会主席,为英国科学的持续发展、科学普及作出了重要贡献。现在的剑桥大学三一学院还安放着一尊凯莱的半身塑像。

作为一位19世纪受人尊敬的学者,凯莱有着许多优秀的品质。他性情温和,遇事总能从容不迫。据说他只有一次失去了冷静。当时,他和朋友西尔维斯特正在他的律师办公室里讨论不变量理论,仆人进来递给一叠要他仔细审看的法律文书。他同西尔维斯特正谈到兴头上,突然插进这么一堆东西,令他大为光火。他从办事员手中抓过文件,厌恶地大吼一声,将它们扔在地板上,然后接着谈数学。

作为一个非常真诚的人,凯莱总是与人为善,他常慷慨地帮助和鼓励别人。受惠于他的不仅有初学者,而且有一些著名学者,如西尔维斯特、泰特、塞蒙、F·高尔顿(优生学创始人)等。凯莱还在劝说剑桥大学接收女生中起了很大作用。

与大多数数学家不同,凯莱是一个有着广泛兴趣,并懂得热爱生活、享受生活的人。这位多能的数学家,对徒步旅行、登山、文学、绘画和建筑都有兴趣。爱好旅游和领略大自然美景的凯莱曾徒步周游了大半个欧洲与美国。作为真正英国传统的登山爱好者,他常去欧洲登山。据说他讲过,他喜欢爬山的原因是,虽然登山艰辛而劳累,但征服一座山峰的愉悦就感觉像解决了一道数学难题或完成了一个复杂的数学理论。他还说,登山很容易获得那种快感。极爱读小说的凯莱还利用任何零星的时间,广泛地阅读过许多文学作品,他一生读了几千部小说,不光有英文的,还有希腊文、法文、德文和意大利文的。凯莱喜欢画画,特别是水彩画,是一位出色的水彩画画家。他对建筑和建筑绘画也颇有研究。

对大自然、对生活的美的享受,决定了他的数学观,他对数学所做的下述描述反映了他那富有情趣的生活的影响:“很难给现代数学的广阔范围一个明确的概念。‘范围’这个词不确切。我的意思是指充满了美妙的细节的范围——不是一个像一马平川的平原那样单调乏味的范围,而是像一个从远处突然看到的辽阔美丽的乡村,它能经得起人们在其中漫步,详细研究一切山坡、峡谷、小溪、岩石、树木和花草。但是,正如对一切事物一样,对一个数学理论也如此——美,只能意会不可言传。”

在他去世后,他的继任者评价说,“凯莱不仅仅是一位数学家。他怀着唯一的目标……直到生命的最后一刻,始终坚持他一生为之奋斗的崇高的理想。他的一生对于那些认识他的人有着重大的影响:他们钦佩他的品格,犹如他们敬重他的天才。在他去世时,他们感到,一个伟大的人从这个世界上消失了。”

在漫长而多产的岁月里,凯莱对数学的多个分支作出了巨大贡献。

凯莱在19世纪下半叶群论的发展中起了十分重要的作用。在群论创始人伽罗瓦及其后的群论研究中,置换群居于中心地位,甚至有不少人认为群论就是研究置换群。正是凯莱第一个认识到,置换群的概念可以推广。在1849年发表的一篇论文中,他引进了不同于置换群的抽象群的概念,以后在1854年、1859年发表的两篇文章中他更进一步讨论了这一问题。但和伽罗瓦一样,凯莱的原创思想由于超前于其时代,以至于没有引起任何注意。其后一段时间凯莱把注意力转向了其他数学领域。1878年,他又猛然转回群论,并发表了多篇开创性论文。这些文章发表后,很快在数学界引起了反响。在其工作之后仅仅四年,关于群论的抽象的公理化定义就出现了。

在几何研究方面,凯莱的重要贡献包括:第一个引入了对纯数学及现代科学都非常重要的n维空间概念,详细讨论了四维空间的性质;把度量几何与射影几何统一在一起;在高次曲线、曲面方面,得到一系列重要结果;他以代数观点研究几何在当时也可谓独树一帜。

在行列式理论上,凯莱也有开拓性贡献。用两条竖线作行列式符号的做法最早由他在1841年给出,并被沿用至今。

凯莱还是矩阵论的先驱。他首先引入矩阵概念,规定了矩阵的符号及名称,讨论了矩阵性质,并得到著名的凯莱—哈密顿定理。

但奠定他最伟大名声的是他关于不变量理论的研究。作为这一理论的创立者与卓越的发展者,凯莱在这方面做了许多奠基工作,从而开创了19世纪下半叶研究不变量理论的高潮。受凯莱的影响,他的好友西尔维斯特在不变量理论的创立过程中也做了许多杰出而基本的工作,“不变量”(invariant)这个术语就是西尔维斯特引进的。凯莱与西尔维斯特也因而被称为“不变量的孪生兄弟”。

西尔维斯特(1814~1897)出生在伦敦一个犹太人家庭,正是这种出身及他对自己宗教信仰的坚持使他一生格外坎坷。

西尔维斯特

西尔维斯特原名叫詹姆斯·约瑟夫。他是兄弟姐妹7个中最小的,他父亲很早就去世了,母亲带着几个孩子过着艰难的生活。他的一个哥哥去美国做了一名保险公司会计师,并在那里取名为西尔维斯特,于是家中其他的孩子也跟着改名叫西尔维斯特。西尔维斯特早年上过私立学校。14岁时进入伦敦大学。但在一次与同学的口角中,他拿了餐厅的一把餐刀,企图与一名挑衅他的学生斗殴,结果因此被开除。15岁时,他进入利物浦皇家学院。在此期间,他的数学才能已经显现无疑。一个有趣的故事可以充分证实这一点:他在美国的哥哥看到美国彩票承办协会被一个排列问题困扰,于是就提议把这个难题交给自己16岁的弟弟。结果,西尔维斯特令人满意地解决了问题,并得到了500美元的奖金。

在学校中他成绩突出。然而因犹太血统和信仰,他经常受到排挤,并一度离开学校去了都柏林,后来在他表舅帮助下,才返回学校继续学习。1831年10月西尔维斯特进入剑桥大学圣约翰学院。1833年底因病在家休养,直到1836年1月。在此期间他仍顽强自学,1837年1月他参加了学院的荣誉学位考试,名列第二。但他却没有能获得学位。因为作为一个犹太人,他拒绝签署英国教会颁布的39条教规,而笃信教规在当时是获得学位的必要条件。1871年,当这一束缚被取消后,西尔维斯特才正式收到剑桥大学学位证书。

1838年,西尔维斯特受聘为伦敦大学学院的自然哲学教授。在此期间他很快将注意力转移到纯数学上。1839年,因为数学上的研究成果,25岁的西尔维斯特入选为皇家学会会员。然而,这并没有减少他生涯中的磨难。

1841年,西尔维斯特接受了美国弗吉尼亚大学数学教授的职位。27岁的他满怀青春热情走上新岗位。他根本没想到,自己3个多月后就会痛苦地结束这段历程。事情仍起源于他的犹太人身份。有学生因憎恨犹太人,在课堂上对他无礼冒犯。而学校的管理层对此却不置可否。痛苦与失望之下,西尔维斯特辞职了。

1843年,在美国几次尝试寻找工作都未能成功后,身无分文的他回到了英国。其后,西尔维斯特一度告别了学术生涯。他先做了一段时间的保险统计员,后又投身于法律界。在这段艰难岁月里,可能是为了谋生,他曾业余给私人讲授数学。其中一名学生后来变得比他更有名。这个学生就是后来闻名世界的医院护理改革家南丁格尔

1846年,西尔维斯特进入法律界,1850年获得律师资格。大约在1851年,西尔维斯特、凯莱这两位喜爱数学的人相识了,并由此结下了终生的友谊与合作。他们开始在从事法律业务的间隙,一起交流数学研究的成果。自此,西尔维斯特对数学的热情被凯莱重新激发起来。后来,西尔维斯特曾多次表达他对凯莱的感激之情“上面阐明的公理部分是在同凯莱先生的一次谈话中提出的……我感激他使我恢复了享受数学生活的乐趣。”“凯莱惯常讲的话都恰如珍珠宝石。”“凯莱,虽然比我年轻,却是我精神上的前辈——他第一个打开了我的双眼,清除了我眼里的杂质,从而使它们能看见并接受我们普通数学中更高深的奥秘。”

1855年,西尔维斯特终于有机会获得了一个数学教授的职位。他离开法律界并在伍尔维奇的皇家军事学院工作了15年。在此期间,他研究成果颇丰。然而,在这岗位上他过得并不是太开心。因为“他把自己首先看成是一个研究者,其次才是老师;学校的管理者却只把他当成一个老师对待,对他迫切希望能挤出时间从事自己的研究漠不关心”。期望值上的冲突,使他与学校一再发生矛盾。1870年,56岁高龄的西尔维斯特不得不退休,学校曾试图骗取他的一些退休金,但在经过力争后他得到了自己应得的。

其后几年,西尔维斯特过着舒适快乐的生活,没有做多少数学研究。对一个已经50多岁的老人来说,数学上有创造力的年代已经过去了吧?然而,1876年美国约翰·霍普金斯大学的邀请让他的人生又一次发生了转变。他再次横跨大西洋,到新建的霍普金斯大学当该校的第一位数学教授。其后,他在这儿过了七年,他一生最快乐也最有成果的七年。

西尔维斯特曾希望结合自己的教学主题,在一个高水准下做研究并且培养后继研究人员。这一理想在伍尔维奇未能实现,然而一些发生在霍普金斯的轶事让我们看到他在这所新大学里成功地做到了这一切。

一次,西尔维斯特宣布“要做三次新泛代数的讲座”。在第三讲的最后,他必须扩展到12讲。结果,这个学年余下的时间都用来讲新泛代数了。另一次,他要开一门置换理论课,用纳托的书。所有学生都买了课本,前三课西尔维斯特也是老实地照那本书讲的。接着他对某些矩阵问题感兴趣了,宣布他每周要讲一节矩阵。后来发现一节课不够,两个多星期后他把纳托忘在脑后,而且再也没讲过。另一则故事说:有一次,他走进来说,“有个值得注意的定理,我还没证明,但我感觉它绝对是正确的。下面是它的一些结果。”下一堂课时,他宣布上次说的那个值得注意的定理是错误的,又提出一个绝妙的修正,从它得出了美妙的结果。学生坐在下面,看着数学如何从熔炉里火热地产生出来。他当时的一个学生说:“所有感受到这种对创造力巨大渴望的青年人都赶往巴尔的摩,西尔维斯特则成了亚历山大城里的欧几里得一般。”

在新的工作中,西尔维斯特不仅可以干他想干的事,充分发挥自己的才干,而且深受学校的器重。为表达对他的敬意,校长曾于1876年11月为他主办了一个大型宴会,他的学界朋友和当地名流都应邀到场。

于是,西尔维斯特在他一生中最幸福、最平静的几年里,又成了一个精力旺盛的“年轻人”,燃烧着热情,焕发出新的思想,并开创、影响、推动了美国纯数学的研究。他在美国建立了第一个真正的数学研究计划,该计划采用了德国的模式,并且很快被芝加哥大学、哈佛大学和耶鲁大学采用。1878年,他在巴尔的摩创办了世界性数学杂志《美国数学杂志》,这是美国历史上第一个数学杂志,他为这本杂志写了30篇论文,对美国大学的数学研究有很大的影响。

1883年,70岁的西尔维斯特辞去霍普金斯大学的职位,回到伦敦担任牛津大学萨维尔几何学教授。1894年,80岁的西尔维斯特退休,晚年仍致力于数学的写作。1897年3月15日因中风瘫痪去世,享年83岁。他的丰富多彩的一生可以用他自己的话作一总结:“我确实热爱我的学科。”

确实,西尔维斯特为数学的发展不遗余力地贡献出全部心血。他一生共发表了300多篇论文,为数学特别是纯数学的发展作出了重要的贡献。他与凯莱、哈密顿等人一起开创了自牛顿以来英国纯数学的一个繁荣局面。

由于对数学的贡献,西尔维斯特一生获得过许多荣誉。1861年获皇家勋章,1880年获科普利奖章。1839年当选为皇家学会会员,1866年被选为伦敦数学学会的主席。

在知识兴趣的广度方面,西尔维斯特和凯莱相似。他的希腊文和拉丁文古典文学原著知识渊博而精确。他的许多论文都因为从古典文学中摘录了引文而更加生动。西尔维斯特还引进许多数学新名词,现代数学中一些术语如“矩阵”、“不变式”、“判别式”等都是他首先使用的。为此,他写道:“也许我可以冒昧地要求得到‘数学亚当’的称号,因为我相信我给数学理性产物起的名字(已经广为流传了)比当代其他数学家加起来还多。”

西尔维斯特还被诗和作诗的规则强烈吸引。1870年他还出版了一本名为《诗的规则》的小册子。一则故事可以说明他对诗歌和诗歌规则的强烈兴趣。

“西尔维斯特除了创作大量诗歌而外,还精美地翻译了一些贺拉斯和德国诗人的诗歌。他那押韵的杰作,是在巴尔的摩表演的,原是为了说明他在《诗的规则》一书里讲的作诗理论。他在皮博迪学院读他的罗莎琳诗,真是一场有趣的心不在焉的表演。全诗400多行,都以罗莎琳的名字为韵(i音可长可短)。大厅里座无虚席,都想从这场独特的诗歌实验里找到乐趣。但西尔维斯特教授发现有必要写出大量的解释性脚注。他宣布,为了不中断诗歌,他先把脚注读一遍。而几乎每个脚注都需要另外当场解说一番。于是,朗读者沉浸在一个个脚注里,几乎忘了时间,也忽略了听众的兴趣。当他解说完最后一个脚注时,一看表,才惊讶地发现他让大家听了一个半钟头的解说,而他们想听的诗歌正文还没开始呢。他一脸尴尬,而听众们爆发出欢快的笑声。接着,他请大家原谅,有事的人尽可自由离开,然后开始读他的罗莎琳。”

西尔维斯特还喜欢音乐,而且是一个有成就的业余音乐家。他曾跟著名法国作曲家高诺德学声乐,他有时还在工人集会上为工人们唱歌。据说,他常以自己的男高音嗓子而自豪。也许正是对数学与音乐两方面的喜好与深刻理解,使他说出一句名言:难道音乐不能描述为数学的感觉,而数学为音乐的理性吗?

然而,在其他几乎所有方面,西尔维斯特与凯莱都形成了鲜明的对比。

凯莱瘦长而结实,外貌看上去很虚弱;西尔维斯特则矮胖粗壮,给人以力气极大,充满活力的印象。凯莱的一生是平静的,西尔维斯特一生则像他自己苦涩地说的那样,把他的大量精力用在“与世界搏斗”上。在个性上,凯莱总是沉着、冷静,性情温和;西尔维斯特则活泼、热情,性情急躁,易激动、易兴奋、易发怒。

在文章风格上,凯莱的数学论文很朴素,推理充分、严密。与之相比,西尔维斯特的文章则奔放且激情洋溢,常包含着许多优美的、富有诗意的描述,而且总是毫不犹豫地用自己的直觉来代替严密的证明,缺少数学的严谨性。

凯莱的教学有准备、有秩序,西尔维斯特的教学则无准备、像漫谈。凯莱的讲演就是完成了的论文,西尔维斯特则常在课堂上创造数学。

凯莱似乎能过目不忘;西尔维斯特则甚至连自己的发现也记不住。一则故事说:有一次,西尔维斯特反驳一个同行的数学论断,坚持认为从没听人说过,也根本不可能是对的。于是,同行给西尔维斯特拿出一篇西尔维斯特本人写的论文,里面就有相关的发现,还有他写的证明。

凯莱读别人的数学成果,他的非凡记忆力使他通晓并能了解数学诸分支中已完成的各个重大成果。西尔维斯特则懒于读别人做过的工作,他很少去记忆定理或命题。每当他要使用某些定理时,就随时把它们推导出来。

凯莱的思想总是强有力的、稳定的、平静的;西尔维斯特的思想则有时像推动水车的水流那样汹涌湍急。

然而,奇特的是,当1846年两人的生活发生交叉后,两人却成了知交,成为志趣相投的一对,就像一对度蜜月的夫妻,只不过这友谊的一方从来不发脾气。两人在漫长岁月的交往中经常互相鼓励、携手并进共同完成了一些重要的数学研究。确立两人最伟大名声的不变量理论就是他们这一友谊的最大结晶。“不变量理论是在凯莱强有力的手中涌现出来的,但是它最后形成一个完美的艺术品,博得后世数学家们的赞美,主要是由于西尔维斯特的才智以其闪光的灵机妙想照亮了它。”也因此,贝尔在他著名的《数学精英》一书中称他们是“不变量的孪生兄弟”。

除不变量方面的重要发现外,西尔维斯特还在微分方程、椭圆函数和θ函数、数论等数学领域做了一些有益的工作。但他重要的贡献却集中在代数学方面。

西尔维斯特早期做过关于方程论的研究。从19世纪中叶,受凯莱影响,西尔维斯特与凯莱等一批数学家开展了对代数型的研究。所谓代数型是指包含n个变元的m次齐次多项式,最常见的是二次型。关于代数型的研究主要围绕着三个课题:一是对不变量的研究;二是二次型的化简;三是关于二次型正定性的判定。西尔维斯特在这三个方面都作出了重要的贡献。如在二次型的化简中得到著名的“惯性定律”;在关于二次型的判定中得到著名的西尔维斯特定理。

在行列式理论和应用方面西尔维斯特也作出了重要的贡献。19世纪的半个多世纪中,他是对行列式理论研究始终不渝的数学家之一。在对代数方程、二次型等的研究中他都应用了行列式这一工具,比如我们已经提到的他的析配法消元。1851年,在对一类行列式的讨论中,他还引进了初等因子、不变因子的概念。可以说,他为行列式的应用开辟了许多新的领域。

西尔维斯特还与凯莱共同发展了矩阵理论。

矩阵这个词是西尔维斯特于1850年首先使用的,他用这个词来表示“一项由m行n列元素组成的矩形排列”,因为由那个排列,“我们能形成各种行列式组”。也就是说,他使用这一术语是用于指称行列式的那个数学矩形阵列,他当时研究的只是行列式,并不是矩阵。几年后,他的好友凯莱将矩阵作为一个数学对象来研究,成为矩阵论的创立者。19世纪80年代,已成为那时最著名数学家之一的西尔维斯特把注意力转向了凯莱创立的矩阵论,并在这方面得到许多重要成果。其中一项是他的所谓零性律。这是矩阵论中关于矩阵乘积的秩的一个重要定理。西尔维斯特还对矩阵与其特征值之间的关系非常感兴趣,并得到许多发现:若A表示一个n×n矩阵,λ表示A的一个特征值,那么λj是矩阵Aj的一个特征值(其中Aj表示A自乘j次后得到的矩阵);λ表示A的一个特征值,那么λ-1是矩阵A-1的一个特征值。

随着矩阵论的创立,矩阵逐渐成为数学中最有力的工具之一。为有效使用矩阵,我们有必要简单介绍一下矩阵代数。为此我们先引入有关矩阵的一些定义。

一个行数为m,列数为n的矩阵称为m×n矩阵。比如,称为3×2矩阵。一类重要的矩阵是行数与列数都为n的矩阵,这种矩阵称为n阶方阵。比如,称为一个2阶方阵。在n阶方阵中,元素a11,a22,……,ann形成方阵的主对角线。特别的,若主对角线位置元素都为1,其余位置元素都为0,这样的n阶方阵称为单位矩阵,并记为I。

矩阵通常用大写英文字母表示,其元素用小写字母表示。如矩阵A的元素用aij表示,其中i表示元素所在的行数,j表示元素所在的列数,于是矩阵A可简记为[aij]。两个矩阵相等的要求非常易理解:它们具有相同的行数与列数,而且要求对应的元素都相等。

在给出了上述定义后,我们可以研究一下矩阵的运算了。

矩阵的加减法运算定义非常简单。

两个矩阵的和就是它们对应元素之和构成的矩阵。以3×2矩阵为例:

由两个矩阵加法运算的定义可以自然地得到数乘矩阵运算的定义。比如在上面两个3×2矩阵的和运算中,若后一矩阵与前一矩阵相等,则有

一般地,用实数c乘矩阵定义为c乘矩阵的每一项。以3×2矩阵为例:

完全类似的,两个矩阵的差,就是它们对应元素之差构成的矩阵。显然,两个完全相同矩阵的差得到的矩阵元素都为0,这种矩阵称为零矩阵。它在矩阵中发挥的作用与0在实数中的作用相当。

下一个似乎不那么显然的是矩阵乘法的定义。

首先一点,与两个矩阵行、列数相同时才能进行加减法运算不同,矩阵的乘法运算要求两个相乘的矩阵满足:第一个矩阵的列数等于第二个矩阵的行数。即m×n矩阵必须乘以n×p矩阵才有意义,而结果将得到一个m×p矩阵。比如一个3×2矩阵乘以2×3矩阵最后可以得到一个3×3矩阵:

下面我们要做的是搞清楚这个新矩阵的元素cij如何求得。结论是:每个数cij都是把第一个矩阵的第i行的各个元素与第二个矩阵的第j列各对应元素分别相乘,最后再求和。比如为了得到上面乘积矩阵中第一行、第一列的第一个元素c11需要进行操作:取左边矩阵中第一行中的第一个元素a11,乘以右边矩阵第一行第一个元素b11,得到乘积a11b11;然后将左边矩阵第一行第二个元素a12,乘以右边矩阵第二行第一个元素b21,得到乘积a12b21;最后把这两个乘积加在一起,即c11=a11b11+a12b21。简单说,它是由第一个矩阵的第一行各元素与第二个矩阵的第一列对应元素相乘后再求和。

乘积矩阵中的其他元素可以用相似的方法计算出来。比如,c12=a11b12+a12b22,它是第一个矩阵的第一行各元素与第二个矩阵的第二列对应元素相乘后再求和。再如,c23=a21b13+a22b23,它是第一个矩阵的第二行各元素与第二个矩阵的第三列对应元素相乘后再求和。这种把元素乘了又加的做法,看起来极为烦琐。但是一旦熟练了其中的技巧之后,会觉得矩阵乘法的计算过程实际上十分简单。

如此定义的矩阵乘法与我们通常所熟悉的数的乘法运算在性质上有些区别。如它不满足乘法交换律,即一般情况下AB≠BA。举一个简单的例子就可以说明这一点。

。下面我们分别计算一下AB、BA。

再比如,两个不为零的矩阵其乘积却可能为零。如:。这与我们所熟悉的数的性质“两个数的乘积等于零当且仅当这两个数中至少有一个为零”不同。这意味着,实数乘法的消去律“设a≠0,如果ab=ac,那么b=c”在矩阵乘法中不成立。

那么,为什么矩阵的乘法运算没有像加减法那样定义为“它们对应元素之积构成的矩阵”呢?原因在于这种自然定义出的矩阵乘法没有用途。而如上所定义的矩阵乘法却无论在数学中还是实际中都有着非常广泛的应用。

我们先举一个矩阵乘法在生活中应用的简单例子。

在人们现在的生活中,超市已经成为不可或缺的一部分。在超市消费时,我们会注意到,超市里的收银员记账、算账方式比传统的营业员要简单、利索、准确得多。说起来,这一切都要归功于超市的计算机管理系统和科学的数学工具,其中就包括处理数据的基本而重要的矩阵的应用。

我们从一个大大简化后的问题出发。假设超市中只有4种商品:蛋、糖、苹果、香蕉;只有甲、乙、丙3个顾客。我们假设4种商品的单价与单位利润如下:

我们假设3位顾客的购买数量为:

问题:在上面的假设下,计算出超市每笔生意的营业额与利润额。

对此,我们不难按通常的方法计算。比如以甲为例,他购得鸡蛋3斤、糖1斤、苹果2斤、香蕉5斤,于是他为超市贡献的营业额为:3×3+1×2+2×4+5×5=44元。他为超市贡献的利润额为:3×0.1+1×0.2+2×0.4+5×0.5=3.8元。同样的,可以计算出乙、丙两位顾客为超市贡献的营业额与利润额。

但我们也可以用更简单的矩阵的方法考虑这个问题。

先把上面两个表格表示为两个矩阵,其中第一个矩阵是购货的数量矩阵,第二个矩阵是单价和利润构成的矩阵。

计算AB,有AB=

这一乘积中的第一列表示了每笔生意(分别由甲、乙、丙所贡献)的营业额,第二列则表示了每笔生意(分别由甲、乙、丙所贡献)的利润额。

当然,真正超市中货物、顾客都比我们的假设多得多,而且超市还要考虑每笔生意所产生的其他指标额(如成本、损耗等),但这只意味着所要考虑的矩阵含有更多的元素,其道理是相同的,都可以通过矩阵乘法来解决。至于具体计算,手工做起来当然非常烦琐、复杂,而且容易出错。但因为矩阵乘法有确定的公式可用,因此只要把数据交给计算机,相同的工作在非常短的时间内即可完成。

在介绍了矩阵的加、减、乘运算后,下面再来看一下矩阵的除运算。

我们先从另一个角度看一下普通乘法的情况。对任何一个非零的数a都存在数b(b=1/a),使得ab=1,数b可称为数a的乘法逆元。于是,可以通过乘法自然地定义除法:一个数b除以a,相当于乘以其逆元(即其倒数1/a),也就是b/a=b·1/a。

与之类似,如果在矩阵乘法中,一个矩阵A存在乘法逆元,那么我们可以用同样的方法引入除运算。而为了引入矩阵的乘法逆元,我们首先要把讨论的范围限制在n阶方阵中。

对一个n×n矩阵A,若存在一个矩阵B,使得AB=BA=I,则称A是可逆的(或非奇异的),矩阵B称其为乘法逆元,并记为A-1。其中I表示单位矩阵,它在矩阵乘法中起着类似于数1在实数中的作用,即对任意矩阵A,有IA=AI=A。

下面我们就可以看一下对非奇异矩阵如何定义矩阵的除法运算了。比如矩阵C除以矩阵A。这无非是要找矩阵B,使A·B=C。为了找出B,我们在A·B=C两边同乘以A的乘法逆元,即A的逆矩阵A-1,于是有A-1·A·B=A-1·C,由于A-1·A=I,而IB=B,因此我们得到B=A-1·C。这样,矩阵的除法就由乘法定义出来了:矩阵C除以矩阵A,相当于用A的逆矩阵A-1去乘以C。这与我们上面刚提到的实数中除法通过乘法定义的思路是完全相同的。只是在这里我们再次遇到了矩阵乘法与普通乘法的一个重要差别:对于实数来说,任何一个非零实数都存在乘法逆元(即其倒数),但矩阵则不同,并不是每一个n阶方阵都有乘法逆元。若一个n×n矩阵A不存在乘法逆元,则称其为奇异的。在矩阵中,只有对非奇异矩阵才可以通过乘法逆元引入除运算。

紧接着的问题是:对任意给定的n阶方阵,如何判定它是否可逆?若可逆,如何求其逆矩阵?

对第一个问题,我们可以给出非常简捷的答案:n×n矩阵A都可对应一个行列式。若A≠0,则A非奇异或可逆(事实上,逆命题也成立,即A可逆,则A≠0);若A=0,则A奇异或不可逆。

比如说,矩阵。对第一个矩阵,因为3×2-4×1≠0,所以它可逆。对第二个矩阵,因为2×2-4×1=0,因此它不可逆。在这里,我们再次看到了行列式的理论应用。不仅如此,应用行列式还可以回答第二个问题,即用行列式可得出可逆矩阵的逆矩阵。结论是:,其中A*称为A的伴随矩阵,它是由元素aij的代数余子式Aij按下述方式排列而成。

举一个简单的例子来看一下。已知,求A-1

先求,又A11=5,A21=-3,A12=-4,A22=2,因此应用上面的结论有:

当然,当矩阵的阶数大时,这种方法的运算量相当大,因此它并不经常使用。真正常用的求逆矩阵的方法是借助矩阵的初等变换。对这种方法,我们这里不再多做介绍。但我们有必要在介绍了如此多的矩阵代数之后,再简单提一下它的一种应用:求解线性方程组。比如求解

我们可以先把这个方程组转化为矩阵的形式:。于是为了解出x, y,我们在两边同乘以的逆矩阵,于是有。利用上面的方法可求得,于是。因此所求解线性方程组的解为:x=1,y=2。

看起来,这比我们用代入法或加减消元法还要复杂。但整个过程中真正烦琐的是求逆矩阵。而这一步现在完全可以交给计算机处理。于是,当求解大型的线性方程组时,这种借助矩阵代数的方法就变得非常有价值了。

矩阵代数的价值还可以通过矩阵与变换的关系体现出来。

在坐标系中,把一个图形从一个位置移到另一个位置,称为坐标变换。比如,我们可以将直角坐标系XOY内的每一个点旋转θ,这样的变换称旋转变换。再比如,我们可以将直角坐标系XOY内每一个点的横坐标变为原来的k1(k1≠0)倍,纵坐标变为原来的k2(k2≠0)倍,这样的变换称伸缩变换。如果原来旧的坐标用x, y表示,而新的坐标用x′,y′表示。那么,旋转变换的坐标变换公式可表示为:,而伸缩变换则可以表示为:。除此外,我们还可以定义反射变换、切变变换、投影变换等。这些几何变换都具有形式,其中a, b,c, d都是常数。这种形式的几何变换统称为线性变换。针对线性变换的如上形式,我们可以引入一个二阶矩阵。容易发现,线性变换可以由这个矩阵唯一确定。反之,这个矩阵也可以由线性变换唯一确定。因此,在取定的直角坐标系中,二阶矩阵与平面上的线性变换是一一对应的。这样,我们就可以通过这个二阶矩阵来研究对应的线性变换。反过来,也可以通过平面上的线性变换来了解对应的二阶矩阵的情况。比如,我们可以从线性变换的角度理解矩阵乘法定义的由来。

假设我们做了一个线性变换g,这一变换可表示为:。在做完第一次变换之后,假设我们又做了第二次变换f,所依据的是如下的变换公式:。于是,出现了这样一个问题:如何让这两个变换一次完成,而不是这样一次接着一次地做?能否找出一个结合两次变换的公式呢?

方法很简单,我们仅需把第一个变换代入方程组中的x′和y′。即有:

x″=ax′+by′=a(Ax+By)+b(Cx+Dy)

y″=cx′+dy′=c(Ax+By)+d(Cx+Dy)

对这一结果稍加整理有:

至此,我们找到了一个变换公式,这个新的线性变换相当于连续施行两次线性变换(先施行变换g后施行变换f)的效果,称为变换g与变换f的复合变换,可记为f·g。

下面,我们再从矩阵的角度分析一下上述结果。显然,上面的线性变换f与变换g及最后得到的复合变换f·g可以用矩阵分别表示为:

而不难发现,

这意味着,连续实施前两个变换的结果,可以用矩阵乘法规则得出来(注意,将两个变换矩阵并排写在一起,第二个变换写在左边,第一个写在右边),即有:

这样,我们就从几何变换的角度重新理解了矩阵乘法定义。进而,我们也可以由此理解矩阵乘法的性质。比如,我们可以注意到变换中的次序问题。先施行变换g后施行变换f,称为变换g与变换f的复合变换,记为f·g;但如果是先施行变换f后施行变换g,则称为变换f与变换g的复合变换,并记为g·f。而且一般地,f·g≠g·f。我们可以举一个简单的例子。

如下所示,第一幅图表示的是:先做横坐标不变纵坐标缩小一半的伸缩变换,然后再做旋转90°的旋转变换。而第二幅图表示的是:先做旋转90°的旋转变换,后做横坐标不变纵坐标缩小一半的伸缩变换。非常明显,虽然两个变换相同,但因为完成的次序不同,最后得到的复合变换结果也完全不同。

把上面几何变换的结果转换为矩阵语言。横坐标不变纵坐标缩小一半的伸缩变换g可用矩阵表示为,旋转90°的旋转变换f可用矩阵表示为。于是复合变换f·g用矩阵表示为,而复合变换g·f用矩阵可表示为则表明。即矩阵乘法不满足交换律。

类似地,我们可以从几何变换的角度理解矩阵乘法不满足消去律。我们还可以从几何变换的角度理解更多有关矩阵的情况。如,我们可以进一步体会数乘以矩阵的运算。再如,我们可以从这一角度思考逆矩阵的概念并理解逆矩阵的性质等。

当然,反过来看,引入矩阵又为研究变换提供了基本的工具。从矩阵与变换的这种对应中,我们可再次体会到矩阵应用的广泛性。

最早的矩阵思想应用于求解线性方程组,并且可回溯至中国古代的《九章算术》。在解线性方程组时,中国古代数学家虽然没有提出矩阵概念,但其所使用的方法实质上相当于现代对方程组的增广矩阵施行初等行变换从而消去未知量的方法。在西方,关于线性方程组的求解最初是通过行列式解决的。直到19世纪,高斯才提出了与《九章算术》中方法实质相同的方法,所以这一消元方法在西方被称为高斯消去法。

1861年,英国数学家史密斯(1826~1883)在讨论n个未知数的m个线性方程组求解问题时,首次使用了增广矩阵和非增广矩阵的术语。其后,英国数学家道奇森(即以《爱丽斯漫游奇境记》闻名的卡罗尔)证明了含有n个未知数m个方程的方程组相容(即有解)的充要条件是系数矩阵和增广矩阵的秩相同。这是现代方程组理论的重要结果之一。

虽然解联立线性方程组时可以利用矩阵,但蕴藏着深刻内涵的现代矩阵概念却不是来自于此。正如矩阵创立者凯莱所指出的:“我决然不是通过四元数而获得矩阵概念的。它或是直接从行列式的概念而来,或是作为一个表达方程组的方便的方法而来的。”

从行列式的研究中引出矩阵概念可以说是一种非常自然的方式。因为行列式、矩阵两者之间有着极紧密的联系。一个行列式总是联系着一个数字方阵,行列式是有关这个方阵的一个数值,因而可以把行列式表述成矩阵的函数,甚至可把行列式论看做是矩阵论的一个组成部分。这意味着,从逻辑上而言,矩阵的概念应先于行列式的概念。然而在历史上这个次序正好相反。18世纪,人们只关心以方阵的行列式定义的数值,对方阵本身并不注意。在行列式的研究获得重大进展后,人们才逐渐意识到,与行列式相比,这种数学方阵本身能够给人们提供更多的有关方程或变换的信息,方阵本身有单独加以研究的必要。

矩阵概念引入的这种推迟带来的一个结果是:矩阵在其诞生之前就已经发展得很好了。事实上它的一些基本性质在其提出之前已经在行列式中发展建立起来,因此当矩阵概念引进之时,关于它的基本性质就已经清楚了。

把矩阵作为方程组和变换的一种紧凑的表达式从而引入矩阵概念同样是很自然的。在上面我们已经对此做过介绍,而这正是凯莱引入矩阵的途径。也就是说,凯莱是在研究线性变换时,为了简化记号引进矩阵的。不过,凯莱作为矩阵理论的创立者,其更重要的贡献在于他首先把矩阵作为一个独立的数学概念提出来,将矩阵作为一种数学对象进行研究,并首先发表了关于这个题目的一系列文章。

特别是在1858年发表的关于矩阵的重要论文《矩阵论的研究报告》中,凯莱系统地阐述了关于矩阵的理论,引进了矩阵的一系列基本概念与运算。其中,他用单一字母A表示矩阵,定义了矩阵的相等、零矩阵、单位矩阵,给出了我们上面所介绍的矩阵加法、数乘矩阵、矩阵乘法的定义。由于他是从线性变换的角度引入的矩阵,因此他非常自然地给出了我们已介绍过的矩阵乘法的定义。凯莱还指出,矩阵加法满足结合律和交换律,并强调矩阵乘法是可结合的,但一般不满足交换律。他还断言,两个矩阵的乘积为零无需其中有一个为零矩阵。文章中,凯莱还给出了转置矩阵、对称矩阵、斜对称矩阵,特别是逆矩阵的定义,并给出了求矩阵的逆矩阵(如果存在)的一般方法,即A-1=1/|A|A*。此外,凯莱还引入了方阵的特征方程、特征值的概念,并给出了著名的凯莱—哈密顿定理:任一方阵都是其特征方程的根。他在3×3的情形下验证了这一定理,但没有给出一般的证明。

凯莱在矩阵方面的工作最初没有引起人们太多的注意。在英国以外的地方,他的工作更不为人知。因此,凯莱的许多思想是后来在其他地方重新发现的。19世纪80年代,西尔维斯特把注意力转向凯莱30年前提出的问题,重新做了凯莱曾做过的工作。西尔维斯特的这些工作及其他对凯莱贡献的赞扬与强调,使凯莱的早期发现引起了人们的注意。凯莱也由此确定了矩阵论创立者的地位。

然而,西尔维斯特的成就远不止重新发现了凯莱的工作。由于对行列式深有研究,这使他能通晓许多对矩阵论来说非常重要的问题,从而得到许多新的有开创性的结果。他也成为矩阵论的创立者之一。

大约在同一时期,还有许多数学家对矩阵理论的创立与发展作出了贡献。如德国数学家艾森斯坦(1823~1852)和法国数学家埃尔米特(1822~1901),特别是德国数学家弗罗贝尼乌斯(1849~1917)进一步把矩阵理论系统化了。

1878年,弗罗贝尼乌斯将行列式中的不变因子和初等因子概念引到矩阵理论中,以合乎逻辑的形式整理了不变因子和初等因子的理论,并证明了“矩阵A, B等价的充要条件是A和B有相同的初等因子或不变因子”。同时他还给出了“正交矩阵”的正式定义,探讨了正交矩阵的性质,并对合同矩阵、矩阵的相似变换等进行了研究。此外,他还提出了矩阵的最小多项式(即矩阵满足的次数最低的多项式)问题。1879年,他又利用行列式引进了矩阵论的重要概念:矩阵的秩。弗罗贝尼乌斯的工作完成了方程组的解和各种特殊类型的矩阵的性质的研究。

在这一时期,矩阵论中的许多重要课题都得到了深入的研究。如特征值理论、把矩阵化为标准型。

特征值理论在1870年之前是以其他形式出现的。如在天体力学中,微扰问题就涉及特征值问题,尤其是对于特征值何时为实数难于确定。1829年,柯西证明,对称矩阵的特征值是实的。1855年,埃尔米特推广到埃尔米特矩阵(即矩阵等于其转置共轭),并证明埃尔米特矩阵的特征根也是实的。

在标准型研究方面,若当于1870年证明,如果矩阵可变换到一个相似矩阵,那么它具有若当标准型,从而建立了矩阵的若当标准型的完整理论。所谓两个方阵A, B称为相似,即指存在一个非奇异矩阵P,使得B=P-1AP。这一概念可追溯到法国数学家柯西。德国数学家维尔斯特拉斯在1868年又证明了,两个相似矩阵的特征方程相同。

随着这些工作的完成,矩阵论的经典内容建立起来了。可见,尽管矩阵概念比行列式的提出晚一个世纪,但它的发展是很快的。原因在于人们构想出矩阵的概念之前,行列式论、谱论以及线性方程组都已经体现了矩阵的许多基本性质,因此矩阵的许多性质在矩阵概念被引进之前就搞清楚了。

在矩阵论的初等工作完成后,在19世纪末和20世纪初,矩阵研究又沿着几个方向发展下去。1892年,美国数学家梅勒茨(1863~1943)引入了矩阵的超越函数,如eM,lnM, sinM……(其中M为矩阵);主要是为了适用方程发展的需要,其他几位数学家将矩阵推广到无穷阶的情形;由于物理学的需要,矩阵的元素又由普通的实数、复数扩充到抽象域。这些理论在20世纪都得到进一步发展。矩阵方程论、矩阵分解论和广义逆矩阵等矩阵的现代理论也逐步发展起来。矩阵经过发展,已成为独立的一门数学分支——矩阵论。

与此同时,矩阵的应用也日益广泛。事实证明,这一分支的高度有用性是凯莱等创始人根本不可能预见的。我们先来看矩阵在数学内部得到应用的例子。

我们已经介绍了矩阵在解线性方程组中的应用。除此外,在实际求解方程个数比较多的线性方程组时,人们还发展了各种数值解法。现在,在实际求解线性方程组时,线性方程组的数值解法在计算数学中占有重要地位。而在各种数值解法的研究中,矩阵都是一种有力的工具。

此外,矩阵论在坐标变换、微分方程问题等方面也有重要应用。更奇妙的是,矩阵还在“环论”这个特殊的数学领域显示了自己的重要价值。环与群、域一样都是抽象数学中的研究对象。环论往往非常抽象,但因为各种n×n矩阵的集合连同运算可以构成一个具体的环的例子,因此人们可以把一个特殊的环表示成一个n×n矩阵的集合。通过这种矩阵表示,数学家们就可以把环理解成具体的,甚至是可以计算的问题,而且能使科学家们去运用数学理论家的那种非常抽象的思想。这种用矩阵集合来表示环的方法,已经成为当代数学、物理学以及理论化学的一个重要组成部分。

除在数学内部的应用之外,矩阵还广泛应用在实际生活、科学以及现代科技的各个领域。

其中一个典型例子是矩阵在物理学中的应用。在凯莱创造出矩阵60~70年后,1925年,德国著名物理学家海森堡发现,矩阵代数正是量子力学所需要的工具。物理学家要做的所有事情就是应用先前发展起来的数学。这使数学家泰特“凯莱正为未来的一代物理学家锻造武器”的预见成真。此外,矩阵也应用在结构力学、线性电路等物理领域。

除物理学外,矩阵还成为在生物学、经济学中有大量应用的数学分支。特别是,大量的科学技术问题,最终往往归结为解线性方程组。而由于解线性方程组的多种多样的方法都和矩阵分不开,这就使矩阵的应用范围不断地扩大到更多的领域。

20世纪随着电子计算机的出现与迅猛发展,还出现了一门研究用计算机来解决数学问题的数学分支:数值分析。而矩阵代数则是数值分析所用程序的必不可少的组成部分。在这些方面,人们需要处理很大的线性方程组,而表示方程的矩阵可能有成千上万项。解决这些问题需要应用矩阵理论,反过来,对矩阵理论的这些应用又刺激、促进了矩阵论的进一步发展。不夸张地说,成为普通数学教育一部分的矩阵已经是应用数学的基础了。

在行列式、矩阵的创立与发展历史中,我们还可以深切体会到恰当的符号在数学中所起的举足轻重的作用。确实,许多数学的进展都是由改良的符号体系所推动的。这里我们先以代数学(主要是方程)为主线,谈一下数学符号的发展历史。

1842年,G·H·F·内塞尔曼恰当地划分出代数学符号历史发展的3个阶段:第一阶段,称为文词代数,即对问题的解,不用缩写和符号,而是写成一篇论说文。第二阶段,称为简字代数,即对某些较常出现的量和运算采用缩写的方法。第三阶段,称为符号代数,即对问题的解,多半表现为由符号组成的数学速记,这些符号与其所表现的内容没有什么明显的联系。

早期的所有代数学都是文词代数。我国的《九章算术》是一个很好的例子。其所有的内容——问题、解以及求解方法——都只用文字和数,而不用数学符号表示,其中没有“等号”,没有表示未知量的x,也没有现在学习代数学时使用的任何其他的符号工具。

第一个进入第二阶段的是古希腊的丢番图,在《算术》中他第一次系统地使用了代数符号。其创设的符号多半采自相应文字的字头。虽然其符号还很不完整(比如当问题涉及另一个未知量时,丢番图没有引入第二个未知量的记号等),但与前人相比,他在发展专门的符号体系方面向前迈进了一大步,将代数记号的发展推进到一个新的阶段,并把代数学中的方程从冗繁的语言文字表示成简洁的符号。

在丢番图之后,完成这一点的是古印度。7世纪古印度数学家婆罗摩笈多在发展数值代数的过程中引入了未知数的数学符号,而且不限于一种,除第一个未知数用ya(来自许许多多一词的第一个音节),其他的几个未知数都采用不同颜色的第一个音节,如第二个未知数用ka(来自黑色kalaka一词的第一个音节)。其他的第三个、第四个、第五个、第六个未知数则分别用蓝色、黄色、白色、红色的第一个音节来表示。用他本人的话说,“这许许多多,以及黑色、蓝色、黄色与红色,此外还有其他颜色,都可被尊敬的教师们选用来代表未知数的数值,以便进行计算。”另外,婆罗摩笈多还引进了平方(在一数后面写上va,表示该数的平方)、立方(在一数后面写上gha,表示该数的三次方)、平方根(在一数的前面写上ka,表示该数的平方根)和减法(在减数上面加个点)、乘法(在各乘积因子后面写上bha)等数学符号。这些缩写符号同样都来自对应字的第一个音节。于是用他所引入的代数符号,方程3x2+10x-8=x2+1可表示成:

其中ya表示未知数,va表示平方,ru表示常数项,数字上面的点表示该数是负数(或说减去该数),数字系数写在表示未知数的符号的后面,用并列表示加法。

再比如,8xy+√10-7可表示成ya ka 8 bha ka 10 ru,其中bha表示相乘,ka表示平方根。

婆罗摩笈多的这套代数符号确实有许多独到之处,其符号化水平超过了丢番图,这也是古印度对代数学作出的又一重要贡献。

晚于古印度,中国代数符号化的尝试始于宋元时期,这就是“天元术”和“四元术”的发明。两者都是用专门的记号来表示未知数,从而列方程、解方程的方法,可看做是一种半符号式的文字代数。

我们先简单介绍一下天元术如何表示一个方程。在最初的天元术中,不懂得用统一符号表示未知数的不同次幂,当时是用“人”表示常数项,未知数x的各次幂x, x2,x3,……,x9分别用“天”,“上”,“高”,“层”,“垒”,“汉”,“霄”,“明”,“仙”表示。而x-1,x-2,x-3,……,x-9分别用“地”,“下”,“低”,“减”,“落”,“逝”,“泉”,“暗”,“鬼”表示。以后经过简化,用“天元”、“地元”分别表示未知数的正幂和负幂,用“太”表示常数项。李冶进一步加以改进,取消“地元”,只用一个天元表示未知数。其具体方法是:先确定未知数一次项系数的位置,在其右侧记一“元”字(或者先确定常数项的位置,在其右侧记一“太”字),其余各项系数从上到下按降幂(或者可约定按升幂)排列。如果方程有负系数,就在这系数的个位筹码上加一斜划。比如,方程2x2+14x-31=0可表示为:

再来看一下朱世杰的四元术表示法。按莫若为《四元玉鉴》所写的序言所记述,四元术是“其法以元气居中,立天元一于下,地元一于左,人元一于右,物元一于上,阴阳升降,进退左右,互通变化,错综无穷”。其中前几句说明的就是如何用天、地、人、物四元表示四元高次方程组。具体而言,先把常数项放在中央(元气居中),并在其右侧记上一个“太”字;天、地、人、物四元(我们可以分别用x, y,z, u表示)和它们的乘幂的系数分别列于“太”字的下、左、右、上。除此外,还会出现两个不同元及它们的幂的交叉项。对此的处理是,两个相邻不同元及它们的幂的交叉积相应地列于左下、右下、左上、右上4个角内,即把xy, yz, zu,……,x2y, y2z, z2u……各项系数依次放入相应位置中。如图为四元布列方式:

但至此为止还存在一个问题,不相邻之元及其幂的交叉积(如yz, xw等)的系数仍无相应位置,对此的处理方法是把它们寄放在相应的间隙位置上。

举几个例子看一下这种表示方法。

如下左图是比较简单的四元一次式x+y+z+u的筹式表示图;而右图是稍复杂的四元二次式x2+y2+z2+u2+2xy+2xz+2xu+2yu+2yz+2zu的筹式图:其中2xy,2yz……等的系数置于相应的格子中,而不相邻的两个未知数的乘积2xu,2yz被放在了夹缝处。而如此表示的四元式,既可表示一个多项式,也可以表示相对应的方程。

我们还可以举朱世杰《四元玉鉴》一书中出现的两个例子。如下分别表示了方程-x2+3xy-2xz+x-y-z=0(《四元玉鉴》卷下“三才变通”第1题)及2u4-u3-u2+3u-8z2+2xz+2xy+6yz=0(《四元玉鉴》卷下“四象朝元”第6题)。

在四元术这种表示法的基础上,还可以进行多项式的加减乘除运算。其做法简言之即莫若序言记述的后几句“阴阳升降,进退左右,互通变化,错综无穷”。但由这种表示法的复杂就可以体会到真正进行这类运算的复杂性。

不难看到以算筹为运算工具的四元术,有着不可避免的局限性。因为四个未知数已把“太”的上下左右占满,第五个未知数再无容身之地,所以不能再增加方程组元数,更不能讨论一般的n元方程组了。这便限制了方程理论的发展,尤其是限制了方程组的一般化程度。

突破这一局限性的是日本算圣关孝和。在继承中算“天元术”的基础上,关孝和创立了所谓“傍书法”。这种具有东方特色的符号代数,使用汉字或用汉字偏旁部首作为简字代数符号,将复杂的筹算布式以简单的文字算式表述出来,克服了“天元术”的缺点,突破了中国古代“四元术”中元数限制,也比筹的运算简便了许多。这种笔算式代数的使用与盛行后来成为和算史上的一大特色。后来这种笔算代数被改称为“点窜”。而用傍书法系统地研究公式变形、解方程(组)、行列式等问题就称为点窜术,其内容相当于现在的初等代数学。由于点窜列出的方程,系数不是数字而是文字,未知数的个数也可以不止一个,所以具有代数的一般性。这就为数学以后的发展开拓了新的天地,特别是扩充了与解方程有关的数学领域,如行列式等。也正是在这种更优越的代数符号的基础上,日本和算在众多方面超越中算取得了骄人的成就。

然而,与古中国、印度、日本不同,阿拉伯在代数符号应用方面却出现了倒退。在花拉子密的《代数学》中完全没有使用代数符号。随着《代数学》约1140年被译成拉丁文,西方接受了其内容、思想和方法,也包括这种文词代数。这一状况一直持续到14~15世纪才得以改变。随着实用算术和方程研究的发展,许多西方国家都自发地出现了一些表示各种运算和未知量的幂的数学符号。如1494年,意大利数学家帕乔利用co表示未知数,用ce表示未知数的平方……由此,欧洲也进入到了简字代数阶段。比如,卡尔丹在1545年用x2+2x=48。但一段时间里,这类代数符号的使用是比较混乱的,不同的数学家采用了不同的代数符号。

在代数符号的进一步发展过程中,向前迈出重要一步的是法国数学家韦达。1591年,他开始采用辅音字母B, D……表示常数,用元音字母A, E……表示未知数。这种在现代人看来十分简单,但在当时却具有突破意义的处理方式使得人们有可能写出具有任意系数(也就是不再限于数字系数)的代数方程和对它们进行运算,这也使得人们可以普遍地讨论整个一类方程的求解方法及性质,并使人们构建通用的方程理论成为可能。韦达的思想是先进的,但他所引入的符号并不优良。如在表示乘幂时,他将D2写作D.quad,将D3写作D.cubum等。

之后,法国数学家笛卡儿在1637年给出了代数符号的现代形式,即用英文最前面字母a, b,c表示已知量,而用最后面的几个字母x, y,z表示未知量。他还创造了正整数指数幂的现代表示法。如他使用了5a4的记法;不过,笛卡儿一般将b2写作bb。于是,在他的著作中我们可以看到他用x3-9xx+26x-4∝0表示方程x3-9x2+26x-4=0。可以注意到,笛卡儿的表示中使用了运算符号,只是有的与现在还有差别,如他是用∝表示相等。

事实上,运算符号的引入也是很晚的事情。在很长的时间里,人们都没有引入运算符号,如在方程的表示中只是把各项并列在一起表示相加,而没有“+”;而表示方程的“=”或者没有使用(如在中国天元术中没有等号,所以一个筹式既可以表示多项式也可以表示对应的方程)或者用单词表示(如卡尔丹、韦达等用aequatur表示相等)。

由于缺少运算符号,尤其是缺少等号,这样的代数只可称为“半符号代数”。符号代数只有当运算符号被使用时才算完善了。

运算符号的引入开始于14~15世纪。其中,“+”、“-”于1489年由德国数学家最早引入;“×”最早由英国数学家于1631年引入;“·”由莱布尼兹于1698年提出;“÷”最早由瑞士数学家于1659年引入;1684年莱布尼兹用“:”作为除号;“=”最早由英国数学家于1557年引入。然而,这些符号由引入到被普遍采用还往往要经过几十年甚至更长的时间。如“=”在引入后,直到17世纪晚期才为人们所接受。1693年,英国数学家沃利斯用x4+bx3-cxx+dx+e=0表示x4+bx3-cx2+dx+e=0。与现在表示法唯一的不同之处是x2用xx表示。至于这一点,直到数学家高斯于1801年采用x2表示xx后,x2才终于变成了标准记法。

还有一点是下标记号的引入。这个想法出现于牛顿和莱布兹的著作中。于是,在经过一段漫长的演化过程后,到17世前后时,人们终于有可能写出多项式方程的一般形式a0xn+a1xn-1+……+an-1x+an=0,这使表述和证明代数学中的一般理成为可能。

数字符号化,标志着数学上一次真正进展的出现,它表明一种较算术而言“更有力的工具和更简单的方法”,即“代数学”的出现。

虽然与代数学密切相关的方程思想出现得很早,但完全意义上的代数学,只是在符号化体系引入后,才获得真正的新生。随着引入符号,并且对未知数进行演算,代数学成为一门独立的学科。从丢番图到韦达和莱布尼兹,在经历了13个世纪之久后,代数学终于变为我们今天所知的形式。从算术走向代数,关键的一步是数学符号化,而完成这一步竟花了人类上千年的时间。

代数把算术提高到一个新的水平,但却比算术容易,而且从“代数”的角度来理解“算术”可以理解得更深刻,这样就可以把“算术”中一些复杂的,处理个别问题的方法抛到一边去。这正是符号化的功绩。正如数学史家克莱因所说:“代数上的进步是引用了较好的符号体系。这对它本身和分析的发展比16世纪技术上的进步更为重要。事实上,采取了这一步,才使代数有可能成为一门科学。”

我们可以透过落后符号对中国数学发展的不利影响,进一步体会到符号对数学发展的重要性。中国数学名著《九章算术》使用的是文词代数。进入宋元后,随着天元术、四元术的问世,中国传统数学开始向符号代数迈进。然而当时所使用的数学符号却有着明显的缺陷。一是数量少,二是不简便。第一点与对算筹的依赖有关,因为用筹演算是无需四则运算符号及等号的,因此在中国一直缺少运算符号和表示一般量的符号。于是用金元时期那些不完备的符号,不仅无法表示高于四元的数值方程,而且连一般形式的二次方程也都表示不了,更不用说进行严格的理论证明了。金元时期的数学理论达到一定深度后没有继续发展,符号的缺陷无疑是原因之一。正如卡约黎在《数学符号史》中所写:“中国古代数学在14世纪以后停滞不前的事实,主要是由于它不完善的、无适应性的符号。”

与之形成对照,和算之所以在江户时期能够在继承中算的基础上取得许多优秀的成果,其原因之一就是它使用了较为先进的傍书法符号体系。其创立对和算的发展具有深刻的意义。由于整个学术语言的改变,提高了和算在思维及演算上的自由度,使和算沿符号化代数方向演进。

在欧洲,为适应笔算的特点最终发展起完善的符号系统,宣告了代数学的出现,正是以此为开端,欧洲数学开始进入快行道。可以说,正是由于大部分符号化在16世纪末已出现,才产生了17世纪的数学黄金时代。

“卓越的符号法产生卓越的思考”,数学符号的进步是数学产生飞跃性发展的必要条件。可以说,数学符号体系从整体上调控着整个数学理论的发展进程:数学发展的内部因素不断促进符号体系的改革,而符号体系的改革又进一步推动数学系统的发展。

在18世纪,数学符号得到进一步发展,其中一部分符号与微积分学的发明密切相关。莱布尼兹为此作出了重要贡献,他所创设的微分、积分等优越符号被广泛接受并使用至今。这一时期,瑞士著名数学家欧拉引入了第一个被普遍采用的变量运算符号,即函数符号f(x)(1734)。由于欧拉的工作,许多特定函数(包括三角函数)的符号都标准化了。欧拉还首先或较早使用了符号e,π,i,从而使它们被普遍采用。

在19世纪,符号的作用变得更加重要,并产生了许多新的符号。数学家们力图使基本数学符号标准化。正是这时一些广泛采用的现代数学符号出现了,如绝对值符号(1841),等等。突显出符号重要性的一个现象是,19世纪许多新理论的出现与大发展都与适当符号的使用密切相关。

“优良的数学符号和生动的概念是数学思想产生的动力和钥匙”。本编所介绍的行列式符号与矩阵符号的引入为此提供了典型例证。

从表面上看,行列式和矩阵的产生只是数学语言的改革。在使用行列式和矩阵之前方程和变换的表达方式是冗长的,而它们则提供了紧凑的表达式。也就是说,对于已经以较扩展的形式存在的概念,行列式与矩阵是速记的表达式,它们本身并没有说出方程或变换所没有说出的任何东西。然而,数学发展的历史却表明,行列式与矩阵都是高度有用的工具,其应用范围在使用过程中不断地得到扩展,在现代数学中发挥着显著的作用。这再次证明了数学符号的威力,没有它们不仅仅是让问题的叙述变得复杂而困难。事实上,许多数学理论如果没有适当的符号就不能发展。

19世纪在使用符号方面还有一个突出现象,即表示关系的符号所占比例显著增加,其中包括同余关系≡、从属关系∈、同构关系≌,等价关系~,等等。我们在下一编会简单介绍其中的同余。德国数学家高斯在引入这一概念的同时引入了同余符号≡,我们会看到这一优越符号的使用促进了同余论的发展。

在20世纪,又出现了一个广泛使用数学符号的数学分支——数理逻辑,随着它的发展,又出现了表示可变关系的数学符号。

因而从某种意义上说,数学的发展是伴随着漫长的符号化进程的,数学发展的历史就是符号发展的历史。数学符号的普遍使用曾是形成近代数学的必要条件。发展到现在,使用数学符号已成为现代数学的一个最为明显和突出的标志,数学符号已是贯穿于全部数学的支柱,几乎每一个数学分支都是靠一种符号语言而生存。而且,数学符号系统已成为国际通用的真正的“世界语”。简直难以想象:如果没有现今的数学符号,数学乃至整个科学的面貌将会是怎样!

古代数学的漫长历程、今日数学的飞速发展;17、18世纪欧洲数学的兴起、我国几千年数学发展进程的缓慢,这些在某种程度上也都归因于数学符号的运用得当与否。数学符号为什么能够成为推动数学发展的巨大力量?数学符号的重要性与威力缘由何在?以下的引述可以对此做出些解释。

符号的巧妙和符号的艺术是人们绝妙的助手,因为它们使思

考工作得到节约……在很大意义上讲,符号扼要地表示了,就像是表现了聪明的实质,在这里它以惊人的形式节省了思维。

——数学家莱布尼兹

由于大量的数学符号,往往使得数学被认为是一门难懂而又神秘的科学……不能认为这些术语和符号的引入,增加了这些理论的难度。相反的,这些术语或符号的引入,往往是为了理论的易于表述和解决问题。特别是在数学中。只要细加分析,即可发现符号化给数学理论的表述和论证带来极大的方便。甚至是必不可少的。

——数学家怀特海

符号常常比发明它们的数学家更能推理。

——数学家F·克莱茵

一套合适的符号绝不仅仅起到速记的作用。它能够精确、深刻地表达某种概念、方法和逻辑关系。

——数学史家梁宗巨

数学的另一个重要特征是它的符号语言……凭借数学语言的严密性和简洁性,数学家们就可以表达和研究数学思想,这些思想如果用普通语言表达出来,就会显得冗长不堪。这种简洁性有助于思维的效率。

——数学史家M·克莱因

一种合适的符号要比一种不良的符号更能反映真理,而且,合适的符号既带着自己的生命出现,并且还创造出新生命来。

——数学史家特洛伊克

正是数学符号的这类奇特性质使许多数学家都有一种感觉,从符号中得到的东西比输入的更多,它们好像比它们的创造者更聪明。有些符号似乎具备一些神奇的力量,能在其内部传播变革和创造性发展的种子。有些时候,可能仅仅是由于选择到适当的符号,就会导致十分重要的数学成果。正如本编所介绍的行列式和矩阵,它们最初都是作为数学语言的改革和简化而引入的,但由于这些符号可以使人们更容易看清深刻的数学关系,结果形成了数学所有分支中最为有用的理论之一——行列式论与矩阵论。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈