近日,全球高等教育研究机构Quacquarelli Symonds发布了2022年度QS亚洲大学排名。其中,北大、清华、浙大、复旦、上海交大,分列中国内地大学前五位。
而前不久,U.S. News也发布了最新的大学排名,前五名是清华、北大、上海交大、中科大、浙大;几乎同时发布的泰晤士世界大学声誉排名,则把清华、北大、上海交大、浙大、复旦列为前五名。
有意思的是,在这些榜单中,不仅进入前五名的中国大学不尽相同,即便是公认的北大清华两所顶级名校,它们的排名时而进入世界前十,时而仅位列前五十。
大学排名:仅供参考
不同排行榜上大学排名之间的差异,主要来自于评选指标的不同。例如:排名更多采用客观数据还是主观评价?客观数据降低了出错和造假的可能,但是数据难以覆盖大学评价的所有维度。主观评价能够体现那些难以量化的无形价值,反映了人们对大学的整体印象,但是也更容易出现偏见和被操纵。
再如,排名更加重视规模还是人均?一所大而全的大学和小而精的大学是各有利弊的,要想在一个榜单中科学地进行排名,几乎是不可能完成的任务。
又如,排名更加重视研究、教学还是就业?社会、学生和大学自身对于这三者的重视程度各不相同。大学可能更看重科研,而学生可能更看重就业。即便仅针对其中一项,视角也会有所差别,例如学生对教学水平的评价就可能与外界不同。
再以大学排名中常见的指标——录取率为例,如果一所大学的录取率比哈佛、耶鲁还要低,是不是证明这所大学太优秀了,只有最顶尖的学生才能考得上?事实上可能只是这所大学的宣传做得好而师资和校舍资源又不足的结果。前两年国内热议的深泉学院(Deep Springs College),号称录取率低于哈佛,其实只是一所教学理念比较特别的大专院校而已。
论文被引量也是大学排名经常使用一个的指标。如果一位学者的论文得到了同行的大量引用,是不是证明他是这个领域的权威?真相也可能是他的论文得到的大多是批评——同行要批评他的研究,首先要引用他的论文而已。
众所周知,不是所有能计算的东西都重要,不是所有重要的东西都可计算。越是宏大的东西,越难以用指标量化和排名。哈佛商学院出身的麦克纳马拉在担任美国国防部长期间,曾要求部队层层统计上报数据指标,例如空军轰炸的次数、炮兵发射的炮弹数量、步兵获取的敌军遗体数量,等等,从而使美军陷入了“量化的泥潭”,引起了前线将领的普遍反感,因为“对战争而言最重要的恰恰是最难以测量的,即敌军继续作战的意志”。
另一个例子是,很多研究把拥有大学学历者的百分比,作为衡量一个国家或者地方“人力资本”的指标。而新的研究表明,在创新越来越成为发展驱动力的今天,经济和社会发展在很大程度上不再取决于国民的平均教育水平,而是取决于那些拥有顶尖知识和技能的人。这些人既可能是知名学者,也可能是在自己领域深耕多年的顶级工匠,文凭对他们来说已经不再是有效的测量指标。
由此可见,“上大学”作为一项指标的经济意义是十分可疑的。而“上大学”的社会意义,例如社群感、成就感等等,却又是数据难以测量的。
指标的误解与欺骗
其实,在生活中,数据和指标几乎无时无刻不在给我们带来误解或者欺骗。试想,如果一位医生做的手术成功率接近百分之百,是不是证明他的水平非常高?那也可能只是因为他不做那些风险高的手术。如果简单地以手术成功率来衡量医生的水平,医生很可能就会劝说那些风险较高的患者不要做手术,或者推荐他们去看其他医生。
数据原本是为了弥补人们经验直觉的不足,但当数据成为指标,问题就出现了。英国经济学家古德哈特提出了著名的“古德哈特定律”:指标一旦成为政策制定的依据便不再有效。因为人们会牺牲其他方面来刻意强化这个指标,从而使这个指标不再能反映真实情况。就像美国学者杰瑞·穆勒的著作《指标陷阱:过度量化如何威胁当今的商业、社会和生活》中引用的评论:“诸多情况下,指标的唯一结果,就是带来更多的指标”。
美国法学院的排名与录取分数这一指标有关,因此一些法学院就以“非全日制”或者“预科”的名义来录取那些分数较低的学生,或者让分数较低的学生先到其他学院就读再转学过来。还有一些美国中学,为了应对教育部门的评估,把成绩较差的学生划入残疾人行列,或者不让他们参加考试,从而改善学生的平均成绩。
英国卫生部门曾经用候诊时间作为考核医院管理的指标之一,对候诊时间超过4个小时的医院进行惩罚。于是,有些医院就把来就诊的患者放在门口的救护车里排队,直到医院确定病人可以在4个小时内看上病才让他们进去。
“指标固恋”的危害
杰瑞·穆勒写《指标陷阱:过度量化如何威胁当今的商业、社会和生活》一书的初衷,是他自己的亲身体验。他是美国一所大学的历史系主任,除了研究和教学,还要负责系里的行政事务。他发现,需要向上级部门提交的各种统计数据和评估量表逐年增长,如学生的成绩、毕业率、就业率、薪酬水平以及教师科研的相关指标,等等。穆勒用于搜集和整理这些数据的时间越来越多,而用于抓教学科研的时间越来越少。
不但如此,各个院系之间还陷入了“数据的军备竞赛”,也就是我们常说的“内卷化”。穆勒发现,一位系主任花了大半个暑假的时间编撰了厚厚一本数据,还加入了很多漂亮的图表,只是为了说服院长增加一名教师。而学校为了处理越来越多的报告,只能聘用更多的数据专家,甚至指定一名副校长来负责此事。
出现这种内卷化的原因是美国教育部的一项规定,要求对高校收集更多的指标数据,并且根据这些指标来对高校进行评估考核。于是,指标在教育系统中层层下放,最终落到穆勒和他的同事们身上。
穆勒指出,美国教育部的做法并非特例,而是现代社会的一个通病——“指标固恋”。“指标固恋”的泛滥造成了指标的“暴政”,我们所有人或多或少都是这个“暴政”的受害者。
例如,美国教育部曾提出让所有美国人都上得起大学的倡议。这一倡议看起来很美好,因为大学生的平均收入确实比中学生要高。从个人层面上来讲,上大学的确具有经济意义。然而,放大到国家层面就未必如此了。因为拥有大学学历的人越多,大学学历作为一种筛选指标的价值就越低,结果很多大学生干的是那些原本高中生就可以干的工作。而更多的人升入大学之后,由于大学毕业率的指标影响了高校排名和经费,因此大学普遍降低了毕业标准,反而降低了大学生的质量。
再如,美国缉毒警察为了提高抓捕罪犯的数量,更乐于抓捕那些街头巷尾的低级毒贩,而不愿意投入大量人力物力侦破那些涉及大毒枭的案件;英国警察部门为了达到市长设定的“犯罪率降低20%”的指标,便对罪案进行瞒报和降级,例如把盗窃记录成“遗失”,把入室抢劫记录成“擅自进入”。
一言以蔽之,指标并非无用,但过于追求指标可能适得其反。“常唤不醒错过风雨人潮,青苔斑驳闻讯而不知晓。人生不能太过圆满,求而不得未必是遗憾”(陈粒),“承认可能存在的局限性是智慧的开端”。有些事物可以测量,有些事物值得测量,但有些可以测量的东西未必值得测量,有些测量的结果反而扭曲了我们对事物的认识,进而使人们的行动背离了测量的初衷。重要的是用我们的经验来评价指标而不是相反。如果我们要用指标做到什么,首先要知道它做不到什么。(王翔)