作者 主题: 为什么高考作文题目是可预测的?(无子先生刚刚转发给我的)  (阅读 1936 次)

水木罗汉

  • 管理员
  • 超级会员
  • *****
  • 帖子: 16608
1

很多中学老师认为高考题目是可以预测的,他们声称自己能感觉到出题的趋势,并且在考前帮着学生押题。我上学的时候总觉得押题是个不靠谱的事,难道出题的人没有自由意志吗?事实是,我们都没有自由意志。

百度推出过一个新产品“百度预测”,在高考方面,百度通过数据分析认为某年高考作文题目将会出现在“时间的馈赠”、“生命的多彩”等六个领域之中,并且给出了各领域命中的精确概率。百度说这个预测是“基于海量作文范文和搜索数据”。各领域下列举的作文题目关键词,比如“时间的馈赠”中的关键词包括“记忆”、“未来”、“成长”、“忘记”等,都是中学生作文的常用词。

也就是说,百度用数据分析预测出来的高考作文题,都是最常见的作文题,都是俗套。换句话说,用数据分析搞预测的隐含假设是未来事件会继续落入最近流行的俗套。

可是出题的人有必要尊重俗套吗?难道出《让未来记住今天》或者《守住心灵的那扇门》这种俗不可耐的题目不是可耻的吗?在回答这个问题之前我们先研究一个更大的问题:

到底什么样的东西是可预测的,什么样的东西是不可预测的?

2

最近几年美国出了一位预测牛人,Nate Silver。美国人很喜欢体育数据,有些棒球杂志上更是连篇累牍全是各种细致的数据。Silver 基于统计模型,自己搞了个软件来通过分析职业棒球的数据去预测各个球员未来的表现。最后他的预测结果超越了那些最有经验的球探。



纳特·西尔弗(Nate Silver),美国统计学家和作家

不但如此,他的政治预测成绩更令人瞠目结舌。2008 年大选,对各州总统选举结果,50 个州 Silver 预测对了 49 个;对 35 个参议员席位,Silver 全部命中。更关键的是,他的预测跟政治专家的预测相差极大——事实证明听专家的远远不如听数据分析的。Silver 2012 年出了本书《信号与噪声》,谈预测的学问。

Silver 在书里说,你别看我预测水平高,其实我预测的东西是容易预测的。比如说棒球,我们都知道这个比赛相当沉闷,外行看着感觉一点都不热闹。棒球的特点恰恰是运动员具有相当的独立性。一个球员的水平是什么样就是什么样,他对球队的贡献非常稳定,并不怎么依赖队友的发挥和对手的表现,场上的随机因素也比较少。

相对而言足球就不是这样,一个球员水平再高也得依赖队友、教练和对手,甚至包括裁判,有时候一着不慎满盘皆输。

关键在于,像棒球这样的简单系统,里面没有连锁反应。

我们都听过一个笑话说拿破仑之所以在滑铁卢战败是因为他穿了紧身裤,紧身裤导致拿破仑得了痔疮。痔疮导致他在战斗的关键时刻未能居中指挥……这就是连锁反应。

连锁反应通常是正反馈的过程,每一环带来的破坏都可能比上一环更大,而且都可能直接激发下一环。对预测者来说更麻烦的是这种反应充满偶然,大多数情况下反应不了几环就会终止,有时候却可能导致大麻烦。

3

简单系统容易预测,因为一个个体哪怕出点预测范围以外的波动,对整个系统也不会有大影响。而如果一个系统中包含各种正反馈机制,它就是不好预测的复杂系统,一个个体的小波动就有可能通过连锁反应层层放大出现“蝴蝶效应”。

比如现代金融体制就是一个复杂系统。地产下跌可能会导致人们还不起房贷,房贷还不上会导致银行受不了,银行一收紧信贷,其他行业又受不了,最后可能就是大规模的金融危机。

Silver 说,那些信用评级机构,给这个评个AAA,给那个评个AA+,这些所谓评级都是根据市场“正常”情况下的数据分析而来,可是一旦发生连锁反应,市场就不正常了,你的那些数据就根本没用!复杂系统,是可能出“黑天鹅”的系统。

“黑天鹅”这个比喻的发明人 Nassim Nicholas Taleb 有个思想很有意思。他说自然本来就是个复杂系统,它的本性其实是充满波动的,时不时就会出点事——可是现代化的政府机构却总是谋求让社会能够稳定地运行。



Taleb 认为时不时出点小事其实是可以锻炼人的——你如果一味追求人为的稳定,最后反而可能会让整个系统变得脆弱,一旦维持不了稳定就会出大事。

我们不管 Taleb 后面一句话对不对,单论“政府机构谋求稳定”这一点,那是绝对没错。

4

那么高考是个简单系统还是复杂系统?当然是简单系统!

搞预测的人最怕“黑天鹅”,高考出题者更怕“黑天鹅”。高考的任务并不是探索先进文化,而是给大学招生。这个任务甚至不是给最好的大学招天才学生,而是给全国所有大学招各种水平的学生。每个考区只有一套试题,不管你报考的是北京大学中文系还是三峡大学科技学院,你都要面对同样的作文题。

在这种情况下,出题者必须让所有人都能有所发挥。他们不会让你谈对乌克兰局势的看法,也不会像法国高考那样让你分析笛卡尔著作,否则对那些只想上个普通大学将来谋个普通工作的学生是不公平的。

除学生水平不一之外,还必须考虑各地文化氛围也不一样,边远地区的孩子可能根本没看过美剧,这种情况下出题可以涉及《非诚勿扰》,而绝不可能涉及《 24 小时》。我国古代科举考试出题范围只限于四书五经,也是这个道理。

不能考太深,不能考太广,出题者还剩下多少选择?在出题者和考生之间只有单向关系,出题者不需要什么反馈,更不需要正反馈!

他们要确保那些稍微聪明一点用功一点的孩子都能考上,把偶然因素降到最低。他们最不想看到的就是一道标新立异的作文题激发社会的强烈反响,他们绝不允许任何事故。他们完全不指望用高考题促进社会进步,也不打算通过出题让自己青史留名。他们的使命就是给不确定的世界增加一点确定性。

所以他们必然诉诸俗套。俗套最安全。数据分析指向哪里,他们就打向哪里。

那么面对一道俗套的作文题,你应该怎么写作文呢?答案是写俗套的作文。高考不是施展写作才华的地方,你有才华阅卷人也看不出来。

事实上何止是高考,就连美国中学的英文课老师,也看不出来真正的好作品。列纳德·蒙洛迪诺是一位非常著名的科普作家,他跟霍金合写了《时间简史》和《大设计》。蒙洛迪诺有一次替自己十五岁的儿子写了一篇作文,结果只得了A-。他震惊之余问了另一位作家朋友,而那人经常在纽约时报之类的地方发表文章,说有一次给女儿写作文却只得了个B。

你知道阅卷老师读完一份作文并且给出评分总共用多长时间吗? 10 分钟? 5 分钟? 2 分钟?答案是新手 50 秒,老手 34 秒!在这么短的时间内没人会品评你的美句,没人会研究你的新思想,你真写一篇惊世骇俗的策论出来最大可能性是阅卷者没看懂直接给个低分。

在这个机械化的业务中谁也别指望出奇制胜——除非你古文写得好,那可能另当别论,古文的确一眼就能被看出来,也许老师们会乐于在枯燥的阅卷工作中拿你的文章消遣一下。如果你热爱写作可以没事在网上写写,高考作文是个拿点经验值赶紧走人的项目。

5

如果你觉得这种作文考试非常可悲,我要说的就是现实比这个还可悲。在高考中出题人的追求是“好使”,而受众则大多是俗人,双方都没有什么创新的需求。还有什么项目也是这种局面呢?

比如说娱乐业。超人、蜘蛛人、蝙蝠侠、钢铁侠,好莱坞为什么翻来覆去总拍这些老超级英雄的故事?难道不应该经常推陈出新吗?因为这些人物的故事好使。

这是一项完全成熟的业务,观众知道自己花钱买票能得到什么,好莱坞也知道这么拍一定会获得稳定的回报。观众和电影制作者达成默契,谁也不用担心谁。一个电影的投资规模越大,它的剧情就越俗套,大制作常常甚至干脆重拍一个所有人都知道的故事,因为大投入要求更小的风险。

俗套好使!所以越流行的东西常常越俗套,这就是为什么真正的文艺青年都以不爱流行文化为荣。

汪峰应该不俗吧?有人统计了汪峰在中国大陆发行的 9 张专辑共 117 首歌曲的歌词,发现用词大量重复:

“爱”      出现 54 次      “生命”  出现 50 次
“碎”      出现 37 次      “路”      出现 37 次
“哭”      出现 35 次      “孤独”  出现 34 次

从他有限的词汇表里随便选几个词就能组合成一句汪峰风格的歌词,比如“不再迷惘的生命,被燃碎了千万次,也依然坚强。”谁说数据分析不能创作艺术?

汪峰人称“浪子”——这个词的字面含义似乎就是行为不可预测,但事实证明汪峰老师除了感情生活经常给人惊喜,其他方面还是很好预测的。

三年书生

  • 管理员
  • 超级会员
  • *****
  • 帖子: 2092
有点意思。
信号与噪声这个提法对我来说很亲切,对预测研究而言也很贴切。
我认为命运也是一个个小因素独立发生,但相互作用,并且层层叠加放大所产生的效果。
汪峰的歌适合呐喊发泄,不适合细听。不管旋律还是歌词。
个人微信号:lf19876656108