在吐槽滿屏的高考季,高考作文成最大槽點(diǎn)。如果我們放下人類的架子,從AI算法的角度來觀察,會(huì)不會(huì)看到什么新奇的結(jié)果?小編向達(dá)觀AI機(jī)器君投喂了近幾年的高考命題和滿分作文,利用文本挖掘技術(shù),帶你揭秘高考試卷背后的種種細(xì)節(jié)。
多讀書,一定要多讀書
拿到今年的高考試題,機(jī)器君就算出了熱度最高的關(guān)鍵詞。去掉了諸如“題目自擬”,“篇幅不限”等通用詞以及“的”、“了”等虛詞,Top10是下面這些:
稍加分析,可以發(fā)現(xiàn)這些詞分為三個(gè)大類:我們自身,外部社會(huì)以及閱讀。“我們”、“我”、“自己”屬于第一類,“人”,“紐帶”,“他們”,“中國”,“時(shí)代”屬于第二類,“書”、“閱讀”、“書店”屬于第三類。
事實(shí)上,強(qiáng)調(diào)關(guān)注自身、關(guān)心社會(huì)和閱讀求知,一直是高考命題的重心所在。我們繼續(xù)向機(jī)器君投喂了過去三年的高考作文題目,得出了Top15如下:
是不是有點(diǎn)似曾相識(shí)?除了“書店”以外,今年的熱詞都是往年的熟面孔。往年的這些高頻詞,同樣可以系統(tǒng)地納入“我們自身,外部社會(huì)以及閱讀”這三大范疇。比如“范兒”這一流行詞體現(xiàn)的是一種社會(huì)現(xiàn)象,“學(xué)習(xí)”和“閱讀”屬性相似,“生活”則是我們自身與外部社會(huì)結(jié)合的結(jié)果。
了解了高考命題的側(cè)重點(diǎn)和思路,一篇好的高考作文的要素也就呼之欲出:一方面要善于觀察和思考自身與社會(huì),另一方面,要“腹有詩書”,才能厚積薄發(fā)。接下來,我們將向機(jī)器君投喂最近5年的滿分作文,看看它對寫好一篇高考作文,還有哪些其他見解。
結(jié)構(gòu)靈活多變,脈絡(luò)始終清晰
一篇好的作文,既要關(guān)心人生與社會(huì),傳達(dá)出富含底蘊(yùn)的內(nèi)容,也要打造令人賞心悅目的修辭風(fēng)格,展現(xiàn)出形式的美感。
所以,高考閱卷老師最偏愛什么樣的形式呢?
去年全國卷I的作文題目是看圖說話:
有考生們寫出這樣的題目《致母親的一封信》……
第一眼看到這個(gè)題目小編是一臉懵逼的。
不過,用文本摘要算法自動(dòng)摘取了關(guān)鍵句后,對文章就有了一個(gè)清晰的概觀:
顯而易見,文章的結(jié)構(gòu)是先點(diǎn)題再講故事,情節(jié)先就是兩條——“你對我一往情深”+“可是我活得很累”,骨架十分清晰。即使把選取范圍縮減到三句,也仍然能體現(xiàn)這些信息:
除了“正-反-合”式的典型辯證法邏輯,完全從反面來立論的“反-正”結(jié)構(gòu)也不在少數(shù),在議論文中尤其多見。
比如2014年全國卷II的主題是“給野生動(dòng)物喂食,易使它們喪失能力”,滿分作文《授之以漁,擺脫依賴》的top5關(guān)鍵句如下:
前面四句都是從反面來論證,“太溺愛必釀惡果”,最后才引出結(jié)論——“不如放手”。這種寫法“欲揚(yáng)先抑”,最后點(diǎn)睛,能產(chǎn)生“四輛撥千斤”的結(jié)果。
此外,“重疊式”的結(jié)構(gòu)效果也不錯(cuò)。2013年的全國卷1的作文試題圍繞“切鉆石”,試題的關(guān)鍵句是“不去想價(jià)值(方面)的事,手就不會(huì)發(fā)抖”,當(dāng)年的優(yōu)秀作文《鉆石有價(jià),我心泰然》就據(jù)此展開了論述。對其進(jìn)行文本摘要處理,抓取關(guān)鍵句如下:
這篇文章采用的結(jié)構(gòu)是用排比的方式,重復(fù)突出“唯有……才能……”這一形式的論點(diǎn),從而讓閱卷老師產(chǎn)生深刻的印象。不過這樣的論述畢竟有些單薄,這可能也是這篇文章雖然得分不低,但沒有摘到滿分桂冠的原因。
上述這些作文雖然采用了不同的結(jié)構(gòu),但是都有一些共同的形式上的特點(diǎn)——每一段的主題都很清晰,全文的脈絡(luò)也自然連貫。
修辭簡約受青睞
修辭也是文章形式的重要組成部分。修辭手法一般可以分為“消極修辭”和“積極修辭”兩大類。前者強(qiáng)調(diào)結(jié)構(gòu)清晰、表達(dá)明確、節(jié)奏允當(dāng),打造的是簡約風(fēng)格,后者則強(qiáng)調(diào)使用比喻、排比等手法,能營造出豐繁、絢爛的風(fēng)格,產(chǎn)生引人入勝的效果。
對于高考作文來說,到底哪種風(fēng)格更受青睞呢?
首先,機(jī)器君對近5年的30篇高考優(yōu)秀作文進(jìn)行了“句長方差”分析。
這些文章的句長方差均值為7253,最大值為16224,最小值為1595,差別還是有點(diǎn)明顯。
不過一串?dāng)?shù)據(jù)的平均值受極端值影響明顯,這串?dāng)?shù)據(jù)的中位數(shù)僅為5103,方差超過10000的僅有3篇,可見這串?dāng)?shù)據(jù)呈現(xiàn)某種偏態(tài)分布,方差較低的文章在整個(gè)優(yōu)秀作文語料庫中占據(jù)更多的比重。
從文章風(fēng)格上說,方差較小說明作者用的長句較少,短句之間搭配也比較平穩(wěn),這樣會(huì)使文章易讀、易理解。而方差較大則說明作者在行文中往往長短句交錯(cuò)使用,相對易讀性會(huì)較差。
除了方差,機(jī)器君還對這些文本做了姓名識(shí)別。我們概念里總覺得,多引用名人名言能提高文章的“逼格”,提升文章的分?jǐn)?shù)。但從高分作文中的姓名統(tǒng)計(jì)來看,事實(shí)并非如此。我們利用姓名識(shí)別算法識(shí)別出近5年的30篇(樣本可擴(kuò)大或不提具體數(shù)字)優(yōu)秀作文中出現(xiàn)的熱門人物,發(fā)現(xiàn)最熱的居然是TA:
排名前五位的都是虛擬人物,其中出現(xiàn)頻次最高、也最讓人陌生的李明、蘇覺是作文《雙贏》中的兩個(gè)虛擬主角;陳先生、小羽和老王是該年試題中的人物。
緊隨其后我們看到了熟悉的名字,喬布斯,楊振寧,陶淵明,魯迅……
經(jīng)過分析,這些人物又可分成兩類。喬布斯、楊振寧等屬第一類,他們主要作為一個(gè)故事案例集中出現(xiàn)在單篇文章中。而陶淵明、魯迅則屬另一類,他們經(jīng)常在不同的文章中露面,每次僅僅po出一段金句,然后就事了拂衣去,深藏功與名。
從姓名識(shí)別的結(jié)果我們可以發(fā)現(xiàn),首先,名人名言的引用并非與高分作文有必然聯(lián)系。如《致陳先生的一封信》、《雙贏》等,完全圍繞身邊的人或虛擬人物來寫,根本不提及名人名言,最后仍然得到好評。其次,名人名言的引用多樣性很重要。優(yōu)秀作文中對名人的引用沒有集中在少數(shù)大家都熟知的人物上,通常是多點(diǎn)開花,涉及多個(gè)領(lǐng)域。比如在2016年全國卷III的滿分作文《成功創(chuàng)業(yè)新模式:天地人和》中,提到了袁隆平、恩格斯、詩人特朗斯特羅姆,比爾·蓋茨、托爾斯泰等人物,涉及農(nóng)業(yè)、哲學(xué)、文學(xué)、創(chuàng)業(yè)等多個(gè)領(lǐng)域。通觀近年的優(yōu)秀作文,即使是陶淵明、魯迅這樣的常見人物,在一篇文章中通常也不會(huì)出現(xiàn)超過一次。
無論是句長方差還是名人出現(xiàn)頻率,都指向一個(gè)共同點(diǎn),那就是高考閱卷老師不喜歡花哨的套路,更喜歡在有限的篇幅里把內(nèi)容講清、講透的簡約“范兒”。想想也是,畢竟每份高考作文的平均閱卷時(shí)間相當(dāng)短,一篇文章只有在做到結(jié)構(gòu)清晰、修辭簡約,才能提高易讀性,從而引起閱卷老師的注意。
“正能量”不足易致低分
和歷年的滿分作文相比,還有一群另類的存在也同樣獲得了大家關(guān)注,那就是千奇百怪的“零分作文”。
和滿分作文相比,零分作文在文本指標(biāo)上會(huì)有哪些特點(diǎn)呢?
真的有點(diǎn)像托爾斯泰所說的,幸福的作文都是相似的,不幸的作文各有各的不幸。從句長方差、姓名識(shí)別等角度來分析零分作文,顯著性并不突出。不過,如果從情感分析的角度切入,兩者之間的差異還是很明顯的。
2015年的天津卷的主題是“范兒”,可是有位段子手寫出了題為《范兒是我女朋友》的作文。我們將之和當(dāng)年的滿分作文《獨(dú)一無二的“中國范兒”》進(jìn)行摘要處理和情感分析,所得結(jié)果如下:
上表中的情感值,表示該句子呈現(xiàn)出積極情緒的概率。從中可以看出,滿分作文的每一段均體現(xiàn)出較強(qiáng)的“正能量”,而零分作文在情感表現(xiàn)上則有點(diǎn)“不陰不陽”,甚至還出現(xiàn)了“范兒冷不防重重地甩過來一個(gè)耳光”這樣的“暴力”內(nèi)容,被機(jī)器直接評出了0.04的低分,實(shí)在有點(diǎn)尷尬。
情感表現(xiàn)上的不“積極”事實(shí)上不止會(huì)帶來“負(fù)能量”的觀感,而且會(huì)讓人覺得修辭色彩和意思表達(dá)不夠明確。在高考評分標(biāo)準(zhǔn)中,符合“偏離題意、中心不明確、內(nèi)容不當(dāng)、思想不健康、感情虛假”等項(xiàng)就可評為0分作文。倘若情感上偏向負(fù)面,那么觸碰這些紅線的概率就大大提升了。
小結(jié)
前面,我們從內(nèi)容和形式兩方面對高考作文的命題和范文進(jìn)行了分析。
從內(nèi)容上說,高考命題始終緊緊圍繞“我們自身”,“外部社會(huì)”以及“閱讀”這三個(gè)主題,鼓勵(lì)考生對個(gè)人人生和社會(huì)多思考多觀察,并加強(qiáng)閱讀積累,提升文化底蘊(yùn)。
從形式上說,高考閱卷偏愛主題結(jié)構(gòu)清晰,脈絡(luò)連貫,修辭簡約的風(fēng)格,對于花哨的套路以及“負(fù)能量”較為“嫌棄”。