大數(shù)據(jù)告訴你,宋朝文人是有多想借“東風(fēng)”

大數(shù)據(jù)告訴你,宋朝文人是有多想借“東風(fēng)”

 

當(dāng)科技感滿滿的“數(shù)據(jù)可視化”邂逅古典的唐詩(shī)宋詞,會(huì)擦出怎樣的火花?

 

近日,一組可視化數(shù)據(jù)作品《宋詞繾綣,何處畫人間》(以下簡(jiǎn)稱《宋詞》)和《唐女詩(shī)人群像》(以下簡(jiǎn)稱《唐詩(shī)》)在朋友圈刷屏。該作品由浙江大學(xué)CAD&CG國(guó)家重點(diǎn)實(shí)驗(yàn)室和新華網(wǎng)數(shù)據(jù)新聞部合作,歷時(shí)半年完成。

 

團(tuán)隊(duì)分析了5.5萬首唐詩(shī)、2.1萬首宋詞,用大數(shù)據(jù)技術(shù)解讀古典唐詩(shī)宋詞,意外發(fā)現(xiàn)不少隱藏的信息。

 

大數(shù)據(jù)顯示

 

蘇東坡去得最多的地方是杭州

 

這個(gè)作品長(zhǎng)什么樣呢?錢報(bào)記者打開了網(wǎng)頁(yè)版的《宋詞》。

 

多處留白,水墨插圖,素雅的配色風(fēng)格,這個(gè)作品的風(fēng)格“整體上是向山水畫靠攏”的。

 

據(jù)了解,《宋詞》以《全宋詞》為樣本,為完成這一解讀,團(tuán)隊(duì)分析了近2.1萬首詞作、近1330家詞人、近1300個(gè)詞牌名。而《唐詩(shī)》作品的基礎(chǔ),則是5.5萬首唐詩(shī)的數(shù)據(jù)分析。

 

記者觀察到,《宋詞》網(wǎng)頁(yè)版是由詩(shī)人行跡圖和年代生平圖聯(lián)動(dòng)的時(shí)空?qǐng)D,以及宋詞詞云圖、意象情緒圖、韻律圖組成的。

 

在年代生平圖中,記者選中代表“蘇軾”的折線,根據(jù)圖示,顯示出一條“先平再升又平”的折線,其試圖反映的是蘇軾一生的仕途起伏。

 

和生平圖聯(lián)動(dòng)的行跡圖上,地圖同步出現(xiàn)大小不同的褐點(diǎn),用線連接,每個(gè)點(diǎn)的大小因蘇軾踏足的次數(shù)決定。這呈現(xiàn)的是蘇軾一生的軌跡。從點(diǎn)線圖上看,蘇軾的足跡幾乎遍布整個(gè)宋朝疆域。其中,最大的點(diǎn)所在位置是杭州城,這說明杭州是他最多造訪的地方。

 

“東風(fēng)”一詞

 

在宋詞中共出現(xiàn)1264次

 

隨著頁(yè)面下拉,映入眼簾的是宋詞“詞云圖”部分。詞云圖根據(jù)宋詞詞語使用次數(shù)分析,使用次數(shù)越多的字號(hào)越大,顏色越深,位置越居中。記者看到,位于正中的詞是“東風(fēng)”,該詞被使用了1264次。排在其后的是“何處”,一共被使用了1157次。排第三的是“人間”,在宋詞中一共出現(xiàn)1061次。

 

“我們之前了解宋詞唐詩(shī),更多地是一首一首分開理解賞析,而這次的研究讓我們可以從大數(shù)據(jù)層面去尋找詩(shī)詞背后所隱藏的信息。”浙江大學(xué)CAD&CG國(guó)家重點(diǎn)實(shí)驗(yàn)室設(shè)計(jì)主管張瑋告訴錢報(bào)記者。

 

此次的研究歷時(shí)半年,浙大團(tuán)隊(duì)和新華網(wǎng)數(shù)據(jù)新聞部制作完成的《宋詞》《唐詩(shī)》作品,均以網(wǎng)頁(yè)的形式呈現(xiàn),里面包含的信息頗為豐富。其中,信息量最大、制作最為復(fù)雜的當(dāng)屬《宋詞》作品。

 

“在傳媒行業(yè),如此成熟的傳統(tǒng)文化題材的可視化數(shù)據(jù)新聞作品還很鮮見。”張瑋說,這也是浙江大學(xué)可視化小組研究團(tuán)隊(duì)在這方面的首次嘗試。

 

詩(shī)人作品中提到“酒”

 

一半是在追思,三成是開心

 

團(tuán)隊(duì)不僅分析了《全宋詞》文本表面的信息,還深入挖掘宋詞所表達(dá)的意象含義,整合成意象情緒圖。

 

意象情緒圖選取了30個(gè)像“月”“酒”等常見的字詞,以蘇軾、李清照等24位高產(chǎn)詞人作為代表。通過大數(shù)據(jù)分析,得出這些意象詞匯所表示的情緒,并將情緒分為五種——“喜怒哀樂思”,然后用餅狀圖表現(xiàn)出各種字詞所表示的不同情緒的比例。

 

比如詩(shī)人在寫“酒”時(shí),近半數(shù)想要表現(xiàn)的意象是懷念和思考。陸游寫“紅酥手,黃滕酒”,或者晏殊寫“一曲新詞酒一杯,去年天氣舊亭臺(tái)”,都是在追憶故人以及對(duì)人生的思考。還有近三成,是類似朱敦儒筆下“日日深杯酒滿,朝朝小圃花開”的開懷一笑。

 

那么,大數(shù)據(jù)技術(shù)是如何從宋詞的字里行間體察到詞人當(dāng)時(shí)的情緒呢?

 

首先,團(tuán)隊(duì)需要將基本只表示某種特定情緒的典型意象整理出來。張瑋說,為了更精確,團(tuán)隊(duì)還專門請(qǐng)來浙大文學(xué)院博士胡秋研進(jìn)行了核對(duì)。

 

負(fù)責(zé)數(shù)據(jù)分析和前端開發(fā)的潘如晟告訴記者,他們會(huì)用大數(shù)據(jù)分析上下文,根據(jù)典型意象去計(jì)算該字詞屬于某一情緒的概率,得出詩(shī)人最有可能想要表達(dá)的情感。

 

簡(jiǎn)單來說,比如詩(shī)人張?jiān)诘摹额}興龍寺老柏院》中寫到:“南鄰北舍牡丹開,年少尋芳日幾回。惟有君家老柏樹,春風(fēng)來似不曾來。”其中,“松柏”表達(dá)的就是一種“追思”的情緒。再聯(lián)系上下文,可以得出“牡丹”和“春風(fēng)”想要傳達(dá)的也是“思”。

 

通過可視化的數(shù)據(jù)呈現(xiàn)

 

讓唐詩(shī)宋詞真正通俗易懂

 

當(dāng)問及這項(xiàng)研究的難點(diǎn)所在,張瑋首先提到的是圖表的選擇。為了找到最合適的數(shù)據(jù)呈現(xiàn)方式,許多圖表都是幾易其稿。

 

合適的圖表,既要美觀,又要能涵蓋所需要呈現(xiàn)的信息,同時(shí)還要表現(xiàn)得直觀,還要與讀者進(jìn)行比較順暢的互動(dòng),這著實(shí)讓團(tuán)隊(duì)費(fèi)了不少工夫。據(jù)張瑋介紹,團(tuán)隊(duì)曾嘗試用“小山峰”視圖去表現(xiàn)詞的抑揚(yáng)頓挫,但考慮到圖像重疊影響觀感,又不利于擺放意象圖像,最后只能作罷。

 

“人是視覺性的,可視化形式的科普手段,可以把晦澀的古詩(shī)詞變得通俗易懂,讓科普擺脫說教或者沉悶的刻板印象,從而起到推廣傳統(tǒng)文化的作用。”浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院副院長(zhǎng)陳為說。

 

這項(xiàng)研究定位是科普,因此選擇分析的對(duì)象也以唐詩(shī)宋詞最基本的內(nèi)容為主。張瑋說:“這個(gè)產(chǎn)品的制作并不是為了得出某一結(jié)論,而是給人們提供一種探索唐詩(shī)宋詞的有趣工具。”因此,更多有意思的結(jié)論還有待于讀者們?nèi)グl(fā)現(xiàn)。

標(biāo)簽: