本篇文章1859字,读完约5分钟
充满科技感的数据可视化遇到经典唐诗宋词会产生怎样的火花?
最近,一组可视化的数据作品“宋词,在哪里描绘人类”(以下简称“宋词”)和“唐女诗人群像”(以下简称“唐诗”)用WeChat的力矩刷屏。 该作品由浙江大学cad cg国家要点实验室和新华网数据信息部合作,历时半年完成。
团队分解了5.5万首唐诗、2.1万首宋词,用大数据技术解读了经典唐诗宋词,却意外发现了许多隐藏的新闻。
大数据显示
东坡去的最多的是杭州
这部作品长得怎么样? 钱报记者打开了网站版的“宋词”。
余白、水墨插图、素净的配色风格很多,这部作品的风格整体上贴近山水画。
据悉,《宋词》以《全宋词》为样本,为了完成这一解读,团队分解了约2.1万首作词、约1330名词人、约1300名词名。 《唐诗》作品的基础是5.5万首唐诗的数据观察。
我注意到《宋词》的网络版由诗人的行迹图和年代生涯图联动的时空图、宋词的云图、意象情感图、韵律图构成。
在年代的生涯图上,记者选择了代表苏轼的折线,如图所示,先平后平的折线,试图反映苏轼一生职业生涯的起伏。
在与生命图联动的轨迹图中,与地图同步出现大小不同的脚本点,用线连接,各点的大小由苏轼踏入的次数决定。 这标志着苏轼一生的轨迹。 从虚线图看,苏轼的足迹几乎遍布整个宋疆域。 其中,最大的亮点是杭州城,杭州证明了他到过最多的地方。
东风一词
宋词中出现过1264次
随着页面的下拉,映入眼帘的是宋词的云图部分。 单词云图根据宋词的采用次数被分解,采用次数越多尺寸越大,颜色越深位置越中央。 记者看到中间的词是东风,该词被采用了1264次。 之后在哪里,一共被录用了1157次。 第三个是人类,在宋词中一共出现过1061次。
我们以前知道宋词,所以越来越多的人对观赏有所了解,但通过这次研究,我们可以从大数据的层面上发现隐藏在诗歌背后的新闻。 浙江大学cad cg国家要点实验室设计负责人张琒告诉金报记者。
此次研究历时半年,浙大团队和新华网数据信息部制作的《宋词》、《唐诗》作品均以网页形式表现,其中包含的新闻丰富。 其中,新闻量最大、制作最多、杂七杂八的是《宋词》作品。
在媒体领域,这样成熟以前就流传着文化主题素材的可视化数据信息作品屡见不鲜。 张琒说,浙江大学可视化小组的研究小组在这方面首次进行了尝试。
诗人的作品中提到了酒
一半在追忆,三成在开心
团队不仅分析了《全宋词》文案表面的新闻,还深入挖掘了宋词所表达的意象含义,整合到意象情感图中。
形象图选取了月酒等30个常见词语,以苏轼、李清照等24位高产词人为代表。 通过大数据观察,得到这些意象词所表达的情感,将情感分为五种喜怒哀乐思维,用饼图表达各个词所表达的不同情感比例。
例如诗人写酒的时候,近半数想要表现的形象是怀念和思考。 陆游写了一杯红酥油、黄腾酒或晏殊新语酒,去年天气古老的亭台,追忆着死者和对人生的思考。 而且,近三成充满了朱敦儒笔下的日深杯酒,像是对着小块田地绽放花朵的不屈不挠的笑容。
那么,大数据技术是如何从宋词文字的行间感受词人当时的感情的呢?
首先,团队基本上需要整理只代表某种特定感情的典型形象。 张琒说,为了更加准确,小组委托浙大文学院博士胡秋研进行了核查。
负责数据观察和前端开发的潘如晟告诉记者,他们用大数据观察上下文,根据典型形象计算该单词属于某一情感的概率,从而得到诗人最想表达的情感。
简单来说,比如诗人张在的《题兴龙寺老柏院》,南邻北舍牡丹开,趁年轻找芳日几次。 只有你家的老柏,好像春风从未来过。 其中,松柏表达了追思的心情。 连接上下文,也可以考虑牡丹和春风想传达的事情。
用可视化的数据表现
使唐诗宋词真的通俗易懂
一问这项研究的难点,张琒首先提到了图表的选择。 为了找到最佳的数据呈现方法,多个图表是一些简稿。
适当的图表涵盖了美丽、所需的新闻、直观地表达出来,并且团队花了很多时间与网民进行更顺利的交流。 张琒表示,球队试图用小山峰的视图来表达语调,但考虑到图像重叠会影响外观,不利于布置形象图像,最后只好作罢。
人类是视觉、可视化形式的科普手段,可以使模糊的古诗词通俗易懂,使科普摆脱说教和无聊的刻板印象,从以前开始就起到了宣传文化的作用。 浙江大学计算机科学技术学院副院长陈为说。
这个研究的定位是科学普及。 因为这个选择分解的对象也以唐诗宋词最基本的文案为中心。 张琒说,这个产品的制作不是为了得出某个结论,而是提供了探索唐诗宋词的有趣工具。 因此,越来越有趣的结论正等待着网民们发现。
标题:快讯:浙大团队用大数据解读唐诗宋词,有了惊人发现
地址:http://www.xunleidownload.com/xhjyxw/12496.html