本篇文章1557字,读完约4分钟

近年来,机器文章不再是纸上谈兵的技术,已经渗透到我们的生活中。 在今天的顶级、腾讯、百度、360等企业,新华社、南方都市报、第一财经等以前流传的媒体单位开展了机械创作技术的研究和应用。

前几天,在北京大学科技成果发布会和北京市科技成果转化统筹协调与服务平台系列项目的演出中,北京大学计算机科学技术研究所万小军研究员的ai创作机器人备受瞩目。

这项成果已经应用于多家媒体单位,研发单位与各媒体单位合作发表了小明、小南、小柯等多家创作机器人,各类机器人自动撰写新闻稿10万余篇。

不仅仅是信息的写作,也可以应用于这些行业

机器写作又称自然语言的生成,是自然语言解决行业重要的研究方向和研究热点之一,也是人工智能走向成熟的重要标志之一。

目前,机器写作在媒体、出版、娱乐、广告等多个领域有着广泛的应用场景。 在欧美等国,根据arria、ai、narrativescience等领域数据,尽早成立了多家以机械制作技术的应用为重点的企业,节省了大量劳动力。 此外,许多国外知名媒体机构利用机械创作技术进行信息稿件创作,节约人力成本,提高效率。

快讯:阅览率与人工稿件基本持平 机器写作正逐渐被接受

与人类作者相比,机器写作具有效率较高、时间长短好、覆盖性强、无偏见等特点。 根据今天顶尖的在线测试,机器人代写新闻稿的阅读率与人工稿的阅读率基本相同,这表明机器稿的质量很好,为广大顾客所接受。 万小军告诉记者。

快讯:阅览率与人工稿件基本持平 机器写作正逐渐被接受

万小军表示,我们希望有计算机,有读写的能力,不仅有阅读和理解语言文案的能力,也有制作文案的能力,可以像人类一样,写出信息、报告、诗、小说、作文等优秀的文案作品

但是,计算机不能随便写,必须根据输入的数据和素材进行创作。 据介绍,根据输入的新闻类型,计算机通常使用不同的创建方法创建。 例如,计算机可以基于输入的结构化数据(报告、rdf数据等)进行复制,生成原稿。 这是目前机器写作应用的第一种方法,适用于天气预报、医疗报告、比赛短信、财经报道等文案的生成。

快讯:阅览率与人工稿件基本持平 机器写作正逐渐被接受

据万小军介绍,这几年,机器文章除了撰写信息、报告等实用文案外,还被用于创作古诗、现代诗、散文等文学作品。 例如,微软的小冰、清华九歌等系统可以分别创作现代诗和古诗。 文案表达的整体效果还不错,但意境上有所欠缺。

快讯:阅览率与人工稿件基本持平 机器写作正逐渐被接受

深度学习产生模型,但难以保证其正确性和可读性

近年来,深度学习发展迅速,机器写作技术也受到严重影响。

万小军表示,基于深度学习技术进行复制生成,不依赖模板和规则。 但是,这样的写作方法在研究上取得了一定的进展,但是目前还不能保证生成的原稿的准确性和可读性,难以满足许多应用场景中的原稿质量要求。 另外,在深度学习中生成的模型训练需要大量的并行数据,很多行业很难获得这样的大规模数据。

快讯:阅览率与人工稿件基本持平 机器写作正逐渐被接受

计算机根据已发表的信息等现有文案素材制作二次文案时,可以根据现有稿件制作不同的稿件,首先依靠的是自动文摘和文案复述两种自然语言解决技术。 其中,自动文摘用于细化和整合单个副本或多个副本,以形成摘要或综述。

快讯:阅览率与人工稿件基本持平 机器写作正逐渐被接受

万军指出,多文件自动文摘比单文件自动文摘更具挑战性。 这是因为不同文件副本的冗长性、片面性、弱一致性。 因此,长篇摘要生成多篇信息文章极其困难,其研究小组在这方面进行了尝试,提出了基于段落排序和融合的方法来摘要生成多篇信息文章,取得了一定的效果。

快讯:阅览率与人工稿件基本持平 机器写作正逐渐被接受

因为复述是改写现有的文案,在主题和意义几乎没有变化的前提下生成另一个文案表达,所以不复制原文也可以达到文案风格化的目的。 副本的复述可以看作是单语机器翻译的问题。 这是因为在并行词汇充足的前提下,包括神经网络机器翻译在内的各种统计机器翻译方法都可以适用于这个问题。 但是,现实中很难得到大规模的这种并列词汇。 由于这种比较复制复述的研究需要别的途径,所以最新的研究重点是如何有效利用少量的并行词汇和大规模的非并行词汇来进行复述模型的学习。 (本报记者华凌)

标题:快讯:阅览率与人工稿件基本持平 机器写作正逐渐被接受

地址:http://www.xunleidownload.com/xhxw/2791.html