还在为谷歌Alpha Go在围棋上战胜人类感到惊讶吗?又有昨天(3月20日),清华大学语音与语言实验中心(CSLT)网站宣布,他们的作诗机器人“薇薇”通过社科院等唐诗专家评定,通过“图灵测试”。所谓“图灵测试”是指通过对话分辨真实人类和人工智能的试验,通过“图灵测试”意味着人类无法通过语言对话分辨出人类和人工智能。据CSLT网站公布结果,“薇薇”创作的诗词中,有31%被认为是人创作的。不过,在本次比赛中,“薇薇”创作古诗的水平还是未能超越现代人类诗人,双方的比分为2.72(满分5分):3.20分。
网络上你怎么知道对面是狗还是机器人?
(观察者网小编:作为科幻爱好者, 我首先想起了刘慈欣的《诗云》……戳这里看。另,关于“图灵测试”,戳这里)
2016年3月20日,清华大学语音与语言试验中心网站更新《中国古诗词图灵测试》内容如下:
人机诗词写作大赛结果终于出炉了!本次比赛,在我们的机器人“薇薇”写的诗中,有31%被认为是人创作的,根据图灵前辈制定的标准,“薇薇”在此次大赛中成功通过了图灵测试!
令人遗憾的是,在本次比赛中,薇薇还是以2.72分(满分5分)的平均分败给了现代人类诗人(3.20分),不过在本次比赛中我们吸取了各位评委老师大量宝贵意见,相信之后薇薇一定会更进一步,争取在未来超过人类!
统计结果如下图:
在人类(a)和机器人“薇薇”(b) 写的诗中,被判为人类创作的诗(橙色)的比例:
打分对比
特别地,我们给出在格律、流畅度、主题、意境(下表从左到右)四个方面我们的“薇薇”与古代诗人所创作的诗的对比打分结果: