陈欣 陈琼
近年来,随着新媒体传播的爆发,人们每天接触的信息量正在成倍地增长。从传播学的角度来看,以图像为载体的视觉叙事更加引人注目,更容易获得人们的好感。数据可视化综合运用计算机图形学、图像处理、人机交互等技术,将采集或模拟的数据变换为可识别的图形符号、图像、视频或动画,既取悦了读者,也达到了新闻传播的目的。为了适应大数据时代所需要的新型新闻传播,各媒体编辑记者和智库生产人员对中央数据库数据提出了大数据可视化分析方面的服务需求。为满足这些需求,以南方报业传媒集团“数据优先”战略为指导,南方报业传媒集团信息技术部建设了中央数据库大数据可视化分析平台(https://db05.nfmedia.com),可将我们的数据( 可以是Excel 文件数据, 也可以是Mysql、Oracle 等数据库,抑或是Hadoop、Spark 等大数据平台)接入平台进行分析展现。平台支持20 余种交互图表制作,包括折线图、饼图、散点图、甘特图、漏斗图、热力地图等,功能强大,能满足多种数据分析需求。平台为集团用户带来简易制作、输出、分享可视化精美图报表的功能体验,让可视化新闻、各类调研分析报告,以及指数、榜单等智库产品的生产更加便捷。
图1 平台提供的部分图表工具
一、新闻数据可视化分析的技术发展概述
可视化新闻是基于数据挖掘、以可视化为呈现形态的一种新闻报道形式。新闻数据可视化并非今日才有,早在上世纪五六十年代,国外报刊已经开始在插图中引入数据图表描述新闻内容。数据分析的发展历程大致可以分为三个阶段:表格时代、传统商业智能时代,以及已经到来的敏捷商业智能时代。
第一阶段,人们使用Excel 这类表格工具对数据进行储存分析处理,并将表格放在幻灯片软件中汇总制作成报告,发送给团队进行分享。由于表格数据需要进行下载和发送,会出现数据不同步的问题。
第二阶段,与数据库直接相连的传统商业智能软件开始占领市场,以项目形式建设企业商业智能,短则3 个月,长则1-2 年,而且成本极高。随着市场节奏的加快,人们意识到传统商业智能方案已经无法跟上时代发展的脚步,不仅消耗大量的人力物力,严重影响对市场变化的判断,对每位数据阅览角色的个性化分析需求也无法满足。
第三阶段,敏捷数据可视化分析产品开始崭露头角。所谓敏捷,体现在数据流在整个企业中的运转、价值挖掘,以及结果的分享。只要准备好数据源,每位用户都可以根据自己的需求,自助进行数据可视化分析,方便快捷地将分析结果在团队中共享沟通,报表制作时间也只有使用传统工具的几十分之一甚至几百分之一,让项目实施效率显著增加。南方报业传媒集团中央数据库大数据可视化分析平台即采用了第三阶段的产品进行搭建。
图2 数据分析的发展历程
二、新闻数据可视化分析与图表类型
数据可视化向我们揭示数据背后的规律,帮助用户理解数据,并以此呈现对用户有价值的信息。用户通过对可视化的感知,使用可视化交互工具进行数据分析,获取知识。数据可视化能把枯燥的数据变得有趣起来,让人们无需在成千上万的数据面前焦头烂额。其中,图表是数据可视化分析的常用表现手段。图表具有集中、概括、便于分析和比较的特点,能给人一种直观、清晰的感觉。运用恰当的图表实现数据可视化非常重要,图表设计既要保证图表本身数据清晰准确、直观易懂,又要分析其适用场景和局限,找准用户关注的核心内容进行适当的突显,通过图表更加直观地传递所表达的信息,帮助用户通过数据进行决策。图表类型选择指南将图表需要展示的关系分为以下几类:对比、分布、构成、关系。获得数据以后,参考这张图表,就可以更快地选择适合展现数据特点的图表类型。
图3 图表类型选择指南
在南方报业传媒集团的大数据可视化分析平台上,只需要三步即可完成数据的可视化分析:连接数据、建立模型、创建报告。我们可以像制作PPT 一样,简单地完成数据分析报告的制作,对数据进行分析跟呈现。制作的报告可以一步导出为图片或PDF 格式,用于报纸、刊物、书籍、报告等使用静态动态图表的场景。同时,为帮助用户更快速制作图表,我们在平台上设置了图表模板,各类图表模板都可以导出为Excel,用户可以仿照Excel 格式填入自己的数据,即可快速生产出自己想要的图表。
图4 数据可视化分析报告的多种导出方式
三、新闻数据可视化分析中的图表联动与上卷下钻
说到可视化新闻,不得不提的是《纽约时报》2013 年推出的SnowFall,作为当年讨论度最高的交互新闻项目,Snow Fall以视频、动画、图片、图表、文字等形式讲述故事,让读者能够了解到该事件的每一个细节,该报道发布仅7天就获得350万点击。虽然Snow Fall 严格意义上来说,并不属于新闻数据分析可视化的范畴,但为我们指出了一条以常规化交互式设置提升新闻可读性和价值的路径。
对于网络传播而言,较之图文新闻,可视化新闻借助数据之便,确实能更清晰更有趣地表明观点,从而吸引更多的网络读者。随着集团新媒体业务的发展,新闻内容生产也逐步开始大量运用图表的联动与在线分析。图表的联动,指的是对一张图表的数据项的选择可以对另一张图表进行筛选,效果如图所示:
图5 图表联动示意图
左侧饼图选中“华东”地区时,右侧气泡图将显示华东地区的城市。与之类似的,还有图表的跳转,即通过一张报表,点击该报表的图形,会跳转到另外一张报表。这样,将复杂的图形和逻辑关系,通过联动或跳转的方式简化,更容易地展现数据之间的关系,让用户获得更直观的体验。
类似的图表交互还有数据的上卷下钻:上卷指的是从当前数据往上回归到上一层数据。例如,某数据的分类下面有细化分类为品名,从品名列表收拢到分类列表;下钻指的是从当前数据往下展开下一层数据。例如,某数据的分类下面有细化分类为品名,从分类列表展开到品名列表。这往往在新闻中引用大量数据,需要进行数据统计分析展示时用到。
要实现图表的交互,传统的做法是采用编程的方式进行,这对于内容生产团队来说,还是有一定的门槛,导致程序开发人员成为了紧缺资源。现在在南方报业传媒集团的大数据可视化分析平台上,我们通过简单的筛选器设置、创建图表联动,就可以让没有程序开发基础的用户设计出可交互的图表,充分释放内容生产者的生产力。
四、媒体大数据可视化分析平台的优势
基于南方报业传媒集团的大数据可视化分析平台,还可以有更多的使用场景:如利用大数据可视化分析平台,我们可以将数据以简洁优美的图表、表格等形式呈现,搭配上图案和背景,形成一幅赏心悦目的新闻作品,为读者提供一种充满视觉享受的轻量化阅读体验;如各类指数的数据建模分析,平台提供诸多分析能力:表计算、跨视图粒度计算、聚类分析、趋势分析、预测分析、同环比分析,帮助用户循序渐进建设自己的数据模型;各类报告的试阅,平台可通过二维码或分享链接,快捷地与他人分享我们的分析结果,并可设置分享密码和分享链接失效时间(参见下图);支持决策分析,接入经营数据生成各类图表,设置到领导驾驶舱为领导提供决策分析依据,管理层可以随时看到自己最关心的核心指标以清晰美观的方式进行展现,提出的问题也可以迅速得到数据支撑的答案。
图6 通过二维码或分享链接分享分析结果
总结起来,使用该平台进行新闻数据可视化内容生产有四大优势:一是安全。平台私有化部署在南方报业传媒集团内部,所有数据源保护在集团内部,不需要担心数据有泄露的风险,同时数据还有严格的权限管控机制,支持数据行列级别的权限控制,能更有效保障数据的使用安全;二是简单、易用。PPT 式的报告制作方式,使用门槛低,轻松上手,同时免安装客户端(推荐用chrome 浏览器),可以让集团全员进行数据分析和应用;三是智能。平台具备智能图表推荐、智能问答(自然语言)、智能分析(一键数据分析)的功能,进一步降低用户使用的门槛;四是性能强大。平台基于大数据技术建设,支持数据行列级别权限控制、亿级数据秒级响应,这让不同业务人员可以灵活地进行多维分析,快速地发现数据中的规律。下面是通过平台创建的两个可参考的数据可视化案例:《希望的种子》将圆环图、散点图、图标及各种生物的照片巧妙地编排在一起,给人以旋律与节奏的联想,融合成了一幅具有音乐感知引导的数据可视化作品。
图7 可视化案例:《希望的种子》
《世界杯球员数据》在配色中加入热情的暖色系,并将球员的身高、体重等数据信息加入了联动效果,点击某一项维度,便可看到图表的即时变化,交互感强,给人以有序、生动的整体印象。我们已经把26 个优秀案例部署在大数据可视化平台中,几乎涵盖了所有图表的运用,集团用户可以随时利用这些案例来深入学习。未来我们还将不断地把集团用户利用平台新设计的优秀案例引入平台,以形成良性循环。
图8 可视化案例:《世界杯球员数据》
在新一轮的媒体融合转型中,面对海量的大数据和急速的变化,新闻从业人员需要一个再学习、培养和转型的过程,提升数据素养,锻炼数据分析与思维能力,打造新型的新闻专业人才。南方报业传媒集团的大数据可视化分析平台,为员工的数据转型提供了利器。为了让集团员工更好地使用大数据可视化分析平台,信息技术部近期安排了多场专项培训,各部门员工报名踊跃,参加人数超出预期。今后,希望平台能帮助记者编辑和智库生产人员制作出更多优秀的可视化新闻作品,并促进集团内新闻业务相关部门达成更多数据可视化方面的合作。
(作者陈欣系南方报业传媒集团信息技术部数据中台室副主管,陈琼系南方报业传媒集团信息技术部副主任)