中华视窗是诚信为本,市场在变,我们的诚信永远不变...
谢谢
@ wang
的邀请,我来介绍一下我了解的数据可视化,以及我的同事何珊的成果。
一、可视化主要的四个采用源
所谓数据可视化呢,就是把客观的数据变成带有观点的信息,传递给他人。其形式包括但不限于平面图片、软件、视频、实物装置等等……大致归纳,数据可视化目前主要是在以下几类机构和行业当中被采用:
1.互联网公司
这里举例的是我所在的公司Uber。
下面三张图是为了反映Uber北京一年发展历程而进行的可视化工作。
我们将一天Uber乘客的所有行程依据时间与起终点转变成流动的线条,通过时间和空间在一个比例尺下的真实反映,绘制出北京移动地图。
2014年1月份的时候,我们还是这样的:
2014年7月份的时候,我们就已经很壮大啦:
知乎不能上动图,不如看视频感受下:
视频:-
2.学术机构
有众多学术研究机构将可视化作为研究课题,例如MIT
City Lab是目前数一数二的关注数据可视化的研究所,网址MIT City Lab。当然UCLA、、CMU、GTech等院校也都有相关的研究所,偏重方向各有不同。
MIT Lab的作品举例: data
MIT团队与可口可乐合作的案例,将可口可乐旗下各产品在不同城市的销售情况以可视化的方式展现出来。
视频在此:/ccfs//ccfs.mp4
3. 媒体
国外华盛顿邮报、纽约时报、英国卫报从2013年就开始了数据可视化的相关尝试
国内的财新传媒也是这方面的领头团体,他们的大部分作品都可以在链接数字专题_数字说频道 当中访问到。
4. 个人和工作室
其中最有名的可能就是位于纽约的工作室。他们的大部分作品都可以通过 and Data 进行访问,其中包括了很多为媒体(CNN, TED, MIT
, )、咨询机构( )、企业(GE、yahoo)做的平面、交互信息图。
二、可视化需要什么能力
有意思的是,以上列举的两个作品(Uber、MIT City Lab),都来自一名女性华人工程师。
她叫何珊。
她现在是我的同事,在Uber总部的可视化团队负责核心工作。有机会邀她本人来到知乎答一答,我先介绍一下她怎么看待数据可视化。
何珊是这样谈可视化的:
I am a and coder, play with , and bits. I build data that are and , the the and . I that can be , and that the next era of will use data as their .
(引自何珊的:/pub/shan-he/16/b/254)
何珊说,可视化设计师需要有以下三个模块的能力:设计、编程和讲故事的能力。最重要的要点是,设计者能将数据通过叙事展现给目标受众。
何珊本人是如何获得这三项能力的呢?
何珊在本科时在清华大学学习建筑,积累了图形、平面等设计的经验和技能;当她毕业后加入设计公司Blu Homes时,她接触到了三维空间可视化网页,开始学习网站设计。这次可视化接触让她开始想要学习更多的技术,于是进入了MIT学习 以及等各种编程工具。为了学以致用,她毕业后作为一名研究员加入了MIT Lab,开始接手一系列数据可视化项目。此后,何珊加入Uber,正式开始了她的数据可视化职业生涯。
三、Uber的可视化
我曾经好奇问过何珊,为什么你会选择来Uber做可视化?
何珊说,数据可视化的基础是优质的数据。Uber的出行数据具有时间、空间上高度的依赖以及精准,通过Uber的数据能够充分洞察用户,这是其他科技公司不能拥有的。
具体来看的话,Uber的数据可视化有以下特点:
需要有分析能力。每一次跑数据都是TB量级,如何将各种信息挑选出有价值的部分呈现出来,是需要分析能力的。
Real-time,Uber的数据是实时的,以秒计时的高速数据等待可视化工程师的整理。
Uber的数据可视化经常是模块化的,像何珊这样的优秀工程师设计的成品,通常可以被Uber各个城市重复利用,导入本地数据就可以得到精妙的结果。
这个特点能够让她有不断的挑战和新作品。
例如,何珊将Uber在美国九大城市的出行行程进行对比,可以看到人们出行时的偏好和重合路径。它可以成为Uber决策的工具(如Uber是否需要推出拼车服务);更为政府对于交通的管理提供借鉴。
点开链接,可以看到九大城市的出行热点:
/2012/11/--a-citys-flow-using-ubers--data/
所以,在Uber做数据可视化,就像在做一个翻译家,将后端冗杂、艰涩的数据转换成给消费者愉悦地欣赏的美丽图景,现在这些美丽的线条已经变成Uber的识别icon了,真是超级精彩!