随着大数据、物联网、人工智能、云计算等技术的兴起,可视化越来越受到人们的关注,而暑期学校也已经成为业界学习、了解可视化的重要途径。
此次特别峰会分为四场,分别为概述与前景篇、科学可视化和交互篇、可视化成长篇、可视化跨界篇,诸位讲者将分别从不同维度为大家带来可视化领域的精彩分享。
文章顺序按讲者出场顺序。标题为 “讲者-单位-标题” 的表述方式
开篇 概述与前景篇
谭晓生 - 360 - 第五战场,网络战争
从FaceBook影响美国大选、茉莉花事件、震网事件等引出网络战争日益凸显,介绍可视分析用数据监控-事件预警-人工干预的方式助力网络攻击发现。
接下来介绍了几个项目、安全大脑1.0、全网数据地图测绘等表示人才缺口和市场机遇
最后强调了可视分析在网络攻击发现中的作用以及炫酷的数据展示方式在政府及领导层面的巨大作用。
陈宝权 - 北大 - 视觉感知,从计算到智能
强调几何元素,(相对于颜色、光影的元素)在视觉感知中的重要性,介绍三维重建从计算式重建到智能式重建。
介绍以前相对传统的三维重建方式,计算式重建。
计算式重建: 航拍->数据清洗->数据补充->三维重建的过程。
由人类可以从single image 还原三维场景,那么机器理论上也可行引出智能式重建。
智能式重建:机器基于联想和经验知识将数据获取智能化。将数据获取、清洗、补充、重建作为一个闭环。主动感知,主动理解、对结果进行重建、对重建中低可靠性的部分进行二次感知、重建。
屈华民 - 香港科大 - 可视化的三大机遇和下一波荣景
第二波荣景 2012年到现在
代表性事件
- 大数据的兴起 面向大众的可视化、可视化和机器学习的融合
- IEEE VAST 会议创办
- 2006 Tableau 发布 2011 D3.js发布
- 2012 大数据元年
代表性工作
- D3.js
- Tableau
- tensorFlow Visualization Plugin
可视化面临的困境
- 手工作坊式的产出模式
- 所有的图表均为程序员手工创作、而非大规模机器生产
- 研究和实践的脱节
- 工业界(饼图,圈图)和学术界(可视分析)认知脱节
- 增长的困境
- 可视化、可视分析缺少落地场景
三大机遇
- 大规模创制
- 图表的大规模创制,技术上已经成熟。
- 由双十一 4亿张海报由AI生成 引出AI生成图表,以及图表质量的智能化评估(介绍了本组关于力学图质量评估的工作,主要基于边交叉、节点覆盖等维度)。
- 以解释为主的可视化崛起
- 欧盟法律规定、AI产品客户可以要求解释(AI算命为是什么是这个结果?)
- 可视化风格化(这里讲者的风格化指的是一种调性,例如在汽车外观设计上、劳斯莱斯的进气栅、凯迪拉克的尾灯等一种独立的设计语言)
- 可视化风格化 不同的叙事风格 简单作品风格化
- 用可视化讲故事。 做一些movie
讲者的一些观点
- 可视化是搞大数据的基本修养,可能并不存在可视化工程师的Title。(这条以下会有讲者重复)
- 机器学习避免引入人的因素 (人相对不可靠) 解释性可视化日渐重要。(这里提的是可视化作为机器学习的解释。关于是否引入人这个元素的问题接下来会有讲者持不同观点)
Q&A
Q:图表怎么风格化,工程师在设计师出图后开发是否有意义?
A: 多与艺术界合作,技术实现本身也是一种竞争力
Q:批量生产与风格化是否矛盾、怎么推进?
A:并不矛盾,技术上是OK的,缺人,学术圈也在推进,没辙。
徐迎庆-清华-行为与情感理解
清华大学最近成立了未来实验室,并从目前进行的人场交互、嗅觉计算等进行了展示和介绍,包括人场交互、行为理解、身份理解等概念,他认为人机交互应当包含情感因素,目前正在做情感交互与理解实验室,希望更多志愿者积极参与。
以下为讲者的一些研究方向
- 人场交互 行为理解 身份理解 (应用 无人商店 线下商城等)
- 情感分析 (应用 智能音箱 情感化 等)
- 多维可视化 以三维技术为基础 引入体感等交互方式 相对于人来说的多种信号输入。
Q&A
Q:如何看待大数据与公民隐私?
A: 核弹还是电厂,区别在于人
Q:如何提高语音识别精度、日常语音情绪不明显
A:不仅日常语音情绪不明显,在情绪极端的情况下同样不易区分、例如极端兴奋、极端恐惧、极端愤怒等。引入大量数据可改善这种情况
技术篇:科学可视化和人机交互
刘世霞-清华-可视化与机器学习的模型进行交互
讲者提出讲机器学习是个黑箱,把人引入机器学习的循环里以帮助解决模型理解和诊断
- 数据标注阶段机器学习中存在不可靠因素(这里讲者列举了一些经过污染的图片,例如一张猴子的图片经过污染之后表面仍是一张猴子的图片但在神经网络几次迭代之后机器识别为桌子确认度为99%的情况)
- 观察机器学习中的路径(在前边的几层路径走错之后更深度的学习是无效的而且及其耗时应该人为修正)
- Debuging阶段引入可视化的方式避免阅读巨型Log文件
单桂华-中科院计算机网络信息中心-科学可视化助力科学发现
有数据的地方就有可视化。可视化可以助力科学探索与发现,并结合可视化在天文领域和力学领域的应用展现了一些科学可视化的结果主要有:
- 黑洞吸积盘可视化
- 科学可视化中大规模可视化全局与局部困境(全球洋流查看全局则无法发现小的湍流,查看湍流则由于视野过小无法发现湍流产生的原因)
- 宇宙背景辐射可视化
- 高铁尾流漩涡可视化
同时介绍了一些科学可视化在辅助参数优化方面的工作。
MIckael macguffin-ETS-AR for knowledge workers
先讲了一堆AR、VR、MR的游戏,引出渲染游戏的方式同样可以通过更多的交互方式帮助知识工作者提升工作效率,演示了Microsoft Hololens与surface结合,通过语音与触摸的方式将操作框扩展至整个视野,以提升工作效率(笔者内心语:原来微软也在搞TNT(详情见锤子TNT))。
接下来演示了AR三维图表,解决二维层面需要分表的问题。同时增加了交互方式。
Q:没听懂
A:没听懂
曹翔-小小牛创意科技-科技为创造而生
介绍 “创 + 造 创是idea,造是make”的观点
整体介绍一个软件(相当于一直在打广告)
该软件降低3D建模门槛
成长篇:我与可视化的故事
赵颖-中南大学-我与可视化暑期学校的故事
以寻找初心、初尝胜果、低谷徘徊、继续前进几个篇章阐明了自己进行可视化研究的道路,讲自己首次参加可视化学校->选定博士方向->参加历年VAST-Challenge->发Paper->毕业->参加学术访问->任教->申请基金、带团队->学生参加VAST-Challenge及ChinaVis的故事。
王祖超-360-做有用的可视分析系统
表明两个概念的不同之处
可视化:展示结果 展示数据的时间、空间、属性特征
可视分析: 分析数据 分析数据的时间空间属性特征、探索其内在的模式和关联
讲述了其在学生时代以及产业时代对于一些问题的思考
讲者在学生时代的一些疑问
用户是谁?用户需要解决什么问题?用户能否用该系统解决他的问题?用户是否会操作该系统?
(笔者深有感触,毕设答辩时这几个问题被评委老师轮番怼来怼去,以及关于毕设题目中“分析”字眼的深究,评委老师认为没有分析算法就是纯可视化跟分析没有关系)
关于这些问题讲者的回答
用户是谁?
“用户是谁?根本没有用户啊,明明软件是我一个人写的,就我一个人在用,哪来的什么用户。可写Paper要用啊,那怎么办,那就当数据提供者是用户把”
用户需要解决什么问题?
“本身没什么问题需要解决啊,我也是拿来的数据、分析探索一番看看能发现啥、可论文必须要有一个问题,那就看看这个可视分析系统本身能发现什么解决什么,那问题就是什么咯。”
用户能否用该系统解决他的问题?
“那就看通过该系统是否发现了什么有趣的case,这个case是否能说明假想的问题,如果不能说明的话,两种方案,将问题改为这个case能说明的,修改系统功能以发下一些新的case来说明这个问题,也是一个重复迭代的过程”
用户是否会操作该系统?
“这个问题的确很难回答,一是我没有真实的用户,二是系统足够复杂之后既需要行业背景知识同时又要懂可视分析的一些基础交互方式。这类问题只能在有真实用户之后来回答”
关于如何做有用的可视分析系统
讲者以负责的全球网络扫描实施监控系统为例通过该系统的几次迭代中的问题来回答如何做有用的可视分析系统。
- 指定性任务,探索性需求不够复杂。(在讲者认为太过简单,仅是个简单的可视化展示与分析无关)。
- 自创探索性需求,但不够真实。(讲者非网络安全背景,自创的需求与业界真实需求存在一定差异)。
- 寻求沟通,真实复杂需求,功能太多,用户不太会用(经过不懈的沟通获取有效的真实需求之后经过一定的版本迭代系统功能已经达到一定的复杂度,功能太多,用户反而不太会用(大软件的通病,最明显的例子是Excel))
最终得出要做又有的可视分析系统需要:
真实的用户 真实的需求 探索性任务 足够的复杂度 实时数据 功能全面 容易使用
闻啸-阿里-数据可视化工程的定位
讲者首先表述了自己在学校和企业的定位差异
学校: 做可视分析系统、数据产品。 负责从问题提出到系统完成整个系统流程
企业:
第一阶段 - 图表工程师
在图表工程师阶段讲者认为,工程师应具备使用图表将故事的能力。例如一个图表能反映多种数据,能够讲多种图表叠加在一起,最够美观,图表的各个元素(例如颜色,大小,位置等)都有数据映射,同时还需要降低图表的理解成本,需要深挖业务。
第二阶段 - 视效工程师
使整体界面达到一种炫酷的效果,激发用户探索欲,关注欲以提高影响力。
更加扎实的技术底蕴,例如针对城市级的地理空间数据,海量的实时数据需要做到流畅绘制。分层展示地理要素的可视化表达方式,更加精细的地图精度等。
孙国道 - 浙江工业大学 - 从学校到学术界
讲者结合自己开始可视化的的经验,分为参加北京大学可视化暑期学校、进行小组项目、回杭州后的实践、 去斯图加特大学访问、回到浙江工业大学的不同阶段,对自己的可视化道路进行了梳理和分享。
成生辉 - 香港中文大学 - 高维数据可视化
讲者提出可视分析是第三代分析技术的观点
- 第一代:统计(从原有的数据中观察结果)
- 第二代:数据挖掘(在原有的数据计算结果)
- 第三代:可视分析(引入人的元素(行业知识))
跨界篇:可视化是风?还是雨?
徐瑞鸽 - 美国雪城大学 - The Role of Art in Visualization
而艺术与可视化的关系有三层
- 艺术让可视化更美丽
- 艺术可以增强可视化的可读性和可用性(readability & usability)
- 艺术可以激发用户探索欲,关注域提高影响力
针对单图,增加更多的设计元素(图形 颜色 图标)。
Q&A
Q: 设计何时嵌入,切入可视化(可视分析系统 ,科学可视化)
A: 合作的关系
谭力勤 - 罗格斯大学 - 科技智能重构技术
艺术与技术平等
万物智能互动,智能工具,智能材料,后人类大众
任远 - 任远工作室 - 计算机中的艺术
展示了一些意义不明但十分炫酷的可视化效果
张加万 - 天津大学 - 可视分析助理文物保护
介绍了在敦煌莫高窟的文物保护工作中利用大量的传感器采集数据,用这些数据利用可视分析的技术分析和应对风险的方法 。
同时提出壁画也是一种可视化壁画本身的作用为宣传经文,同时也是经文的另一种表述方式。壁画可以理解为经文的可视化。
Peter Eades - 悉尼大学 - Topographic and Geometric Graphs
讲述了一些关于图布局压缩的内容,在封闭的没有边交叉的图可以将图的面抽象成节点以构成新图。(太专业引了一堆数学,没听太懂,以下是官方介绍)
1 | 绍了关于小图布局的工作。他提出,图布局可以视为对只有点边关系的抽象图数据,增加面和面相邻信息转化为拓扑图,再增加边的曲线进行图布局。数学中的一些关于平面图的研究可以被用于进行图绘制,并可以通过平面图的性质,进行语义缩放、动画中的布局等。 |
袁晓如 - 北大 - 可视化的魅力
讲述了创办,暑期学校、ChinaVis会议人数历年增加,ChinaVis投稿数,挑战赛参赛团队增加速度迅猛。
接下来从可视化的“三民主义”角度阐述了可视化的魅力
of the people :从面向数据科学家-> 更加面向大众。
for the people : 可视分析系统解决很多问题`` 航空领域 伪基站等。
by the people : 做可视化本身有助于艺术表达。
他指出,可视分析是把算法与决策关联起来的一种技术,为机器和人的交互建立桥梁。对科学家而言,无论是哪个方向的研究,都需要可视化方法,这已经成为他们分析数据的重要手段。可视化恰好成为展现数据之美的一个重要途径。
笔者小结
此次峰会,多次点明,可视化展示、可视分析、科学可视化概念以及应用上的不同,不同的学者和可视化工作者也提出了在学术界和工业界对可视化的理解和应用上的一些区别。
可能并不存在单纯的可视化,可视化本身是一门跨界的学科,需要与业务深度界合。
机器学习人工智能发展迅猛,可视化可能在该领域大有可为,但仍需探索。
可能并不存在可视化工程师的Title,可视化是大数据从业者的一种基本素养。
虽然已经很重视艺术在可视化中的位置但艺术在可视化中的重要性仍比想象中的重要。