数据科学家变身故事大王的秘诀是……?
讲故事有助于人们更好地感知发生在自己周围以及之前发生的事。讲故事者不仅以此来吸引面前观众的注意,也吸引了后来者的注意。讲故事是一门艺术。随着时间的流逝,用于讲故事的技巧、方法和工具有所改变,但主要思想和目标却没变,即如何有效地吸引观众,让他们明白你讲的故事。
- 作者:读芯术来源:读芯术|2021-03-29 13:38
本文转载自公众号“读芯术”(ID:AI_Discovery)
作为数据科学家,我们也应擅长讲故事。我们经常要向不同的利益相关者展示工作,由于他们的背景不同,所以我们也要相应地变化语调。但在任何情况下保持不变的是,讲故事的那个人是你。
许多方法有助于讲好故事,让我们一起来研究研究。
尽可能多地交流
交流是有效实现某事的关键。作为数据科学家,尽可能多地与不同的相关者交流就更加重要。我们通常把相关者分为四类:
- 用户——他们渴望看见经验的最佳解决方法
- 领域专家——他们有义务用领域的专业知识提供帮助
- 行政领导——他们对业务和收入更感兴趣
- 技术人员——他们对技术方面的事最感兴趣
为了有效地与他们交流,需要用他们能理解的方式交谈。用户对于最终解决方案和解决难题的方法更感兴趣;行政领导和经理更倾向于关注收入及相关的事情;领域专家乐于在相关领域用专业知识提供帮助。你需要利用他们的知识为给定的问题构建一个好的解决方案。
以既定事实开头
讲故事要以人们都知道的事实开头。可以是用户每天面对的问题,或是未经优化的、可以智能化的东西,也或许是能为公司创收的东西。若以人们早就知道的事开头,人们就能有更好的理解,因为他们亲身经历过这件事。
通常,对于不直接接触技术的概念的人来说,技术概念抽象模糊又复杂。讲故事包括两部分:
- 有助支撑论据、易于观众理解后面的故事情节的种种事实。
- 为了说服观众采取行动、把故事中展示的事与思考内容和思考方式联系起来的叙述
因此,有必要以一种为预期的相关者描绘解决方案的方式来展示事实。
利用视觉化吸引观众
一图值千言。的确如此,仅仅一张图就能展示你想向观众传达的一大堆话。不同的图表、数字、视觉化工具可供选择以让观众更好地理解数据进展、数据趋势以及数据的一般行为。
有时在分析数据或使用不同的统计技术时,可能会遗漏有用信息,此时教具和图表会起作用。它们使你发现之前未注意到的部分、方面以及对加强数据的理解。
视觉化实际上是一个机会,让你用观众理解的事替代故事。例如,如果在一个图表里有许多变量,那么观众可能不易理解,在图表也复杂的情况下。所以,你最好制作简单而直接的视觉图像以便利用它们叙述故事。
使用统计学理解数据
统计学对于理解和解释数据大有裨益。你可以从中推断出许多事实,并利用这些事实来更好地理解它们。
统计学主要可以分为两类,描述统计学和推论统计学。前者描述现有数据而后者展示数据中不同特点和变量的总体关系。通常,使用描述统计学能获得关于当前或可用的一组数据的信息,而使用推理统计不仅仅能基于一个或多个样本使用抽样来概括总体。
根据故事的不同层面选择不同的统计学类型很重要,这可以对现成的数据加以解释,并把结论讲给那些你不了解他们的特点的人。你可以使用这一信息告诉观众你在数据中发现的不同的理解,并相应地建立不同的假说。
解释模型的运作原理
机器学习模型通常被称为“黑盒”。如果你使用过一些高级模型,那么就需要在性能和可解释性之间进行权衡。线性模型,逻辑回归模型和基于树的模型是容易解释的,而非线性模型是很难解释的。
在现实世界,没人想使用自己不理解的东西。而且,在一些领域如银行业、保险业和药业,更需要解释管理过程要求。可解释性的另一层面是对不同利益相关者的终极信任。众人皆知,如果我们清楚地理解一件事的运作原理,那么就会自信地使用它、信任它。
同理,机器学习模型也是如此。如果理解这些技术,人们就会对题目更感兴趣。可解释机器学习模型的技术多种多样。一些现有的技术与统计推断相关,它们可以帮助我们识别关键特征,并从数据中获得有意义的表示。
讲故事涉及多种内容。它是一种艺术,通过实践和学习可以加强讲故事的能力。它可以从原始数据中挖掘出黄金,帮助你和你的用户发现之前可能会遗漏的理解和信息。
希望本文的技巧能帮你修炼成为一个“讲故事大家”。
【编辑推荐】
点赞 0
- 大家都在看
- 猜你喜欢
编辑推荐
- 24H热文
- 一周话题
- 本月获赞
- Pandas数据合并与拼接的5种方法看完了这篇实时数仓建设,才发现以前的都白看了(内有美团案例)Hive中的内部表、外部表、分区表和分桶表现代数据分析的5个视角图算法系列之无向图的数据结构一款Kafka可视化Web界面管理工具:CMAK用Python画中国地图,实现各省份数据可视化Python数据可视化:箱线图多种库画法
- Pandas数据合并与拼接的5种方法谷歌推出新开源语言Logica:用于大数据处理看完了这篇实时数仓建设,才发现以前的都白看了(内有美团案例)一款Kafka可视化Web界面管理工具:CMAK数据大佬教你简单粗暴的绘制Excel中的箱线图Python数据可视化:箱线图多种库画法“十四五”规划里的大数据前景解读大数据发展前景:大数据未来竟是这样?
- Pandas数据合并与拼接的5种方法一款Kafka可视化Web界面管理工具:CMAK看完了这篇实时数仓建设,才发现以前的都白看了(内有美团案例)数据大佬教你简单粗暴的绘制Excel中的箱线图Python数据可视化:箱线图多种库画法终于有人把业务中台、数据中台、技术中台都讲明白了学习Python数据可视化,看这篇就够了阿里的过来人告诉你,数据中台为什么搞不下去了?
订阅专栏+更多
-
数据湖与数据仓库的分析实践攻略
助力现代化数据管理:数据湖与数据仓库的分析实践攻略共3章 | 创世达人7人订阅学习
-
云原生架构实践
新技术引领移动互联网进入急速赛道共3章 | KaliArch36人订阅学习
-
数据中心和VPDN网络建设案例
漫画+案例共20章 | 捷哥CCIE230人订阅学习
视频课程+更多
-
Elasticsearch分布式数据库与ELK大数据平台实
讲师:风哥5416人学习过
-
GreenPlum分布式集群数据库培训(PB级大数据
讲师:风哥9112人学习过
-
【范昌明】从零开始系列-Project 2010视频课
讲师:范昌明197347人学习过
专题推荐+更多
-
订阅51CTO邮刊
点击这里查看样刊

51CTO服务号

51CTO官微