问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

8个提高数据分析工作效率的技巧

发布网友 发布时间:2022-04-23 13:53

我来回答

1个回答

热心网友 时间:2023-02-09 06:33

8个提高数据分析工作效率的技巧

我刚和一位老友恢复了联系。她一直对数据科学很感兴趣,但10个月前才涉足这一领域——作为一个数据科学家加入了一个组织。我明显感觉到她已经在新的岗位上学到了很多东西。然而,我们聊天时,她提到了一个至今在我脑海里都挥之不去的事实或者说是问题。她说,不论她表现如何,每一个项目或分析任务在令经理满意之前都要做好多次。她还提到,往往事后发现原本不需要花这么多时间!

听起来是不是很像你的遭遇?你会不会在得出像样的答案之前反复分析很多次?或者一遍又一遍地为类似的活动写着代码?如果是这样的话,这篇文章正好适合你。我会分享一些提高效率和减少不必要的重复工作的方法。

备注:请别误会。我不是说迭代都不好。这篇文章的重点在于如何识别哪些迭代是必要的,哪些是不必要且需要避免的。

什么原因导致了数据分析中的重复工作?

我认为没有加入新信息,就没必要重复分析(后面提到一个例外)。下面这些重复工作都是可以避免的:

对客户问题的诊断有偏差,不能满足需求,所以要重做。重复分析的目的在于收集更多的变量,而你之前认为不需要这些变量。之前没有考虑到影响你分析活动的偏差或假设,后来考虑到了所以要重做。

哪些迭代是必要的呢?下面举两个例子,一、你先建立了一个6个月后的模型,随后有了新的信息,由此导致的迭代是健康的。二、你有意地从简单的模型开始逐渐深入理解并构建复杂模型。

上面没有涵盖所有可能的情况,但我相信这些例子足够帮助你判断你的分析迭代是不是健康的。

这些生产力杀手的影响?

我们很清楚一点——没有人想在分析中出现不健康的迭代和生产力杀手。不是每个数据科学家都乐于一边做一边增加变量并反复运行整个分析过程。

分析师和数据科学家会因为不健康迭代和丧失效率而深感挫败,缺乏成就感。那么让我们尽一切努力来避免它们吧。

小贴士:如何避免不健康迭代并增加效率

技巧1: 只关注重大问题

每个组织都有很多可以用数据解决的小问题!但雇一个数据科学家的主要目的不在于解决这些小问题。好钢要用在刀刃上,应该选取3到4个对整个组织影响最大的数据问题交给数据科学家来解决。这些问题一般具有挑战性,会给你的分析活动带来最大杠杆(或者收获满满或者颗粒无收,想象一下借贷炒股)。当更大的问题没被解决时,你不应当去解决小问题。

听起来没什么,但实际上很多组织都没做好这一点!我看到很多银行没用数据分析去改善风险评分,而是去做市场营销。有些保险公司没用数据分析提升客户留存率,而是试图建立针对代理机构的奖励计划。

技巧2: 一开始就创建数据分析的演示文稿 (可能的布局和结构)

我一直这样做并且受益匪浅。把分析演示稿的框架搭起来应该是项目启动后的第一件事。这听起来或许有悖常理,然而一旦你养成这个习惯,就可以节省时间。

如何搭框架呢?

你可以用ppt、word、或者一段话来搭框架,形式是无关紧要的。重要的是一开始就要把所有可能情况列出来。例如,如果你试图降低坏账冲销率,那么可以像下面一样布局你的演示文稿:

接下来,你可以考虑每个因素如何影响坏账冲销率?例如,由于给客户增加了信用额度导致银行的坏账冲销率增加,你可以:

首先,确定那些信用额度没被增加的客户并没有导致此次坏账冲销率增加。

下一步,用一个数学公式来测量这个影响。

一旦你把分析中的每一个分支都考虑到了,那么你已经为自己创造了一个良好的起点。

技巧3: 事先定义数据需求

数据需求直接源于最后的分析结果。如果你已经全面地规划了要做哪些分析、产生什么结果,那么你将知道数据需求是什么。这里有几个提示来帮助你:

? 试着赋予数据需求一个结构: 不单是记下变量列表,你应该分门别类地想清楚分析活动需要哪些表格。以上面增加坏账冲销率为例,你将需要客户人口统计表,过往市场营销活动统计表,客户过去 12 个月的交易记录,银行信贷*变更文件等资料。

? 收集你可能需要的所有数据: 即使你不是 100%肯定是否需要所有的变量,在这一阶段你应该把所有数据都收集起来。这样做工作量大一些,但是与在以后的环节增加变量收集数据相比,还是更有效率一些。

? 定义您感兴趣的数据的时间区间。

技巧 4: 确保你的分析可重现

这个提示听起来可能很简单——但初学者和高级分析人员都难以把握好这一点。初学者会用Excel执行每一步活动,其中包括复制粘贴数据。对于高级用户,任何通过命令行界面完成的工作都可能不可重现。

同样,使用记事本(notebook)时需要格外小心。你应该克制自己修改以前的步骤,尤其是在前面的数据已经被后面的步骤使用的情况下。记事本在维护这种涉及前后数据勾稽关系的数据流方面表现地非常强大。但是如果记事本中没维护这种数据流,它也会非常没用。

技巧5: 建标准代码库

没必要为简单的操作一次又一次重写代码。它不仅浪费时间,还可能会造成语法错误。另一个窍门是创建常见操作的标准代码库并在整个团队*享。

这将不仅确保整个团队使用相同的代码,而且也使他们更有效率。

技巧6: 建中间数据集市

很多的时候,你会反复需要同一批信息。例如,你将在多个分析和报告中用到所有客户信用卡消费记录。虽然你可以每次都从交易记录表中提取,但是创建包含这些表的中间数据集市,可以有效节省时间和精力。同样,市场营销活动的汇总表也没必要每次都查询提取一次。

技巧7: 使用保留样本和交叉验证防止过度拟合

很多初学者低估了保留样本和交叉验证的强大。很多人倾向于认为只要训练集足够大,几乎不会过拟合,因此没必要交叉验证或保留样本。

有这种想法,往往会在最后出岔子。不单我这样说——可以看一下Kaggle上任意竞赛公开或非公开的排行榜。你会发现前十名中有些人不再过拟合时他们的排名就不再下降了。你可以想象这些都是高级数据科学家。

技巧8: 集中一段时间工作并且有规律地休息

对于我来说,最佳的工作状态是集中利用2-3小时解决一个问题或项目。作为一名数据科学家,你很难同时完成多项任务。你需要以自己的最佳状态对待一个单独的问题。对于我来说,2-3 小时的时间窗口最有效率,你可以依据个人情况自行设定。

后记

上面这些就是我提高工作效率的一些方法。我不强调非要第一次就把事情做好,但是你必须养成每一次都能做好的习惯——这样你才能成为一个专业的数据科学家。

你有什么提高工作效率的好方法吗?有的话请在下面的评论中留言。

原文标题:8 Proctivity hacks for Data Scientists & Business Analysts

翻译笔记

1、catch up with sb.还特指同某人恢复联系,相当于become current with what’s going on in someone’s life when you haven’t been in touch for a while

所以这句话的意思是说 “再次联络到(碰到/遇到)你真好”,特指有段时间和你没有见面或者联络时候的说法。

2、proctivity killers,生产效率杀手,降低生产效率的因素,阻碍提高生产效率的因素。

3、坏账冲销率,信用卡行业的重要指标,每月发生坏账除以当月初信用卡应收款总额的年化比例,主要用于衡量资产的信用水平。

4、插图中Brand strategy change,品牌战略变更可能会导致坏账冲销率增加。例如,当采用竞争品牌或者边际品牌战略时可能会导致坏账冲销率的增加。

5、品牌战略:

形象品牌。在品牌竞争中形象品牌能有效地赢得公众的信赖,形成良好的“口碑”效应,对累积、提升品牌资本有着极为重要的作用,能促进企业其它品牌的推广。例如,雀巢公司的“雀巢”作为母品牌就是形象品牌,它有力地推动了其众多的子品牌。因此,企业的品牌经营战略不能没有形象品牌。竞争品牌,通常是针对市场上同类产品而推出的,它将通过其特殊的市场定位如技术上的、价格上的或服务上的特色撕开竞争对手的防线,或开辟崭新的目标市场。显然,竞争品牌的主要目的就是为企业争夺更多的市场份额,创立企业的竞争优势。这种类型的品牌也许现在并不能为企业带来多少利润,但发展潜力极大,是企业参与未来市场品牌竞争的关键和希望。利润品牌,是企业多品牌经营的中心。利润品牌为企业创造利润是现代品牌经营的重要特征。利润品牌一般都是企业独特技术(企业核心竞争力)的代表,竞争者难于在较短时间内进入这一领域为企业创造很大的利润空间,甚至是超额利润。当然这类品牌如果不加以提升和改善,就有进入衰退期的可能。边际品牌,是企业多品牌经营战略的必要补充。边际品牌不是企业的形象品牌、竞争品牌,从其表象看难于创造利润但因其具有一定的客户基础,不像其它品牌那样需要高额的投资。因此,即使该品牌的销售额停滞不前或缓慢下降,仍有一批忠诚的消费者不会放弃这类品牌。边际品牌的作用就是创造盈余资源,并为企业的竞争品牌、形象品牌和利润品牌提供资源支持,为冲销企业的固定经营费用做出贡献。

6、插图中“Acquisition driven”,acquisition意为(1)(对公司的)收购,并购;(2)(图书馆通过采购、交换赠阅等)图书资料的获得;获得的书籍(或报刊、杂志);(3)(知识、技能等的)获得,习得。例如,data acquisition指数据采集。

7、插图中“Spend simulation”,译者在此只依文解义的翻成了“花费模拟”。在ask.com搜索引擎中,没有相应内容,网站提示是否搜索spent simulation,spent是一个互动游戏,由一个帮助流浪者和贫穷者的公益组织发起,玩家用1000美元生活一个月模拟贫穷的生活状态,玩家参与互动游戏时会面临很多选择,比如Cover the minimum on your credit cards or pay the rent?支付信用卡还是支付房租。这个游戏从2011年2月第一次举办到2014年7月已经有200万人在218个国家玩超过400万次。如果客户参与这类活动,可能会导致信用卡超期未付。参考链接:http://umrham.org/  https://en.wikipedia.org/wiki/SPENT_(online_game)#cite_note-2

8、data requirement,数据需求,与之相关的还有Market requirement,Proction requirement,其中产品需求与数据需求关系紧密。因为数据需求随着产品业务逻辑展开。要收集一个产品的数据,首先需要了解产品业务逻辑,例如功能之间的交互关系以及单一功能的业务逻辑。其次将业务逻辑节点化,识别出重要节点并列出优先级。再次将节点化的业务代码化,主要将列出的重要节点(需要统计的节点)添加统计事件和统计参数。最后形成数据需求文档。

9、more often than not,往往。

读后感

译完这篇文章,我感觉数据分析人员可以从两个方面借鉴经验,一是从传统管理咨询行业借力,DA需要具备的能力包括传统咨询行业解决问题的能力加上数据处理技能。比如本文的第二点提示,类似于咨询行业的重要方法——结构化思维。可以参考芭芭拉·明托编写的《Logic in writing, thinking and problem solving》(中文译名:金字塔原理——思考、表达和解决问题的逻辑),这本书是麦肯锡的经典培训教材,介绍了很多实用的方法,帮助读者在思考表达时重点突出、逻辑清晰、主次分明。二是可以从传统的数据资源规划中得到启发。本文第三点提示,如何确定数据需求,恰恰可以参照传统数据资源规划中从业务需求得到数据需求,并对业务和数据进行建模的系统化方法,具体可以参考高复先教授的《信息资源规划:信息化建设基础工程》。

本文最后提到工作和休息,这点因人而异。我觉得需要关注以下几点:

一是评估综合效率。一周有一两次效率特高,但综合效率或许不如一周都保持一个平稳的节奏。可以尝试用番茄钟这种时间管理工具来量化分析一下自己的情况;

二是调整生活习惯。数据分析工作需要饱满的精力,影响精力的因素很多,比如暴饮暴食可能就会带来负面影响。

三是关注呼吸,如果我们高效率的时候身心舒畅,呼吸自然,那么这种状态是可持续的。如果精力集中时,经常屏住呼吸,这种方式更倾向于消耗。冥想和正念训练或许会有帮助。

工作有如跑马拉松,有些人的目标不为跑得快只为跑得年头久,希望60岁依然能去跑,这类人对控制心率的需求大过提高速度。有些人希望尽快提高成绩,去冲刺几个重要赛事,因而自愿承担自由基增加的代价。做数据分析也一样,设定怎样的目标,那就怎样去奔跑吧。

以上是小编为大家分享的关于8个提高数据分析工作效率的技巧的相关内容,更多信息可以关注环球青藤分享更多干货

统计分析8大方法,用对统计分析软件效率翻倍!

六、综合评价,全面视角的钥匙面对复杂的社会经济现象,综合评价分析法就像一把钥匙,解锁多元因素的影响,提供全面而深入的理解。七、景气分析,洞察经济脉搏景气分析,是宏观经济决策的得力助手,通过宏观经济和企业景气调查,为我们把握经济波动和稳定提供了有力工具。八、预测分析,预见未来的智慧统计预测,...

Excel操作技巧提高你的数据分析效率

4.多表格数据快速查找 查找替换功能都会使用,如果想要在三百张的表格数据中找到想要的内容应该怎么办呢?嗯简单在查找替换的时候,选择工作范围按钮进行操作,如下图:5.快速插入批注 批注插入经常进行操作,如何快速进行操作呢?教你一个快捷键操作方法,一秒快速进行,首先按住shift,然后按住F2即可。6.高...

分析师如何提高工作效率

增强抗干扰能力 :如果周围的环境太嘈杂,心还能静下来是最好的,但是如果静不下来那可以戴一个降噪耳机,通过物理降噪的方式来寻找安静的环境,提升自己的专注力。 学会情绪管理 :对接业务方可能会遇到不好沟通的,尽可能将注意力都放在任务本身上,放到人身上容易影响到情绪,从而影响工作效率,要知道将目标完成才是最重要...

如何提高数据分析的效率?

五、用图表说话 简略明晰的图表能够协助更好的展现数据结果,发现问题所在。在数据剖析的过程中,图表能够协助理清剖析思路,跳出剖析瓶颈。六、多种可视化展现 跟着信息化的发展,数据井喷时代带来海量数据,以往一般单调的展现方式现已无法满足需求。一起,关于企业来说,明晰多元的数据能更好的开掘问题所在...

资料分析速算技巧(提高计算效率,提升数据分析能力)

二、快速计算平均数 在数据分析中,计算平均数是一个基本的操作。但是,当数据量很大时,手动计算平均数会非常耗时。因此,我们可以使用快速计算平均数的方法,即使用平均数公式。平均数公式的步骤如下:1.将所有数相加;2.将上述和除以数的个数,即为所求的平均数。例如,有一组数据:2、5、8、11...

这八个体制内常用的Excel办公技能,让我分分钟变厉害

在体制内工作中,掌握一些Excel办公技能可以大大提高效率。以下是八个实用的技巧,让你轻松提升工作效率:1. VLOOKUP函数匹配: 用于将两个表格中的相同信息关联起来,如姓名与电话。使用VLOOKUP函数,如公式`=VLOOKUP(B2,Sheet1!A1:B9,2,FALSE)`,能精确匹配数据,避免手动复制粘贴的繁琐。2. 自动表头...

数据分析法HR怎么用才能提升效率

提高数据分析法的效率 (1)不是每个数据都要分析:抓重点、抓关键、抓中心,牵扯到工作核心的数据一定要保持思维高度活跃,运用科学的方法进行分析得出结论。对于那些琐碎的数据碎片,我们可以不浪费时间。(2)是否有更高效的.分析法:打个比方,对于3W分析法来说5W1H分析法的数据分析范围更广阔,所以...

分享7个最提高效率的Excel分列方法(附案例)

在数据处理的世界中,Excel的分列功能就像一把神奇的钥匙,能帮助我们高效地解锁数据的潜力。今天,我们将深入探讨七个提升工作效率的Excel分列技巧,让你的数据管理如虎添翼。1. Excel分列操作指南 想要使用这一强大工具?只需在"数据"菜单栏中找到"分列"选项,跟随向导的引导,就能轻松上手。方法一:...

如何运用信息技术提高工作效率

运用信息技术提高工作效率如下:1、提高信息获取能力:掌握信息技术的基础知识,如计算机操作、网络应用等,提高获取信息、处理信息的能力。同时,要学会利用各种搜索引擎和数据库,获取与工作相关的知识和资源,以减少重复性劳动。2、提升自动化处理水平:信息技术的发展让许多工作流程实现了自动化,例如使用...

2. EXCEL常用技巧(二)

Excel,数据分析师的得力助手,掌握它的基础技巧,工作效率将翻倍。本文将继续揭示更多实用的Excel操作,让你的数据分析之旅更为顺畅。1. 智能填充(Ctrl + E)的魔力常规填充功能虽然常见,但面对复杂数据,智能填充(如图所示)大展身手。当需要提取如图中的数值串时,普通填充无能为力,只需在第一个...

提高矢量数据叠加分析效率 提高数据处理效率技术 为了提高数据的检索效率 提高数据输入正确性和效率的方法 视图能够提高对数据访问的效率 索引可以提高数据输入的效率 为了提高数据库的查询效率 提高矢量数据叠加效率 提高多表关联数据查询效率
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
山东海天软件工程学院到底在哪? 山东工程职业技术大学地址是什么 异地汇款中行转农行的手续费是多少? 佳木斯提前几天卖异地票?佳木斯到北京的呢? 什么时候卖2017年佳木斯到烟台的火车票1月13号往后的 2017年的二月二号的火车票佳木斯至胶州的开始卖了吗 烟台到佳木斯2017年1月15日火车票 佳木斯车站提前几天售票 2017年佳木斯到烟台春运期间的火车票哪天能卖 作为大学生应如何坚守意识形态 数据处理能力提升,有关数据有效性的相关设置 寻找细微差别的图片,怎么搜索? 提高数据处理效率的基本途径 有二微吗图片怎么扫 网络里如何通过图片找人? 如何从图片上微销通水印找到商家 微博怎么通过照片找出微博 airpods2跑步时可以不带耳机盒吗? airpods掉地上 运动的话AirPods2好还是beats? 无线的跑步耳机戴哪款会比较舒服 我带earpods会掉 带airpods会不会掉 跑步的时候用蓝牙耳机不好吧,容易掉,没有哪款蓝牙耳机适合吧? 运动跑步戴AirPods可以么 airpods跑步时容易掉吗 只是去掉了两根线的airpots到底有什么科技含量? AirPods跑步的时候容易掉吗? 苹果的airpods,戴起来去跑步会不会很容易掉 如何评价苹果的 AirPods无线耳机? 戴起来真的舒服容易掉吗? 跑步带什么耳机 大学生如何提高数据处理能力 提高数据分析能力必读书籍推荐 如何提升高中生的数据处理能力 如何提高数据处理,分析能力 如何提高电脑的数据处理能力? 怎样有效提升图表中的数据处理能力.ppt 如何大力提升数据运营能力,发挥数据应用 如何在自主实验中培养学生实验数据处理能力 卷心菜为何有圆的还有扁的?哪种更好吃更有营养? 平包菜和圆包菜区别 圆包菜好吃还是扁包菜好吃? 包菜和卷心菜有何区别? 甘蓝和卷心菜是同一种吗,为什么有的说甘蓝是偏绿的,分不出来,还有,有的是扁的有的是圆的哪个是甘蓝啊 包菜还叫什么,包菜有什么特点 包菜的品种 工资低辞职报告怎么写 工资低离职原因怎么写? 因工资辞职报告怎么写 我换了一个手机,自己拍的抖音作品就一个也没有啦!不知道咋样才能找回来? 工资低 辞职信怎么写