企业如何使用机器学习和数据科学家

来源 :计算机世界 | 被引量 : 0次 | 上传用户:hanyanwei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  与数据科学家合作,逻辑胜过创造力。我们需要采用一些其他的商业方式。
  机器学习已成为商业技术的流行词,但其应用的实际意义往往被忽视。
  机器学习和数据分析专业公司Yandex Data Factory的首席执行官Jane Zavalishina说:“主要的问题是数据科学本身是科学,而企业在决策时不太习惯使用科学的方法。”
  该公司是俄罗斯最大的搜索引擎运营商跨国技术公司Yandex的子公司。2014年12月,Yandex启动了Yandex数据工厂,扩展了自己开发的数据科学的功能,支持其核心产品为行业应用提供基于机器学习的服务。
  该公司2014年末成为俄罗斯最大的搜索引擎运营商——跨国公司Yandex的子公司。它提供机器学习和数据科学服务,为广告活动策划和确定商店库存订单等事项建立预测模型。
  Yandex数据工厂团队通过实验过程确定其结果,只有在实验结束后才能判断是否成功。
  Zavalishina解释说:“当您把一些工作交给您的员工时,理想情况下,您或多或少地总是期望有一个完整的结果。但数据科学家的工作方式完全不一样,因为您不能指望数据科学保证能得到结果。”
  失败是任何数据科学项目合理的结果,业务经理以后也得接受这一事实。
  是什么让数据科学家与众不同?
  逻辑胜过创造力,而现实胜过信念,所以应采用其他的商业方法与数据科学家合作。换句话说,它取决于事实和逻辑,而不是想象会有什么样的结果。
  那么就会很难向数据科学家提出一些问题让他们回答,因为他们会认为这些问题根本上是无意义的。
  Zavalishina说:“听起来就像零除以零,没有意义。问题是您无法让他们去这样做;您不能让人们去做零除以零的事情。他们会认为您可能是一个白痴,不会与您很好地合作。”
  他们要先了解项目,觉得可以试一下。例如,如果他们打算使用机器学习来改进系统,那么他们要有足够的数据才能评估结果是否有意义。
  Yandex数据工厂首席运营官Alexander Khaytin说:“很多业务决策都是凭直觉做出的,这就是为什么不需要评估所有常规业务的原因。但是当面对数据科学项目,或者与数据科学家沟通时,您不能只告诉他们,‘这样做,我觉得会很好’。这样是不行的。”
  提出合适的问题
  预测分析建模所采用的算法比传统的统计系统更复杂。这可能很难解释。
  零售业经常使用数据科学来更好地预测每周订单的库存补货需求。结果可能令人惊讶,但是这个过程涉及的因素太多,通常很难理解。
  Zavalishina说:“对于不能理解数据复杂性的人来说,很难向他们解释,但由于无法解释,您无法根据常识或者商业智能来决定它的好坏。您需要确定您知道想改进什么,以及如何评估结果。
  这不是创造。它是很具体的,知道要预测或者优化什么。这就像和数学家打交道。您提出问题,那么您会得到这个问题的答案。
  如果您的问题是错误的,不要指望得到正确的答案。这是一个令人惊讶的常见问题,因为公司往往缺乏对其目标的全面规划和评估。”
  Zavalishina回忆说:“我们和一家大型零售公司合作,他们要求我们建立一个模型,预测下周每个商品能有多少销售。我们在一个商品上试了一下,但问题是他们意识到预测实际上对他们没什么用处。”
  他们的模型是准确的,但公司正在订购的产品是6个一包,而不是单独分开包装。如果预测的是下周7个商品的销售,那他们要回答的问题就完全不同了。他们应该买一个还是两个?可能会有些小变化,但实际上他们一开始就错了。模型变得完全不同,因为优化参数已经变了。
  数据科学需要仔细的进行规划。公司收到了正确的答案,但一开始应该提出不同的问题。
  在迈向成功的道路上失败了
  向另一家零售商提供的优化模型表明,他们很少售出的昂贵而又不常见的产品根本不值得订购。这个决定在数学上是合乎逻辑的,但这并不能说明在商业上可行。这些商品对于商店名声和客户群都是非常重要的。
  Zavalishina说:“可以向您保证的是,通过您的第一个数据科学项目或者机器学习项目,您需要回顾并重新考虑标准是什么,目标是什么。”
  Yandex通常建议客户从非常具体和短期的项目开始,以避免对项目进行长期投资带来的风险,因为这些项目可能会产生无意义的结果。这种方法允许公司全面地逐项进行改进。
  另一家公司有自己的系统来确定向哪些客户发送报价。Yandex使用由机器学习算法产生的统计模型的建议来确定怎样随机地联系一些客户群。其余客户根据以前的系统进行了联系,然后公司对比了从报价到实现销售的转换率。
  唯一的问题是,周五将报价发送给控制组,而在周末向实验组发送报价。不同的联系时间、不同的行为模式使得任何比较都没有意义。
  业务经理经常问Yandex是否应该参加机器学习或者数据科学课程,以了解怎样让技术给企业带来好处。
  Zavalishina说:“我们通常的回答实际上是‘不’,没有任何意义。这不会使您成为数据科学家,所以不会真的对您有所帮助。如果您希望能够将该技术应用于工作中,那么您应该更好地学习科学的方法以及测量和实验。基本上,如果您希望这种技术能带来结果,那么我们需要一种更科学的方法。”
  接受不确定性
  企业应接受科学文化。负面结果并不意味着工作失败,只是证明优化没有起作用。
  企业结构内的责任是另一个挑战。有一家客户曾经希望Yandex能够优化其广告支出。开发的算法实现了当初的承诺,能节省20%的成本。
  但要实现这一结果比得出结论更具挑战性。负责这个项目的工作人员的奖金取决于他们应该购买什么以获得最佳效果的计划和决策。
  Zavalishina解释说:“所以现在他们有了这个模型,为他们提供了建议,数学上证明这些建议更好,但问题是这是他们的责任。”
  数据科学项目承认同一业务中可能存在不同的责任和优先级。该团队将实施一个可能减少奖金的业务模型。
  Khaytin补充说:“谈到科学的方法,它更加理性,更具有可衡量性,这可能是一个相当矛盾的情形。
  通常的决策目的至少会被颠覆。例如,一位专家可以告诉您‘我有一种直覺,我有一种想法,会是这样’。在我们这里,您有一些数据科学工具,一些数据科学项目,它是完全不同的,没有直觉。”
  把商业和科学方法整合在一起是一个复杂的过程,需要耐心和理解。Yandex还与钢铁制造商合作,优化了生产过程中使用的材料混合物的配比。通过增加某种材料量来提高质量,但这种材料越多,产品就越贵。
  Yandex使用历史数据做出了让混合物质量和成本达到最佳平衡的准确模型,得到了由机器学习算法提供的配方。
  Zavalishina说:“这个配方对他们来说往往没有任何意义。他们看着说‘不行,我不能这样做,我不接受这个,我做的不一样。’
  有趣的是它虽然能带来更好的优化,但另一方面,他们有自己的经验,那么应如何处理呢?有80%的建议他们基本上都没有采用。
  我们想出了一个解决方案,这是获得我们提供的配方的另一种算法,在此基础上,还建立了预测,预测被客户接受的可能性。从严格的数学角度来看,优化后的配方好像不是最优的,但更有可能被接受。”
  长期以来人们一直恐惧人工智能可能会毁灭人类,但人与机器学习之间的结合仍然是数据科学的基础。
  原文网址:
  http://www.computerworlduk.com/data/how-use-data-scientists-machine-learning-in-enterprise-3656051/
其他文献
本报讯(记者 李敬)5月13日,微软公司宣布正式在中国推出Windows Embedded Standard7 RTM版(制造版)。据介绍,该款嵌入式操作系统与Windows 7有着同样强大的功能、触控用户界面和可靠的服务,同时具有定制化和组件化特性。  值得关注的是,这款跨越了Vista阶段的嵌入式操作系统不仅支持OEM厂商开发如触控电子展示牌等独特的用户体验,增强了专用设备与PC及服务器的互联
摘要:随着国家教育体制改革的进一步推进,职业教育已经成为我国教育改革的重要部分。职业教育扶贫措施是统筹城乡教育一体化发展、实现教育公平的有力措施,本文基于当前职业教育扶贫发展现状,力求找出其中症结,并提出相关政策建议,以期为我国职业教育的发展贡献绵薄之力。  关键词:职业教育 扶贫发展 现状 问题  一、职业教育扶贫发展现状  为进一步推进“科教兴国”战略的实施,国内许多中职学校逐渐开始对贫困学生
当智能手机开始普及,网络接入速度加快,资费降低,社交平台大规模增长,支付平台全面开放,消费者、供应商、劳动者、平台、地理位置、移动支付等均已准备完毕,移动互联网时代已经全面到来。  在“互联网 ”时代,信息更加对称,消费者有能力参与产品的开发、生产;消费者的个性化需求进发,大规模制造变成规模化定制,个性化、多样化的消费时代来临;去中心化、去中介化特征凸显,领导职能大大削弱;员工有足够的知识进行自主
国家在大力实施“走出去”战略的过程中,需要进一步发挥金融的推动作用,促进金融资本与产业资本的有机结合,为企业“走出去”提供全方位的支持与服务。  走出去”是我国经济发展和对外开放到了一个特定阶段后必然出现的趋势,是中国企业拓展市场空间、应对贸易壁垒、获取优势资源的战略选择,有利于改善我国国际收支结构,促进国际收支基本平衡。2014年我国非金融类对外直接投资规模为1028.9亿美元,同比增长14.1
摘要:复式教学是一种特殊的教学组织形式,它是指一位教师在同一教室内同一节课中为两个及两个以上年级的学生穿插讲解不同教材的知识。但由于各种原因,小学复式教学仍然存在诸多弊端,在一定程度上限制了学生的学习,也不利于课堂教学质量的提升。对此,本文提出了改善农村小规模学校复式教学的方法。  关键词:农村小规模学校 复式教学 弊端 方法  一、农村小规模学校复式教学存在的弊端  1.家长对复式教学的认识存在
市场  中移动与新华社打造盘古搜索新闻搜索为重点    本报讯 2月22日,新华社和中国移动共同宣布,双方联手研发的盘古搜索(panguso.com)上线,这一搜索引擎结合了双方在信息资源和网络技术方面的优势,将提供新闻、网页、图片、视频、音乐、时评等服务搜索。其中新闻搜索是盘古的重点之一,据介绍,这一服务针对目前网络新闻搜索中存在的检索方式单一、显示无序、查找片面、难于精确定位等问题,进行专项攻
摘 要: 课外阅读是学生提高语文能力的活水之源。如何让这股生命之水源源不断地注入学生心灵,在心灵深处落地生根,开花结果,进而滋养生命?要独辟蹊径——寻找课外阅读教学的有效措施。总结学校创建“书香校园”工作的经验,作者认为小学生课外阅读的有效措施是要全面指导、有效结合、适时评价、展示成果。  关键词: 小学生 课外阅读 有效措施  课外阅读是学生语文能力提高的活水之源,大量的课外阅读,广泛的知识积累
摘 要:为落实“立德树人”的基本要求,地理课程的基本理念向培养学生的“地理学科核心素养”转变。本文以新课标文综全國卷Ⅰ和福建卷为例,在对核心素养四大要素的考核特征分析基础上,得出二者的考核特征差异,进而为福建省制定有效教学提出应对策略。  关键词:地理核心素养;高考;考核特征;教学策略  一、 引言  为落实“立德树人”的基本要求,为实现“深化课程改革、落实立德树人”的目标,核心素养已经置于深化课
摘要:众所周知,朗读能力是学生形成其他各项语文能力的基础,因为朗读可以培养学生一定的阅读语感,陶冶他们的情操,这对于全面提高高中生的语文素养是有很大作用的。因此,高中语文教师必须重视朗读教学的作用。本文主要探讨了高中语文朗读教学存在的误区,提出了提高朗读教学效率的基本策略。  关键词:高中语文 朗读教学 误区 策略  朗读是学生学习语言、驾驭语言及运用语言的一种重要方法,在高中语文课堂教学中,朗读
近日,索尼(中国)有限公司举行了以“耀世而创”为主题的索尼VAIO夏季个人电脑新品发布会,掀开了VAIO笔记本电脑全新高端便携旗舰机型VAIO Z系列的神秘面纱。  全新VAIO Z系列凭借轻薄的外形设计、超强动力、顶级的硬件配置、令人耳目一新的功能扩展理念,再次以全新高度重新定义了“超轻薄,高性能”的新标准。其仅16.65毫米的超薄、超便携外形设计,1.16千克的机身重量及长达约7小时的电池续航