产业资讯
|
 运营商信息 制造商信息 综合信息 
您现在的位置:首页产业资讯制造商信息
亚信数据机器学习平台典型应用场景:降维技术助力运营商业务创新
2017-12-25 17:14:00

  近日,以“数据众智 美好未来”为主题的DataTech 2017浙江大数据建模与创新应用大赛暨浙江省大数据发展应用培训会在杭州西子湖畔大华饭店成功落幕。本届大赛在浙江省经济和信息化委员会指导下,由中国移动浙江公司和浙江大数据交易中心联合主办,旨在挖掘数据价值、实践数据赋能,推动大众创业、万众创新,以“开放、互联”的精神激发全社会创新能量。

  亚信数据人工智能团队负责人应江勇出席并分享了数据降维技术在运营商业务中的典型应用场景,在此之前,应江勇对亚信数据机器学习平台做了简单介绍。

  亚信数据人工智能团队负责人应江勇

  亚信机器学习平台对不懂技术的小白客户同样“友好”

  应江勇表示,自己的团队在处理运营商或者其他行业项目的时候,发现很多客户都有学习基于人工智能建模的需求,但是对于客户来说,自己搭环境建模、准备数据、沉淀模型等难度相对较高。所以亚信自主研发机器平台,初始化部署帮助客户把常用数据源对接好,并把国际通用的机器学习算法框架、主流编码语言等技术环境集成在我们的平台里面。各行各业有很多不懂编码技术的客户都想做基于机器学习算法的建模,他们对于业务的理解很透彻,但几乎不具备编码能力,亚信针对这些客户,在自主研发的机器学习平台内设计了前台化的向导式挖掘工具,客户只要知道做哪些场景的模型,按照提示简单设置,平台就可以按照内置的亚信专家经验自动生成模型。

  谈到亚信的机器学习平台跟国际国内主流的友商平台有什么区别?应江勇表示,其负责的团队在某些项目里面用到很多友商的挖掘工具,但得不太顺手,有一些工具功能不太灵活,也就是说,如果要让不懂技术或者说技术懂得不透彻的客户来用,难度较大。而亚信的机器平台针对两部分客户设计,一部分客户是编码能力较强的技术人员,第二种客户则是对自身业务非常了解,但是对数据建模及技术比较陌生。

  大数据建模流程可分为业务分析、数据处理、模型假设、模型建立、模型应用等几个步骤。业务分析指的是详细剖析业务需求所对应的现实问题,即根据业务需求确定问题的本质,明确决策方式,比如是预测,还是分类,或是聚类,以便确定建模的主要技术框架。数据处理是数据建模过程中非常重要的环节。数据处理的主要目的是提高数据所含信息的质量,提升模型的精确度。而数据降维作为数据处理中非常重要的技术手段,通过降维一方面针对业务需求提取价值含量高的信息,另外一方面解决高维数据带来的“维数灾难”问题。

  而由于理论模型和实际问题之间总是存在着不可避免的误差,通过模型假设这一步骤,数据建模人员可以确定一些人为不可控的因素,排除部分变量对模型的干扰,从而确定模型在实际应用过程中的适用性特征。

  模型建立就是通过测试与优化,建立误差允许范畴内的相对最优模型。

  到了最后一个步骤,就是模型应用。根据实际业务需求对模型进行分析、解释、求解。在模型假设的前提下,根据模型输出的结果进行业务上的决策。

  数据降维在运营商业务中的典型应用

  在此次演讲中,应江勇重点分享了在数据处理中,数据降维在运营商业务中的应用。他强调了数据降维的几大优势。第一,高维到低维的压缩,能降低算法运行的时间复杂度和事务描述的空间复杂度精准的数据降维,可以大大提升模型结果的准确率。第二,高维数据变换成低维数据,剔除噪音,节省研究不必要特征的成本。第三,精准的数据降维,可以大大提升模型结果的准确率。第四,相同限制条件下,低维的模型比高维的模型在数据集上有更强的解析性。第五,针对业务需求的数据降维,可以更好的分析数据、理解模型和解释模型的输出结果,甚至可以实现数据可视化。

  应江勇表示,亚信在数据降维过程中,会采用开源的技术包,在此基础上进行调整优化。具体的数据降维方法分为三个场景:一是线性和非线性,二是全局和局部的,三是监督和无监督的。

  从运营商的数据降维具体场景来看,分为多种情况。比如,在基站信息采集时,一些不必要的时间戳信息,这种数据所包含信息对模型构建,不是必要的,无该数据信息对模型构建无明显影响。还有,比如在做用户套餐精准营销时候,用户近三个月消费、与用户单月消费情况,具有有高度的信息相关性。这种情况下,数据在某些维度之间呈现出高度相关关系,很可能这个维度上包含了其他维度上的信息。下面介绍亚信为运营商进行数据降维的两个场景:图像降维和语音降维。

  首先来看图像降维,运营商办理实名制业务,都会使用用户的身份证做图像识别,亚信为某运营商做智能营业厅项目,项目建成后,只要用户一进入这个营业厅,就马上可以识别出她的身份信息,这里面就用了图像降维技术,亚信通过降维抓住五官主要特征的信息,提高精准度。这里面涉及了两个步骤,第一是图像特征提取,第二就是图像重构。

  语音降维则是通过语音信号采集、情感特征提取、情感识别几个步骤,经过降维以后形成一个混合的模型,就可以区别正在和客服通话的这个用户目前的情感特征是高兴、惊讶还是不开心。然后再提前准备好语调库,让机器人和用户对话。

  应江勇表示,数据降维技术是亚信机器学习平台内置的重要功能之一,,亚信除了机器学习平台,还有很多行业的基于人工智能技术的典型应用,愿意与产业各界交流。

相关文章
泰尔网版权与免责声明:
①凡本网注明“来源:泰尔网”的所有作品,版权均属于泰尔网,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:泰尔网”。违反上述声明者,本网将追究其相关法律责任。
② 凡本网注明“来源:XXX(非泰尔网)”的作品,均转载自其它媒体,转载目的在于科学研究和传播交流更多资讯,不代表本网赞同其观点和对其真实性负责。
③ 如因作品版权和其它问题需要同本网联系的,请在30日内进行。 联系信箱:cttl@catr.cn
《信息通信行业发展规划(2...
  为加快实施网络强国战略,推动信息通信行业持续健康发展...
大数据发展促进委员会常务...
魏凯表示,目前我们在大数据方面存在的很多问题,把它总结成...
热点专题
泰尔数据
中国通信标准化协会    电信终端测试技术协会    信息名址服务管理中心    工信部电信经济专家委员会   
中国下一代互联网示范工程专家委员会    中国通信企业协会通信网络安全委员会    中国通信企业协会增值服务专业委员会    云计算发展与政策论坛   
Copyright©2008-2014 cttl.cn All Right Reserved. 京ICP证080582 京公网安备11010802010351号 网站声明