你的心声我来听——MoPaaS有奖调查

亲爱的小伙伴

MoPaaS已经成立五周年啦

风风雨雨我们一起见证了PaaS在国内突飞猛进的发展

现在,我们也想了解

相伴这么久的你

会更喜欢哪类文章

会更希望一同成长成什么模样~

将有三位小伙伴有机会获得MoPaaS的大礼一份哦~

【时间:5.21-5.27】

【可多选】

投票点击这里,请在手机上进行投票!

将投票完成的截图发给后台

六类文章分别对应以下已发文章

海外干货类

Docker、Kubernetes和Apache Mesos: 谁会是容器领域的霸主?

 

限时活动类

双十一钜惠大酬宾,MoPaaS超大折扣等你来拿

 

经典案例类

《中国证券期刊》| MoPaaS在金融领域的解决方案

专家分析类

清华自动化系教授张长水:图像识别有风险

公司动态类

MoPaaS荣获PaaS专利,细分行业持续发力!

行业资讯类

泊云社 | 中国研发全球性价比最高服务器;腾讯成立机器人实验室;微软与世纪互联合作进一步深入

  以上,小伙伴们动动手指,奖品到手哦~

清华自动化系教授张长水:图像识别有风险

本篇干货整理自清华大学自动化系教授张长水于2018年4月27日在清华大学数据科学研究院第二届“大数据在清华”高峰论坛主论坛所做的题为《机器学习和图像识别》的演讲,转载自公众号数据派THU(ID:DatapiTHU)。MoPaaS略作编辑。

注:后台回复“010”下载完整版PPT。

以下为演讲全文:

大家好,我来自清华大学自动化系,主要做机器学习和图像识别的研究。现在人工智能很流行,机器学习也推到风口浪尖上,图像识别已经变成产品,新闻媒体告诉我们AlphaGo、AlphaGo zero已经战胜了人类、皮肤癌的识别超过了大夫、无人车已经上路测试,很快要量产。这些新闻仿佛告诉我们,图像识别的问题已经解决了,然而很多高科技做图像识别公司都还在高薪聘用掌握机器学习的人才。图像识别问题解决了吗?我们看看现在图像识别还有些什么问题。
现在做图像识别,要求有大量的数据。什么叫大量的数据?比如下图是业界在做图像识别的数据集,包含很多类别的图像,像飞机、鸟、猫、鹿、狗。对于一个物体,需要有不同的表现,需要有不同的外观在不同的环境下的表现,所以我们需要很多照片素材。

数据集

尽管在我们领域里有很多大的数据集,但其实这些数据集远远不能满足我们的实用产品的要求。比如说我们看这样一个文字识别的例子。文字识别比一般的图像识别要简单,因为文字不涉及到三维,它只是一个平面的东西。

我们要识别清华大学的“清”,通常的做法是收集“清”的各种各样的图像,所谓各种各样的图像就是说要包括不同的字体,不同的光照,不同的背景噪声,不同的倾斜等,要想把“清”字识别好,就需要收集上很多这样的样本。那么这么做得困难是什么?

同一个“清”字的不同变形

1、样本的获取当我们应用于实际、设计产品的时候,就会发现不是每一种情况下都有那么多数据。所以,怎么获得丰富的数据是首要的问题。

上图给大家展示的这一排图像是一个交通标志的识别任务。我们如果需要去识别路上的交通标志,就要在不同的环境下,不同的光照下,比如说早晨、中午、晚上,逆光还是背光,不同的视角,是否有遮挡,所有的因素都要考虑到,来采集数据。经验上每种标识收集上千张或者更多的图像,才能保证识别率到达实际应用的水平。我们的问题是什么?看类似连续急转标志这样的图像在城市很难见到,除非到山区。这个例子说明,图像获取本身就不容易。

2、样本的标注

现在的图像识别方法是基于标注的数据的,叫做监督学习。图像标注就意味着把图像一张一张抠出来。如果我们开车穿梭在北京市大街小巷,但是交通标志并不是在视频的每一张图片上出现。如果我们需要把视频中交通标志都要标出来,需要花费很多金钱和精力。

做机器学习的人也会关心能不能通过一些更廉价的方法去做数据标注,包括众包这种形式。在12306网站购买火车票,每次让我们勾出相对应的图像,就可以看做是在标注数据。但是众包标注数据也存在一些问题,每个人标注习惯会导致不同的误差。所以我们如何设计学习算法,使得机器学习中,它对错误的标注不敏感,这一问题大概七八年前就开始研究,也不断的有新的文章出现。

那当数据没有那么多的时候,怎么办?机器学习界遇到的另一个问题,就是小样本的数据学习。当样本不多的时候能不能达到和大数据量类似的识别效果?例如上图中只有几张狗的图片的时候,要识别狗,还能从哪里得到狗的信息?思路是从其他的图片中来,比如上边有有鸟,有猫,有鹿,它们的皮毛很像狗等等。换句话说,他从其他的丰富的图像中获取一些信息,把那些信息迁移到这个少量的数据上,从而能够实现对狗的识别。
另外,图片数量是否能降到只有一张?比如清华大学的“清”,只有一个模板图像,是否能够把文字识别做好。更极端的例子,能不能做到一个样本都没有,也就是说,机器在没有见过狗的情况下,是否能把狗识别出来,这都是研究人员关心的事情。3、大数据量的训练

我们有了大量的数据怎么去做训练?GPU去做训练可以达到特别快的速度,在大的数据量上进行训练和学习叫做Big Learning。Big Learning 关心是否有更快速的方法训练,比如一个月才能训练出来的问题能不能在一天就训练出来?能不能用并行训练?如果数据不能一次存到硬盘里,这个时候怎么学习呢?这些就是企业和机器学习界都关心的事。

 

除此之外,我们发现深度学习模型很容易被攻击。如上图左边是一只熊猫,我们已经训练好网络能够识别出这是一只熊猫。如果我在这张图像上加了一点点噪声,这个噪声在右图你几乎看不出来,我再把这个叠加后的图像给网络,它识别出来的不是熊猫,是别的东西。而且它以99.3%的信心说这不是熊猫,甚至你可以指定他是任何一个东西。这件事情的风险在什么地方?如果只是娱乐一下,也没什么大关系。但是如果把它用于军事或者金融后果就比较严重了。因此我们一直在关心这个问题怎么解决,就是希望算法能够抗攻击性强一点,但目前只是缓解而没有彻底解决。而且研究中会发现这个问题,相当于去研究分类器的泛化性能。泛化性能这件事在机器学习里是理论性很强的问题,是机器学习圈子里面非常少的一些人做的事情。换句话说,这个问题看起来很应用,其实它涉及了背后的一些很深理论。为什么会出现这样的情况?因为我们对深度学习这件事没有太好的理论去解释它,我们没有那么好的方法去把所有的问题解决。

我们再说风险,图像识别中我们会把一个学习问题往往形式化一个优化问题,然后去优化这个函数,使这个函数最小。我们把这个函数叫做目标函数。有的时候我们会把这样的函数叫做损失函数,物体识别有错就带来损失。就是说在整个过程我们希望不要有太多的损失。其实,风险函数可能是更合适的词。因为你识别错了,其实是有风险的。一般来说目标函数对应于错误率,把狗识别成猫错了一张,把猫识别成狗又错了一张,都影响错误率,而错误率足以反映算法的性能。

但是在不同的问题里,识别错误的风险是不一样的。比如我们做一个医学上的诊断,本来是正常人,你判别说他有癌症,这种错误就导致虚惊一场。还有一种情况是他患有恶性肿瘤,算法没有识别出来而导致了延误治疗。这样的错误风险就很大。因此我们在优化的时候,这个目标函数其实是应该把这样的决策错误和风险放到里面去,我的目标是优化这个风险。但优化风险又和应用、和我们的产品设计相关。所以不同的产品设计,它的决策风险不一样。所以我们在设计产品的时候,需要考虑。苹果宣称他们的人脸识别错误率是百万分之一,如果别人来冒充你去用这个手机是百万分之一的可能性,就是说,别人冒充你是很难的;但是人脸识别还有一种错误,就是:我自己用我的手机,没有识别出是我,这个错误率是10%。换句话说,你用十次就会有一次不过。在用手机这个问题上不明显,但是如果用于金融,这个事就有风险。我们设计产品的时候,你就要考虑风险在哪,我们怎么样使得整个风险最小,而不是只考虑其中一边的错误率。

有公司会宣传说错误率可以降到百万分之一,让人误以为人脸识别的问题已经解决了,然而我们在CAPR、ICCA这样的学术会议上仍然能看到怎么去做文字的检测,怎么去做人脸识别的研究。换句话说这件事还没有到那么容易使用的地步。所以我们做图像识别的产品有风险,产品设计要考虑风险,我们做这件事就要考虑用技术的时候,用对地方很重要,用错地方就会很大的风险。

机器学习是一个和应用紧密结合的学科,虽然有很多高大上的公式,其实都是面向应用,希望能解决实际问题。实际应用给我们提出很多需求,图像识别遇到的问题给我们提出了挑战。最后,感谢各位的聆听。

张长水,清华-青岛数据科学研究院二维码安全技术研究中心主任,智能技术与系统国家重点实验室学术委员会委员,清华大学自动化系教授、博士生导师,IEEE Fellow 。主要从事机器学习与人工智能、计算机视觉等研究工作。

 

MoPaaS人工智能实训平台了解下

前不久的五四青年节,朋友圈刷爆了“我的前世青年照”,小编的妈妈也乐此不疲。旗袍、军装、校服…各种风格无缝切换,满满的回忆杀仿佛又把她带回到了那个青葱岁月。而作为走在时代前沿的IT从业者,小编趁机结合场景向母上大人解释了下她平时一头雾水的人工智能——

人工智能(Artificial Intelligence)是一个最广泛的概念,人工智能的目的就是让计算机这台机器能够像人一样思考,而机器学习(Machine Learning)是人工智能的分支,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,使之不断改善自身的性能。深度学习(Deep Learning)是一种机器学习的方法,它是试图使用包含复杂结构或由多重非线性变换构成的多个处理层(神经网络)对数据进行高层抽象的算法。

我们现在所说的人工智能更大程度上指的是机器学习,例如这些照片处理软件中画风转换、自动去抖、高清放大、自动修补图、一键处理等都是通过各种深度学习算法来实现的。

机器学习分为两大类,可监督性学习和非可监督性学习。此文着重讨论可监督性学习,前者需要大量、带有标签的图片进行样本训练,从而使模型越来越优。这就像小时候认识周围的事物,父母告诉我们这是猫、狗、蛋糕并不停用各种样本来充实我们对这些事物的概念。到后来我们就可以自己把看到的东西跟之前识别过的东西进行对比,做出识别和判断。

机器学习的蓬勃发展源于计算能力的大幅增加和训练数据的大量出现。最早的机器学习就是图片内容识别(image connection)及识别其跟周边的物体有什么关系(object detection),而伴随着GPU/TPU的问市及越来越多如IMAGENET、GOOGLE图片数据库等海量的样本生成,可以说,图像识别技术是目前机器学习商用最成熟且最重要领域之一。

(相关阅读TED《How we’re teaching computers to understand pictures》)

对于像小编妈妈这样的普通人而言,编程可谓天方夜谭,更不用说人工智能相关模型研发。然而其实没你想得那么难。之前某网帖子《一小伙用深度学习算法识别猫,竟然抓住大鼠,9行tensorflow程序》简要的描绘了模型开发的几个步骤。

  1. 从系统文档中提取一部分猫狗图片为测试集
  2. 建立神经网络模型
  3. 通过测试集对模型进行训练,准确率提高以后利用模型对猫狗进行识别分类
有了图片测试集和神经网络模型后,你所需要做的就是训练!训练!再训练!

MoPaaS人工智能实训平台即提供了这样的训练环境和算力支持。简单六步即可在MoPaaS AI智能实训平台完成模型调优:

正如上文中提及孩子对世界的认识是通过不断的训练养成的。机器学习也有其标准的两步骤算法——可监督性学习训练时间及模型生成时间。

  • 极致性能

各类框架运行于GPU服务器,GPU天生的超强计算能力,包含上千个计算单元,具有高并行、高吞吐、低时延等特点,在科学计算表现中性能比传统架构提高50倍。

  • 开箱即用

支持 TensorFlow、Caffe、Torch等多种深度学习框架,无需购买其他资源,无需安装配置环境,无需进行性能调优,只需上传代码、数据和配置参数,即可快速提交训练任务。

  • 服务保障

专业的运维团队提供 7×24 小时的运维服务,服务稳定可靠,无需关心硬件故障。

  • 弹性灵活

可随时根据需求创建深度学习训练环境,提供多种可选资源配置选择,可以满足多种业务场景需求。

  • 节约成本

无需预先采购、准备硬件资源,一次性购买免除硬件更新带来的额外费用,有效降低基础设施建设投入,无需负担运维成本。

  • 安全防护

不同用户之间资源全面隔离,保障您的数据安全。完善的网络监控服务保障您的网络安全。

我们的平台已被多个985、211重点大学及科研机构用于教学环境中,同时正被更多行业企业运用于生产环境。

 

 

凭借其多年的行业经验和技术沉淀,此次MoPaaS研发副总沈阅斌应全球云计算大会组委会的邀请,发表了题为《如何使用云平台降低AI技术门槛》的演讲。MoPaaS有效的结合PaaS的核心功能、微服务架构、应用交付工具,研发了人工智能实训平台,形成围绕PaaS中央服务集群即大数据中心+零散节点结合的资源环境运作体系,保证高可用,高并发的用户体验价值体系。

 

截止发稿,人工智能界又爆惊人发现。权威杂志《自然》最近发表的一篇论文(点击阅读原文阅读)称,一种最新研发的计算机程序具有类似哺乳动物一样的寻路能力。该研究同时也为理解人脑的运作提供了更多见解。

在人工智能的时代,每个人都应该有AI的概念,MoPaaS希望为更多有志于人工智能应用开发、学习及培训的客户提供平台服务,为打造AI生态体系做出贡献。

想要了解更多产品详情,可拨打免费客服热线:400-001-5592。

MoPaaS荣获PaaS专利,细分行业持续发力!

“中兴”未艾,“华为”又起。伴随着中美贸易战的硝烟四起,人们对增强自主知识产权能力、创新能力的意识上升到了新的高度。作为知识经济时代的企业核心竞争力,自主知识产权的获得与企业对研发的重视和资源投入密不可分。MoPaaS从创立之初就始终秉持自主创新的精神,不断提高自主创新能力,大力开发具有自主知识产权的关键技术和核心技术。

继“云存储系统”成功获得发明专利,近日MoPaaS凭借其研发的“一个智能化PaaS云计算平台系统”(专利号:CN201310092888.1)再次斩获中华人民共和国国家知识产权局授予的发明专利。至此,MoPaaS成为国内唯一一家拥有真正意义上“PaaS云计算平台”发明专利的公司。这无疑是对MoPaaS的核心技术及其能带来的技术成果转化的充分肯定。

MoPaaS此次获得专利奖项的PaaS平台系统,由用户界面、平台引擎、云控制器、平台监控管理等几大模块组成,构成了一种全新的灵活的PaaS平台系统。该智能化PaaS云计算平台系统可以满足千差万别的应用系统和配置要求,并能通过统一架构的平台型PaaS对底层资源进行动态、统一的分配管理,对资源进行优化整合,大幅节约人力资源与成本,为企业提供了全套的应用生命周期管理,从而满足企业敏捷开发、快速迭代的要求。

另一方面,通过对金融、工业制造、人工智能等领域的深入挖掘与研发,MoPaaS智能化PaaS云计算平台系统在性能、安全、稳定性等方面精益求精,已被诸如拉卡拉、航天科工、海尔科技、清华iCenter等100多家世界五百强客户认可且应用于生产环境中,同时也累积了逾20万的个人及中小企业用户。

对比很多同类型产品,从管理层面上,MoPaaS的云平台对资源调用细粒度更高、可实现数据库可视化管理和备份、多租户同时在线管理等稳定简便操作;从技术层面上来讲,MoPaaS数据平台引擎包含的三个子模块可自由组合、根据不同的客户需求提供日志分析、信息分析、自定义搜索等有针对性的应用功能。平台的复杂性和平台的使用者被隔离开,企业及开发人员可以更专注于产品的研发,为行业赋能。

可以说,“一个智能化PaaS云计算平台系统”这一专利的获得,为MoPaaS提供了更高的行业知名度,也更加凸显了其在行业中的强大竞争力。

根据Gartner的报告,2019年中国云计算市场规模将达到5706.4亿元,同时未来云计算市场规模仍将保持20%以上的增长速度。这一数据,伴随着工信部发布《云计算发展三年行动计划(2017-2019年)》,正式宣告了云计算2.0时代的到来。

互联网时代的特性,使得产品越来越频繁的直面市场挑战,反馈、改版、迭代、再反馈的这一产品链条滚动的越来越快,持续创新能力受到挑战,企业技术水平很多时候成为了发展壮大的拦路虎。能够借助有效的云平台拥有基础服务、工具部署、应用开发等能力,根据行业属性逐步实现个性化订制开发,从而达到对行业领域深入理解的水准,成为众多传统企业刚需。

MoPaaS站在行业的风口,面对时代巨变和庞大的市场机会,选择了从细分行业切入。在持续深耕自主研发云平台产品的基础上,提供工业制造云平台、人工智能实训平台以及SRE智能化运维平台等积极有力的行业解决方案。(点击子标题链接查看产品详情☟)

人才,是第一生产力——MoPaaS人工智能实训平台

当人工智能上升到国家战略,人才的培养就不应只是高校的职责。MoPaaS充分意识到教育和人才的重要性,已为多家高校及科研机构成功搭建自主研发的人工智能实训平台。通过提供基于包括TensorFlow、Torch、Caffe等多种算法技术框架,灵活地提供相关AI服务,实现了最优的GPU服务器集群的资源管理和调度。在满足高校有关人工智能教学及实训需求的基础上,突破技术困境,为学生提供了更多创新的思路和机会,成功孵化出经得起市场检验的商业团队。

万物互联,智能制造2025——MoPaaS 工业互联平台

智能制造作为IoT市场的一部分,承载着工业制造业乃至国家第二产业的未来。根据 IDC发布的研究报告,到2020年,在全球领域将会有250亿的物联设备连接。整个市场的规模将会达到72000亿,其中工业互联平台将占据约30%的物联平台市场份额(IoT Analytics)。MoPaaS作为最早进入该领域的PaaS厂商,为航天科工打造的中国首个工业互联网云平台——INDICS,在日前亮相2018年德国汉诺威工业博览会时,获得一致好评。MoPaaS工业互联平台有极高的资源利用率,达到传统方式的4倍以上,大大节省了基础设施资源投入。另外MoPaaS提供统一开放的标准和协议,可以实现与工业互联平台底层数据收集系统、上层的应用系统和其他第三方的服务实现灵活快速的集成,提供统一的解决方案。

安全地使用云——MoPaaS SRE 智能化运维平台

Gartner近期的一份调研报告对“云是否安全”这一话题进行了探讨,其中提到“到2022年,至少95%的云安全故障都由客户失误造成”。针对以上问题,MoPaaS早在去年就已推出的SRE智能化运维平台产品能很好的解决CIO们的困扰。SRE管理平台子系统支持自定义步骤和表单以及图形化拖拽式的流程定义,设定完善权限定义,并在相应节点设专人处理流程,降低了因管理造成的失误概率。通过与CMDB、自动化平台等其余模块的协同,不但能降低研发进度和应用运行稳定度之间的矛盾,也确保配置管理、系统监控、故障隔离、故障恢复等一些列自动化智能运维的实现,保证系统的可靠运行。技术的高可用性与MoPaaS云平台业务的完美结合,更是为企业提供从开发到运维的一站式服务,降低成本节约社会资源。

“MoPaaS将会始终坚持以技术为导向,以服务为根本。”MoPaaS CEO鲁为民针对此次新获专利评价道,“我们会继续不断完善以核心技术专利为依托的场景化云平台技术及服务,与更多行业内的合作伙伴共同搭建云计算生态,为企业带去更大的价值。” 在IaaS+PaaS或SaaS+PaaS模式将成趋势的现实中,在PaaS平台成为云计算生态集成中重要一环的有力条件下,我们将继续扩大行业领域布局,有效提高产品市场化占有率,同时助力用户企业进一步发扬其自身优势,进入产业“快车道”!