中文版 | English

研究与观点

研究与观点

RESEARCH & IDEAS

云计算行业专利分析报告(简版)

当前位置:首页 > 研究与观点

云计算行业专利分析报告(简版)

更新:2014年07月02日点击:12162

北京集慧智佳知识产权管理咨询有限公司      曹之晨 王尚丽 何珊珊 吕丽君

 

       云计算是随着多核处理器、虚拟化、分布式存储、宽带互联网和自动化管理等技术的发展而产生的一种新型服务模式,具有大规模、低成本、可扩展、可度量及高可靠性等特点。它提供各种计算服务的IT资源(包括网络、服务器、存储、应用软件、服务等),按使用量付费,用户和企业无需关注计算服务的实现过程,即可完成资源的灵活分配和应用的快速部署。

       一、云计算产业链结构

 


图1云计算产业链结构

       如图1所示,云计算产业链主要有十大关键环节,各环节相互协作,组成云计算特有产业链,云服务(资源、应用、平台)提供商在整个云计算产业链中占据核心地位。云资源服务提供商在获得硬件资源后,通过云计算支撑软件生成资源池,实现资源动态调配,提供基础资源服务;云平台服务提供商提供云计算平台服务;云应用服务提供商提供丰富的、个性化的应用。整条产业链上其他各个行业几乎都与这三个云计算服务提供商有着紧密的联系,通过网络服务商、终端或是云平台服务提供商向用户提供相关服务。

       在云服务提供商中,Amazon 是最早提供云计算服务的公司之一,该公司的云存储服务(Amazon Simple Storage Service,S3)的采用的是Dynamo分布式存储引擎;弹性计算云(Elastic Compute Cloud,EC2)服务则基于Hadoop计算框架和虚拟化Xen技术,为用户提供按需分配的“出租虚拟机”服务。IBM 的“蓝云(blue cloud)”计算平台采用了开源的虚拟化技术Xen和PowerVM以及开源的Hadoop计算框架,为客户提供低成本、易操作的云计算环境。Google公司推出GAE(Google APP Engine)云计算平台,采用了GFS(Google File System)、MapReduce、BigTable等分布式数据管理系统,为用户提供一定免费存储空间和流量,以及按使用付费的增值服务。而微软的Windows Azure平台则提供了一个可扩展的开发、托管服务和服务管理环境采用了HyperV虚拟化技术,并提供对Hadoop的支持。

       从云服务提供商的云平台可以看出,云计算的关键在于分布式计算和虚拟化。在虚拟化和云计算共同构成的架构里,虚拟化有效分离了硬件与软件,使人们将精力集中于软件提供的服务上,因此,虚拟化为云计算提供了坚定的基础。分布式计算则是云计算创造出的一种全新的计算模式,用作大规模数据处理,它是云计算的核心,也是云计算的发展趋势。Hadoop作为分布式计算的一种开源软件解决方案,也是当今最热门的分布式框架,为个人和企业提供一个可靠、可伸缩、低成本的云计算模式。

       开源软件的低成本特性可以帮助云计算服务提供商显著地降低开发、运营、维护等成本,同时保证客户自由使用。云计算服务继承了开放源码软件产品免费、服务收费的商业模式。开源技术的开放性和兼容性能够为云计算提供最强有力的支持。可以预计,开源云计算将成为云计算发展的一个重要方向。


       二、Hadoop生态圈发展路线分析

       传统的关系型数据库管理系统面对海量数据处理,逐渐无法胜任当前的需求。2003年以来,Google陆续推出了GFS、MapReduce、BigTable(谷歌“三宝”)等与可扩展、高性能的分布式数据处理框架相关的技术,实现了海量数据的并行处理,证明了它们在处理海量半结构化或非结构化数据的优越性。

 


图2 Hadoop生态圈发展路线

       如图 2所示,Hadoop由Doug Cutting于2004年提出,它的原型和灵感来自于Google的MapReduce和GFS,是开源的分布式计算框架。2006年,随着Doug Cutting 加入雅虎,Hadoop项目从Nutch(一个开源的网络搜索引擎)项目中独立出来,成为Apache基金会资助的顶级项目。随后,Hadoop经过七年积累,融入了R语言、Hive、Pig、Zookeeper、Cassandra、Chukwa、Sqoop等一系列数据库及工具,从一个科学项目逐渐发展成一个成熟的主流商业应用。

       Hadoop项目的核心是HDFS、MapReduce和HBase。HDFS是GFS的开源实现,提供高吞吐量的可靠分布式文件系统。MapReduce是Google MapReduce的开源实现,提供大型分布式数据处理模型。HBase是BigTable的开源实现,提供结构化数据存储的分布式数据库。Cassandra提供非关系型的分布式数据库,是Amazon的Dynamo存储引擎和Google的BigTable存储数据库的有机结合。Hive和Pig与编程模型有关,Hive是提供数据摘要和查询功能的数据仓库,Pig是一种可以简化MapReduce任务开发的数据流语言。Google Chubby很好地解决了分布式开发的一致性问题,Zookeeper是Chubby的开源实现。Chukwa是大型分布式数据收集分析系统,主要负责将非结构化数据转化成结构化数据;Sqoop是分布式数据迁移工具,主要负责关系型数据库与HDFS、Hive之间数据的传递。

       Doug Cutting于2009年离开Yahoo,加盟初创公司Cloudera,它是最早将 Hadoop商用化的公司。如今,Cloudera、2011年从Yahoo剥离的Hortonworks、MapR在Hadoop领域形成三足鼎立之势。Hortonworks选择与红帽、微软等公司联手,希望借助开源社区和合作伙伴的力量壮大自己;Cloudera则与英特尔合作,瞄准高利润的大订单;MapR通过与EMC达成战略合作伙伴,致力于开发下一代性能强的Hadoop。同时,Zettaset、HStreaming、Hadapt等与Hadoop相关的新公司也获得投资,为市场带来最新技术。


       三、云计算相关技术趋势分析

 


图3 2002-2013年世界云计算相关技术发展趋势

(2013年数据由于专利公开时间滞后导致检索到专利申请量下降)

       图3是近十年世界云计算所涉专利申请的变化趋势。如图所示,云计算技术约已发展十多年时间,但从2009年开始云计算所涉专利申请量开始出现明显的增幅,尤其是数据存储和数据管理技术,专利申请量在2012年分别达到了1800和1500多件,这两个技术现已成为最热点的技术。云安全技术的发展也较为迅速,其专利申请量也呈现出明显的增长趋势。平台管理技术的专利申请量也在逐年增多,而编程模型技术处于平稳发展阶段,每年专利申请量基本持平。

 


图4中国云计算相关技术发展趋势

(2013年数据由于专利公开时间滞后导致检索到专利申请量下降)

       如图4所示,2009年之前,我国的云计算技术处于起步阶段,专利申请呈现缓慢增长趋势。从2010年开始,各项技术加快发展步伐,其中数据存储和数据管理技术发展最快,在2012年的专利申请量均达到800多件,说明国内各大企业和研究机构非常看好这两项技术的发展。紧随其后的是云安全,其申请量在2012年达到了500多件,也成为了关注的重点。云平台管理技术专利申请量虽不及其他技术那样增速显著,但是它一直保持着良好的发展势头。编程模型所涉专利申请量在经过2011年的高峰后出现下滑趋势。总体来讲,我国的云计算技术发展趋势与世界趋势保持一致。

       从云计算技术的发展趋势中不难看出,数据存储和数据管理技术发展最为迅速,都已成为热点技术。就这两个技术而言,数据存储技术是利用分布式存储的方式对海量的数据进行存储,将其放入Bigtable、HBase、Cassandra等数据库中;数据管理技术则是对数据库中的大数据集进行处理、分析,高效的管理,所以说数据存储是数据管理的基础与前提。云存储作为云计算服务的一项重要组成部分,也是增长速度最快的云计算服务。


       四、数据存储技术专利分析

 


图52003-2013年数据存储技术所涉专利申请量(优先权年)

(2013年数据由于专利公开时间滞后导致检索到专利申请量下降)

       如图5所示,数据存储技术已发展十多年时间,起初几年发展相对缓慢,从2009年开始申请数量上开始出现明显的增幅。从2009年到2011年,这个阶段数据存储技术的专利申请量每年翻一番,2012年专利量仍然保持着上升势头,达到1600多件,可见数据存储技术处在技术快速成长期,仍存在着很大的发展潜力。

 图6数据存储技术专利首次申请国家/地区构成比例(2003-2013年)

       从数据存储技术专利首次申请国家和地区的比例来看,中国的申请量已居全球首位,达到40%的份额。以阿里云、奇虎、盛大、浪潮等为代表的公司正在加大研发的力度,另有国际巨头在华落地,扩大中国市场,使得中国区域的数据存储技术的专利骤增。美国的申请量仅次于中国,占到全球份额的37%。美国拥有技术实力强大的雅虎、IBM、微软、Salesforce(软营)、Google以及Facebook等公司,因此在技术上,仍然占据主导地位。韩国和日本也在加大发展势头,他们的申请量占到了全球的8%和4%,总体上讲中国和美国是数据存储技术的主要来源国家。



 图7数据存储技术各国专利申请情况(2003-2013年)

       图7是数据存储技术专利申请量的国家分布地图。从图中可以看出,数据存储技术专利申请量最多的国家是中国和美国。对于中国,一方面由于国家对云计算发展的重视并给予大力支持,另有阿里云、盛大、浪潮等公司在数据存储技术上研发迅猛,显示了强大的研发实力。此外中国是世界上较大的云计算市场,是各个公司的必争之地,国际巨头也纷纷落地中国,因此在中国的专利布局较多。而对于美国,一方面由于美国拥有以雅虎、微软、google、IBM等为代表的公司,所以在技术上占有绝对优势,另一方面巨大的云计算市场也是其争先进行专利布局的原因。

       韩国、日本在数据存储技术专利的申请量上属于第二梯队,其中韩国实力不容小觑,其以三星、韩国电子研究院、SK公司、韩国电信为代表的企业一直拥有优势,并也在数据存储技术上不断加大研发投入,取得了较大的发展,同时也进一步扩大了市场。日本也处于发展期,正在加大对数据存储技术的开发及专利布局。

       英国、欧盟、印度、中国台湾处在第三梯队,他们的专利申请量要少于中国、美国、日本及韩国。综上可见,中国和美国占据了大部分数据存储技术专利申请量份额,这两个国家对数据存储技术的发展和全球市场有着巨大的影响力。

 


图8 2005-2014年中美数据存储技术专利授权情况

(2014年数据由于专利公开时间滞后导致检索到专利授权量下降)

       如图8所示,从中美两国的数据存储技术专利授权量来看,2005年至2010年,这一时期数据存储技术尚处于起步阶段。从2011年开始两国的数据存储技术专利授权量快速增加,其中美国的年授权量远多于中国,说明美国在关键技术上具有很大的优势,我国与美国还有很大的差距。但是我国的专利授权量的增长速度也十分迅猛,这是由于我国对发展数据存储技术较为重视,加之拥有较大的市场潜力,未来我国的数据存储技术专利授权量仍会保持增长趋势。



 


图9数据存储专利申请的主要专利权人(2003-2013年)

       图9为数据存储技术主要专利权人的专利申请量,从图中可以看出,美国的IBM和微软是数据存储技术专利拥有量最多的两个公司。IBM和微软,全球领先的云服务提供商,都十分重视专利的布局,他们在数据存储技术上的专利布局已经处于领先地位。

       Li Z(个人)的专利达到了110余件,位列第三;中国的浪潮也在数据存储技术上有较好的表现,拥有70多件数据存储技术专利。在排名前十五的企业中,中国的企业还有中兴、上海博路信息、奇虎、华为。韩国的企业包括SK电讯、韩国电子通信研究院,他们也都在积极的布局数据存储技术的专利。

 


图10数据存储专利申请的主要发明人(2003-2013年)

       如图10所示,ZHANG X、WANG Y、LI Y、CHEN Y等主要与IBM公司进行合作。LI Z(大多专利自己作为专利权人)、WANG J、WANG Y、LI Y与微软公司保持良好的合作关系,同时,WANG J、WANG Y、LI Y与上海博路信息有合作。ZHANG J和LI X均与多家公司保持密切的合作。LIU H 服务于奇虎公司,其发明专利均为奇虎公司所有。总体上看,基本多家公司都与主要发明人保持合作关系,共同推动数据存储技术的发展。



 


图112003-2013年数据存储技术的IPC变化情况

(2013年数据由于专利公开时间滞后导致检索到专利申请量下降)

       (注:图中分类号含义分别为:G06F  电数字数据处理;H04L  数字信息传输;G06Q 数据处理系统或方法;H04N  图像通信,如电视等;H04W  无线网络通信;G06K  数据识别、数据表示、记录载体;G05B  控制或调节系统;H04M  电话通信;G06T 图像数据处理或产生;H04B  传输)

       对历年数据存储技术涉及的IPC变化情况进行分析,如图11所示,从2003年至2008年,数据存储的专利申请处于初始阶段。从2009年开始,数据存储技术进入发展时期,专利申请主要布局在G06F、H04L、G06Q以及H04N。其中技术G06F及H04L占的比例最高,G06F为电数字数据处理,大部分专利涉及档案的管理、分享、备份等技术内容,而H04L为数字信息的传输,大部分的专利涉及到档案的传输技术及传输技术的应用。其次数据存储在数据处理及图像通信方面(G06Q、H04N)也占据着较大的比例,这也是数据存储需要重点关注的方面。数据存储在H04W、G06K、G05B上也有一定的布局,但是总体数量较少。

 


图12近5年数据存储技术的研究热点(2009-2014年)

       对专利的热力图进行分析,我们可以看到专利涉及虚拟环境、服务器信息、模块连接、文件信息存储等多种领域。热点技术包括存储虚拟化、自动分层存储、重复数据删除及数据压缩。众所周知,云计算采用分布式存储的方式来存储数据,采用冗余存储的方式来保证存储数据的可靠性,即为同一份数据存储多个副本。另外,云计算的数据存储技术还具有高吞吐率和高传输率的特点。所以说这些热点技术的发展和应用能够提高数据存储技术性能,是数据存储发展关注的重点。

图13数据存储技术研究热点(关键技术)的专利布局(2003-2013年)

       如图13所示,存储虚拟化是数据存储的研究热点,IBM公司在存储虚拟化技术上占有绝对的优势;微软仅次于IBM,在存储虚拟化技术上也保持领先地位。LI Z(个人)、FERRIS J M(个人)、韩国电子通信研究院、华为及中兴等专利权人也在积极地进行专利布局。在重复数据删除技术上,IBM、微软及浪潮公司的专利布局保持着比较均衡的态势,中兴和奇虎紧随其后,也在加紧布局。自动分层存储技术的专利布局较少,其主要专利权人为LI Z(个人),在技术上相对领先,微软、浪潮、谷歌、上海博路信息和韩国电子通信研究院的专利布局相对均衡。在数据压缩技术(ICIC)上,主要专利权人的专利布局也较少,IBM、微软及LI Z(个人)在该领域保持着领先优势,占据着主导地位。



 


图14 2010-2013年数据存储技术热点的生命周期

       对于一种技术而言,其生命周期分为起步,成长,成熟和衰退四个阶段。如图14所示,2009年之前,数据存储技术处于起步期,从2010年开始存储虚拟化和重复数据删除技术取得突破,高速发展,专利权人迅速增加,专利申请量也在不断增多。其中重复数据删除技术发展势头在近两年开始赶超存储虚拟化技术。至今两项技术仍处在技术的成长期,仍有较大的发展潜力。

 


图15数据存储技术主要专利权人(前15)的合作关系(2003-2013年)

       从数据存储主要专利权人的合作关系来看,FERRIS J M(个人)、红帽和RIVEROS GE(个人)关系密切存在合作关系,深圳先进技术研究院与中兴存在合作,SK Planet是从SK电讯中分出来的子公司,专利共享。IBM、微软、LI Z(个人)浪潮、上海博路信息、华为、三星、奇虎、谷歌等公司在数据存储技术上都没有开展合作,各自发展。

       总体上看,在数据存储技术中,各大公司尚未开展深入的技术合作,一定程度上是因为各个公司都有自己擅长的领域并占有优势,以此为基础进行独立研发。


       五、结束语

       云计算是随着多核处理器、虚拟化、分布式存储、宽带互联网和自动化管理等技术的发展而产生了一种新型的计算模式。这种计算模式的总体思想是通过网络将庞大的计算处理程序自动拆分成无数较小的程序,利用多台服务器的资源进行处理,最后汇总。其中,Hadoop是当前云计算相关技术中最热门的分布式应用开源软件框架。通过对云计算专利的分析,可以看出数据存储技术是当下十分热门的技术,由于云存储服务的迅速普及,数据存储技术专利申请量每年都在急速增长。

       从世界分布来看,各国在数据存储技术上的发展并不均衡,美国和中国处于领先地位。全球数据存储技术主要分布在IBM、微软、Li Z(个人)、浪潮、SK电讯、谷歌、上海博路信息、中兴等公司和个人手中。从行业关系角度来看,各大公司尚未在数据存储技术中开展深入的技术合作,都在自己擅长的领域独立研发。

       以存储虚拟化、重复数据删除为代表的数据存储技术发展日趋成熟,随着商用化的到来,各大公司将面临更加激烈的竞争,数据存储技术专利将是市场竞争的利器,关乎企业的发展和竞争地位。随着技术的革新,数据存储相关专利也将向着高速、稳定、安全的方向发展。

       本报告所作的专利分析工作以THOMSON INNOVATION(汤森路透专利数据库)中获得的专利文献数据为依托,并参考专家调研信息,综合运用了定量分析和定性分析方法。

       附:云计算技术标准及联盟

表1云计算技术标准联盟