蘇州市干將路303號創意產業園
0512-3565 6563
Jackjones@kuaidata.com
聯系客服
數據中心托管服務/管理式網絡
服務:
400 651 8888
微軟云服務:
400 089 2448
markjune@kuaidata.com
內容分布式網絡服務:
400 811 0278
云集成與合作:
cloud@kuaidata.com
2015-05-04
這篇文章的目的,是簡要地闡述一下在“中國”這個語境下公有云發展的一些個人觀點。
一、公有云的規模
所謂公有云,簡單地講就是以服務的方式向公眾提供計算資源。在這篇文章的范疇之內,計算資源主要指計算資源(虛擬機),但是在必要的時候會擴展到存儲資源和 網絡資源。用各位從業人員背得滾瓜熟爛得術語來說,就是用戶象用水用電一樣使用計算資源,按需獲取,按量計費。基于這樣一個定義,一個真正意義上的公有云 需要具備一定的規模才能夠達到向“公眾”提供服務的基本要求。[在這篇文章的范疇之內,托管云(Managed Cloud)被認為是公有云(Public Cloud)的一種特例。]
按照Gartner的統計數據,在2006到2014年間,全球服務器硬件市場每年的出貨量穩定地在10,000,000臺上下波動。其中,亞太地區占比在 1/4左右,也就是2,500,000臺。中國境內服務器出貨數量在亞太地區的占比不詳,保守地按1/5計算也有500,000臺。按照3 年折舊周期進行估算,全國范圍內現役的計算資源至少有1,500,000臺物理服務器。作為一家服務于“中國”的產業級別的公有云服務提供商,假設其業務 成熟之后擁有全國計算資源的2%,就是30,000臺物理服務器。再按1:3到1:4的虛擬化比例進行估算,則虛擬機的數量為100,000臺左右。公有 云作為一種新型服務,其市場規模尚有相當程度的自然增長空間,因此五年之后的公有云可能達到的規模只會比這個數字更大。
根據AWS最近發布的財務數據,2015年第一季度的銷售收入達到15.6億美元。假設來自EC2以及基于EC2的其他服務對收入的貢獻占50%,按照中等 配置的m3.large實例(2個vCPU核心,7.5 GB內存,每小時0.14美元)來估算,相當于2,500,000個EC2實例。根據Rackspace歷年的財報進行估算,2014年 Rackspace用于公有云服務的物理服務器數量大概在20,000臺到30,000臺之間,換算成虛擬機也達到了100,000臺。因此,將 100,000臺虛擬機作為一個基礎目標,并非好高騖遠。
基于這些估算,我們可以根據其規模判斷一家公有云創業企業所處的成長階段:
概念階段,小于5,000臺虛擬機。公司的終極目標相對模糊,在私有云解決方案提供商和公有云服務提供商之間搖擺不定。在戰術層面,缺乏明確的技術路線圖,產品形態相對原始并且沒有明確的技術指標。
原型階段,小于10,000臺虛擬機。公司基本上將其終極目標定位為公有云服務提供商。由于公有云和私有云之間的巨大差異,必然要放棄私有云解決方案服務提 供商的身份。在戰術層面,基本形成相對清晰的技術路線圖,基礎產品(云主機)基本定型,在宕機時間和產品性能方面均有明確的技術指標。在云主機的基礎上, 提供能夠承擔中低負載的負載均衡、數據庫、緩存等等周邊產品。
成長階段,小于50,000臺虛擬機。基礎產品(云主機)能夠滿足高性能計算的要求,同時發展出一系列模塊化的周邊產品。普通用戶完全依靠云服務提供商所提供的不同模塊即可自主創建大規模可伸縮型應用(無需云服務提供商進行干預)。
成熟階段,小于100,000臺虛擬機。在技術方面,資源利用率開始提高,規模效應開始出現。在市場方面,客戶忠誠度開始提高,馬太效應開始出現。這標志著公司在公有云領域已經獲得了較有份量的市場份額,其產品和技術獲得了一個或者多個細分市場的廣泛認可。
產業階段,大于100,000臺虛擬機。只有進入這一階段,才能夠認為一個服務提供商已經站穩了腳跟,可以把公有云當作一個產業來做了。至于最后能夠做多大,一個好看國內的大環境,另外一個還得看公司自身的發展策略。
按照這樣一個階段劃分,國內大部分公有云創業公司都還處于概念階段,最多有一家創業公司已經進入原型階段。阿里云不能夠按照創業公司來看待,但是如果只統計 其ECS部分的話,可能處于成長階段的早期。我個人的估計,五年后公有云擁有的計算資源可能占全國計算資源的3%到5%。這意味著市場可以容納一大一小兩 家進入產業階段的公有云服務提供商,外加兩到三家進入成長階段或者成熟階段的公有云服務提供商在一些細分市場里面深耕細作。
這也就是為什么我一直強調云計算是一片剛剛顯現的藍海。現在國內各家做公有云的公司殺得你死我活,看起來似乎已經是一片血海。在我看來,這些不過都是假象。如果一家公有云創業企業沒有這樣的大局觀,那么我只有一個建議:“認慫服輸,割肉止損,是為美德。”
二、公有云的產品
作為一個公有云服務提供商, 其產品形態必然是多種多樣的。但是公有云要取得成功,就不能是私有數據中心可有可無的補充,而必須具備完全取代私有數據中心的能力。這意味這公有云要能夠 滿足高性能計算的要求,普通用戶完全依靠云服務提供商所提供的各種模塊即可自主創建大規模可伸縮型應用(無需云服務提供商進行干預)。12306的查詢部 分遷移到阿里云勉強可以算是一個案例,問題在于這個遷移需要阿里云內部工程師的深度參與,因此不能算是一個好的案例。
鑒于產品的多樣性,這里我們僅以塊存儲、負載均衡、自動伸縮為切入點談談公有云產品的特性。
塊 存儲的磁盤IO指標,在從業人士當中是一個熱門話題。相關討論大都集中在云主機磁盤應該達到什么級別的IOPS或者是吞吐量,其實這些討論所關注的點是完 全錯誤的。對于公有云服務提供商來說,重要的不是云主機平均可以達到什么樣的IO指標,而是如何根據客戶的需求對整體IO能力進行分配。對于需要10個 IOPS的低流量企業主頁,為其提供100個IOPS是沒有必要的。對于需要1000個IOPS的企業級應用,為其提供100個IOPS是遠遠不夠的。套 用云服務“按需獲取,按量計費”的思路,IO能力需要成為可以“按需獲取,按量計費”的商品。對于需要大容量低性能的用戶,可以賣存儲空間;對于需要低容 量高性能的用戶,可以賣IOPS。譬如說AWS提供三種不同規格的EBS卷: 傳統機械硬盤EBS卷(magnetic)不論磁盤大小平均提供100個IOPS的IO能力,GP2型SSD EBS卷每一GB保證提供3個IOPS同時又可以允許高達3000個IOPS的爆發性IO,Provisioned IOPS型SSD EBS卷保證可以達到用戶創建該EBS卷時所指定的IOPS指標。有了這樣的設計,用戶可以根據其實際需求購買所需要的磁盤空間或者是IOPS。盡管這樣 的購買依然受到服務提供商整體IO能力的限制,但是至少比所有的云主機都具備類似的“平均性能指標”要好得多。顯而易見,設計這樣的產品,要求云服務提供 商對計算資源具有極細顆粒度的調控能力。
負載均衡也與此類似。對于一個正常的Web應用,其負載通常可以劃分成三個檔次:長期平均負載, 長期高峰負載,短期爆發負載。在每秒只有數百個請求的情況下,負載均衡具備每秒處理一萬個請求的能力是沒有必要的。在每秒達到數萬個請求的情況下,負載均 衡只有每秒處理一萬個請求的能力是遠遠不夠的。如果用戶按負載峰值購買負載均衡,結果是資源利用率偏低;如果用戶按負載平均值購買負載均衡,結果是高峰期 訪問質量降低;如果用戶按照實際負載切換負載均衡,結果是他再也不敢用公有云了。因此,負載均衡也要根據“按需獲取,按量計費”的思路來設計,在負載降低 的時候自動降級,在負載升高時自動升級。這樣一種特性,就是自動伸縮。
將自動伸縮這個概念應用到云主機集群上,就是AWS的 AutoScaling Group(ASG)。一個ASG包含一組具備相同功能的云主機,應用負載降低的時候,ASG自動殺掉多余的云主機以節省成本;應用負載升高的時 候,ASG自動啟動更多的云主機以應對壓力。用戶按照系統的實際負載購買計算資源,既不存在處理能力不足的問題,也不存在浪費計算資源的問題。
如上幾個例子,都是AWS在其發展早期就已經實現的技術,其核心思想都是“按需獲取,按量計費”。更重要的是,通過自動伸縮這樣的概念,在滿足客戶負載需求的前提下沒有讓客戶花冤枉錢。我在前段時間寫了一個題為《Building a scalable web application from ground zero》 的入門小教程,基本上能夠反映一個中型Web應用對計算資源的需求特征。各位做公有云的不妨對照這個教程看看類似的需求如何在自己的平臺上實現。AWS可 能不是公有云的終極模式,但它至少是一種相對先進的模式,其產品對同行來說是極具啟發意義的。一家公有云領域的創業公司,如果不了解不熟悉AWS的產品, 未免有閉門造車之嫌了。
有些人可能會說,AWS的產品好是好,但是國內用戶并不接受。這就涉及到創業公司到底是想做現在的市場還是想做未 來的市場的問題。如果做現在的市場,就必須迎合市場的需求,按照客戶的要求去設計你的產品。如果做未來的市場,就必須從技術上進行創新,指導客戶按照你的 思路去設計他的應用。最近幾年,國內市場(尤其是互聯網公司)對AWS所倡導的理念的接受程度是在穩步提高的。對比國際上幾家公有云服務提供商,目前的局 勢是AWS一家獨大,剩下幾家(包括Rackspace、Windows Azure、Google Compute Engine、HP Cloud)容量的總和與AWS存在接近一個數量級的差別。究其原因,在于其他幾家出于種種原因沒有接受AWS所倡導的“按需獲取,按量計費”理念,只是 按照傳統數據中心的思路來做公有云而已。在這個大背景下,國內創業公司在熟悉AWS產品的基礎上,模仿AWS的產品并爭取有所創新,可能是創業早期(譬如 說概念階段)相對穩妥的發展道路。
三、公有云的成長
公有云的成長,涉及兩個問題:一是用戶增長,一是財務回報。
在用戶增長方面,阿里云目前的方法有兩個,一個是將存量用戶(萬網的用戶,天貓的商戶)往云上遷移,另外一個是發展政府客戶。這兩種客戶,其特點都是對負載 的要求不高(天貓整體的負載很高,但是大部分商家的獨立負載并不高),對“按需獲取,按量計費”的需求并不明顯。換句話說,基本上是將公有云當作傳統的服 務器托管的替代品來用。以阿里云目前的狀況來看,將這兩部分用戶做好只是時間問題。從規模上看,把這兩部分用戶做好了,阿里云應該可以從成熟階段進入產業 階段。問題在于,做好這兩部分用戶只能讓阿里云擁有公有云的皮毛,并不能讓阿里云擁有公有云的本質。這種情況和Rackspace往公有云轉型過程中所遇 到的問題類似。Rackspace創立于1998年,以服務器租賃起家,平均每年新增服務器數量10,000臺左右。受AWS的影響,Rackspace 從2008年起開始做公有云,但是其思路一直是用虛擬機替代物理服務器,并沒有從“按需獲取,按量計費”這樣的思路去設計其公有云產品。仔細研究 Rackspace從2006年到2014年間的財報數據,可以看到其收入總額和服務器數量基本上呈線性增長的趨勢。換句話說,Rackspace只是在 做物理服務器的替代品,公有云部分并未對其業務產生重大影響。另外,一個值得探討的問題是在“中國”這個語境下是否真的需要類似于AWS的“按需獲取,按 量計費”的公有云?或者說,“按需獲取,按量計費”這樣的需求,在所有需求中到底占多大份量。根據個人的觀察,“按需獲取,按量計費”這樣的理念,即使是 在國內互聯網行業當中也還有待進一步推廣,在其他行業中的接受程度顯然要更低。受政策影響,未來三到五年政府在計算資源采購方面全面向公有云傾斜,而這部 分用戶關心的只是供應商的名字是否有“云”字,至于這個”云”字后面是啥完全不在考慮之列。我不止一次聽在政府部門做IT的同行說領導要求項目一定要用上 阿里云,至于用阿里云干啥完全沒有要求。因此,每次有朋友問我阿里云值不值得去的時候我都說阿里云的前景一片光明,如果能去的話當然要去。
按照王博士早些年的想法,阿里云還要為阿里巴巴集團提供服務。在王博士執掌阿里云的時期,阿里巴巴內部的人都覺得這是個笑話,不僅內心厭惡而且公開抵制。(關于王博士的故事,可以參考我兩年前寫的一篇短文《從王博士說起》。) 現在章文嵩等人成為阿里云的主力,這個笑話便有了變成現實的可能性。至于這個可能性有多大,還得看阿里云后面兩到三年的發展。一旦阿里云具備了為阿里巴巴 集團提供服務的能力,為其他互聯網企業提供服務更是不在話下。屆時,阿里云可能會成為國內公有云領域毫無疑問的老大。2012年5 月我在第四屆中國云計算大會的一個演講上說“阿里云的技術也很好,但是在云計算產品的設計方面,還是比較業余的”,當時在從業人員當中引起了很大爭議。三 年過去了,如果在同行內部做一個橫向比較的話,阿里云的基礎產品和某些創業公司的產品相比尚存在較大差距。這個差距并非來自技術差異而是來自認知差異 -- 換句話說,不是因為阿里云的工程師們技術水平不行,而是因為阿里云還是沒有從公有云的角度去設計產品。
與阿里云相比,創業公司基本上屬于“三無”狀態:沒有存量用戶、缺乏政府資源,尚未形成品牌。創業公司的用戶增長過程,一期靠創始人的人品,二期靠技術推廣,三 期靠定向銷售。所以創業公司的用戶一般可以分成兩類:某細分行業用戶,其他創業公司。因此,創業公司更有可能根據自己的發展思路對其早期用戶進行教育,指 導早期用戶按照自己的思路和產品路線設計應用。這些投入在公司發展早期看似無用,但當客戶的業務逐步增長而公有云并不成為其負載或者性能瓶頸的時候,他們 就會成為公有云的長期客戶和成功案例。2009年Netflix全面轉向AWS時業內幾乎全是等著看笑話的,現在Netflix是運行在公有云上的最大型 應用,同時也是AWS最有說服力的技術傳教士。公有云幫助客戶應對負載波動問題,使得客戶可以聚焦在其自身業務上。客戶的成功自然而然地導致消費增加,而 其示范效應還會帶來更多的客戶。這樣日積月累,方能形成一個良性循環。從資源投放的角度來看,提供“按需獲取,按量計費”的能力要求云服務提供商預留部分 計算資源用來應對客戶的爆發性需求。云服務提供商只有到了一定的規模,才能夠準確地預測客戶對計算資源的需求,從而將閑置的計算資源降低到財務可以接受的 比例之下。換句話說,客戶成功才有公有云的成功,規模壯大才有公有云的盈利。
前兩天看到陳沙克近期的一篇文章《一個做了15年運帷的老兵對公有云的深度剖析》, 開篇就談到2014年做公有云的幾家創業公司是否盈利。問題在于公有云市場不是一個短期市場,而是一個未來十年尚有充分增長空間的市場。目前,中國的公有 云市場尚屬于發展早期,應該專注于產品研發和客戶教育。一家公有云創業公司如果在概念階段就實現了盈利,這種盈利很有可能是不可持續的。在這里我想澄清一 個廣為流傳的故事,那就是“由于其電子商務業務存在大量閑置計算資源,亞馬遜想到了通過零售的方式盤活這些閑置資源,并在其基礎上研發了公有云服務”。這 樣的故事聽起來雖然合理,卻是完完全全的無中生有。之所以對此進行澄清,是想說明AWS在其發展的早期同樣會遇到客戶教育、市場培養、需求預測等等問題。 通過接近10年的努力,AWS基本上解決了這些問題,并在國際公有云市場上取得了一家獨大的地位。由于缺乏歷史數據,我們無從得知AWS是在第幾年開始進 入盈利狀態的。但是從S3業務的指數增長曲線來看,AWS不大可能在第四年(2010年)末就實現盈利。
談到財務回報,就不能不談公有云的計費模式和定價策略。在《從微觀經濟學看云計算發展》一文中,我從 微觀經濟學的角度分析了企業計算資源市場的供需關系。這些分析表明,和傳統的服務器銷售和服務器租賃業務相比,公有云改變的不僅僅是計算資源的商業模式, 它改變的是計算資源市場的供需關系。對于服務器銷售和服務器租賃業務來說,客戶的需求是剛性的。這意味這客戶通常是根據其業務規劃購買計算資源,對計算資 源的價格波動并不敏感。對于公有云業務來說,客戶的需求是柔性的。這意味這客戶對計算資源的價格波動相對敏感,在價格下降時趨向于增加消費。對比AWS和 Rackspace,可以發現只有AWS呈現這個特性,Rackspace的云計算業務并沒有呈現這個特性。因此,我把客戶的需求到底是剛性還是柔性作為 區分虛擬機租賃和“按需獲取,按量計費”的公有云的標準。如果你的客戶的需求是剛性的,那么你只不過是在用傳統數據中心的思路在做虛擬機租賃業務;如果你 的客戶的需求是柔性的,那么你就是在做“按需獲取,按量計費”的公有云業務。從業務增長的角度來看,傳統數據中心基本上是線性增長,而“按需獲取,按量計 費”的公有云業務是指數增長。
一種經濟現象的出現,與其參 與者的行為是密不可分的。換句話說,不能因為在AWS那里觀察到了柔性需求,就斷言在中國一定也會出現柔性需求。關于這一點,Rackspace和HP Cloud恐怕深有體會,因為到目前為止他們還沒有觀察到柔性需求。在中國,創業公司如果延用傳統數據中心的思想來做公有云,結果只能是產品同質化市場紅 海化。反之,如果圍繞“按需獲取,按量計費”這個理念去進行創新,開始的時候可能相對困難,但是只有堅持下去才有走進公有云這片藍海的可能。
在外人看來,阿里云可以說是要錢有錢,要牛有牛,有戰略有戰術,是公眾心目中的土豪型選手,唯一的缺憾在于五行缺(對云計算有深刻理解的)產品經理。依靠阿
里巴巴的品牌和萬網的銷售能力,目前阿里云在國內的規模最大。但是從互聯網行業的角度來看,阿里云的用戶體驗較差。很多人可能會認為阿里巴巴的技術很好,
用阿里云應該比較放心。問題在于阿里巴巴并不等同于阿里云,就如同Google并不等同于Google Compute
Engine,微軟也不等同于Windows
Azure。在互聯網行業中,技術人員對青云和UCloud的認可度更高。雖然兩者都還還處于概念階段,但是從其產品和運營來看,比較符合我對公有云的理
解。這兩者當中,青云看來更為激進,大有后起居上的勢頭。
UnitedStack由于全面擁抱OpenStack而廣為人知,目前還在私有云解決方案提供
商和公有云服務提供商這兩個角色之間搖擺不定。私有云和公有云固然都很好,但是往深了做是截然不同的兩個方向。創業公司需要聚焦,因此
UnitedStack需要盡早在這兩個角色之間做一個決斷。如果決定往公有云服務提供商這個方向去做的話,建議抽空看看OpenStack外面的世界。