咨詢熱線:021-80392549

AWS首席數據科學家談云價格戰(zhàn)和大數據

放大字體  縮小字體 發(fā)布日期:2014-12-18     來源:[標簽:出處]     作者:[標簽:作者]     瀏覽次數:107
核心提示:

亞馬遜Web服務近年來頻繁變動,從價格削減到緊密整合私有數據中心,再到調整企業(yè)市場,而且不斷擴展其原來的開發(fā)者和創(chuàng)業(yè)公司客戶。

在眾多執(zhí)行者中一馬當先的就是Matt Wood,他是亞馬遜Web服務(AWS)的數據科學總經理。SearchCloudComputing本周在AWS峰會上和他探討了企業(yè)客戶的熱點問題。這里我們將談談云價格、云聯盟、法規(guī)以及數據定位。

TechTarget云計算:云價格是當下的熱點話題,谷歌和亞馬遜都在本周大幅降價。在每個人都可以免費得到一切之前價格究竟會有多低?

Matt Wood:我們一直都知道, 和我們的零售業(yè)務有一點像,云計算是一種大容量、低利潤的游戲,而且這是一種我們非常適應的業(yè)務模式。

如果你回顧過去的八年,我們降價42次,這樣做并沒有任何真正的競爭壓力。降價只是我們所做的一部分,是我們的組織發(fā)展的脈搏的而一部分,而且我們處于良性循環(huán)中……有越多客戶采納這個平臺的地方,他們就使用得更多,而且因為我們能走出去和我們的廠商進行客制交易,我們走出去,并且利用規(guī)模經濟,總體上我們最終是節(jié)省了成本。我們還可以從中獲利。這也是一種合情合理的事情。但是我們選擇將這些成本節(jié)省回饋給客戶……我們一直在做這些事情,而且未來我們還會這樣做。

TechTarget云計算:你的專長領域是數據科學和大數據分析。在這個領域里你是否看到了一些新的趨勢?

Wood: 最大的趨勢之一就是增益,而非取代,但是傳統(tǒng)商業(yè)智能的增益則伴隨更加實時的服務。而且是二者同時變得更加強大。

芬蘭游戲公司Supercell就是個很好的例子……他們運作流行移動游戲,比如部落戰(zhàn)爭(COC),而且他們一天中有八百萬人在ios上玩這個游戲。理想上,如果你是個游戲公司,你希望盡可能地捕捉價值。你想知道人們如何同游戲世界交互。你想知道你的游戲競技表現如何。你想知道誰買了什么,以及誰和誰進行了對話,在什么情況下退出了游戲。你可以利用這些信息改善游戲。

通過收集所有數據有些已經實現了。你收集什么并沒有限制,使用亞馬遜實施管理流服務Kinesis,就是一種實現途徑,你可以將數據丟進去,并且以不同的樣本率連接傳感器,,用同樣的數據流可以做不同的事情。

TechTarget云計算:亞馬遜將自己描述為“客戶導向”。那么哪些特性和服務是客戶目前尋求的呢?

Wood:他們會詢問類似這樣的事情,‘是否易于訪問高價值、公共數據集?’這就要求我們要做很多。因為有很多數據。我們花費大量的時間識別,且同公共的可用數據工作,并且使其易于使用。

Common Crawl就是個很好的例子,它會定期更新,是一個非常大的Web集,Web上的每一頁、下載和預計算,放到一個主頁上,這就讓Hadoop很容易運行。你不必自己來抓取,必須將原素材進行預計算所有的標簽,并且移除HTML和類似的東西,這些都已經做好了。

你所得到的就是格式化的數據,易于用分布式的方式使用。你可以在冷啟動中在不到十分鐘的時間里查詢數十億網頁。我們存儲且托管這個數據是免費的,因為對于整個社區(qū)是有益的,然后我們確保其遵循了最佳的簡單對象存儲(S3)訪問實踐,所以這也很容易加速大型Hadoop集群,并且運行查詢。

TechTarget云計算:我們接觸的一些客戶認為云聯盟很有前途,亞馬遜如何看待這個問題呢?

Wood: 我們目前還沒從客戶那里聽到這樣的說法,但是這并不代表未來這不重要。

我們從一些更大企業(yè)機構那里聽到就是已經在基礎架構上進行了大量投資。他們已經有了藍圖。我們和這些人談論的時候,我們嘗試引導他們并非一種選擇,可以本地運行或者是在AWS上運行一切。

我們過去的十八個月都在構建集成點,使其更易于讓用戶在有意義的地方運行工作負載。我們在他們的數據中心和我們的數據中心之間構建了直接的鏈接,我們提供私有存儲選擇,我們也有私有計算選擇,我們識別了聯合選擇以及類似于WorkSpaces這樣的事物,這是一種在后端同活動目錄集成的事物。所有的這些集成點都幫助客戶在其工作負載上做出正確的選擇。

TechTarget云計算:一些客戶處于法規(guī)遵從原因需要將數據保存在某個特性區(qū)域,亞馬遜能夠簽署法定協議,保證客戶的數據不會離開具體的可用區(qū)或者具體的區(qū)域嗎?

Wood: 實際上,你如果不選擇數據存在哪里是沒辦法使用我們的平臺的。客戶必須做出謹慎的決定,確定其數據將會存在的區(qū)域。我們有這樣的特定區(qū)域,每一個區(qū)域都有多種可用區(qū),而且可用區(qū)內部都有數據中心。以S3服務為例,我們通過可用去得到鏡像數據,但是我們不會在區(qū)域間做鏡像數據。


工博士工業(yè)品商城聲明:凡資訊來源注明為其他媒體來源的信息,均為轉載自其他媒體,并不代表本網站贊同其觀點,也不代表本網站對其真實性負責。您若對該文章內容有任何疑問或質疑,請立即與商城(podvhdv.cn)聯系,本網站將迅速給您回應并做處理。
聯系電話:021-31666777
新聞、技術文章投稿QQ:3267146135  投稿郵箱:syy@gongboshi.com