混合云100問「運營篇」:跨云協(xié)同,讓業(yè)務管理更高效
問:如何對各類公有云資源池進行有機結合和管理?
答:要對多云環(huán)境進行實現(xiàn)快速、敏捷、高效、彈性的管理,需要通過統(tǒng)一的云管平臺來解決。在這方面的路線選擇上,每個企業(yè)不同,但是主要有以下幾種方式:第一,采用開源Openstack。可以利用開源社區(qū)的優(yōu)勢,獲取知識較快,落地相對也較快,但是需要投入比較熟悉Openstack的人員自己研究、測試、持續(xù)跟蹤、升級,尤其是在沒有外部專家的情況下,升級、迭代會比較困難;
第二,自主研發(fā)。自主研發(fā)云平臺最大的好處是貼近需求,可以把企業(yè)所有的資產(chǎn)管理、IT流程、自動化、配置管理等所有集成在一套平臺上,提供端到端、場景化的IT基礎設施服務,難點是投入大、開發(fā)周期長,而且必須要持續(xù)開發(fā);
第三,直接使用商業(yè)化產(chǎn)品。采購一款商業(yè)化,包括廠商的閉源產(chǎn)品或者OpenStack商業(yè)化產(chǎn)品,這種方式見效最快,但是不一定完全貼近需求,往往需要二次開發(fā)。
問:在混合云環(huán)境部署業(yè)務,如何實現(xiàn)高效統(tǒng)一管理?實現(xiàn)工作負載優(yōu)化與管理復雜性之間的平衡?
答:混合云增加了業(yè)務靈活性的代價,必然是多云和多集群環(huán)境也變得更加復雜,管理難度不斷提升。如何在統(tǒng)一平臺下,進行統(tǒng)一的管理和運維,甚至是智能化和可視化的運維,難度變得更大。多樣化的工作負載帶來了管理復雜性的挑戰(zhàn),絕大多數(shù)的客戶沒有相應的工具和流程來管理和運營復雜的混合云環(huán)境。
在這樣的情況下,企業(yè)勢必需要一個統(tǒng)一的管理平臺和工具,能夠跨平臺進行資源調(diào)度,降低系統(tǒng)性風險并在整個上云過程中交付更多自動化能力。對此,IBM Cloud Pak for Multicloud Management提供了完整的多云管理解決方案,以基于RedHat Openshift的容器平臺為依托,其目標管理環(huán)境極為廣泛,無論用戶的應用運行在主流的公有云平臺 (如 IBM Cloud、AWS、微軟Azure、Google Cloud),還是運行在企業(yè)的私有云平臺,內(nèi)部系統(tǒng)中,均可通過Cloud Pak進行管理。此外,包括邊緣計算平臺如 IoT,物聯(lián)網(wǎng)、車聯(lián)網(wǎng),采集端等環(huán)境,也是Cloud Pak的目標管理環(huán)境。并且,平臺之上的各部分管理能力與組件模塊都擁有統(tǒng)一的可視化操作界面,可以為用戶提供統(tǒng)一的、端到端的、可視化的使用體驗。
問:基于混合多云架構,如何更好地實現(xiàn)數(shù)據(jù)共享、管理和應用?
答:在混合云架構下,數(shù)據(jù)遍布于各個不同環(huán)境——不同的公有云之間、公有云與私有云之間、云與本地之間,甚至是各種邊緣端。據(jù)統(tǒng)計, 90% 的數(shù)據(jù)是未經(jīng)分析的、非結構化的,不可信或無法訪問,阻礙了企業(yè)數(shù)字化重塑之旅的進程。企業(yè)只有最大化地釋放數(shù)據(jù)的價值才能規(guī)模化地實現(xiàn)人工智能。
對此,全面集成的數(shù)據(jù)和AI平臺IBM Cloud Pak for Data,基于IBM Cloud Paks,助力企業(yè)實現(xiàn)從數(shù)據(jù)的收集、組織到分析和融合整個過程,幫助企業(yè)實現(xiàn)數(shù)據(jù)價值的最大化。該平臺采用云原生設計,將覆蓋整個分析生命周期的市場領先服務全都統(tǒng)一了起來。Cloud Pak for Data 基于 Red Hat OpenShift 簡化的混合云基礎而構建,充分利用了其底層資源和基礎架構優(yōu)化及管理。并完全支持 Amazon Web Services (AWS)、Azure、Google Cloud、IBM Cloud® 等多云環(huán)境和私有云部署,幫助客戶降低總體擁有成本并加速創(chuàng)新。
問:混合云和物聯(lián)網(wǎng)、邊緣計算等技術如何結合?
答:從關聯(lián)性上看,物聯(lián)網(wǎng)和邊緣計算是企業(yè)云端觸角的延伸。企業(yè)通過混合云可以構建多種不同應用,從而滿足企業(yè)不同的業(yè)務需求。物聯(lián)網(wǎng)和邊緣計算技術應用就是其中的兩種,通過混合云可以更好的將物聯(lián)設備所收集的數(shù)據(jù)統(tǒng)一進行收集、整理、分析。同樣通過混合云也可以將邊緣計算處理的零散業(yè)務數(shù)據(jù)盛統(tǒng)一集中分析,從而使企業(yè)的云、邊、端結合成一個有機整體,共同服務于企業(yè)業(yè)務發(fā)展和創(chuàng)新。
問:在邊緣端的運維如何進行? 如何確保邊緣端的應用高效運行?
答:IBM Edge Application Manager 是一個智能靈活的平臺,為邊緣計算提供自主管理。一個管理員就可以同時輕松管理包含數(shù)以萬計端點的應用環(huán)境的巨大規(guī)模、紛繁種類和變化速度。該解決方案是一個具有完整生命周期的邊緣環(huán)境,可幫助您在邊緣創(chuàng)建、部署、運行、監(jiān)控、維護和擴展業(yè)務邏輯和分析應用。它可以在任何地方運行,并可以管理幾乎任何邊緣端點(包括服務器、網(wǎng)關和設備)上的工作負載。邊緣端點在容器和 Red Hat® OpenShift® 企業(yè)級 Kubernetes 編排平臺上運行,讓您可以靈活地選擇從任何公共云或私有云擴展到任何邊緣服務器和設備
問:混合多云環(huán)境的運維難度大大提升,有什么好的工具可以用?
答:在解決復雜性、重復性問題方面,人工智能被認為是輔助人類的一個重要工具。而針對混合多云環(huán)境下的運維難題,IBM在今年的think大會上就推出了一款人工智能產(chǎn)品——Watson AIOps。利用AI技術,Watson AIOps可以自動化地對IT異常事件進行自我檢測、診斷和響應,同時,基于最新版的Red Hat OpenShift構建,這還意味著Watson AIOps可以運行在任何混合云環(huán)境中,并能與包括Slack 、Box、Workday等在內(nèi)的分布式工作環(huán)境的常用核心技術協(xié)同工作,從而幫助實現(xiàn)企業(yè)IT基礎架構的自動化和彈性能力。
問:對于業(yè)務連續(xù)性和快速災難恢復,混合云架構有何優(yōu)勢?
答:混合云架構意味著企業(yè)可以把不同的業(yè)務系統(tǒng)部署在不同的IT環(huán)境,也可以在不同IT環(huán)境之間同步和備份相關的數(shù)據(jù)。相當于,把雞蛋放在不同的籃子里。因此,當任何一個環(huán)節(jié)出現(xiàn)問題,就可以快速切換到另一個環(huán)境,從而保障前端業(yè)務的安全性和連續(xù)性。特別是在流量高峰期,還可以在多地、多環(huán)境之間進行統(tǒng)一、快速的IT資源調(diào)配,既保證業(yè)務穩(wěn)定性,也能減少資源的浪費,降低成本。與此同時,針對一些突發(fā)的狀況,譬如疫情之后集中的數(shù)字化辦公、大規(guī)模的數(shù)字化業(yè)務開展,基于混合云架構,也可以幫助企業(yè)非常快地進行資源擴展和業(yè)務切換。
問:如何更好地編排和簡化混合多云環(huán)境?
答:具有以下功能的敏捷多云集成架構對于成功的 IT 管理至關重要:
可見性——了解業(yè)務應用組件在何處運行非常重要。您必須在相應的業(yè) 務背景下,監(jiān)控不同Kubernetes 環(huán)境中資源(例如,部署、 Pod 和 Helm 發(fā)布)的運行狀況,無論它們是處于公有云還 是私有云中。
- 治理——隨著云原生環(huán)境在整個企業(yè)中迅速蔓延,DevOps 團隊的 任務是確保根據(jù)企業(yè)的治理和安全策略來管理這些環(huán)境。 一站式儀表板可以為您提供一系列連貫一致的必要配置和 安全策略,用于管理日益增多的云原生組件。
- 自動化——無論是云原生應用還是傳統(tǒng)應用,通過端到端自動化高效地 管理和交付服務,同時支持開發(fā)人員構建符合企業(yè)策略的應 用,這些都十分關鍵。與之同樣重要的是,采用靈活、一致的 方法在不同環(huán)境中部署應用,包括備份和災難恢復選項,此 外還要有能力遷移工作負載。不僅如此,您還要能夠在任何云端將單個 Kubernetes 集群即服務進行供應、配置和交付。
高效的 IT 管理需要在整個企業(yè)范圍內(nèi)實現(xiàn)集成,而正確的 多云解決方案則可以為您提供清晰的應用視圖、內(nèi)置的合規(guī) 管理支持以及自動化所帶來的便捷和智能。
IBM Cloud Pak for MCM 能夠提供多云環(huán)境下的應用生命周期管理、云工作負載保護與合規(guī)、容器環(huán)境管理、VM 環(huán)境管理、應用和基礎架構監(jiān)控等服務功能,對多云環(huán)境提供可視化的清晰洞察。
問:混合云架構下,如何提高數(shù)據(jù)生產(chǎn)力?
答:基于 IBM Storage for Data and AI 基礎架構,從數(shù)據(jù)的收集、組織到分析和融合整個過程,實現(xiàn)面向數(shù)據(jù)和 AI 的存儲化繁為簡并實現(xiàn) AI 數(shù)據(jù)管道的加速來提高數(shù)據(jù)生產(chǎn)力。在可視化方面,通過簡化數(shù)據(jù)視圖來提高管理效率,并通過先進的元數(shù)據(jù)跟蹤平臺,跨結構化存儲和云應用等多種手段來提高數(shù)據(jù)生產(chǎn)力。
問:針對混合云架構,現(xiàn)有的存儲架構是否需要升級?
答:針對混合云架構,存儲架構即需要保證穩(wěn)定安全,有需要敏捷靈活。對此,IBM通過業(yè)界領先的穩(wěn)定安全架構包括99.99999% 高可靠,兩地三中心,多中心多活等技術,來為核心業(yè)務負載可提高信賴的存儲方案,同時提供靈活彈性的云化敏捷架構,來為前沿技術的業(yè)務賦能。
問:私有云和公有云的計費模式不同,不利于成本核算,如何實現(xiàn)成本投入優(yōu)化?
答:混合云允許企業(yè)通過采用具有最佳性價比的云計算服務來控制成本,這對于不斷攀升的公有云成本,對企業(yè)而言也是一件好事。但是理想很美好,現(xiàn)實很殘酷。企業(yè)需要一個集中的控制臺實現(xiàn)云成本的優(yōu)化,包括內(nèi)部私有云的資源池建設還有公有云的成本支出。
問:混合云安全需要重點考慮哪些問題?
答:混合云是新生事物,要上云一般會有一些新的安全系統(tǒng)和設備上線,因此,大概率上說,混合云應該能改善企業(yè)的安全狀況,但這并不意味著什么也不做自動就獲得了更好的安全性。實際上,隨著云技術的成熟,安全性逐漸變成一個更為復雜的事項。但安全仍然是一項持續(xù)的挑戰(zhàn),需要在任何組織中進行管理。”
要保證混合云的安全也是一個大話題,很難說應該集中在哪里。但常識依然有效,就是從可見性開始。如果存在安全盲點,那就是安全隱患,其他重要的關注點還包括:建立責任人制度,建立良好的溝通機制和定期進行安全評估制度等。
問:混合云安全管理包括哪些方面?
答:混合云的安全管理是一個比較大的課題,從宏觀方面主要包括安全策略和制度、機構和人員安全管理、安全系統(tǒng)、安全運維等。在混合云中,安全也可以作為服務存在,安全即服務,將一些安全制度、安全策略通過建模、抽閑、歸納最終可以形成一些安全的應用系統(tǒng)和安全的組件,提供直接的安全場景服務或者供其他系統(tǒng)調(diào)用實現(xiàn)安全管理。在混合云建設過程中,基礎設施安全服務層實現(xiàn)了終端安全、系統(tǒng)安全、網(wǎng)絡安全、云安全等多個安全服務,應用安全服務層實現(xiàn)了用戶認證、客戶認證、密碼服務、數(shù)據(jù)安全、安全監(jiān)控等多個安全服務,形成企業(yè)級一體化的策略管理,對整個框架進行管理,各層服務進行管控,落實安全策略、安全管控要求,最終實現(xiàn)企業(yè)級、統(tǒng)一的、涵蓋多維度的安全管理。
問:混合云中為什么要重視身份管理?
答:混合云意味著應用程序可能會在私有云和公有云之間移動,這就意味著傳統(tǒng)的基于邊界的安全方法不再適用。隨著邊界的消失或者模糊化,相應地,安全的立足點就只能從基于邊界轉移到基于身份,對訪問者身份的管理將變得至關重要。實際上,企業(yè)要真正規(guī);渴鸹旌显茣r把身份管理是改進混合云安全的關鍵策略之一,應該使用多因認證來確保準確、精細地授予訪問者的權限。同時,之前的諸如最小授權原則也依然適用。每個人只能訪問其絕對需要完成工作所需的數(shù)據(jù)、特權和環(huán)境。
問:目前人工智能和混合云怎么做結合?
答:混合云屬于企業(yè)數(shù)字化應用的基礎設備,人工智能是一種應用,通過混合云的基礎設施,可以很好的支撐人工智能應用到客戶體驗、關鍵工作流,痛點及潛在價值中,幫助企業(yè)快速啟動創(chuàng)新。目前,隨著人工智能技術及其應用的日益成熟,大多數(shù)的云服務提供商都會在云上集成人工智能、機器學習等工具,幫助企業(yè)以更低的門檻去使用AI,實現(xiàn)IT運維、業(yè)務運營等方面的自動化、智能化。但隨著企業(yè)IT環(huán)境越來越復雜,如何實現(xiàn)人工智能的跨環(huán)境、跨平臺應用也變得越來越重要,這就要求企業(yè)能夠構建一個統(tǒng)一管理的混合云架構,讓應用在這個混合環(huán)境中“自由流動”。
問:混合云安全是否有一些通用的指導性原則?
答:不同的企業(yè)對于安全的需求不一樣,因此不存在通用的方法,但是還有一些實踐被證明適合大部分企業(yè)。
第一,根據(jù)安全需求在混合云中合理的分配工作任務;旌显苹A架構的兩個最大吸引力是其靈活性和可擴展性,可以把任務分配到公有云或者私有云上,相應地,混合云安全策略也應做出調(diào)整,要明確哪種環(huán)境適合哪種數(shù)據(jù),要確保數(shù)據(jù)的安全需求與所選環(huán)境中提供的安全功能很好地匹配。
第二,從基于邊界的防御變?yōu)樯矸莨芾怼;旌显颇:似髽I(yè)安全的邊界,因此安全需要從“邊界”轉移到“身份”。
第三,確?梢娦院鸵(guī)定負責人。 要確保混合云的安全性,管理者需要對整個系統(tǒng)具有完整的可見性,這意味著要部署工具和策略以確保對混合基礎架構具有360度視角。否則,混合云的部署很可能會帶來安全盲點,那就是漏洞或潛在的“云洞”。除了可見性,所有的系統(tǒng)和設備都應該有明確的負責人。
第四,文化要做出轉變。混合云的安全保證在很大程度上取決于文化轉變。如果說從傳統(tǒng)上講,安全是流程中的最后一步(或接近最后一步),那么在混合云時代,必須把安全作為所有工作的一部分。換而言之,應該將安全性盡早地納入工作范疇。
問:混合云架構,如何實現(xiàn)存儲架構的靈活擴展?
答:在混合云架構中,數(shù)據(jù)是客戶最關心的部分,因此,存儲架構至關重要。首先,IBM的混合云存儲既可以支持傳統(tǒng)關鍵業(yè)務,也可以支持新興業(yè)務,既可以支持集中式存儲,又可以支持分布式存儲。對于數(shù)據(jù)格式,既可以支持結構化數(shù)據(jù),又可以支持非結構化數(shù)據(jù)。IBM的所有混合云存儲設備,都支持云接口、支持容器的封裝方式,可以讓客戶打通云上和云下的數(shù)據(jù),同時保證數(shù)據(jù)的安全。在擴展性上,可以支持靈活的擴展可容災需求。同時,在云存儲解決方案中,還支持Worm方式,符合合規(guī)的要求。對于混合云中冷數(shù)據(jù),IBM可以提供高效低成本的磁帶以及備份、歸檔方案,為用戶降低超過80%的成本。主要的產(chǎn)品有Flash System,SVC,Spectrum Scales, COS, Spectrum Protect.
問:跨多個云服務提供商管理技術資產(chǎn)是一個巨大的挑戰(zhàn),如何做到成本可控?
答:跨多個云服務提供商管理技術資產(chǎn)是一個巨大的挑戰(zhàn),這就需要選擇一個合適的多云管理平臺,IBM的多云管理平臺提供Consumption,Operation,DevOps和Governance四個組件:通過Consumption實現(xiàn)使用自服務,降低運營成本;通過Openration組件和AIOps相結合,優(yōu)化管理模式和提升效率;通過DevOps組件更好地管理開發(fā)模式,優(yōu)化開發(fā)流程與開發(fā)成本;通過Governance可以幫助客戶管理多云環(huán)境的使用成本,基于AI提供使用情況的深度洞察,提供各種云服務提供商的使用成本優(yōu)化。
問:混合云架構下,海量數(shù)據(jù)的存儲管理如何更有效?
答:海量數(shù)據(jù)多為非結構化數(shù)據(jù),呈分布式架構存放在云平臺中。管理、同步、合規(guī)成為難點,IBM的存儲系統(tǒng)可以給企業(yè)提供易管理、高效、有彈性、安全的數(shù)據(jù)平臺。針對多站點的分布式架構,IBM COS是針對對象存儲的方案,支持海量數(shù)據(jù)跨地域的保存和歸檔。針對大數(shù)據(jù)、超級計算等領域,Spectrum Scale針對數(shù)據(jù)湖、機器學習、數(shù)據(jù)挖掘,提供多站點多活的數(shù)據(jù)平臺支持,讓云上云下的數(shù)據(jù)同時為業(yè)務服務。這些方案既可以有純軟件的交付方式,也有軟硬一體的交互方式,讓用戶的管理更加便捷。
問:容器集群會部署到公有云,私有云、海外等混合環(huán)境,針對超過10個以上集群管理,有什么好的解決方案嗎?
答:首先,企業(yè)級的多云環(huán)境的PaaS平臺搭建(公有云,私有云),最好是使用統(tǒng)一PaaS平臺,從技術、管理、安全保持一致性。例如,OpenShift的企業(yè)級容器PaaS平臺就很適合。
其次,中小規(guī)模的業(yè)務部署,建議可以把國內(nèi)的公有云、私有云搭建成多Region,多Zone的集群架構,在統(tǒng)一的集群下做統(tǒng)一的管理(單集群的Pod上限數(shù)為15萬)。海外環(huán)境建議另設成獨立的集群。
此外,大規(guī)模的業(yè)務部署,建議可以部署多集群OpenShift平臺。
不同屬性特質(zhì)的容器應用可以部署到不同的云化容器集群中。不管是部署在公有云的集群,還是私有云的集群,還是其他地域的集群,使用同一套技術棧標準的產(chǎn)品和服務會是一個很不錯的選擇,比如:Redhat Openshift Container Platform PaaS平臺產(chǎn)品。在單集群中可以從region, az的角度進行machine, node節(jié)點的規(guī)劃建設設計,在多集群的環(huán)境中可以采用多云管理平臺,比如:Cloud Paks for Multicloud Management 產(chǎn)品 或 原生的Multi Cluster Federation進行多集群管理。
問:在不同的云環(huán)境如何運行以及實現(xiàn)API接口的調(diào)用?
答:首先,企業(yè)級的多云環(huán)境的PaaS平臺搭建(公有云,私有云),最好是使用統(tǒng)一PaaS平臺,從技術、管理、安全保持一致性。例如,OpenShift的企業(yè)級容器PaaS平臺就很適合。
其次,中小規(guī)模的業(yè)務部署,建議可以把國內(nèi)的公有云、私有云搭建成多Region,多Zone的集群架構,在統(tǒng)一的集群下做統(tǒng)一的管理(單集群的Pod上限數(shù)為15萬)。海外環(huán)境建議另設成獨立的集群。
此外,大規(guī)模的業(yè)務部署,建議可以部署多集群OpenShift平臺。
不同屬性特質(zhì)的容器應用可以部署到不同的云化容器集群中。不管是部署在公有云的集群,還是私有云的集群,還是其他地域的集群,使用同一套技術棧標準的產(chǎn)品和服務會是一個很不錯的選擇,比如:Redhat Openshift Container Platform PaaS平臺產(chǎn)品。在單集群中可以從region, az的角度進行machine, node節(jié)點的規(guī)劃建設設計,在多集群的環(huán)境中可以采用多云管理平臺,比如:Cloud Paks for Multicloud Management 產(chǎn)品 或 原生的Multi Cluster Federation進行多集群管理。
問:在混合多云環(huán)境下,運營管理面臨巨大挑戰(zhàn),企業(yè)如何實現(xiàn)管理化繁為簡,運營成本持續(xù)優(yōu)化?
答:IBM以即需即供的云模式幫助企業(yè)實現(xiàn)混合云的一體化運營,使得承載企業(yè)核心業(yè)務的私有云能夠和公有云一樣,具備資源彈性、動態(tài)優(yōu)化和成本節(jié)約等特性,通過運營驅(qū)動云價值的持續(xù)實現(xiàn)。
通過AIOps、Ansible自動化、數(shù)字員工等認知和自動化技術,實現(xiàn)平臺的智能自動化管理與預測性維護,提高平臺和應用穩(wěn)定性,降低人力投入和成本。
此外,IBM還特別關注數(shù)字化轉型過程中企業(yè)IT組織成長,為企業(yè)提供BOT(Build-Operate-Transfer)或者外包(Outsourcing)模式的全方位伴隨式服務。
本文章選自《AI啟示錄》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
