魔搭ModelScope開源社區(qū)
2022年云棲大會,達(dá)摩院聯(lián)合CCF開源發(fā)展委員會共同發(fā)起了國內(nèi)首個中文Al模型開源社區(qū)“魔搭"(ModelScope),將達(dá)摩院近五年潛心研究的600個優(yōu)質(zhì)模型,向全中國的Al研究者與團(tuán)隊開放,共同促進(jìn)中國的Al基礎(chǔ)研究。作為發(fā)起者之一,達(dá)摩院向魔搭社區(qū)開放了一批高質(zhì)量的初始模型,同時,作為社區(qū)的一分子,達(dá)摩院更希望與學(xué)界和企業(yè)一起,通過開源社區(qū)的共建,推動模型應(yīng)用生態(tài)繁榮發(fā)展,豐富技術(shù)生態(tài),共同將我國的人工智能創(chuàng)新推上新的臺階。
戰(zhàn)略規(guī)劃
近年,A|研究發(fā)展迅猛,不斷拓寬以數(shù)字化、智能化推動數(shù)實融合的空間,但Al應(yīng)用始終存在使用門檻過高、場景結(jié)合不足等難題。數(shù)據(jù)的復(fù)雜性和稀缺性,以及模型訓(xùn)練高難度與高成本,令模型訓(xùn)練(尤其是大模型的訓(xùn)練)在國內(nèi)仍未得到普及。另外,模型的定制化對開發(fā)人員要求高,且目前在國內(nèi)沒有一個通用的模型交流平臺,缺乏一個系統(tǒng)化的模型分享渠道。為此,魔搭ModelScope開源社區(qū)應(yīng)運而生,唯有開源,才能降低大模型的研究門檻;也唯有開源,才能推動一系列基礎(chǔ)研究的開拓和發(fā)展;唯有開源,才能為數(shù)實融合注入新動力。
業(yè)務(wù)模式
當(dāng)前,魔搭ModelScope社區(qū)上架模型超過700個,覆蓋了視覺、語音、自然語言處理、多模態(tài)等Al主要領(lǐng)域,覆蓋任務(wù)超過60個。其中包含幾百個SOTA(業(yè)界領(lǐng)先)模型和幾十個預(yù)訓(xùn)練大模型,均已開源代碼或開放使用。ModelScope社區(qū)兼容了各種機(jī)器學(xué)習(xí)的框架,開發(fā)者可以快速接入各種模型。目前,社區(qū)上也集合了很多來自高校,企業(yè)的優(yōu)秀模型。
技術(shù)架構(gòu)
ModelScope社區(qū)提供了一站式的模型服務(wù),包括模型的管理、下載、調(diào)優(yōu)、訓(xùn)練、部署一體化能力,社區(qū)提供非常豐富的模型以及對應(yīng)的版本管理能力。社區(qū)也提供一個在線體驗的能力,在不開發(fā)代碼的情況下,能夠讓眾多使用者能夠快速體驗各種模型的效果。除了模型以外,社區(qū)同時還提供了豐富的數(shù)據(jù)集。為了構(gòu)建這些完整的平臺體驗,ModelScope提供了一個功能強(qiáng)大的開源Python package,這個package提供了不同模型接入Model Scope生態(tài)的接口和實現(xiàn),底層能夠兼容各種機(jī)器學(xué)習(xí)框架,無縫銜接模型應(yīng)用與開發(fā)。
轉(zhuǎn)型成效
(一)企業(yè)價值:
提供高效便捷工具,提高經(jīng)營效率。通過模型開源的方式,給阿里巴巴集團(tuán)內(nèi)部提供了全套模型即服務(wù)的工具,讓集團(tuán)各個部門能夠更加高效便捷地研發(fā)、使用新技術(shù),通過人工智能創(chuàng)新和變革工作模式,包括生產(chǎn)經(jīng)營成本下降、協(xié)同效率提升、產(chǎn)品質(zhì)量提升、流程優(yōu)化、經(jīng)濟(jì)效益增加。通過提供基礎(chǔ)模型,讓人工智能算法架構(gòu)趨于統(tǒng)一,統(tǒng)一底層算法架構(gòu)為下一代通用人工智能系統(tǒng)提供了條件。
(二)社會價值:
共享技術(shù)紅利,實現(xiàn)綠色節(jié)能。魔搭ModelScope社區(qū)為科研工作者提供了最前沿的開源模型,豐富數(shù)據(jù)集以及共享交流的平臺,對開發(fā)者提供了一系列開發(fā)者支持計劃,開發(fā)者可以免費獲取算力、Al教程,可以快速上手進(jìn)行學(xué)習(xí)和實踐。魔搭社區(qū)開源了一系列預(yù)訓(xùn)練大模型,讓廣大企業(yè)尤其是中小企業(yè),不需要在基礎(chǔ)模型訓(xùn)練上投入大規(guī)模算力和數(shù)據(jù),而是基于預(yù)訓(xùn)練模型,用小規(guī)模算力和數(shù)據(jù)訓(xùn)練下游任務(wù),豐富場景運用的實例,在全社會層面減少算力損耗,實現(xiàn)綠色節(jié)能。
魔搭模型開源社區(qū)的主要發(fā)起方,阿里巴巴集團(tuán)達(dá)摩院,一直致力于通過技術(shù)的應(yīng)用和研發(fā),提高智能產(chǎn)品的滲透率,通過開源共享的技術(shù),推動產(chǎn)業(yè)智能化升級。在人工智能技術(shù)方面,達(dá)摩院建設(shè)了完整的基礎(chǔ)Al能力:深度學(xué)習(xí)、語音、 NLP、視覺、優(yōu)化等,并通過開源社區(qū)魔搭ModelScope社區(qū)開源開放了760個各種模態(tài)的模型,覆蓋視覺,語音,自然語言處理,多模態(tài),Al for Science等,在主要的Al技術(shù)賽道上達(dá)到世界先進(jìn)水平。
本文章選自中國上市公司協(xié)會發(fā)布的《中國上市公司數(shù)字化轉(zhuǎn)型典型案例》