• <progress id="rrndj"></progress>
    <rp id="rrndj"></rp><rp id="rrndj"></rp>
    <rp id="rrndj"><nav id="rrndj"><input id="rrndj"></input></nav></rp>

    <progress id="rrndj"><i id="rrndj"><sub id="rrndj"></sub></i></progress>
    掃碼關注官方微信公眾號

    基于大模型的MaaS工業(yè)應用分析與思考

    2023-06-20


    10DF7



    基于大模型的MaaS工業(yè)應用分析與思考
    文/冷語欣  欒曉曦  羅培
    清華大學互聯(lián)網(wǎng)產(chǎn)業(yè)研究院


    2023 年初,社交網(wǎng)絡上出現(xiàn)了一陣曬出與 ChatGPT 的聊天截圖風潮,這也是 ChatGPT 被大眾認知最廣的一個功能——智能交互對話[1]。ChatGPT 是美國人工智能研究實驗室 OpenAI 開發(fā)的一種全新聊天機器人模型,能夠通過學習和理解人類的語言來進行對話,還能根據(jù)聊天的上下文進行互動,支持回答問題、承認錯誤、質疑并拒絕不適當?shù)恼埱蟮惹榫?/span>[2]。中國信息通信研究院聯(lián)合中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟對 ChatGPT 進行的測試顯示,ChatGPT 在百科檢索、數(shù)學問答、文學交流、常識問答、知識推理等對話任務上的意圖識別率均達到 98% 左右,在生活閑聊上的意圖識別率約為 95%,已具備較好的語義理解能力[3]。


    01


     

    生成式預訓練Transfomer模型

    GPT 的全稱為 Generative Pre-Trained Transformer,即生成式預訓練 Transfomer 模型?;?GPT 架構,OpenAI 構建了可以應用在多種任務上的大規(guī)模語言模型,并成功應用在商業(yè)領域。大規(guī)模語言模型 Large Language Model (LLM)是一個基于 Transformer 的神經(jīng)網(wǎng)絡,由具有許多參數(shù)(通常為數(shù)十億個權重或更多)的神經(jīng)網(wǎng)絡組成,使用自監(jiān)督學習在大量未標記的文本上進行訓練。而 2022 年初推出的 InstructGPT 引入新技術 RLHF(基于人類反饋的強化學習),該技術可以直接從人類反饋中訓練“獎勵模型”。當處理包含人類價值觀和人類偏好的復雜任務,包括但不限于文本分類、生成文本以及回答問題[4]時,RLHF 可以生成與人類價值觀相符的答案,并能夠拒絕與其價值觀不符的任務。這提高了強化學習的魯棒性和探索性。

    Transformer 模型來自谷歌 2017 年發(fā)表的論文《Attention is all you need》,作為一種采用自注意力機制(Self-Attention)的深度學習模型,Transformer 是目前常見大規(guī)模語言模型的核心組件。模型按照輸入數(shù)據(jù)各部分的重要性的不同而分配不同的權重。

    該模型顛覆了傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡 (RNN)和長短時記憶網(wǎng)絡(LSTM)的建模范式,在自然語言處理任務中取得了顯著的成功。

    Transformer 的優(yōu)勢在于:


       

    采用并行訓練,大幅提高了訓練效率;


    能夠在處理文本時捕獲長距離依賴關系,避免了傳統(tǒng) RNN 和 LSTM 中的梯度消失問題。


    可以應用于多種自然語言處理任務,如文本生成、分類、翻譯等,具有很高的通用性。


    ● 經(jīng)過多次迭代,參數(shù)量大幅提升。

    Transformer 結構的提出,使得深度學習模型參數(shù)突破了 1 億。從 lenet、Alexnet、ResNet 開始,模型參數(shù)日益增長。到了 BERT 網(wǎng)絡模型的提出,參數(shù)量首次超過 3 億規(guī)模,鵬程盤古實現(xiàn)千億參數(shù)規(guī)模,OpenAI 于 2020 年 5 月推出第三代 GPT-3 模型參數(shù)量達 1750 億。

    目前,通用大模型已經(jīng)成為人工智能領域的研究熱點,國內(nèi)外均有研究成果和商用模型陸續(xù)發(fā)布。其中國外大模型研究起步較早,OpenAI、谷歌等公司為代表經(jīng)過多年研究,大模型版本不斷迭代,規(guī)模逐漸擴大,性能不斷提升(表1)。

    表 1 國外主要大模型

    522F7

    國內(nèi)目前已有百度、阿里等互聯(lián)網(wǎng)頭部企業(yè)入局,另有清華大學、復旦大學、中科院等科研院所以及商湯科技、智譜 AI 等人工智能企業(yè)已發(fā)布或在研大模型產(chǎn)品(表2)。

    表 2 國內(nèi)主要大模型

    3A986


    02


     

    大模型是新一代的“操作系統(tǒng)”

    Transformer 模型可并行運算的特性和出色的可擴展性為人工智能模型向通用大規(guī)模發(fā)展奠定了基礎。一方面,Transformer 架構結構靈活,具有很強的可擴展性。通過增加層數(shù)、注意力頭數(shù)等方式,根據(jù)任務和數(shù)據(jù)集規(guī)模的不同調整模型規(guī)模、改進模型性能,這為開發(fā)更大規(guī)模、更強大的模型提供了可能。另一方面,Transformer 具有良好的并行化能力,這使得其能夠處理大規(guī)模數(shù)據(jù)集。

    在大規(guī)模數(shù)據(jù)和計算資源的支持下,基于 Transformer 可以設計并訓練參數(shù)規(guī)模上億的大模型。這種大模型具有更好的泛化能力和性能,能夠應對更加復雜的處理任務,并逐漸進入到可以大規(guī)模、可復制的大工業(yè)落地階段[5],應用于細分領域的下游任務。

    33647

    △ 圖1 大模型與應用下游任務

    (圖源https://arxiv.org/pd f/2108.07258.pdf)

    清華大學講席教授、智能產(chǎn)業(yè)研究院院長張亞勤在《AI大模型時代》的演講中指出,“GPT+ 等各種大模型是人工智能時代的“操作系統(tǒng)”,對上層應用有重構、重寫的作用?!辈煌臅r代有不同的操作系統(tǒng),它們決定了服務器架構和應用的形態(tài)。人工智能時代,大模型將成為底層的操作系統(tǒng),芯片架構包括 GPU、CPU、XPU,上層的云計算架構將從 IaaS–PaaS–SaaS,演變?yōu)?IaaS– 垂直模型/MaaS/基礎模型 –SaaS。

    6906

    △ 圖2 大模型時代下重塑的云計算架構

    上海大學計算機工程與科學學院鄒國兵教授于 2012 年就提出了“MaaS”(模型即服務)的概念:MaaS 由基礎層、中間核心層和底層擴展層三部分構成。

    871C

    △ 圖3  MaaS理論模型

    基礎層包含用戶的身份信息,如姓名和職業(yè)等;中間核心層涉及用戶的重要特征,如興趣、偏好、目標等;底層擴展層含有個性化知識的用戶特征,如通過語義分析和推理得到的興趣、偏好和模型網(wǎng)絡?;A層、中間核心層和底層擴展層共同構建了一個 MaaS 平臺。平臺可以作為獨立的服務平臺,嵌入到云計算中,位于 PaaS 層和 SaaS 層之間。從 MaaS 的構成得以看出,它可以利用IaaS層收集的個人信息,生成個性化的模型網(wǎng)絡。百度創(chuàng)始人李彥宏在“文心一言”發(fā)布會上表示大模型時代下,將會產(chǎn)生新型云計算公司,其主流商業(yè)模式也將從 IaaS 變?yōu)?MaaS[6]


    03


     

    MaaS 應用對生產(chǎn)制造行業(yè)的影響

    大模型時代下,需要擁抱以工業(yè)大模型為基礎、輕量化微調的 MaaS 服務,快速形成智能化的 MaaS 應用,優(yōu)化傳統(tǒng)工業(yè)互聯(lián)網(wǎng)賦能方式,推動我國工業(yè)化進程[7]。

    在開發(fā)設計方面,開發(fā)人員可以直接通過自然語言生成代碼,提升產(chǎn)品易用性和個性化程度。PaaS 的開發(fā)可以基于 MaaS 平臺,或者直接由 MaaS 替代,實現(xiàn)數(shù)據(jù)和功能的定制化。應用模型的圖像生成能力,設計人員可以用更低的時間成本進行三維可視化設計,建立智能工業(yè)知識庫。例如:汽車外形的研發(fā)設計可以直接通過大模型生成并給出對應的設計說明及優(yōu)缺點,輔助設計師創(chuàng)新。

    在生產(chǎn)制造方面,大模型能在生產(chǎn)制造流程中幫助工人精準設定設備的工藝參數(shù),提供有效的精細化操作指引,在突發(fā)故障時提供快速診斷和應急解決方案建議。例如:針對復雜的儀器設備和多流程的工藝環(huán)節(jié),大模型可以自動生成各環(huán)節(jié)工藝參數(shù),并在數(shù)字孿生系統(tǒng)進行仿真輸出報告供人類選擇。

    在運營管理方面,大模型通過對 ERP、CRM、SRM 等系統(tǒng)的運營數(shù)據(jù)與模型代碼的理解,用戶直接使用自然語言描述需求,生成儀表盤、報告或 AI 分析。同時也能與圖像識別處理系統(tǒng)、時間序列分析等系統(tǒng)融合,通過深層次、多維度的數(shù)據(jù)分析。例如:大模型直接生成Excel并進行數(shù)據(jù)分析,供管理人員了解整個工廠的運營情況、提供可參考的最終決策。

    在產(chǎn)品服務方面,大模型可以提高響應效率并創(chuàng)新產(chǎn)品服務形式。既可以通過智能客服的形式協(xié)助人工進行會話、業(yè)務處理、操作講解,也可實現(xiàn)社媒推廣、智能面試等創(chuàng)新服務。例如:大模型可以充當社交媒體 KOL,為抖音、微博、微信公眾號等各種平臺創(chuàng)建內(nèi)容并與關注者互動,以推廣產(chǎn)品或服務。

    在人員培訓方面,大模型可以被視為一個規(guī)模龐大、擁有專業(yè)知識體系的數(shù)據(jù)庫,通過與員工的交互來輸出知識,在工業(yè)領域的人員培訓中多功能應用,實現(xiàn)智能培訓。例如:模擬如應急事件、安全事故等各種突發(fā)場景,讓員工在模擬實踐中學習應對突發(fā)情況的方法和技能。

    然而互聯(lián)網(wǎng)領域通用的 AI 模型開發(fā)和應用與工業(yè)領域有著非常明顯的差異,主要體現(xiàn)在數(shù)據(jù)、需求規(guī)模、精度要求、算力支持、模型部署等五個方面 [8]。百度、騰訊、阿里巴巴、華為等國內(nèi)科技企業(yè)在 MaaS 領域已經(jīng)展現(xiàn)了強大的研發(fā)實力和實踐能力,在工業(yè)領域模型應用上探索了路徑。百度 Apollo 提供自動駕駛、智能汽車、智能交通等解決方案;文心大模型構建了“基礎+任務+行業(yè)”的三級模型體系,基礎大模型支撐任務與行業(yè)大模型的建設,任務和行業(yè)大模型結合真實場景與數(shù)據(jù)反哺基礎大模型優(yōu)化;騰訊混元協(xié)同了騰訊預訓練研發(fā)力量,完整覆蓋 NLP、CV、多模態(tài)及眾多行業(yè)領域任務模型;阿里巴巴“通義”大模型基于 AI 統(tǒng)一底座構建了通用模型與專業(yè)模型協(xié)同的層次化人工智能體系,支撐了電商、金融、物流等多個場景;華為云“盤古大模型”與昇騰(Ascend)芯片、昇思(MindSpore)語言、ModelArts 平臺深度結合,已經(jīng)發(fā)展出包括基礎大模型(L0)、行業(yè)大模型(L1)、行業(yè)細分場景模型(L2)三大階段的成熟體系。

    因此,在行業(yè)大模型的構建和應用方面,應引導 AI 模型研發(fā)供應商與制造類鏈主企業(yè)展開充分對接,形成數(shù)據(jù)、訓練、治理全套服務的大模型開源生態(tài)體系。朱巖教授在《2023年中國數(shù)字經(jīng)濟發(fā)展的十個趨勢》一文中提出預測,如同 2C 的大型平臺經(jīng)濟企業(yè)一樣,在 2B 領域也將涌現(xiàn)大量新型的產(chǎn)業(yè)數(shù)字服務平臺企業(yè)。


    參考文獻

    [1] 張智雄,錢力,謝靖等.(2023).ChatGPT對科學研究和文獻情報工作的影響.

    CSTR:32003.36.ChinaXiv.202303.00093.V1

    [2] 唐長樂,高翔,謝鑫.(2023).ChatGPT賦能數(shù)字人文:概念解構、應用前景與現(xiàn)實問題.圖書情報工作.

    CSTR:32003.36.ChinaXiv.202303.00089.V1

    [3] 時斕娜. “特別能聊”的人工智能聊天機器人ChatGPT會聊出些什么?[N]. 工人日報

    [4] Ouyang, Long et al. “Training language models to follow instructions with human feedback.” ArXiv abs/2203.02155 (2022): n. pag.

    [5] 張振乾,汪澍,宋琦,高云龍.人工智能大模型在智慧農(nóng)業(yè)領域的應用[J].智慧農(nóng)業(yè)導刊, 2023,3(10):9-12+17.DOI:10.20028/j.zhnydk.2023.10.003.

    [6] 思杭.MaaS來臨,SaaS進入「奇點」時刻|產(chǎn)業(yè)深度[EB/OL].產(chǎn)業(yè)家.http://www.chanyejiawang.com/h-nd-1773.html

    [7] 顧維璽.類ChatGPT推動中國新型工業(yè)化發(fā)展[J].中國信息界,2023(02):32-35.

    [8] 王改靜.卡奧斯工業(yè)智能研究院工業(yè)AI技術總監(jiān)王曉利:工業(yè)AI面臨五大挑戰(zhàn)[N].通信產(chǎn)業(yè)報,2023-02-27(010).DOI:10.28806/n.cnki.ntxcy.2023.000097.


    編輯|段文秀   
    審核、責編|楊帆   
    亚洲国产精品成人久久久_在线观看中文字幕日韩_中文字幕免费日韩不卡_99V久久综合狠狠综合久久
  • <progress id="rrndj"></progress>
    <rp id="rrndj"></rp><rp id="rrndj"></rp>
    <rp id="rrndj"><nav id="rrndj"><input id="rrndj"></input></nav></rp>

    <progress id="rrndj"><i id="rrndj"><sub id="rrndj"></sub></i></progress>