姜紅德
數月來(lái),以ChatGPT為首的AI大模型掀起了新一輪技術(shù)熱潮,甚至被業(yè)內人士稱(chēng)之為信息革命的新拐點(diǎn)?!芭cAI大模型相比,谷歌、字節跳動(dòng)等公司現在的業(yè)務(wù)模式或者正在做的事情可以被概括為搬運信息的工作”。原百度總裁、奇績(jì)創(chuàng )始人兼CEO陸奇這樣表示。對躬身入局的企業(yè)來(lái)說(shuō),他們的大模型定位各有差異,也具備不同的稟賦優(yōu)勢?!吨袊畔⒒冯s志對部分AI大模型進(jìn)展進(jìn)行了簡(jiǎn)單梳理,以“管窺全豹”。
OpenAI由數位硅谷大佬共同出資10億美元于2015年在舊金山創(chuàng )立。自2018年起,OpenAI相繼發(fā)布了大模型GPT-1、 GPT-2、 GPT-3。2022年12月公布的ChatGPT其實(shí)是在GPT-3基礎上的3.5版本。
2 0 2 3年3月1 5日凌晨,OpenAI正式推出GPT-4。相比ChatGPT僅能在文字領(lǐng)域施展特長(cháng),GPT-4是多模態(tài)大模型,即支持圖像和文本輸入以及文本輸出,擁有強大的識圖能力。GPT-4在知識能力測試方面能夠達到人類(lèi)較高水平,業(yè)界普遍認為GPT-4將為AI產(chǎn)業(yè)帶來(lái)更多機會(huì ),同時(shí)也引發(fā)了對AI倫理方面的一些擔心。最新的消息顯示,OpenAI于5月15日宣布向所有ChatGPT Plus用戶(hù)推出聯(lián)網(wǎng)和插件功能。位于A(yíng)lpha和Beta通道的ChatGPT Plus用戶(hù)都能使用聯(lián)網(wǎng)功能以及70多個(gè)已上線(xiàn)的插件。此次更新意味著(zhù)最后一道“封印”已被徹底解除,ChatGPT將利用最新的信息和資訊為使用者提供服務(wù)。
2月11日,微軟發(fā)布語(yǔ)言模型Turing-NLG(簡(jiǎn)稱(chēng)T-NLG)。該模型擁有170億參數量。TuringNLG在各種語(yǔ)言建?;鶞史矫娴谋憩F出眾,并且在回答問(wèn)題和摘要生成方面表現十分優(yōu)異。這主要得益于以下突破:一是利用NVIDIA DGX-2硬件設置,使用InfiniBand連接,以便GPU之間實(shí)現比以前更快地通信。二是使用四個(gè)V100 GPU,在 Megatron-LM框架中應用張量切片分割模型。三是使用Deepspeed和ZeRO降低了模型的并行度(從16降低到4) ,將每個(gè)節點(diǎn)的批處理大小增加4倍,并且減少了三倍的訓練時(shí)間。除了通過(guò)總結文檔和電子郵件來(lái)節省用戶(hù)時(shí)間,T-NLG可以通過(guò)向作者提供寫(xiě)作幫助和回答讀者可能提出的關(guān)于文檔的問(wèn)題,來(lái)增強使用Microsoft Office 套件的體驗,打造更強的聊天機器人等等。
2月24日,Meta宣布推出針對研究社區的“Meta人工智能大型語(yǔ)言模型”系統,簡(jiǎn)稱(chēng)“LLaMA”。在此之前,Meta也曾推出過(guò)大型語(yǔ)言模型 OPT-175B,這構成了其聊天機器人blenterbot 新迭代的基礎。
Meta公司CEO扎克伯格在社交媒體上表示,LLaMA在文本生成、問(wèn)題回答、書(shū)面材料總結,以及自動(dòng)證明數學(xué)定理、預測蛋白質(zhì)結構等更復雜的方面也有很大的發(fā)展前景。LLaMA可以在非商業(yè)許可下提供給政府、社區和學(xué)術(shù)界的研究人員和實(shí)體工作者,目前正在接受研究人員的申請。
當地時(shí)間5月10日,谷歌發(fā)布最新的人工智能語(yǔ)言模型 PaLM 2,這是谷歌去年推出的大語(yǔ)言模型 PaLM的進(jìn)階版——2022年4月,谷歌推出了 PaLM,參數規模為5400億。相比之下,PaLM2在語(yǔ)言豐富度、推理能力、代碼能力上比上一個(gè)版本有了提升:一是多語(yǔ)言性。
PaLM 2 在多語(yǔ)言文本方面接受了更多的訓練,涵蓋 100多種語(yǔ)言。在理解、生成和翻譯細微差別文本 (包括成語(yǔ)、詩(shī)歌和謎語(yǔ)) 的能力上表現更好。PaLM 2 還通過(guò)了“精通”級別的高級語(yǔ)言能力考試。二是推理, PaLM 2的廣泛數據集包括科學(xué)論文和數學(xué)相關(guān)信息,在邏輯、常識推理和數學(xué)方面表現更好。三是編碼,PaLM 2 在大量公開(kāi)可用的源代碼數據集上進(jìn)行了預訓練。它擅長(cháng)Python 和 Java 等流行的編程語(yǔ)言,也可以生成 Prolog、Fortran和 Verilog 等語(yǔ)言的專(zhuān)用代碼。
從華為云官網(wǎng)查詢(xún)的消息得知,華為的盤(pán)古系列 AI 大模型即將發(fā)布。盤(pán)古大模型由 NLP 大模型、CV 大模型、多模態(tài)大模型、科學(xué)計算大模型等多個(gè)大模型構成,通過(guò)模型泛化,解決傳統 AI作坊式開(kāi)發(fā)模式下不能解決的 AI規?;?、產(chǎn)業(yè)化難題,可以支持多種自然語(yǔ)言處理任務(wù),包括文本生成、文本分類(lèi)、問(wèn)答系統等等。其中 NLP 大模型是被認為最接近人類(lèi)中文理解能力的 AI 大模型,而 CV 大模型首次兼顧了圖像判別與生成能力。媒體評價(jià),如果單純從數據的角度來(lái)看,華為盤(pán)古的級別已經(jīng)達到GPT-3.5的水平。
3月16日,百度正式發(fā)布了生成式人工智能大模型“文心一言”,并展示了它在文學(xué)、商業(yè)、數理推理等方面的多模態(tài)表現。在實(shí)際演示中,該模型能夠根據用戶(hù)需求做到數理計算、資料查詢(xún)、分析解答。同時(shí),文心一言也能夠根據用戶(hù)需求,進(jìn)行圖片、語(yǔ)音甚至視頻的智能生成。
在4月11日召開(kāi)的阿里云峰會(huì )上,阿里巴巴正式宣布推出大語(yǔ)言模型“通義千問(wèn)”。通義千問(wèn)具備多輪對話(huà)、文案創(chuàng )作、邏輯推理、多模態(tài)理解、多語(yǔ)言支持等功能。具體到應用上,通義千問(wèn)可以跟人類(lèi)進(jìn)行多輪的交互,也融入了多模態(tài)的知識理解,有著(zhù)非常強的文案創(chuàng )作能力,能夠續寫(xiě)小說(shuō)、編寫(xiě)郵件等,可以極大提高工作效率。據阿里巴巴集團董事會(huì )主席兼CEO張勇透露,釘釘、天貓精靈將于不久后正式接入該模型,未來(lái)阿里巴巴全系產(chǎn)品都將用上該模型。
據騰訊披露,其旗下“混元”AI大模型覆蓋了NLP(自然語(yǔ)言處理)、CV(計算機視覺(jué))、多模態(tài)等基礎模型和眾多行業(yè)模型。2023年3月22日,騰訊總裁劉熾平回應稱(chēng),公司將投入大量資源構建基礎模型,并在未來(lái)將其應用到騰訊的每一個(gè)業(yè)務(wù)線(xiàn)中。同時(shí),基礎模型也會(huì )幫助騰訊開(kāi)展新的業(yè)務(wù),將用戶(hù)與用戶(hù)之間的優(yōu)勢帶入到人機互動(dòng)領(lǐng)域。
3月14日,商湯科技發(fā)布擁有30億參數的多模態(tài)多任務(wù)通用大模型“書(shū)生2.5”。該模型實(shí)現了通過(guò)文本來(lái)定義任務(wù),從而可以靈活地定義不同場(chǎng)景的任務(wù)需求,并根據給定視覺(jué)圖像和任務(wù)的提示性語(yǔ)句,給出相應的指令或作答,進(jìn)而具備通用場(chǎng)景下的高級感知和復雜問(wèn)題處理能力,比如圖像描述、視覺(jué)問(wèn)答、視覺(jué)推理和文字識別等。在自動(dòng)駕駛和居家機器人等通用場(chǎng)景下,“書(shū)生2.5”可輔助處理各種復雜任務(wù)。
5月6日,科大訊飛星火認知大模型在安徽合肥發(fā)布?,F場(chǎng)圍繞訊飛星火認知大模型的七大核心能力,即多風(fēng)格多任務(wù)長(cháng)文本生成、多層次跨語(yǔ)種語(yǔ)言理解、泛領(lǐng)域開(kāi)放式知識問(wèn)答、情景式思維鏈邏輯推理、多題型步驟級數學(xué)能力、多功能多語(yǔ)言代碼能力、多模態(tài)輸入和表達能力,展開(kāi)現場(chǎng)實(shí)測。目前首批來(lái)自36個(gè)行業(yè)的3000余家企業(yè)開(kāi)發(fā)者將接入星火大模型,聯(lián)合各行業(yè)合作伙伴共建大模型“星火”生態(tài)。
中國科學(xué)院自動(dòng)化研究所5月6日宣布,該所正在和武漢人工智能研究院聯(lián)合打造全模態(tài)大模型“紫東太初”2.0。有別于以文本為主的大部分語(yǔ)言大模型,中科院自動(dòng)化所自2019年開(kāi)始就在語(yǔ)音、文本、圖像等單模態(tài)大模型研究和應用基礎上,瞄準多模態(tài)大模型領(lǐng)域聯(lián)合攻關(guān),2021年7月正式發(fā)布全球首個(gè)千億參數多模態(tài)大模型“紫東太初”。
“紫東太初”大模型已在手語(yǔ)教學(xué)、法律咨詢(xún)、交通出行、廣電、醫療機器人、醫學(xué)影像判讀等數十個(gè)行業(yè)場(chǎng)景領(lǐng)域,展現出廣闊的落地應用潛力。
猜你喜歡模態(tài)文本語(yǔ)言語(yǔ)言是刀文苑(2020年4期)2020-05-30在808DA上文本顯示的改善制造技術(shù)與機床(2019年10期)2019-10-26基于doc2vec和TF-IDF的相似文本識別電子制作(2018年18期)2018-11-14讓語(yǔ)言描寫(xiě)搖曳多姿小學(xué)生作文(中高年級適用)(2018年3期)2018-04-18累積動(dòng)態(tài)分析下的同聲傳譯語(yǔ)言壓縮華北電力大學(xué)學(xué)報(社會(huì )科學(xué)版)(2016年4期)2016-12-01文本之中·文本之外·文本之上——童話(huà)故事《坐井觀(guān)天》的教學(xué)隱喻小學(xué)教學(xué)參考(2015年20期)2016-01-15國內多模態(tài)教學(xué)研究回顧與展望湖北經(jīng)濟學(xué)院學(xué)報·人文社科版(2015年8期)2015-12-29我有我語(yǔ)言少兒科學(xué)周刊·少年版(2015年4期)2015-07-07基于HHT和Prony算法的電力系統低頻振蕩模態(tài)識別上海電機學(xué)院學(xué)報(2015年4期)2015-02-28由單個(gè)模態(tài)構造對稱(chēng)簡(jiǎn)支梁的抗彎剛度計算物理(2014年2期)2014-03-11