【文/觀察者網 呂棟】
(相關資料圖)
到目前為止,如果要評選2023年最熱的概念,非AI大模型莫屬。這輪由ChatGPT引爆的技術熱潮,經過一段時間的發酵,已在國內迎來爆發期,互聯網大廠紛紛躬身入局。人們也似乎越來越認識到,大模型是通往通用人工智能(AGI)最明確的路徑。
在此背景下,商湯科技也厚積薄發,于近期正式推出了自研AI大模型體系“日日新SenseNova”,其中不僅包含語言大模型,還擁有AI文生圖創作、2D/3D數字人生成、大場景/小物體生成等一系列生成式AI模型及應用。
在這輪AI大模型浪潮中,由于ChatGPT率先出圈,不少人認為,中國企業只是隨波逐流,跟風模仿,甚至只是概念炒作。但實際上,想要推出一個經得起考驗的大模型,絕不可能一蹴而就。國內已推出大模型的企業中,均有著長期規劃,商湯自然也早有準備。
在算力、數據和應用場景等大模型核心能力上,商湯科技已處于國內B端第一梯隊。其前瞻布局的AI大裝置SenseCore,擁有2.7萬塊GPU,可以輸出5.0 exaFLOPS的總算力,是亞洲目前最大的智算平臺之一,也是商湯自研大模型體系的關鍵基礎設施。
基于“大模型+大算力”雙輪布局,無論在當下還是未來,商湯科技都對中國AI產業界具有重要的戰略價值和意義。
千億參數大模型,驚艷亮相
4月10日,在距上海市中心近百公里的臨港,商湯科技在自己的智算中心舉辦技術交流日,現場投資者、分析師、記者等人流攢動,座無虛席。在大模型持續爆火幾個月后,大家依然非常期待這個人工智能領域的頭部企業能拿出更亮眼的作品。
商湯科技不負眾望,董事長兼CEO徐立登場后,正式發布了國內首個大模型體系——“日日新SenseNova”。該名稱出自《禮記·大學》中湯之《盤銘》:茍日新、日日新、又日新。這個名字也承載了商湯對大模型快速迭代、走向通用人工智能(AGI)的希冀。
由于ChatGPT持續火熱,加之百度和阿里相繼推出“文心一言”和“通義千問”,語言類大模型為人所熟知。在最新的大模型體系中,商湯也推出了自研語言大模型“商量SenseChat”。
與之前語音交互、圖像識別等AI應用類似,語言大模型也被用于人機交互,人們能通過文字和機器對話,獲得內容。但語言大模型的突破之處在于,它是真正在嘗試理解人們的想法,并基于大數據集生成內容,而不是簡單對比和匹配,這意味著AI擁有了一定的自學習能力。