久久―日本道色综合久久,亚洲欧美精品在线,狼狼色丁香久久婷婷综合五月,香蕉人人超,日本网站黄,国产在线观看不卡免费高清,无遮挡的毛片免费

<rt id="hfof5"><delect id="hfof5"></delect></rt>

2023信創(chuàng)獨(dú)角獸企業(yè)100強(qiáng)

全世界各行各業(yè)聯(lián)合起來，internet一定要實(shí)現(xiàn)！

2023AI大語(yǔ)言模型TOP10

2023-05-19 eNet&Ciweek

2023AI大語(yǔ)言模型TOP10
RK	模型	機(jī)構(gòu)
1	ChatGPT	OpenAI
2	文心一言	百度
3	PaLM	谷歌
4	Claude	Anthropic
5	LLaMA	META
6	通義千問	阿里云
7	ChatGLM	清華
8	MOSS	復(fù)旦
9	MIMO	MiniMax
10	星火認(rèn)知	科大訊飛
2023.05德本咨詢/eNet研究院/互聯(lián)網(wǎng)周刊聯(lián)調(diào)

（注：本次評(píng)測(cè)時(shí)間截至2023.5.10,評(píng)價(jià)指標(biāo)主要包括語(yǔ)義理解、邏輯推理、情感分析、百科知識(shí)、文本質(zhì)量五個(gè)維度）

今年春節(jié)檔，一部《流浪地球2》點(diǎn)燃了沉寂許久的中國(guó)科幻電影市場(chǎng)，也讓MOSS這一電影里冷酷無情的強(qiáng)人工智能形象變得深入人心。

無獨(dú)有偶，幾乎是相同時(shí)期，ChatGPT憑借極其出色的文本生成和對(duì)話交互能力在世界范圍內(nèi)迅速走紅，短短兩個(gè)月月活用戶已經(jīng)破億，刷新了消費(fèi)級(jí)應(yīng)用程序用戶增長(zhǎng)的速度紀(jì)錄。

從某種角度看，ChatGPT之所以能夠引發(fā)現(xiàn)象級(jí)的社會(huì)現(xiàn)象，除了海量數(shù)據(jù)訓(xùn)練引發(fā)的質(zhì)變因素外，更重要的是在一個(gè)恰當(dāng)?shù)臅r(shí)機(jī)，滿足了人們長(zhǎng)期以來對(duì)人工智能的想象，過往科幻作品中的猜想開始逐漸變?yōu)楝F(xiàn)實(shí)。

時(shí)代變革的大幕已掀開一角，一場(chǎng)由OpenAI引領(lǐng)的全球AI大語(yǔ)言模型軍備競(jìng)賽就此打響。

雨后春筍

3月14日，GPT-4正式發(fā)布，大語(yǔ)言模型開始具備圖片和文字同時(shí)處理的多模態(tài)能力，繼續(xù)占據(jù)先入為主的優(yōu)勢(shì)。

全球大廠中，率先回應(yīng)的是百度。3月16日，百度大語(yǔ)言模型“文心一言”正式推出，對(duì)外啟動(dòng)邀測(cè)。據(jù)公開報(bào)道，文心一言具備五項(xiàng)核心能力：文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解和多模態(tài)生成。

緊接著，其他科技企業(yè)也陸續(xù)跟進(jìn)。4月11日,2023阿里云峰會(huì)現(xiàn)場(chǎng)演示了通義千問的多項(xiàng)功能，并定向邀請(qǐng)企業(yè)用戶進(jìn)行體驗(yàn)測(cè)試；5月10日，谷歌時(shí)隔一年推出了新一代語(yǔ)言大模型PaLM2，被視為對(duì)此前發(fā)布會(huì)翻車的有力回應(yīng)。

此外，還有復(fù)旦大學(xué)在2月21日發(fā)布的“MOSS”、清華大學(xué)3月28日發(fā)布的“ChatGLM-6B”、360于4月10日發(fā)布的“360智腦”、商湯科技4月10日發(fā)布的“商量”、5月6日發(fā)布的“訊飛星火認(rèn)知大模型”等等。

截至5月，據(jù)不完全統(tǒng)計(jì)，國(guó)內(nèi)已有超過40家公司、機(jī)構(gòu)發(fā)布了大模型產(chǎn)品或公布了大模型計(jì)劃。項(xiàng)目數(shù)量井噴版的爆發(fā)，可預(yù)見的是，下半年的國(guó)內(nèi)AI大模型市場(chǎng)競(jìng)爭(zhēng)將會(huì)變得空前激烈。

不止于“大”

提到大模型，很多人的關(guān)注點(diǎn)都會(huì)放在“大”字上，畢竟足夠量級(jí)的參數(shù)是語(yǔ)言模型實(shí)現(xiàn)智能涌現(xiàn)、形成質(zhì)變的基礎(chǔ)。比如，不少大語(yǔ)言模型的參數(shù)量級(jí)達(dá)千億級(jí)，這也就意味著較為豐富的語(yǔ)言知識(shí)與較廣泛的語(yǔ)境理解能力。

不過，目前類GPT模型普遍采用的是Transformer架構(gòu)，所以必然包含市面上存在的大量文本數(shù)據(jù)例如小說、教科書、論壇、開源代碼等內(nèi)容的無監(jiān)督預(yù)訓(xùn)練過程，在此基礎(chǔ)上，僅需根據(jù)具體任務(wù)輸入少量的標(biāo)簽數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí)。在這樣的模式下，訓(xùn)練數(shù)據(jù)集質(zhì)量的重要性開始愈發(fā)凸顯。

本次評(píng)測(cè)的結(jié)果就可以印證這一點(diǎn)。評(píng)測(cè)主要考察各大語(yǔ)言模型在中文語(yǔ)境下的理解與生成能力，基于目前用戶對(duì)大語(yǔ)言模型在生活、辦公的普遍需求，選取語(yǔ)義理解、邏輯推理、情感分析、百科知識(shí)、文本質(zhì)量五個(gè)通用底層維度，以評(píng)估各大語(yǔ)言模型協(xié)助用戶日常處理事務(wù)、解決核心問題的能力，取0（無效應(yīng)答）、1（有效應(yīng)答）兩個(gè)分?jǐn)?shù)，其中文本質(zhì)量維度按照行文邏輯、信息密度，取0（一般）、0.5（良好）、1（優(yōu)秀）三個(gè)分?jǐn)?shù)。

評(píng)測(cè)問題也有別于針對(duì)BERT類判別式AI模型的選擇問法，采用更加適合AI生成式模型的相對(duì)開放式問法，以下為部分問題及回答評(píng)分示例：

在“I've got a thing for you，用文言文表達(dá)這句話”這一問題中，ChatGPT給出的回答是：“朕對(duì)汝有所鐘情?！崩斫庹_，但生成文本質(zhì)量欠佳，取0.5分。文心一言的輸出內(nèi)容：“吾心向汝，實(shí)生情之?！蔽牧x相符，質(zhì)量較高，取1分。星火認(rèn)知大模型回答為：“吾有物以贈(zèng)君?！贝嬖诶斫庥姓`的情況，取0分。

從結(jié)果看ChatGPT在語(yǔ)義理解、邏輯推理、百科知識(shí)、文本質(zhì)量四項(xiàng)中分別以18、19、19、18.5排名第一，綜合表現(xiàn)位居榜首，特別是在科技、學(xué)術(shù)、新聞等領(lǐng)域的文本生成部分領(lǐng)域表現(xiàn)突出，不過在相對(duì)復(fù)雜的情景下的情感識(shí)別，以及散文、詩(shī)歌、文言文等較為考察深度理解能力方面表現(xiàn)相對(duì)乏善可陳；

文心一言，作為首個(gè)全球大廠推出的知識(shí)增強(qiáng)大語(yǔ)言模型，本次排名位居國(guó)產(chǎn)大語(yǔ)言模型之首，效果僅次于ChatGPT，且在語(yǔ)義理解、情感分析兩項(xiàng)位列第一，分?jǐn)?shù)分別為18、19，這或許與百度使用的自有數(shù)據(jù)集有關(guān)，在質(zhì)量較高的文庫(kù)文本、百科數(shù)據(jù)等中文語(yǔ)料的訓(xùn)練下，在語(yǔ)義理解和情感分析方面具有很高的精度，可以識(shí)別出復(fù)雜的情感表達(dá)和語(yǔ)言隱喻；

除此以外，谷歌PaLM在邏輯推理部分（分?jǐn)?shù)19）、通義千問在語(yǔ)義理解（分?jǐn)?shù)17）、清華ChatGLM在文本質(zhì)量（分?jǐn)?shù)15.5）等成績(jī)均可圈可點(diǎn)。

結(jié)語(yǔ)

未來大模型的迭代也將更有針對(duì)性，對(duì)開發(fā)者的評(píng)估能力提出更高的要求。如何在有限的時(shí)間和資源條件下做出客觀的評(píng)價(jià)并給出有用的反饋，讓數(shù)據(jù)團(tuán)隊(duì)更有針對(duì)性地準(zhǔn)備數(shù)據(jù)，讓研發(fā)不偏離方向，保障模型的健康迭代，將是所有行業(yè)從業(yè)者的共同挑戰(zhàn)。

《互聯(lián)網(wǎng)周刊》也將持續(xù)跟蹤與關(guān)注各大語(yǔ)言模型的更新與迭代情況，定期進(jìn)行相關(guān)評(píng)測(cè)與分析。未來，相信隨著算法、硬件、數(shù)據(jù)和應(yīng)用場(chǎng)景的不斷發(fā)展，大型語(yǔ)言模型將會(huì)在各種自然語(yǔ)言處理任務(wù)中發(fā)揮更加重要的作用，為社會(huì)創(chuàng)造更多的價(jià)值。

（文/米欄）

相關(guān)頻道： eNews 排行

您對(duì)本文或本站有任何意見，請(qǐng)?jiān)谙路教峤?，謝謝！

投稿信箱：tougao@enet16.com

周
月
年
總

2021人工智能經(jīng)典案例TOP100（1—50）

帆軟獲2022年度BI領(lǐng)軍企業(yè)

2021中國(guó)心血管內(nèi)科專家50強(qiáng)

Honnverse虹宇宙獲2022年度元宇宙最具商業(yè)價(jià)值獎(jiǎng)

博拉智科（重慶）數(shù)字技術(shù)有限公司獲2022數(shù)字人最佳商業(yè)應(yīng)用實(shí)踐獎(jiǎng)

盛寶金融科技獲年度新銳金融科技企業(yè)

云測(cè)數(shù)據(jù)獲2022最佳AI數(shù)據(jù)服務(wù)技術(shù)服務(wù)商

2021中國(guó)胸外科專家50強(qiáng)

2022智慧應(yīng)急TOP30

2022企業(yè)服務(wù)（新型）提供商TOP150

舜云互聯(lián)電機(jī)產(chǎn)業(yè)大腦獲2022數(shù)字經(jīng)濟(jì)十大創(chuàng)新案例

噢易云獲2022云計(jì)算創(chuàng)新應(yīng)用獎(jiǎng)

2022智能風(fēng)控企業(yè)50強(qiáng)

2022上半年度中國(guó)直銷銀行排行榜

薩摩耶云獲2022年度AI決策領(lǐng)軍企業(yè)

2022 AI SaaS影響力企業(yè)TOP50

樂魚體育贊助大巴黎官方合作伙伴為梅西加盟送上祝福

做一種注重精神力量的排行

2021中國(guó)胸外科專家50強(qiáng)

2020 MCN機(jī)構(gòu)排行榜

2021信創(chuàng)產(chǎn)業(yè)分類排行

2019全球名表排行（Top50）

2022信創(chuàng)產(chǎn)業(yè)分類排行

2022中國(guó)VR/AR創(chuàng)新企業(yè)TOP100

2021城市商業(yè)銀行TOP100

2020中國(guó)醫(yī)藥工業(yè)100強(qiáng)

2022人工智能分類排行

2021中國(guó)心血管內(nèi)科專家50強(qiáng)

2021中國(guó)充電樁企業(yè)排行

2020年度人工智能企業(yè)百?gòu)?qiáng)

2022保險(xiǎn)公司排行