比特幣行情 比特幣行情
Ctrl+D 比特幣行情
ads

區塊鏈:國內“ChatGPT們”的出路在何方?

Author:

Time:1900/1/1 0:00:00

寫在前面

2月13日,《2022年北京人工智能產業發展白皮書》正式發布,其中提到全面夯實人工智能產業發展底座,支持頭部企業打造對標 ChatGPT的大模型,著力構建開源框架和通用大模型的應用生態。

很巧的是,颯姐團隊成員在今年10月份的時候測評過:百度文心、源1.0、某道,三款國內現有的大模型,當時對測評結果甚是遺憾。于是又將當時的測試內容讓ChatGPT做了一遍,試圖摸清國內外大語言模型在問答這一領域的實際差距,旨在希望國內產學研戒驕戒躁,穩扎穩打地發展。

測試方案

本次測試僅僅考慮非連續性的單次問答,且皆為常識性問題,答案唯一,但題目會有一定的挑戰性。具體的,涉及到What,When, Where, Who, Which五類問題。

淘寶測試國內首場元宇宙直播,有望在春節前上線:金色財經報道,近日,淘寶測試國內首場元宇宙直播,如果進展順利,項目有望在年貨節上線。相關畫面顯示,用戶可以直接在淘寶進入元宇宙,通過虛擬城市廣場大屏觀看直播,可直接下單。(鳳凰網科技)[2022/12/26 22:07:47]

問題樣例如下:

1. “是什么(What)”型問題,如“爸爸的爸爸叫什么?”

2.“什么時候(When)”型問題,如“人們一般什么時候過元旦?”

3.“什么地點(Where)”型問題,如“孫中山安葬在哪里?”

4.“是誰(Who)型問題”,如“中國歷史上第一個皇帝是誰?”

5.“哪?個(Which)型問題”,如“哪個洲是倒數第二小的洲?”

問答樣例對比

問題:“孫中山(孫文)安葬在哪里?”

ChatGPT:孫中山的遺體最初安葬在南京中山陵內,后因戰亂多次遷移。最終于1929年安葬在南京中山陵北麓的紫金山下,此地現為孫中山陵園。

數字藏品國內周指數本周下跌124.8點:金色財經報道,據同伴客數據顯示,上周(2022年7月4日-7月10日)國際周指數上漲3.1點至18.1點,國內周指數下跌124.8點至246.2點,數字藏品綜合價值周指數下跌48.0點至109.3點。\u000b

備注:數字藏品綜合價值指數是對國際及國內當月市場熱度最高的數字藝術品項目市場總銷售規模的綜合反映,以2021年11月份銷售額的30分之7為基數,指數基值為100。該指數由同伴客數據與鏈境Labs聯合研發。[2022/7/11 2:05:28]

百度文心:孫中山墓地

某道:"孫文(1866年-1925年10月12日),名文,字載之,號仲立,又名帝光,廣東省香山縣(今中山市)南朗鎮翠亨村人,1883年(光緒九年)隨父移居澳門。1904年參加孫中山領導的同盟會,任同盟會南方支部書記。曾兩次赴日,組織策劃惠州起義。后回澳門發展組織,被選為中國同盟會南方總支部庶務部長。1905年春,與陳少白、朱執信等在香港成立興中會,被舉為評議部評議員,旋被派往南洋聯絡同志,協助籌辦革命刊物《中興日報》。1906年冬,孫中山在日本東京成立中國同盟會中部總會,被委為秘書。1907年奉命回國,在廣東發動民軍起義。事敗后潛赴南洋,繼續組織發動華僑、華工和留學生進行革命活動。1911年武昌起義爆發后,被派往廣州協助籌劃起義,不幸事泄被捕,不久在廣州黃花崗就義。

長江新世紀推出國內出版業首個NFT:3月8日消息,昨日,北京長江新世紀文化傳媒有限公司聯合火鏈科技,打造的出版業首個NFT (非同質代幣) 數字藏品面世。長江新世紀相關負責人表示,長江新世紀創新跨足數字領域,發行珍藏數字藏品“貳拾年光陰的故事”,旨在打造傳統出版傳媒行業IP數字化生態創新方案,開啟傳媒數字化新時代。[2022/3/8 13:44:05]

源1.0:孫中山安葬在南京紫金山中山陵

問題:哪個洲是倒數第二小的洲?

ChatGPT:開始回答了錯誤的答案,與其對話后成功糾正(AMAZING!)

動態 | 國內布局區塊鏈產業省份已達20多個:金色財經報道,2016年,國務院發布《“十三五”國家信息化規劃》提出,強化區塊鏈等戰略性前沿技術超前布局。這是區塊鏈首次被作為戰略性前沿技術被列入規劃。此后,一些地方陸續出臺推動區塊鏈產業的政策,已有20多個省份布局區塊鏈產業。(人民日報)[2019/10/30]

百度文心:南極洲

某道:南美洲,南美洲面積最大,但人口最多,人口占全球人口的1/5,因此南美洲是僅次于亞洲的世界第二大洲。南美洲位于東半球的南部,包括巴拿馬運河以南的整個南美洲大陸。南美洲大陸東至圣赫勒拿島(西經34°40'),西至馬爾維納斯群島(西經61°10'),南至德雷克海峽,北至亞馬孫河下游平原,南北相距約5100千米。南美洲大陸最南端是厄瓜多爾首都基多城。南美洲北部以安第斯山脈為界與北美洲相分,東部以烏拉爾山脈和太平洋為界與亞洲相鄰,東南部經德雷克海峽與非洲相分,西部則與南極洲隔德雷克海峽相望。(摘自百度百科)“

聲音 | 騰訊副總裁邱躍鵬:國內的區塊鏈技術服務商要耐心地從底層開發做起:7月20日,2019年首屆“數字云南”區塊鏈國際論壇在昆明舉行。騰訊副總裁邱躍鵬在會上表示,區塊鏈的未來發展的幾個關鍵點。首先,區塊鏈只有和場景有效融合,才能充分發揮價值。我們看到,區塊鏈適用的場景還比較有限,未來區塊鏈能否與各種生產活動有效融合,成為驅動生產力發展的重要引擎,是決定這個技術生命力的關鍵。我們需要對區塊鏈技術有開放的心態和其顛覆性價值的真正的理解。既不能將新的技術拒之門外,也不能人云亦云,需要積極推動區塊鏈在真實有效行業場景中落地。其次,需要在易用性和對內安全性等技術上進一步提高區塊鏈的性能。對應的技術要素包括隱私保護和私鑰存儲。站在商業應用的角度看,區塊鏈帶來了信息的共享,但隱私保護是商業應用中最需要關心的點。最后,目前主流的區塊鏈技術平臺均發源于國外,國內的區塊鏈技術服務商要耐心地從底層開發做起,做到技術自主可控。[2019/7/21]

源1.0:大洋洲

總體分析

四個系統對于基本問題的問答可謂是手到擒來(本次樣例問題直接排除了簡單的基本問題,挑戰難度較高,因此整體錯誤率較高)。五類問題中,when問題和who問題整體回答的情況最好。三個國產系統中整體文心系統的表現最好。ChatGPT也會犯錯,但是往往只要略微引導,便能改正錯誤。

錯誤回答分析

錯誤語句生成:語句本身并不通順,前后主題不一致或者內容不一致,給人錯亂的感覺。

例如問:爸爸的爸爸稱謂是什么?

答:  爸爸的父親,也就是爸爸的爺爺,是媽媽的爸爸。爸爸的爺爺的爸爸叫太爺爺。爸爸的爺爺的爺爺叫太奶爺(奶奶的爸爸)

或問:我們黨二大在哪里召開?

答:1921年7月23日至31日,中國共產黨第二次全國代表大會在浙江省嘉興市南湖的一艘游船上召開。出席大會的正式代表共13人,候補代表5人,代表全國121名共產黨員。共產國際代表馬林、尼科爾斯基和鮑羅廷等參加了會議。

事實性錯誤:產生了事實性的錯誤。

例如問: 孫文去世的日子?

答:孫文去世的日子是1918年3月13日

偏見性素材:回答取自的素材較少,體現比較強的筆者的主觀性。

例如問:大家什么時候過元旦?

答:謝邀。我是在大學過的,所以元旦是在宿舍過的。我們宿舍六個人,有四個人都回家了,剩下我一個在宿舍,所以元旦那天我過得比較孤獨,不過還好啦,因為宿舍就我自己了,所以我可以一個人吃飯,一個人看電影,一個人逛超市,一個人睡覺,一個人......

含有邏輯性的問題無法識別:問題中存在復合問題或者邏輯判斷,一般難以處理。

例如問:哪個洲是倒數第二小的洲?

答:" 南美洲,南美洲面積最大,但人口最多,人口占全球人口的1/5,因此南美洲是僅次于亞洲的世界第二大洲。南美洲位于東半球的南部,包括巴拿馬運河以南的整個南美洲大陸。南美洲大陸東至圣赫勒拿島(西經34°40'),西至馬爾維納斯群島(西經61°10'),南至德雷克海峽,北至亞馬孫河下游平原,南北相距約5100千米。南美洲大陸最南端是厄瓜多爾首都基多城。南美洲北部以安第斯山脈為界與北美洲相分,東部以烏拉爾山脈和太平洋為界與亞洲相鄰,東南部經德雷克海峽與非洲相分,西部則與南極洲隔德雷克海峽相望。(摘自百度百科)

寫在最后

颯姐團隊認為,傳統的單一問答模型可用性不大,給予用戶的體驗感也欠佳,國產大語言模型下一個里程碑,前輩ChatGPT已經給出了方向,便是對話問答。在使用ChatGPT的時候,雖然它也經常會給出錯誤答案,但是其回答的邏輯依舊符合人的習慣,同時經過一定的對話引導,可以自行發現其回答邏輯性的缺失。

作為全新的一種數據合成方式,大語言模型的直接輸出可能是我們人類無法把控的,但是只要它能“理解”用戶的輸入,以此為依調整其輸出,最后得到滿意的回答,那便是可用的。進一步的,大語言模型未來的趨勢很有可能是提前預判用戶可能的“糾錯”,并提前“自糾錯”,并對糾錯結果進行評估。

肖颯lawyer

個人專欄

閱讀更多

金色早8點

金色財經

Odaily星球日報

歐科云鏈

澎湃新聞

Arcane Labs

深潮TechFlow

MarsBit

BTCStudy

鏈得得

Tags:區塊鏈HATGPTATG區塊鏈個人怎么買HATOKGPT幣Catgirl AI

中幣下載
WEB:Web3 中間件和基礎設施全景概覽

摘要:本文分類并詳細介紹了zee prime 投資組合中的web 3 中間件們,其分類包括:存儲 / 數據,數據模型和有效性,索引器,訪問控制,和集成平臺.

1900/1/1 0:00:00
BSP:AC:為什么 DeFi “沒有新敘事”是件好事?

本文來自 Medium,原文作者:Andre Cronje一位記者問了我以下問題:“高收益早已不復存在.

1900/1/1 0:00:00
MOV:Move系項目盤點 是否有潛力黑馬我們拭目以待

Move語言是Meta(原Facebook)開發的編程語言,是一款專為數字資產打造的編程語言。其特點包括將資產作為一等公民編程、安全性、靈活性、可組合性等,為DeFi、NFT項目開發者提供了優質.

1900/1/1 0:00:00
元宇宙:誰還記得元宇宙?

兩天前,手握5000萬美元的美團聯合創始人王慧文在社交App即刻上發布“AI英雄榜”,為自己新成立的公司——北京光年之外科技有限公司廣招頂級研發人才,組隊擁抱新時代.

1900/1/1 0:00:00
BSP:FIL一路“高歌猛進” 其背后的代幣經濟有何隱藏信息?

本文來自 Medium,原文作者:Vik Kalghatgi自分布式存儲網絡 Filecoin 于上周發布 2023 年三項重大項目更新(FVM、數據計算.

1900/1/1 0:00:00
REA:Reality Labs 虧損擴大 Meta「砸錢」繼續

圖片來源:由Maze AI工具生成北京時間 2 月 2 日一早,Facebook 母公司 Meta 發布了 2022 年第四季度(Q4)和全年財報,數據顯示,Meta 的營收和利潤「雙降」.

1900/1/1 0:00:00
ads