“國家隊”評測30個大模型數學能力,九章、文心、星火位列前三

Home / 汽車新聞 / “國家隊”評測30個大模型數學能力,九章、文心、星火位列前三

“國家隊”評測30個大模型數學能力,九章、文心、星火位列前三

(原標題:“國家隊”評測30個大模型數學能力,九章、文心、星火位列前三)

去年ChatGPT橫空出世後,我國也迎來“百模大戰”,大模型能力測評成爲業界前沿課題。近日,大模型數學能力權威測評基準MathEval圍繞數學能力,對國內外30個大模型(含同一模型的不同版本)開展測評。根據測評結果,學而思九章、百度文心一言4.0、訊飛星火V3.5摘得前三名。其中,學而思旗下九章大模型在整體表現和中文、英文、各學段子榜單中,都具備領先優勢。

声动中国|清明节,用AI再现你的爱与想念

數據顯示,截至去年10月,國內累計發佈大模型超200個。大模型越來越多地被運用到數學應用領域,包括數學問題解決、數據分析、學術研究、學習輔導等。目前,通用或垂類大模型都具備一定的數學能力,而其能力表現則需要專門測評。不過現有大模型能力測評多數是對通用能力的測評,也有對推理能力、自然科學能力的專門測評中,但沒有專門針對數學能力測評的參考基準,以及專門的權威測評機構。

马英九访问陕西 今出席甲辰年清明公祭轩辕黄帝典礼

近日MathEval的上線,彌補了行業空白。MathEval由智慧教育國家新一代人工智能開放創新平臺聯合暨南大學、北京師範大學、華東師範大學、西安交通大學、香港城市大學共同發起,是一個專注於全面評估大模型數學能力的測評基準,旨在全面評估大模型在算術、小初高競賽和部分高等數學分支在內的解題能力表現。

截至目前,MathEval收集了2010年以來共19個被廣泛使用的數學能力測評數據集,這些數據集來自ACL、AAAI、ICLR等數十個國際人工智能頂會論文中的公開數據,覆蓋了不同年級、題型、文本形式和難度的數學問題,從而提供全面、具體的數學能力測評結果。

最新這次測評中,MathEval測試了30個大模型。在評測過程中,MathEval團隊使用了GPT4大模型來進行答案抽取和答案的匹配,減少基於規則進行評測所帶來的誤差。結果顯示,九章大模型在整體榜單和子榜單均排第一名。

九章大模型是由學而思自主研發的、面向全球數學愛好者和科研機構的垂類大模型。據悉,該公司在相關研發方面已累計投入超10億元。可以說,作爲少有的專注解題和講題算法的大模型,九章這一表現並不意外。

來幫新老虎命名!竹市立動物園列5名字票選 今起開跑

偷心的女人

同時,作爲通用大模型的文心一言4.0、訊飛星火V3.5在測評中的表現也頗爲亮眼,佔據了第二、三位,均優於GPT-4。由此可見,國產大模型在數學方面的能力已經實現了趕超,未來能力提升和落地應用值得期待。

V观财报丨沃尔核材:研究开发单通道224G的高速通信线

连假首日国道多路段紫爆 避车潮国5下午再上地雷路段曝

V觀財報丨沃爾核材:研究開發單通道224G的高速通信線

Home / 汽車新聞 / V觀財報丨沃爾核材:研究開發單通道224G的高速通信線

V觀財報丨沃爾核材:研究開發單通道224G的高速通信線

【V觀財報丨沃爾核材:研究開發單通道224G的高速通信線】沃爾核材在互動平臺表示,爲達到1.6Tbps的傳輸速率要求,公司正在積極研究開發單通道224G的高速通信線,目前尚處於配合行業大客戶打樣階段。(中新經緯APP)

一嫁三夫 小说
木葉之一拳超人模板 小說

骨灰坛被震碎 祖先全混在一起 礼仪师建议3步骤善后

全能邪才 石头会发光
我的外挂戒灵

止战优于终战

喵咪日

慧洋揚帆 Q1 每股賺2元

影/臨時併排停車不想移 台中外配女不斷推警察被法辦

清明連假首日國道局部路段紫爆 車速20公里以下

【院士談科技自立自強】加強原創性、引領性科技攻關

Home / 汽車新聞 / 【院士談科技自立自強】加強原創性、引領性科技攻關

【院士談科技自立自強】加強原創性、引領性科技攻關
安七夜 小說

【院士談科技自立自強】

半傻瘋妃 小說

深圳楼市重现人声鼎沸,全球资金重回中国股市

作者:賁德(中國工程院院士、中國電科資深首席科學家)

关于强吻再邂逅

習近平總書記強調,”新時代更需要繼承發揚以國家民族命運爲己任的愛國主義精神,更需要繼續發揚以愛國主義爲底色的科學家精神”,勉勵廣大科技工作者”大力弘揚科學家精神,勇攀世界科技高峰,在一些領域實現並跑領跑,爲加快建設科技強國、實現科技自立自強作出新的更大貢獻”。

猛烈暴風狂雨來襲!北市1人傷 另有12樹木、12招牌與電桿被吹倒

正是懷着拳拳報國心,我國雷達人潛心研究、集智攻關,實現了機載脈衝多普勒火控雷達從無到有,從有到優的重大跨越。

20世紀70年代,空中作戰樣式發生根本性改變。機載脈衝多普勒火控雷達就是影響空戰,乃至制空權的關鍵因素之一,具有重要戰略意義。當時,僅有幾個發達國家能夠研製先進機載火控雷達。國家將機載脈衝多普勒火控雷達的研製任務交給了中國電科14所。

脱骨香

彼時我國基礎薄弱,面對國外技術的嚴密封鎖,雷達人立下了”我們一定要爭口氣”的錚錚誓言,從基礎理論、基礎算法開始,終於在20世紀80年代末成功突破PD關鍵技術,並榮獲國家科技進步一等獎,奠定了我國國防機載雷達領域自主研製的基礎。

陰陽鬼廚 小說

面對接踵而至的榮譽,科研人員沒有一刻鬆懈,而是急國家之所急,緊追機載火控雷達技術最前沿,短時間內實現了新體制機載雷達技術的一次又一次飛躍,爲後續系列戰機裝上”戰鷹之眼”。

2024新北市纪录奖 初选入围名单出炉

在2016年中國航展上,國產機載有源相控陣雷達首次公開亮相,這代表了該領域雷達技術的國際先進水平,引發了國內外的廣泛關注。在2018年中國航展上,”三面陣””機相掃”等產品以先進的理念、成熟的技術,爲現代戰機突破傳統視野侷限提供了多種選擇,成爲全場焦點。

加快實現高水平科技自立自強,要以國家戰略需求爲導向,集聚力量進行原創性、引領性科技攻關,堅決打贏關鍵技術攻堅戰。自主研製機載火控雷達的實踐證明,關鍵技術是要不來、買不來、討不來的,不能只跟着別人走,必須自強奮鬥,敢於突破。只有加強原創性、引領性科技攻關,我們才能突破關鍵核心技術難題,在重點領域、關鍵環節實現自主可控。

當前,我國發展面臨的國內外環境發生深刻複雜變化,”十四五”時期以及更長時期的發展對加快科技創新提出了更爲迫切的要求,在科技創新的道路上,什麼是最大的激勵?我們的選擇就是把個人發展深深融入祖國的強軍事業中,把個人理想與祖國命運緊緊相連,把個人選擇與黨和國家的需要緊緊相連,把個人利益與人民利益緊緊相連。

拆除預售樣品屋…樓板塌陷砸死小山貓駕駛 2名臨時工逃亡桃園一帶

無限風光在險峰,科技創新同樣如此。我們要胸懷”國之大者”,錨定戰略目標,在解決受制於人的重大瓶頸問題上強化擔當作爲。高水平科技自立自強就是我們的”強勁筋骨”,我們要在日趨激烈的國際競爭中把握主動、贏得未來,創造更多大國重器。

中職/徐若熙有對象連多數隊友都不知道 婚訊讓葉總嚇一跳

未來商業早參 | 章小蕙將入淘開播;IDC預測全球生成式AI市場年複合增長率或達85.7%

Home / 汽車新聞 / 未來商業早參 | 章小蕙將入淘開播;IDC預測全球生成式AI市場年複合增長率或達85.7%

未來商業早參 | 章小蕙將入淘開播;IDC預測全球生成式AI市場年複合增長率或達85.7%

每經記者:劉雪梅 每經編輯:李卓

| 2024年3月29日 星期五 |

NO.1 IDC:全球生成式AI市場年複合增長率或達85.7%

IDC近日發佈的《全球人工智能和生成式人工智能支出指南》顯示,2022年全球人工智能IT總投資規模爲1324.9億美元,並有望在2027年增至5124.2億美元,年複合增長率爲31.1%。聚焦生成式AI,到2027年45%的企業將掌握並使用生成式AI來共同開發數字產品和服務,從而使收入增長比競爭對手翻一番。IDC預測,全球生成式AI市場年複合增長率或85.7%,到2027年全球生成式AI市場規模將接近1500億美元。

我改變「第一擊」定義 共軍:勿輕舉妄動

點評:IDC關於全球生成式AI市場的增長預測顯示了該領域強勁的發展潛力。生成式AI是藉助深度學習和大數據,能夠創造新的內容和解決方案,這在許多領域,如遊戲開發、營銷、內容創作與安全性等方面有着巨大的應用前景。特別是在數字產品和服務的自主創新方面,其價值不言而喻。然而,對於中國市場來說,如何在衆多的創業公司和巨頭之間找到自己的市場定位,確保數據安全和隱私保護,並且合理規避潛在的倫理和知識產權風險,將是關鍵。生成式AI技術的快速增長,也預示着未來幾年中會對人才市場形成巨大需求,並推動相關輔助行業的成長。

NO.2 微盟2023年報:營收22.28億元,下半年經營現金流與經調整EBITDA轉正

3月28日消息,微盟集團發佈2023財年報告,集團總收入人民幣22.28億元,同比增長21.1%。集團毛利人民幣14.84億元同比增長36.0%,毛利率66.6%。經調整EBITDA收窄至-0.75億元,同比減虧93.1%;經調整淨虧損同比減少73.4%。公司2023年下半年經營現金流0.6億元已轉正,經調整EBITDA 0.13億元。報告期內,微盟集團訂閱解決方案收入爲人民幣13.49億元,同比增長4.5%;商家解決方案收入爲人民幣8.78億元,同比增長60.5%。

點評:微盟集團2023年的財報顯示出這家面向商家提供數字化解決方案的公司有了明顯的增長和好轉。特別是商家解決方案收入的大幅增長顯示出微盟在市場中的競爭力和受歡迎程度。轉正的經營現金流和經調整EBITDA同樣證明了公司成本控制和盈利模式轉型的成效。在電商行業競爭日益激烈的今天,微盟提供的服務能夠幫助商家提升在線運營效率,這也就說明了微盟能突圍而出的原因。不過,考慮到整體宏觀經濟環境的不確定性,以及電商行業的變化,微盟未來仍需在產品創新和市場拓展上不斷努力。

研勤助攻志强 越洋支援智慧管理

胸中绽放的黄花

NO.3 章小蕙將入淘開播

3月28日消息,從淘寶內容電商盛典上獲悉,著名演員、時尚博主章小蕙將於近期入淘開播,此前章小蕙於小紅書收穫粉絲數超170萬。

博鳌亚洲论坛|加强团结合作 反对“脱钩”“筑墙”——外国政要和国际组织负责人呼吁共同应对全球性挑战

點評:章小蕙作爲有一定粉絲基礎的演員和博主轉戰淘寶直播,是內容電商個人品牌力量的體現。淘寶作爲集消費、娛樂、互動爲一體的電商平臺,通過明星效應可以吸引更多的流量,進而推動銷售。然而,內容電商的成功不僅在於個人影響力,更在於如何持續提供高質量、與粉絲互動強、商品匹配度高的內容。對於淘寶而言,吸引章小蕙這樣的具有強大個人品牌的內容創作者,是深化其內容電商生態的策略之一,但淘寶也需繼續完善平臺的服務和功能支持,以保證內容創作者的長期穩定收益和用戶體驗的不斷提升。

NO.4 快狗打車下調北京抽傭上限,由16%降至10%

從快狗打車獲悉,3月28日,快狗打車宣佈啓動“春風行動-北京站”。自4月1日起,北京地區的平臺司機抽傭上限將從16%降低至10%,服務質量排名前20%的司機能享受8%的抽傭率,降低司機運營成本,提升收入水平。

點評:快狗打車降低抽成比率的做法,是對當前激烈的同城物流市場競爭環境的直接回應。減輕司機的運營成本,有助於提高司機的收入和忠誠度,從而在服務層面爲平臺贏得更好的口碑和市場份額。不過,降低抽成可能會直接影響快狗打車的短期利潤,這意味着公司必須通過提升運營效率、優化服務或拓展新的利潤增長點來彌補。此舉在提振司機士氣的同時,也需要快狗打車平衡好成本控制和市場擴張之間的關係,確保其長期的可持續發展。

这菜不起眼,却是养肝明目的高叶酸食物,营养美味,现在吃正当季

陽明調整越太平洋航線

全球科技早參丨Grok將向X平臺Premium會員全面開放

Home / 汽車新聞 / 全球科技早參丨Grok將向X平臺Premium會員全面開放

全球科技早參丨Grok將向X平臺Premium會員全面開放

每經記者:李孟林 每經編輯:蘭素英

|2024年3月28日 星期四|

NO.1 Grok將向X平臺Premium會員全面開放

馬斯克表示,其旗下人工智能初創公司xAI的聊天機器人Grok,在本週晚些時候將對社交媒體平臺X(前身爲Twitter)的所有Premium會員開放。馬斯克在X平臺上發佈了這一消息,但沒有透露更多細節。此前,該聊天機器人只對“Premium +”用戶開放。

超级名医

周琦16+17沃特斯28分 广东主场险胜江苏

仙帝歸來 風無極光

點評:這一決策利好X平臺付費用戶,增強平臺吸引力,但具體影響尚待觀察。

NO.2 AI訓練芯片太集中將致電網崩潰

AI初創公司OpenPipe聯合創始人Kyle Corbitt透露,自己和負責GPT-6訓練集羣項目的微軟工程師交流,後者表示,在不同地區的GPU之間配置無限帶寬級鏈接很麻煩,但是如果將超過10萬塊英偉達H100芯片佈置在一個州內,將導致當地電網崩潰。

石老虎 小说

點評:AI算力集中發展引發電網安全隱患,需謹慎規劃佈局。

NO.3 智庫:AI或致英國800萬人失業

英國智庫公共政策研究所最新研究指出,AI可能會導致英國近800萬人失業。目前的AI浪潮已經影響了11%的英國員工,如若企業進一步整合AI技術,下一波AI浪潮將使59%的工作崗位面臨風險。然而,如果政府控制得當,儘量減少對勞動力市場的破壞,英國經濟將受益於AI轉型。

點評:AI大規模應用帶來的失業風險需政府採取措施應對。

No.4 基於量子干涉的單分子晶體管面世

才開賣台北-東京航線突然片面退款 亞航道歉了

英國、加拿大科學家團隊開發出一種新型單分子晶體管,利用量子干涉來控制電子流。傳統晶體管制造方法已到達極限,而由於存在量子隧穿效應,即使晶體管關閉,電子也會從中泄漏。該研究團隊藉助量子干涉研製出一種新型晶體管,消除了量子隧穿效應的影響。

點評:這一成果有望催生比現有設備更小、更快、更節能的新型晶體管,以製造新一代電子設備。

国会改革刻不容缓 国民党版:在五权宪法框架下进行

NO.5 三家AI加密公司將合併代幣

據外媒報道,SingularityNET、Fetch.ai和Ocean Protocol三家在區塊鏈上運營的AI公司,正在討論將他們的代幣合併爲 ASI 代幣,該代幣完全攤薄後的價值約爲 75 億美元。

點評:此舉旨有助於三家公司開發一個去中心化的AI平臺。

免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前核實。據此操作,風險自擔。

捷運萬大二期土城地下段動土 拚2031年完工

辣妹饭
萧潜 小说

特斯拉正在開發“私有5G”基礎設施 爲電動汽車和人形機器人提供連接

Home / 汽車新聞 / 特斯拉正在開發“私有5G”基礎設施 爲電動汽車和人形機器人提供連接

特斯拉正在開發“私有5G”基礎設施 爲電動汽車和人形機器人提供連接

《科創板日報》28日訊,特斯拉IT製造解決方案工程首席工程師Pat Ruelke分享的一則招聘信息顯示,特斯拉正在開發“私有5G”基礎設施,以爲其電動汽車和Optimus人形機器人提供連接。 (eletrek)

雪剑情缘
那个江湖之天刀

布农族圣地七彩湖 清出500公斤废弃物

美味甜妻要爬墙
怪兽8号

深化做好经济工作的规律性认识

26.9万起! 全新极氪001的价格让小米SU7有点难

浩子到底交過幾個女友 大霈說溜嘴:他告訴我8個

真正的加菲貓!她收編鬥雞眼奶貓「每天都看起來很驚訝」 離奇身世曝光網全哭了

又一輛獨一無二的委託製作案!Ferrari SP-8 將在臺灣亮相?

Home / 汽車新聞 / 又一輛獨一無二的委託製作案!Ferrari SP-8 將在臺灣亮相?

又一輛獨一無二的委託製作案!Ferrari SP-8 將在臺灣亮相?

Ferrari SP-8。 圖/Ferrari

作爲獨立自主性極高的 Ferrari,若客戶條件許可,並且有足夠的銀彈,其實可以按照自身需求,向 Ferrari 官方申請委託製作案,用以打造只屬於自己的法拉利車款。此次,官方透過自家平臺對外發表了以前述方式委託製作完成的 SP-8,值得一提的是,車主居然來自臺灣!

战鬼和捡到的女儿悠闲生活

王的彪悍寵妻

《劍星》福利連送卻沒有拍照模式?日媒向金亨泰呼籲快點端上來吧

Ferrari SP-8。 圖/Ferrari

一如先前所述,SP-8 爲 One-off 獨一無二的特製車款,據悉是由臺灣層峰買家向 Ferrari 委託設計打造,以 F8 Spider 爲基礎延伸而來,爲敞篷雙座跑車,考量到駕駛人的使用情境,品牌特別將整車透過模擬、風洞測試來調整車輛風阻與導流,以確保跑車聲量的維持與避免駕乘者於開篷時會有任何不適。

吞噬进化 育

Ferrari SP-8。 圖/Ferrari

造型上,SP-8 以大量碳纖維複合物料材質爲基礎,輔以 Blu Scuro Stellato 用色鋪裝,車後則採用霧面材質的 Argento Micalizzato 烤漆,藉此增加視覺衝擊。值得提及的是,SP-8 車頭採用鋁合金材質、並且以 3D 列印方式來造就單體式設計。

女力蘭馨交流協會募款400萬 關懷弱勢學童

Ferrari SP-8。 圖/Ferrari

農門醫香之田園致

動力部分則沒有任何特殊改變,同樣使用 3.9 升 V8 雙渦輪增壓引擎,具備 710 匹最大馬力、以及 770 牛頓米峰值扭矩,並且採後輪驅動。

趙樂際:中國正採取一系列擴大高水準對外開放的新措施

SP-8 將於 11/16 至明年 3 月,於 Ferrari 博物館展出。

Ferrari SP-8。 圖/Ferrari

Ferrari SP-8。 圖/Ferrari

南部民團反對老舊核電廠延役 籲國民黨正視核安

畫面曝光!竹東高中校車差點掉到橋下 吉祥物救了全車

高盛:英偉達的GR00T是人形機器人的重大突破

Home / 汽車新聞 / 高盛:英偉達的GR00T是人形機器人的重大突破

高盛:英偉達的GR00T是人形機器人的重大突破
開始的感嘆號 小說

高盛認爲,英偉達的GR00T項目爲全球人形機器人行業帶來AI技術的重大突破。

身份折叠

在3月21日的報告中,高盛預測,2024-2025年,全球人形機器人的出貨量預計將達到3.5k/20k臺,到2035年,全球人形機器人的出貨量將達到140萬臺,年複合增長率爲70%,市場規模將達到380億美元。

霸氣寶寶:帶着孃親闖江湖 小說

高盛認爲,這一增長主要得益於技術可行性的提高,特別是由機器人LLMs和端到端AI加速,以及BOM成本的降低帶來的更好的應用經濟效益。

医不小心:帝少的天价宠儿 小说

一個時代的終結:最後一輛VOLVO柴油車下線

本週英偉達GTC大會最具科幻感的一幕是,黃仁勳和一組機器人一同向觀衆致意。黃仁勳介紹了英偉達的GR00T項目,這是一個通用的基礎模型,專爲人形機器人的學習和執行設計。GR00T能夠連接到大型語言模型,接收多模態和自然語言指令,例如文本、視頻、VR演示,並生成機器人執行的下一個動作。

高盛預計,汽車行業有望最先採用人形機器人。例如,Figure AI宣佈與寶馬簽訂商業協議,在汽車製造線上部署通用人形機器人;Apptronik與梅賽德斯-奔馳合作,在汽車生產線上使用機器人對裝配套件的進行交付和檢查;UBTECH Robotics年初在蔚來汽車裝配線上測試了其人形機器人執行多項任務,例如門鎖、安全帶和徽章安裝的質量檢查等。

讯飞星火大模型预计6月发布4.0版本 全面对标GPT4

中信证券:将有序推进一年多次分红相关工作;亚泰集团拟出售持有的东北证券29.81%股份

馬斯克稱部分X賬戶將免費獲得Premium功能

Home / 汽車新聞 / 馬斯克稱部分X賬戶將免費獲得Premium功能

馬斯克稱部分X賬戶將免費獲得Premium功能

馬斯克3月28日表示,未來所有擁有超過2500個經過驗證訂閱者的X賬戶將免費獲得Premium功能,擁有超過5000個經過驗證訂閱者的X賬戶將免費獲得Premium+功能。

全能 住宅 改造 王 下載

巴黎小香包漲價!香奈兒精典包款首破1萬歐元大關 漲幅6.2%

大法官被提名人尤伯祥:贊成在民意基礎上 逐步朝廢死前進

「台北大安」無服務費的小酒館,台北宵夜來這邊就對了!

柯文哲又失言「我得票率远高于你们」!泛欧绿党当面告状 韩国瑜反应曝光

Keep發佈全新8.0版本,新10年致力“成爲10億運動者的自由運動場”

Home / 汽車新聞 / Keep發佈全新8.0版本,新10年致力“成爲10億運動者的自由運動場”

Keep發佈全新8.0版本,新10年致力“成爲10億運動者的自由運動場”
醉里行

Keep今天正式發佈全新 APP 8.0版本,在功能、玩法以及內容等方面進行了升級,覆蓋包括跑步、騎行等超60種運動品類、100多個分享模板,與50+外部硬件設備打,將圈子升級爲俱樂部。同時,Keep將投入更多資源在戶外場景,在運動課程和數據方向繼續投入和升級。 在成立九週年之際,Keep還將使命更新爲“激發每一次運動,讓世界充滿活力”,樹立了其10年願景與目標,致力於“成爲10億運動者的自由運動場”。

本文源自金融界AI電報

蒙牛乳业换帅卢敏放任职6年营收增83% 高飞接棒有望带领企业迈入“千亿俱乐部”

百萬年薪挖角經理人!中國芯原在台非法賺8.8億 檢方請求沒收遭駁確定

外送員才說不衛生「別再叫這家」 她打開餐盒竟見蟑螂爬來爬去

女大生私密片遭外流休學 母怒求償280萬!渣男等10共犯下場慘了

習近平會荷蘭首相:任何勢力無法阻遏中國科技發展進步