找回密碼
 註冊
查看: 6|回覆: 6

下戰帖?馬斯克才推AI聊天機器人 DeepSeek發布新研究成果

[複製鏈接]
簽到
165

1738

主題

7829

回帖

2萬

積分

超級元老

積分
29350

百萬富翁勳章論譠元老勳章高級元老勳章超級元老勳章

發表於 4 天前 | 顯示全部樓層 |閱讀模式
人工智慧(AI)大戰愈演愈烈,科技富豪馬斯克今天發布最新版AI聊天機器人Grok 3後,中國深度求索(DeepSeek)也宣布推出用於超快速長文本訓練與推理的「原生稀疏注意力」(Native Sparse Attention,簡稱NSA)。

1738

主題

7829

回帖

2萬

積分

超級元老

積分
29350

百萬富翁勳章論譠元老勳章高級元老勳章超級元老勳章

 樓主| 發表於 4 天前 | 顯示全部樓層
據中國媒體第一財經今天報導,DeepSeek官方18日在海外社交平台X上發布了一篇純技術論文報告,主要內容是關於「原生稀疏注意力」。據官方介紹,這是一種用於超快速長文本訓練與推理、硬體對齊且可原生訓練的稀疏注意力機制。
回覆 讚好 不讚 使用道具

舉報

1738

主題

7829

回帖

2萬

積分

超級元老

積分
29350

百萬富翁勳章論譠元老勳章高級元老勳章超級元老勳章

 樓主| 發表於 4 天前 | 顯示全部樓層
報告宣稱,NSA針對現代硬體進行了優化設計,能加速推理過程,同時降低預訓練成本,且不犧牲性能。NSA在通用基準測試、長文本任務和基於指令的推理,均能達到或超越全注意力模型的表現。NSA為提高效率同時保持模型能力提供了一個有前景的方向。
回覆 讚好 不讚 使用道具

舉報

1738

主題

7829

回帖

2萬

積分

超級元老

積分
29350

百萬富翁勳章論譠元老勳章高級元老勳章超級元老勳章

 樓主| 發表於 4 天前 | 顯示全部樓層
在這篇名題為「原生稀疏注意力:硬體對齊且可原生訓練的稀疏注意力機制」(Native Sparse Attention:Hardware-Aligned and Natively Trainable Sparse Attention)的論文署名中,DeepSeek創始人梁文鋒也是共同作者。
回覆 讚好 不讚 使用道具

舉報

1738

主題

7829

回帖

2萬

積分

超級元老

積分
29350

百萬富翁勳章論譠元老勳章高級元老勳章超級元老勳章

 樓主| 發表於 4 天前 | 顯示全部樓層
另一方面,馬斯克(Elon Musk)旗下人工智慧新創公司xAI於台灣時間18日發布最新版AI聊天機器人Grok 3。馬斯克表示,Grok 3的運算能力是前一代的10倍,並稱它「聰明得嚇人」,又指「Grok目標是要理解宇宙」。
回覆 讚好 不讚 使用道具

舉報

1738

主題

7829

回帖

2萬

積分

超級元老

積分
29350

百萬富翁勳章論譠元老勳章高級元老勳章超級元老勳章

 樓主| 發表於 4 天前 | 顯示全部樓層
法新社報導形容,馬斯克希望Grok 3將在ChatGPT及中國的DeepSeek等對手競爭激烈的AI市場中占有一席之地。
回覆 讚好 不讚 使用道具

舉報

1738

主題

7829

回帖

2萬

積分

超級元老

積分
29350

百萬富翁勳章論譠元老勳章高級元老勳章超級元老勳章

 樓主| 發表於 4 天前 | 顯示全部樓層
中國大陸深度求索(DeepSeek)宣布推出用於超快速長文本訓練與推理的「原生稀疏注意力」(Native Sparse Attention,簡稱NSA)。圖/路透社
回覆 讚好 不讚 使用道具

舉報

您需要登錄後才可以回帖 登錄 | 註冊

本版積分規則

Archiver|聯絡我們|141華人社區

GMT+8, 2025-2-22 15:49

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回覆 返回頂部 返回列表