下戰帖？馬斯克才推AI聊天機器人 DeepSeek發布新研究成果

anex · 發表於 4 天前

人工智慧（AI）大戰愈演愈烈，科技富豪馬斯克今天發布最新版AI聊天機器人Grok 3後，中國深度求索（DeepSeek）也宣布推出用於超快速長文本訓練與推理的「原生稀疏注意力」（Native Sparse Attention，簡稱NSA）。

anex · 發表於 4 天前

據中國媒體第一財經今天報導，DeepSeek官方18日在海外社交平台X上發布了一篇純技術論文報告，主要內容是關於「原生稀疏注意力」。據官方介紹，這是一種用於超快速長文本訓練與推理、硬體對齊且可原生訓練的稀疏注意力機制。

anex · 發表於 4 天前

報告宣稱，NSA針對現代硬體進行了優化設計，能加速推理過程，同時降低預訓練成本，且不犧牲性能。NSA在通用基準測試、長文本任務和基於指令的推理，均能達到或超越全注意力模型的表現。NSA為提高效率同時保持模型能力提供了一個有前景的方向。

anex · 發表於 4 天前

在這篇名題為「原生稀疏注意力：硬體對齊且可原生訓練的稀疏注意力機制」（Native Sparse Attention:Hardware-Aligned and Natively Trainable Sparse Attention）的論文署名中，DeepSeek創始人梁文鋒也是共同作者。

anex · 發表於 4 天前

另一方面，馬斯克（Elon Musk）旗下人工智慧新創公司xAI於台灣時間18日發布最新版AI聊天機器人Grok 3。馬斯克表示，Grok 3的運算能力是前一代的10倍，並稱它「聰明得嚇人」，又指「Grok目標是要理解宇宙」。

anex · 發表於 4 天前

法新社報導形容，馬斯克希望Grok 3將在ChatGPT及中國的DeepSeek等對手競爭激烈的AI市場中占有一席之地。

anex · 發表於 4 天前

中國大陸深度求索（DeepSeek）宣布推出用於超快速長文本訓練與推理的「原生稀疏注意力」（Native Sparse Attention，簡稱NSA）。圖／路透社

賬號		自動登錄	找回密碼
密碼			註冊