Kneron 希望與 Nvidia 展開競爭。
在生成人工智能的世界中,這是一場計算能力和獲得最快、最強大芯片的戰鬥。現在人工智能邊緣公司 Kneron 宣布將在今年年底前推出新的神經處理單元 (NPU) 芯片。
Kneron 表示,名為 KL730 的 NPU 芯片將使運行大型語言模型 (LLM)) 的成本更低,因為該處理器是專門為機器學習和人工智能應用而構建的。
KL730 是 Kneron 的下一代處理器。2021年,該公司推出了支持 Transformer 模型的 KL530芯片,這些模型支撐著一些生成式 AI 模型。
Kneron 首席執行官 Albert Liu 告訴 The Verge,NPU 芯片是專門為 AI 設計的,不會強迫最初為處理圖形而設計的東西為它工作——這是對人工智能芯片巨頭 Nvidia 的含蓄挖苦。
“我想說的是,如果你擁有像我們這樣功能強大且輕量級的芯片,那麼你就可以將像 GPT 這樣強大的變壓器模型帶到多種設備中”,劉說。
Liu 不願透露 KL730 的價格,但指出與 GPU 芯片相比,其 KL530 芯片的用戶運營成本下降了 75%。
大多數人工智能公司和雲提供商都湧向 Nvidia 的 H100 Tensor Core GPU 芯片,因為人們認為 GPU 是最容易訪問的處理器,能夠編譯運行生成人工智能模型所需的計算。但即使擁有這種能力,通常也需要大量 H100 來運行一個大型語言模型,因此用戶必須 “分解” 該模型才能使其運行。
即便如此,隨著需求持續增長,H100 的價格仍飆升至每片 40,000美元左右。Nvidia 已經宣布計劃在 2024年第二季度發布更強大的 AI 芯片。競爭對手已經在伺機而動, AMD 計劃在今年第四季度發布自己的 AI芯片。
Kneron 表示,與之前的芯片相比,KL730 的能效 “實現了三到四倍的飛躍”,並且具有每秒 0.35 兆兆次運算的基礎計算能力。
該公司表示,新芯片還允許用戶完全離線運行法學碩士,無需連接到雲提供商並更安全地處理數據。
記得 LIKE 我地 facebook 、Share、follow IG 同支持最潮及最新資訊既 《飛聞CHILL流誌》 🙏🏻🙏🏻🙏🏻