在高通技術公司,我們長期以來一直相信人工智慧助理將無處不在、個人化和設備上。
今天,我們很高興與大家分享這一旅程中的一個重要里程碑:OpenAI 開源了其第一個推理模型 gpt-oss-20b,這是一種直接在配備旗艦 Snapdragon 處理器的設備上運行的思維鏈推理模型。OpenAI 的複雜模型以前僅限於雲端。今天是該公司首次將其模型用於設備上推理。
透過早期存取模型以及與我們的高通人工智慧引擎和高通人工智慧堆疊的整合測試,我們看到這個 20B 參數模型是一個令人印象深刻的模型,它完全可以在裝置上進行思維鏈推理。
我們將這一刻視為一個轉捩點:一睹人工智慧的未來,即使是豐富的助理式推理也將是本地的。它還顯示了人工智慧生態系統的成熟,合作夥伴和開發人員可以使用 Snapdragon 處理器即時利用 OpenAI 等領導者的開源創新。OpenAI 的 gpt-oss-20b 將使設備能夠利用設備上的推理,在隱私和延遲方面提供優勢,同時通過 AI 代理補充雲解決方案。
透過搶先體驗 gpt-oss-20b 以及與 Qualcomm AI Stack 的整合測試,我們親眼目睹了該模型令人印象深刻的功能,使複雜的推理完全在裝置上實現。開發人員將能夠透過 Hugging Face 和 Ollama 等流行平台存取該模型並在搭載 Snapdragon 的裝置上利用其功能,有關部署的更多詳細資訊很快就會在高通人工智慧中心上提供。
通過將 Ollama 的輕量級開源 LLM 服務框架與強大的 Snapdragon 平台集成,開發人員和企業可以直接在具有 Snapdragon 計算平台的設備上運行 gpt-oss-20b,還可以運行 Web 搜索和其他一些開箱即用的默認功能。用戶還可以探索 Ollama 上的渦輪模式,以探索模型的更多功能。
在接下來的幾年裡,隨著移動內存佔用空間的不斷增長和軟件堆棧的效率越來越高,我們相信設備上的人工智能能力將迅速增強,為私密、低延遲、個性化的代理體驗打開大門。