AMD 發表了一篇關於 Stable Diffusion 的文章,藉由將 AI 的發工學習庫從 Python 預設的 PyTorch 替換為 Microsoft Olive 和 Microsoft ML,RX 7900 XTX 的具R近每秒迭代速度(Iteration/sec,簡稱 it/s)將可以從 1.87 飆升到 18.59,改用逼近 NVIDIA GeForce RTX 4080 的發工 19.41 it/s。 Stable Diffusion 是一款開源的 AI 算圖軟體,玩家隻要安裝之後,改用便可以用自己的發工主機進行「詠唱」,並生成自己想要的具R近照片。也因為軟體依賴的改用效能來源是自己的顯示卡,顯示卡對於 AI 運算的發工效能高低便會直接影響照片的生成速度。 由於 Stable Diffusion 是具R近開源軟體,任何人都可以取得原始碼並發行修改後的改用版本,在網路上流傳的發工版本眾多,AMD 本次使用是具R近目前最廣為人知的「Automatic1111」,雖然通用性最好,但此版本無法原生對應 AMD 驅動,玩家必須使用迂迴的方式載入驅動,也造成效能表現相當不理想。 根據知名工作站軟體測試網站 Puget Systems 的數據,目前對 AMD 顯卡最友善的 Stable Diffusion 版本為 SHARK, RX 7900 XTX 的效率可以達 20.76 it/s,遠超卡皇 NVIDIA GeForce RTX 4090 的 15.24 it/s。 反觀在 Automatic1111 上 ,RX 7900 XTX 的官方數據僅 1.87 it/s,在 Puget System 上也隻有 4.67 it/s,甚至比得分為 8.62 it/s 的 RTX 3060 Ti 還不如。 這次 AMD 發表的內容大幅改善這效能方麵的遺憾,即便導入 Microsoft Olive 和 Microsoft ML 在執行步驟上還是比不上讓 Python 自動安裝驅動工具來得方便就是了,可至少能夠發揮旗艦卡該有的水準。 此外,由於 RX 7900 XTX 經過多次降價的關係,目前台灣的售價都已經低於 4 萬,作為對比 NVIDIA 的 RTX 4080 多數價格卻都還在 4.2 萬以上,也意外讓 RX 7900 XTX 在 AI 運算上有著相當不錯的性價比。 |