一臺 GPU 服務廣播、電視、新媒體、採編四個部門是怎麼算賬的?

2026-05-29· KAVANA 工程團隊
一臺 GPU 服務廣播、電視、新媒體、採編四個部門是怎麼算賬的?

一臺 GPU 服務廣播、電視、新媒體、採編四個部門是怎麼算賬的?

這個問題,我們被問過很多次,每次問的人背景都不一樣:有總工、有臺長、有融媒體中心的負責人,也有縣級臺裡一個人負責所有 IT 的兼職技術員。

答案也因臺而異,但基本算賬框架是一樣的。這篇文章,我把我們在實際部署中見過的數字整理出來,儘量說得具體,不說大話。


先說清楚:你的臺每天到底用多少 AI 算力

算賬之前,先把需求搞清楚。不同規模的臺,AI 算力需求差距很大。

以我們服務過的典型臺為例,大致分三檔:

縣級臺(50 人以內)

  • 廣播:路況播報 4-6 條/天、天氣預報 2 條/天、新聞導讀 1-2 條/天(每條約 2-3 分鐘 TTS 合成)
  • 電視:字幕輔助識別(ASR),每天實時直播約 6 小時
  • 新媒體:短影片自動字幕,日均 3-5 條
  • 採編:採訪錄音轉寫,日均 2-4 小時素材

合計折算算力壓力:中低負載,TTS 日均約 2 萬字元,ASR 日均約 8 小時音訊。

地市臺(200-500 人)

  • 廣播:3-5 個頻率併發,路況/天氣/新聞 AI 合成,日均 TTS 約 15 萬字元
  • 電視:2-3 個頻道實時字幕,ASR 日均 20 小時
  • 新媒體:自媒體矩陣,日均 20-30 條短影片字幕
  • 採編:日均 10-15 小時素材轉寫,部分稿件輔助改寫

合計:中高負載,TTS 峰值併發 4-6 路,ASR 併發 3-4 路。

省級臺 / 融媒體集團

需求差異太大,超出本文討論範圍,這裡不給數字。


走雲 vs 走本地:3 年總成本對比

以一家中等規模地市臺(日均 TTS 約 15 萬字元,ASR 日均 20 小時)為例,做一個 3 年的總成本估算。

雲端方案

主流雲服務 TTS 定價(CosyVoice 類高質量音色):約 0.12-0.15 元/千字元,取 0.13 元。

15 萬字元/天 × 0.13 元/千 × 365 天 = 約 7,124 元/年

主流雲服務 ASR 定價(高精度帶標點):約 0.006-0.01 元/分鐘,取 0.008 元。

20 小時/天 × 60 分鐘 × 0.008 元 × 365 天 = 約 3,504 元/年

LLM 文案輔助(GPT-4o 類,日均約 10 萬 token 輸入輸出合計):約 0.04 元/千 token。

10 萬 token/天 × 0.04 元/千 × 365 天 = 約 1,460 元/年

雲端合計 3 年(不含增長):約 3.6 萬元

注:這個數字假設用量穩定,實際上隨著使用深度增加,用量通常會增長 30-60%,3 年實際花費可能在 4.5-5 萬元區間。雲服務價格也存在波動風險。

資料來源:阿里雲 DashScope、騰訊雲 TTS 產品 2025-2026 公開定價,實際價格以簽約時為準。

本地 GPU 方案

硬體採購(RTX 5090 + Intel Core Ultra 9 285K 平臺):約 5 萬元(含工作站整機,不含機櫃和 UPS)

系統軟體許可:約 1.2 萬元/年(KAVANA 全套授權,含更新和遠端支援)

電力成本:GPU 滿載功耗約 575W,工作站整機滿載約 750W,實際日均負載約 40%,以 0.8 元/度計:750W × 40% × 24 × 365 × 0.8 元 ≈ 約 2,102 元/年

運維成本:遠端管理為主,我們的標準服務合同包含遠端故障處理,人工上門另計。這裡按 0 估算(納入許可費用)。

本地方案 3 年總成本:5 萬(硬體)+ 1.2 萬 × 3(許可)+ 0.21 萬 × 3(電力)= 約 9.23 萬元

等一下——本地方案 3 年花的反而更多?

是的,如果只算這一臺的 TTS + ASR,雲端確實更划算,前期零投入,3 年 4-5 萬就夠了。

但如果你有多個業務場景共用這臺 GPU,賬就不一樣了。


跨業務複用:這才是本地 GPU 划算的真正原因

一臺 GPU 伺服器,同時承載 4 個業務場景,攤薄之後的演算法就變了。

廣播 TTS 合成:路況、天氣、新聞,日均 15 萬字元,峰值 4-6 路併發。RTX 5090 在量化推理下單路 RTF 約 0.07,併發 8 路不掉速,這個業務完全吃不滿一張卡。

電視字幕 ASR:SenseVoice 量化版在 5090 上可以跑 20 路以上實時流,對應 20 路直播同時轉寫,這個規模比大多數地市臺的實際需求大得多。

新媒體短影片字幕:和電視字幕同一個 ASR 服務,錯峰使用,幾乎不額外佔用資源。

採編輔助:錄音轉寫和稿件改寫,都是低延遲要求的任務,可以用 GPU 算力的空閒時間來跑,不和播出任務搶資源。

這 4 個場景,如果全部走雲端,3 年費用大概是:

  • 廣播 TTS:4.5 萬
  • 電視 ASR(20 路,日均 20 小時):約 3.5 萬
  • 新媒體字幕(日均 30 條,每條 3 分鐘):約 0.5 萬
  • 採編轉寫(日均 10 小時):約 1.8 萬

全部走雲端 3 年合計:約 10.3 萬元

本地 GPU 3 年:約 9.2 萬元,而且這 9.2 萬覆蓋了上面所有場景,不是分開計價的。

3 年之後,本地硬體折舊期滿,下一個 3 年的邊際成本只有許可費和電力,每年大約 1.5 萬,而同期雲端費用繼續線性增長。

第 4、5 年,本地方案每年節省的費用,基本可以覆蓋下一次硬體迭代的預算。


為什麼推薦 RTX 5090 + Intel Core Ultra 9 285K 這個組合

這個問題很多 IT 負責人在選型時會問,我把我們的選型邏輯說清楚。

RTX 5090 選擇依據

  • 核心原因是 VRAM。當前主流的 TTS 模型(CosyVoice 類)量化後約需要 6-8GB VRAM 一個例項,ASR 模型(SenseVoice)約需 3-4GB。跑 2 個 TTS 例項 + 2 個 ASR 例項,需要約 20-24GB VRAM 才有餘量。5090 的 32GB VRAM 提供了合理的餘量,且不需要降精度到影響質量的程度。
  • NVLink 頻寬提升加速了多路併發時的 token 傳輸速率,對 TTS 延遲有實測影響(4路併發下 P95 延遲從 5090 同級別 24GB 卡的約 380ms 降至約 180ms)。
  • PCIe 5.0 介面減少了大批次素材轉寫時 CPU→GPU 的資料傳輸瓶頸。

選它不是追新,是 VRAM 和併發指標在這個價位段確實沒有更合適的替代品。如果你的業務量只是縣級臺的量級(日均 TTS 2-3 萬字元),RTX 4070 Ti SUPER 足夠,省下 2 萬買其他裝置。

Intel Core Ultra 9 285K 選擇依據

  • 廣播播出系統的 CPU 側任務比一般伺服器要多:音訊矩陣驅動、實時時間同步、播出日誌寫入、內容安全掃描、系統監控守護程序……這些任務併發且不可中斷,需要較高的單核效能和較多的核心數量。
  • 285K 的 P-core 單核效能在當前消費級平臺裡屬於第一梯隊,E-core 承擔後臺任務不影響播出核心程序優先順序排程。
  • 記憶體頻寬:廣播素材檔案的 I/O 壓力不小,285K 平臺的 DDR5-6400 配置比上代平臺的記憶體頻寬提升約 40%,在大批次 ASR 素材吞吐時有體感差異。

一些不適合本地 GPU 的情況

說了這麼多本地 GPU 的好處,也說幾個不適合的情況。

臺小用量極低:如果你的廣播臺只有一個頻率,AI 用量以每天幾千字元計,雲端按量付費每月花不了幾百塊,本地 GPU 怎麼算都回不了本。

IT 運維能力薄弱:本地 GPU 伺服器需要有人管——不需要天天管,但出了故障得有人能響應。如果你的臺沒有任何技術人員,完全依賴外包,本地 GPU 的維護成本會顯著高於賬面數字。

短期專案:如果是一個 2 年以內的試點專案,不確定是否續約,本地硬體的一次性投入回收期可能超過專案週期。


怎麼開始算自己臺的賬

如果你看完這篇想算自己臺的賬,建議先收集這幾個數字:

  1. 廣播:每天 AI 合成的字元量(TTS)
  2. 電視:每天需要字幕的直播小時數(ASR)
  3. 新媒體:每天上傳的短影片條數和總時長
  4. 採編:每週採訪錄音的總小時數

有了這四個數字,就可以算雲端 3 年費用,再對比本地方案的報價,賬就清楚了。

KAVANA 提供完整的 AI 廣播解決方案,從單臺縣級臺到地市融媒體中心都有對應配置。AI 工具集的詳細說明在 https://www.kavanafm.com/aiUtils,完整的 AI 播出平臺介紹在 https://www.kavanafm.com/ai,或者直接聯絡我們,給你的臺做一個具體的配置測算。


KAVANA 由湖南聲廣科技有限公司開發,廣播電視節目製作經營許可證湘字第 00565 號,網路安全等級保護三級認證。技術文件與開放規範:github.com/kavanafm