男人的天堂2814,久久精品一区二区三区四区,久久国产精品久久

GMI Cloud 發(fā)布“ AI 應(yīng)用構(gòu)建成本計(jì)算器”，宣布降低海外 IT 成本超40%

[ 通信界 | 文猛 | www.k-94.cn | 2025/7/30 8:17:32 ]

　　7月29日晚間消息，今日閉幕的2025世界人工智能大會(huì)（展覽）上，GMI Cloud 發(fā)布自研“ AI 應(yīng)用構(gòu)建成本計(jì)算器”，宣布通過實(shí)時(shí)量化不同場(chǎng)景下的算力成本、時(shí)間損耗與供應(yīng)商性價(jià)比，可為開發(fā)者提供成本規(guī)劃支持。

　　典型場(chǎng)景評(píng)估顯示，使用 GMI Cloud 方案可使海外 IT 成本降低 40% 以上，回本周期縮短至行業(yè)平均水平的 1/3。

　　Token作為AI文本處理的基本單位，其消耗成本直接決定商業(yè)可行性。據(jù)行業(yè)數(shù)據(jù)顯示，GPT-4 Turbo處理單次多步驟Agent任務(wù)消耗可達(dá)200萬Token（成本約2美元），而工程化部署周期普遍被低估60%。

　　據(jù)介紹，GMI Cloud “ AI 應(yīng)用構(gòu)建成本計(jì)算器”可基于Token數(shù)量與單價(jià)（區(qū)分輸入 / 輸出），核算AI應(yīng)用/AI Agent 構(gòu)建總花費(fèi)；結(jié)合Token吞吐量（輸入 / 輸出速度），計(jì)算處理總請(qǐng)求的耗時(shí)。同時(shí)，該工具還能實(shí)時(shí)對(duì)比OpenAI、Anthropic等15家供應(yīng)商的Token單價(jià)，自動(dòng)標(biāo)記Inference Engine等低成本替代方案。

　　此外，GMI Cloud Inference Engine 的底層調(diào)用GMI Cloud 全棧能力，可直接調(diào)用英偉達(dá) H200、B200芯片，從硬件到軟件進(jìn)行了端到端的優(yōu)化，極致優(yōu)化單位時(shí)間內(nèi)的Token吞吐量，確保其具備最佳的推理性能以及最低的成本，最大限度地幫助客戶提升大規(guī)模工作時(shí)的負(fù)載速度以及帶寬。同時(shí)，其讓企業(yè)以及用戶進(jìn)行快速部署，選擇好模型后即刻擴(kuò)展，幾分鐘之后就可以啟動(dòng)模型，并用這個(gè)模型進(jìn)行 Serving。

1作者：文猛　來源：新浪科技　編輯：顧北

聲明：①凡本網(wǎng)注明“來源：通信界”的內(nèi)容，版權(quán)均屬于通信界，未經(jīng)允許禁止轉(zhuǎn)載、摘編，違者必究。經(jīng)授權(quán)可轉(zhuǎn)載，須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息并注明“來源：通信界”。②凡本網(wǎng)注明“來源：XXX（非通信界）”的內(nèi)容，均轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多行業(yè)信息，僅代表作者本人觀點(diǎn)，與本網(wǎng)無關(guān)。本網(wǎng)對(duì)文中陳述、觀點(diǎn)判斷保持中立，不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考，并請(qǐng)自行承擔(dān)全部責(zé)任。③如因內(nèi)容涉及版權(quán)和其它問題，請(qǐng)自發(fā)布之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將在第一時(shí)間刪除內(nèi)容。

未經(jīng)書面許可，禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像

无码成人A片在线观看,性欧美videofree高清变态,中文字幕有码无码av,国产无人区卡一卡二扰乱码 ,最近高清日本免费