投資洞察
佳都秉承“城市慧變得更好”的初心,通過科技、資本與創(chuàng)新三大核心驅(qū)動力,搭建科技含量高、示范帶動強的“佳都+”人工智能產(chǎn)業(yè)共同體,為現(xiàn)代城市精細(xì)化治理提供全要素、全時空解決方案,成就新常態(tài)下創(chuàng)新驅(qū)動和粵港澳大灣區(qū)的發(fā)展樣本與價值理念。
本期巡禮,我們關(guān)注到佳都參股公司思必馳,分享思必馳在AIGC相關(guān)領(lǐng)域——人機交互、生成式AI等應(yīng)用場景打造的優(yōu)秀實踐案例。思必馳是國內(nèi)專業(yè)的對話式人工智能平臺公司,提供智能人機交互軟件產(chǎn)品、軟硬一體化人工智能產(chǎn)品以及對話式人工智能技術(shù)服務(wù),加速全鏈路語音語言技術(shù)的產(chǎn)業(yè)賦能落地。
智能語音在人工智能行業(yè)的重要性不言而喻,隨著超級對話模型ChatGPT的發(fā)布,業(yè)界已廣泛感受到預(yù)訓(xùn)練大模型給AI行業(yè)帶來的巨大機會,這也帶動了自然語言處理類技術(shù)及應(yīng)用相關(guān)的細(xì)分賽道煥發(fā)生命力,有望迎來全面爆發(fā)。 思必馳在智能語音語義技術(shù)方面有著長期的投入和儲備,經(jīng)過十余年基礎(chǔ)技術(shù)研發(fā),截至目前已擁有近100項全球獨創(chuàng)技術(shù),掌握全鏈路語音及語言交互技術(shù),涵蓋語音信號處理、識別、合成、語言理解、問答聊天、知識圖譜等人機信息交互閉環(huán)涉及的各個模塊級技術(shù),能夠感知用戶意圖和情感,并基于用戶畫像實現(xiàn)擬人化的語言風(fēng)格互動,為場景化智能終端和垂直行業(yè)領(lǐng)域的企業(yè)提供“云+芯”一體化服務(wù),深耕垂直應(yīng)用領(lǐng)域,打造了多樣化的人工智能解決方案。 過去一年,思必馳發(fā)展勢頭不減,通過技術(shù)研發(fā)不斷突破自我,語音識別技術(shù)不斷邁向更準(zhǔn)確、更豐富、更智能的道路。 ?發(fā)音人音色定制平臺 2022年3月,思必馳推出簡單易操作的發(fā)音人音色定制平臺。該平臺是思必馳提供的一項進行音色定制訓(xùn)練的平臺服務(wù),旨在賦能用戶自主完成語音合成音色模型定制,降低語音合成定制門檻。使用者只需要根據(jù)自身場景需要,上傳一定量符合規(guī)定標(biāo)準(zhǔn)的音頻(一般為2-20小時有效音頻),即可一站式完成自動標(biāo)注、模型定制、質(zhì)量評測。音色定制,為虛擬人、機器人、智能客服與人類之間的溝通賦予了更多情感溫度,隨著智能語音在元宇宙、虛擬數(shù)字人等領(lǐng)域的應(yīng)用,可以窺見智能語音未來發(fā)展的潛力。 ·DUI平臺上線“單人千音” 2022年12月,思必馳DUI平臺上線“單人千音”功能,助力更多客戶打造多語言的AI產(chǎn)品。“單人千音”通過深度神經(jīng)網(wǎng)絡(luò)對發(fā)音人音色進行建模,實現(xiàn)單個音色就能生成同時覆蓋多種語言、多種風(fēng)格的語音合成聲音,極大豐富了合成語音的表現(xiàn)力。目前,單人千音可滿足智能車載、AI客服、視頻配音、智能家居等場景下的使用。 ·智云譯芯平臺 思必馳智云譯芯(CUI)是一款軟硬一體自動化編譯平臺,通過可視化的定制操作,將思必馳語音交互能力賦予芯片平臺,快速編譯 SDK 和固件,實現(xiàn)AI智能硬件模組的高效開發(fā)和迭代。平臺簡化了操作流程,降低了操作門檻,支持定制純離線場景的AI產(chǎn)品,無需連網(wǎng)即可賦予設(shè)備語音交互能力,讓萬物可“溝通”。 目前,智云譯芯賦能的語音芯片已經(jīng)覆蓋到各類家居場景,例如廚房中的油煙機、集成灶、凈水器,客廳場景中的空調(diào)、電燈、風(fēng)扇、茶吧機、按摩椅、晾衣架等,助力家居產(chǎn)品的智能升級。 ·“千語千訓(xùn)”自動優(yōu)化系統(tǒng) 為了提高語音識別的效果和語音識別模型一站式自動優(yōu)化能力,思必馳推出“千語千訓(xùn)”系統(tǒng),這是一套融合算法技術(shù)與工程服務(wù)創(chuàng)新的語音識別自動優(yōu)化系統(tǒng),將原本由算法工程師承擔(dān)的工作以自動化執(zhí)行的方式完成,實現(xiàn)算法人員0人工介入,自動更新模型,另一方面實現(xiàn)語音識別系統(tǒng)更新頻率從周級到天級的提升,及時優(yōu)化時效熱點話術(shù)和難點場景,保證模型與時俱進。 2022年7月,思必馳還獲批建設(shè)國家科技部“語言計算國家新一代人工智能開放創(chuàng)新平臺”,為語言計算開發(fā)者提供更加標(biāo)準(zhǔn)和高效的支持與服務(wù),為全面提升語言計算智能與實體經(jīng)濟的深度融合水平、高效整合技術(shù)資源、產(chǎn)業(yè)鏈資源的先行探路。 目前,思必馳在智能家電、智能汽車、消費電子等物聯(lián)網(wǎng)領(lǐng)域,以及以數(shù)字政企類客戶為主的生產(chǎn)、生活和社會治理領(lǐng)域(涵蓋金融服務(wù)、交通物流、地產(chǎn)酒店、政務(wù)民生、醫(yī)療健康等行業(yè)場景)等場景均有落地,推進產(chǎn)品智能化升級,推進行業(yè)降本增效。 智能語音交互如何為用戶帶來更便捷的駕乘體驗?思必馳與上海交大建立智能人機交互聯(lián)合實驗室,依托生成式AI底層技術(shù),以車載場景下的人機對話交互為核心,為汽車前裝與后裝導(dǎo)航及智能座艙設(shè)備提供智能車聯(lián)網(wǎng)解決方案,融合智能導(dǎo)航、多媒體娛樂、車身控制、駕駛行為監(jiān)控、車況監(jiān)控等智能座艙人機交互需求,圍繞“語音交互智能+云端互聯(lián)服務(wù)”,改變了傳統(tǒng)車載設(shè)備以觸控、按鍵為核心的操控模式,車主可以通過語音完成更多的車控操作,極大改善了交互體驗。 在語音交互服務(wù)能力落地應(yīng)用上,與北汽、上汽、理想、小鵬、哪吒、博泰、雅迪等知名車企攜手,推出包括理想ONE-全新理想L9、長城哈弗系列、小鵬汽車P7/P5/G3、雅迪換電獸02 Max等多款車型,滿足主機廠、車廠及Tier1廠商對語音交互的需求,推進車聯(lián)網(wǎng)智能化升級。 隨著人工智能技術(shù)在各個領(lǐng)域生根發(fā)芽,人們逐漸習(xí)慣了智能便捷的家居生活。在智能家電和消費電子領(lǐng)域,思必馳基于全鏈路語音語言技術(shù),與海信、華為、美的、小米、長虹等客戶達成深度合作,持續(xù)為智能產(chǎn)品引入AI語音技術(shù),與硬件廠商攜手打造全方位的家居智能體系。針對全屋智能場景,思必馳雙麥陣列和綜合聲紋識別、方言識別、通話降噪、直面喚醒等全鏈路語音技術(shù)助力實現(xiàn)就近喚醒、多設(shè)備連續(xù)對話、語義理解、空間話控和個性化設(shè)置,讓自然交互成為可能。針對On-The-Go移動場景,思必馳提供“云、端、芯”一體化AI解決方案,賦予耳機、手表、眼鏡等越來越多的智能穿戴產(chǎn)品交互的能力,攜手開啟萬物互聯(lián)新時代,未來將有望成為連接虛擬生活的全新入口。 基于自主知識產(chǎn)權(quán)的對話機器人全鏈路智能語音語言關(guān)鍵技術(shù),結(jié)合精細(xì)化、可視化、場景化、規(guī)模化的一站式對話機器人快速定制能力,以及深度的行業(yè)數(shù)據(jù)積累,思必馳可以快速、高效地打造各場景下的對話式數(shù)字員工,為企業(yè)提供專業(yè)深化的場景解決方案及啟發(fā)式智能對話服務(wù),成功應(yīng)用于軌交、金融、物流、政務(wù)、醫(yī)療、地產(chǎn)、餐飲、運營商等多個行業(yè),同時開放DUI全鏈路智能對話定制平臺,推進語音語言技術(shù)的應(yīng)用規(guī)模化。 例如,基于銀行實際業(yè)務(wù)需求打造的“智能回訪員”、“智能催收員”,能夠自動外呼完成客戶回訪、通知任務(wù),助力銀行實現(xiàn)降本增效;“智能語音機器人”可以在沒有人工干預(yù)的情況下完成快遞下單,查單,快遞價格、時效、狀態(tài)查詢等操作,且全天24小時無間歇;思必馳打造的“AI社區(qū)數(shù)字網(wǎng)格員”,能高效完成通知、調(diào)研、跟蹤回訪等任務(wù),目前已在全國多個社區(qū)街道實現(xiàn)常態(tài)化“任職”,為社區(qū)居民提供大大小小數(shù)百種服務(wù)。 從思必馳持續(xù)探索場景落地的過程,和最近火爆的ChatGPT,可以看到生成式AI的商業(yè)價值,已步入了擬人智能化與深層價值挖掘的產(chǎn)品階段,通過持續(xù)與合作伙伴攜手推動產(chǎn)品智能升級,思必馳AI語音識別將在佳都+人工智能產(chǎn)業(yè)生態(tài)圈中迎來廣闊的市場發(fā)展空間。 部分圖文來源|思必馳
感謝您的留言,我們會第一時間聯(lián)系您!