itc語(yǔ)音轉(zhuǎn)寫系統(tǒng)
概述
itc語(yǔ)音轉(zhuǎn)寫系統(tǒng)是廣東保倫電子股份有限公司(itc)自主研發(fā)、生產(chǎn)、設(shè)計(jì)的利用人工智能技術(shù)將語(yǔ)音內(nèi)容轉(zhuǎn)換為文本的系統(tǒng)。
系統(tǒng)介紹
itc語(yǔ)音轉(zhuǎn)寫系統(tǒng)提供實(shí)時(shí)語(yǔ)音識(shí)別和錄音文件識(shí)別能力,實(shí)現(xiàn)語(yǔ)音實(shí)時(shí)轉(zhuǎn)寫、實(shí)時(shí)字幕、實(shí)時(shí)上屏、快速編輯語(yǔ)音轉(zhuǎn)寫紀(jì)要,并具有角色分離、錄音轉(zhuǎn)寫導(dǎo)出、紀(jì)要導(dǎo)出等功能,配合傳統(tǒng)會(huì)議室系統(tǒng)使用。
系統(tǒng)功能
實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫
可將會(huì)議現(xiàn)場(chǎng)參會(huì)人員的發(fā)言內(nèi)容實(shí)時(shí)快速轉(zhuǎn)寫成文字,并且可以進(jìn)行文字同步編輯,在會(huì)議結(jié)束后可以快速的整理出會(huì)議記錄或紀(jì)要,讓記錄人員的錄入效率從以往最高每分鐘輸入120~150個(gè)字提升到當(dāng)前每分鐘輸入250~350個(gè)字,縮短記錄時(shí)長(zhǎng)。

歷史音頻轉(zhuǎn)寫
會(huì)議結(jié)束后,記錄人員可將會(huì)議結(jié)束后的歷史錄音文件針直接導(dǎo)入系統(tǒng)進(jìn)行轉(zhuǎn)寫進(jìn)行文字轉(zhuǎn)寫,確保會(huì)議記錄的準(zhǔn)確性。系統(tǒng)支持wma/wav/mp3/m4a/pcm/avi等多種格式音頻,轉(zhuǎn)寫結(jié)果支持錄音文字同步調(diào)聽矯正,可快速完成文字校核。一次性支持上傳50條數(shù)據(jù),數(shù)據(jù)總大小不超過5G,單條音頻時(shí)長(zhǎng)不超過18小時(shí)。

實(shí)時(shí)上屏展示
可將文字轉(zhuǎn)寫內(nèi)容通過大屏顯示給現(xiàn)場(chǎng)人員觀看,通過展板上屏、展示實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫結(jié)果,字體顏色和展板背景顏色支持根據(jù)實(shí)際情況需要進(jìn)行調(diào)整,實(shí)現(xiàn)參會(huì)人員視聽結(jié)合。

關(guān)鍵詞優(yōu)化
針對(duì)會(huì)議的轉(zhuǎn)寫過程中,某些個(gè)性化或者生僻的詞語(yǔ)(例如人名、公司名、地名等)可能出現(xiàn)錯(cuò)誤的情況,后臺(tái)記錄員可以提前輸入一些關(guān)鍵詞來優(yōu)化語(yǔ)言識(shí)別模型,以便在后面的實(shí)時(shí)轉(zhuǎn)寫過程中,系統(tǒng)自動(dòng)修正這些文字的轉(zhuǎn)寫結(jié)果,提高識(shí)別準(zhǔn)確率。

語(yǔ)氣詞過濾
使用超大規(guī)模的語(yǔ)言模型,對(duì)識(shí)別結(jié)果語(yǔ)句智能預(yù)測(cè)其對(duì)話語(yǔ)境,提供智能斷句和標(biāo)點(diǎn)符號(hào)的預(yù)測(cè)。能夠在實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫開始前或者進(jìn)行文稿整理時(shí),根據(jù)需要選擇是否開啟“語(yǔ)氣詞過濾”功能,若開啟則能將參會(huì)人員語(yǔ)氣詞和多余的詞匯去除,以保證文稿的規(guī)整。

禁忌詞屏蔽
系統(tǒng)管理人員可將不適宜展示的敏感詞添加禁忌詞列表中,屏蔽此禁忌詞,當(dāng)識(shí)別到此類詞匯時(shí),系統(tǒng)提供不顯示、*號(hào)和空格三種顯示方式供選擇。

重點(diǎn)內(nèi)容標(biāo)記
當(dāng)發(fā)言遇到一些重要的信息時(shí)后臺(tái)工作人員可對(duì)內(nèi)容進(jìn)行重點(diǎn)標(biāo)記,同時(shí)對(duì)領(lǐng)導(dǎo)的一些決策也可以進(jìn)行重點(diǎn)標(biāo)記,便于會(huì)議結(jié)束后的記錄查詢等。
系統(tǒng)支持在實(shí)時(shí)語(yǔ)音轉(zhuǎn)寫過程、對(duì)轉(zhuǎn)寫文本結(jié)果進(jìn)行編輯,對(duì)一些有疑問的內(nèi)容重點(diǎn)標(biāo)記高亮顯示,已標(biāo)記的文本也可以進(jìn)行修改和標(biāo)記取消,方便整理會(huì)議紀(jì)要,會(huì)議結(jié)束會(huì)后即可或直接成稿。

音頻文字雙向?qū)?yīng)
在會(huì)議過程會(huì)議結(jié)束后,若對(duì)會(huì)議當(dāng)時(shí)的記錄存在異議,可對(duì)當(dāng)時(shí)的歷史音頻文件進(jìn)行回放并再次轉(zhuǎn)寫,轉(zhuǎn)寫過程可以任意拖動(dòng)進(jìn)度條,并會(huì)顯示當(dāng)前進(jìn)度條所轉(zhuǎn)寫的語(yǔ)音文字區(qū)域?qū)崿F(xiàn)雙向?qū)?yīng),方便記錄人員復(fù)查會(huì)議記錄內(nèi)容。
播放器、時(shí)間軸及文本區(qū)互相同步定位,更方便找到錄音時(shí)間對(duì)應(yīng)的文本對(duì)照修改。語(yǔ)音文字雙向交互,既可通過文字定位到語(yǔ)音,也可通過語(yǔ)音定位到文字,方便進(jìn)行問題針對(duì)性的查看及修改。

角色分離
通過接入不同音頻通道實(shí)現(xiàn)角色自動(dòng)分離,每個(gè)通道對(duì)應(yīng)發(fā)言角色。實(shí)現(xiàn)在會(huì)議過程中參會(huì)人員各方發(fā)言的內(nèi)容進(jìn)行角色分離并自動(dòng)實(shí)時(shí)識(shí)別成文字。

快速會(huì)后紀(jì)要
在會(huì)議中記錄人員需要仔細(xì)聽現(xiàn)場(chǎng)參會(huì)人員的發(fā)言,并記錄他們發(fā)言內(nèi)容,在會(huì)議過后并整理存檔,可使用語(yǔ)音轉(zhuǎn)寫結(jié)果進(jìn)行編輯會(huì)議紀(jì)要,復(fù)制語(yǔ)音轉(zhuǎn)寫文本內(nèi)容到會(huì)議紀(jì)要中。會(huì)議結(jié)束后,自動(dòng)歸檔會(huì)議紀(jì)要文件。管理人員可前往歷史會(huì)議中查看會(huì)議紀(jì)要文件,下載會(huì)議紀(jì)要文件。

會(huì)議錄音
可實(shí)時(shí)錄制參會(huì)人員發(fā)言的現(xiàn)場(chǎng)音頻,方便記錄員回聽錄音??蓪?duì)照轉(zhuǎn)寫文本回聽錄音,追根溯源。速記員在會(huì)議記錄過程中,因記錄不及時(shí)、發(fā)言人語(yǔ)速過快的情況,通過轉(zhuǎn)寫過程中打點(diǎn)標(biāo)記相應(yīng)的位置,在閉會(huì)時(shí),可以通過回聽會(huì)議音頻,再快速修正記錄內(nèi)容。

系統(tǒng)特征
依托核心語(yǔ)音技術(shù),準(zhǔn)確率最高可達(dá)95%以上。
整段錄音全自動(dòng)機(jī)器轉(zhuǎn)寫,1小時(shí)音頻最快5分鐘出稿。
采用獨(dú)立專業(yè)服務(wù)器,不需聯(lián)網(wǎng),避免會(huì)議內(nèi)容和信息的外泄。
采用先進(jìn)聲學(xué)模型和語(yǔ)言模型訓(xùn)練,。
基于有限狀態(tài)機(jī)的解碼網(wǎng)絡(luò),支持語(yǔ)音流實(shí)時(shí)輸出。實(shí)時(shí)轉(zhuǎn)寫,200ms內(nèi)返回結(jié)果。
實(shí)現(xiàn)在會(huì)議過程中對(duì)會(huì)議的發(fā)起方、參與方、主席、主持人、秘書等將各方發(fā)言的內(nèi)容進(jìn)行角色分離并自動(dòng)實(shí)時(shí)識(shí)別成文字。
通過提取上下文相關(guān)的語(yǔ)義特征,同時(shí)結(jié)合停頓、基頻信息等語(yǔ)音特征,來進(jìn)行子句與段落的劃分;綜合運(yùn)用上下文相關(guān)語(yǔ)義特征和語(yǔ)音學(xué)特征,解決分句與分段問題。
通過使用泛化特征并結(jié)合上下文相關(guān)語(yǔ)義特征和語(yǔ)音學(xué)特征,剔除轉(zhuǎn)寫結(jié)果中的停頓詞、語(yǔ)氣詞、重復(fù)詞。
會(huì)議室的會(huì)議音響系統(tǒng)可與智能會(huì)議語(yǔ)音轉(zhuǎn)寫系統(tǒng)統(tǒng)一結(jié)合、協(xié)同使用,直接對(duì)接。
會(huì)議發(fā)言、音頻擴(kuò)聲、會(huì)議語(yǔ)音實(shí)時(shí)轉(zhuǎn)寫多項(xiàng)模塊靈活疊加組合,滿足不同行業(yè)、不同會(huì)議場(chǎng)景的多功能會(huì)議需求。
應(yīng)用場(chǎng)景
適用于辦公會(huì)議、工作報(bào)告、學(xué)術(shù)講座、培訓(xùn)、采訪等多種場(chǎng)景