<pre id="1dxwt"><div id="1dxwt"><source id="1dxwt"></source></div></pre>

<noscript id="1dxwt"><tbody id="1dxwt"></tbody></noscript>

^{<style id="1dxwt"></style>}

<source id="1dxwt"><tr id="1dxwt"></tr></source>

商學(xué)院

多知商學(xué)院創(chuàng)辦于2017年，面向教育行業(yè)創(chuàng)業(yè)者、從業(yè)者、投資人，課程體系涵蓋系統(tǒng)課、專題課、大講堂，旨在連接行業(yè)頭部，直擊深度思考，提升商業(yè)認(rèn)知，催生自我迭代。

Open Talk

OpenTalk是多知組織的定期線下活動，邀請行業(yè)細分賽道頭部選手，分享行業(yè)新趨勢、時下最前沿的觀點和玩法，提供線上、線下多維度互動，也為多知讀者提供暢聊的見面機會。

字節(jié)跳動推出大模型同傳智能體，“接近人類同聲傳譯水平”

2024-07-30 09:13:35發(fā)布來源：多知網(wǎng) 作者：哆啦

　　多知7月30日消息，近日，字節(jié)跳動 ByteDance Research 團隊的研究人員推出了端到端同聲傳譯智能體：CLASI(Cross Language Agent - Simultaneous Interpretation) ，效果已接近專業(yè)人工水平的同聲傳譯。

　　此前，市面上傳統(tǒng)的同聲傳譯軟件通常采用級聯(lián)模型(cascaded model)的方法，即先進行自動語音識別(Automatic Speech Recognition, ASR)，然后再進行機器翻譯(Machine Translation, MT)。這種方法存在一個顯著的問題——錯誤傳播。ASR 過程中的錯誤會直接影響到后續(xù)的翻譯質(zhì)量，導(dǎo)致嚴(yán)重的誤差累積。此外，傳統(tǒng)的同聲傳譯系統(tǒng)由于受限于低延時的要求，通常只使用了性能較差的小模型，這在應(yīng)對復(fù)雜多變的實際應(yīng)用場景時存在瓶頸。

　　而CLASI 采用了端到端的架構(gòu)，規(guī)避了級聯(lián)模型中錯誤傳播的問題，依托于豆包基座大模型和豆包大模型語音組的語音理解能力，同時具備了從外部獲取知識的能力。從字節(jié)方面釋出的幾則視頻中可以看到，無論是繞口令、文言文，還是充滿即興和靈感的隨意聊天，模型都能流暢自然地給出準(zhǔn)確的翻譯結(jié)果。

　　系統(tǒng)架構(gòu)上，CLASI 采用了基于 LLM 智能體的架構(gòu)，將同聲傳譯定義為一系列簡單且協(xié)調(diào)的操作，包括讀入音頻流，檢索(可選)，讀取記憶體，更新記憶體，輸出等。整個流程由大語言模型自主控制，從而在實時性和翻譯質(zhì)量之間達到了高效的平衡。該系統(tǒng)能夠根據(jù)實際需求靈活調(diào)整各個環(huán)節(jié)的處理策略，確保在高效傳遞信息的同時，保持翻譯內(nèi)容的準(zhǔn)確性和連貫性。CLASI 底層模型是一個 Encoder-conditioned LLM，在海量的無監(jiān)督和有監(jiān)督數(shù)據(jù)上進行了預(yù)訓(xùn)練。

截屏2024-07-30 09.14.49.png

相關(guān)閱讀

字節(jié)跳動推出大模型同傳智能體，“接近人類同聲傳譯水平”

多知新書開售，共赴教育+AI新紀(jì)元
兩部《教育科技這一年》重磅發(fā)售！

感谢您访问我们的网站，您可能还对以下资源感兴趣：

粗大猛烈进出高潮视频_99热精品人妻无码_亚洲精选视频_无码动漫精选在线播放

成全动漫视频在线观看视频二区制服人妻中文字幕舌头伸进我下面好爽动态图_国产v欧美v日本v韩国_国产αv天堂在线观看免费_成人无码视频日韩一区二区三区国产

<noscript id="b0vkc"><meter id="b0vkc"></meter></noscript>

<td id="b0vkc"><tr id="b0vkc"></tr></td>