華爾街見聞獲悉,本周,由阿里國際聯合上海人工智能實驗室、北京語言大學一起制定的AI翻譯測評榜單TransBench在OpenCompass上線。與傳統的翻譯測評體系相比,該榜單增加了幻覺率、文化禁忌詞、敬語規范等指標,并首次針對行業的細分領域構建評測數據和評測方法。這些指標均來自真實場景的使用反饋,測評方法也已開源。
現代實驗室裝備網 實驗室行業專業網絡媒體
4001009187 0731-84444840
?Copyright 2000-2024 現代資訊 All Rights Reserved
QQ:369830746
4001009187 0731-84444840
?Copyright 2000-2024 現代資訊 All Rights Reserved
QQ:369830746